Bonjour,
Avec quelques amis nous aurions decidé d'essayer de concevoir au mieu un spider (genre googlebot) et qui sait, p-e de faire un petit moteur de recherche si on arrive a qqch de concluant (Loin de nous l'idée de tenter d'arriver a un niveau semblable a celui de Google, c'est plutot pour travailler un peu nos connaissances de Java).
Apres avoir lu pas mal de doc sur le net,j'ai a peu pres une idée de comment le bot se deplace sur les differentes pages mais parcontre j'ai pas trop bien compris comment faire pour l'envoyer sur les pages.
J'ai lu qu'on peut soumettre a google l'adresse d'un site pour qu'il la valide, et qu'apres il suivra les liens sur le site pour faire grandir sa base de données ... mais dans mon cas ca risque de poser des problemes quand meme ... Dans le sens ou les adresses que j'insererai manuellement dans le bot ne seront jamais utilisables pour joindre la totalité des pages..
On avait donc pensé a faire qqch de plus "radical" (et catastrophiquement lent) c'est a dire de tenter la connection sur le port 80 de toutes les adresses IP, puis de voir lesquelles sont atteignables, et par la suite lancer le suiveur de liens. Cela dit, c'est tres lent (plus que 4 miliards de combinaisons possibles... dont une bonne partie seront "HS" ) => grosse perte de temps. Donc, est-ce qu'il existe une maniere plus simple a votre avi?
Merci d'avance, je vous tiendrai au courrant de l'avancement eventuel du projet
Esox
---------------
Si la vérité est découverte par quelqu'un d'autre,elle perd toujours un peu d'attrait