sur l'intranteque je developpe, j'indexe un peu plus de 400 000 documents , en php , masi je m'appuie  sur lucene pour indexer tout ca , d'autre utilise sphinx   pour stocker et organiser  les données
 l'avantage de sphinx est d'etre une surcouche sur mysql , c'est assez simple a mettre en place.  PErso , j'ai préféré lucene pour sa puissance au niveau des filtres 
 apres , tu fasi, en php , les interface de consultation, ou tu t'appuie sur des crawler qui fonctionnent deja et tu te contente des les intégrer
 
Message édité par flo850 le 05-11-2008 à 19:12:11