rufo Pas me confondre avec Lycos! | Mon algo LSA est aussi codée en PHP + Mysql. L'avantage de l'algo LSA, c'est qu'il n'est pas sensible à la conjugaison des verbes, au noms communs au pluriel ou féminin puisqu'il intègre une étape de lemmatisation. Moi, je l'ai faite via la BD Lexique.org : http://www.lexique.org/telLexique.php.
Après, y'a une étape de calcul du Tf-idf : https://fr.wikipedia.org/wiki/TF-IDF
Puis on calcule les covariances entre les documents, à partir de la matrice où, en ligne, tu as les termes, c'est-à-dire les mots lemnisés et en colonne, les documents (dans ton cas, les titres d'articles) ce qui permet d'avoir le taux de corrélation entre chaque document. A noter qu'on peut calculer les covariances entre les termes : dans ce cas, on a le taux de proximité entre des termes, ce qui peut être intéressant si on veut faire de la recherche étendue à partir d'un terme saisi par l'utilisateur et qu'on incorpore des termes proches à ce terme dans la recherche pour trouver plus de résultats  ---------------
Astres, outil de help-desk GPL : http://sourceforge.net/projects/astres, ICARE, gestion de conf : http://sourceforge.net/projects/icare, Outil Planeta Calandreta : https://framalibre.org/content/planeta-calandreta
|