Bonjour tout le monde !
Je vais vous exposer mon problème le plus clairement possible en espérant avoir de l’aide .
Actuellement en école d’ingénieur généraliste, je suis en train de finir un projet mais je bloque sur une étape.
Mon projet est le suivant :
Développer un mini moteur de recherche en Java basé sur l’algorithme Hits.
Contrainte : développement en Java sous NetBeans.
En entrée on possède 2 fichiers texte :
Un web (des pages et les liens entre les différentes pages) et un index (des mots avec les pages associé, bien sur les pages sont les pages du web).
En sortie :
Une liste de page trié.
Le fonctionnement est simple : l’utilisateur choisi d’abord s’il veut un classement suivant l’authority score ou le hub score puis tape un mot clé.
L’algo recherche alors les pages qui contiennent le mot clé et les pages qui y sont liées afin de déterminer le graphe de voisinage.
Puis l’algo calcule la matrice d’adjacence, les « authority score » et « hub score » et enfin affiche les rangs pour chaque page avec un algorithme de tri (ex : tri à bulle).
Mon problème se situe à une étape précise : le calcul de la matrice d’adjacence.
J’ai trouvé une solution pour y répondre mais pour l’écrire en java je suis un peu perdu.
Pour faire la matrice d’adjacence, je vous rappelle ce qu’on possède :
Un mot clé avec les pages associés et le web.
Par exemple :
Cheval : {p1 ; p4} et le web (avec les liens entre les différentes pages).
La solution est de mettre dans un tableau les pages 1 et 4 (pages contenant le mot clé) puis de regarder chaque page du web (sachant que notre web n’est pas grand) si elle a un lien avec la page 1, la page 4 ou bien les 2.
Si elle possède un lien, on rajoute cette page dans le tableau.
On obtient donc un tableau avec toutes les pages qui ont au moins un lien avec le mot clé.
Il ne nous reste plus qu’a sortir ce tableau sous forme de matrice.
Voila voila ^^, si vous avez des questions et/ou réponses n’hésitez pas !
Merci !