Forum |  HardWare.fr | News | Articles | PC | S'identifier | S'inscrire | Shop Recherche
776 connectés 

  FORUM HardWare.fr
  Programmation
  Perl

  [Perl] Débutant : Rechercher mot-clé et extraire paragraphe

 


 Mot :   Pseudo :  
 
Bas de page
Auteur Sujet :

[Perl] Débutant : Rechercher mot-clé et extraire paragraphe

n°1360265
sytembenla​get
Posté le 05-05-2006 à 11:00:30  profilanswer
 

Bonjour   :hello:  
 
Voila mon petit souci :
Je voudrais rechercher dans un texte une liste de mot-clé, en extraire les paragraphes correspondant au mot-clé trouvé et copier ces paragraphes dans un autre fichier.
 
Après des essais plus ou moins réussis sous VBA, on m'a dit que Perl était bcp plus approprié à ce type de manip.
 
Je me mets donc à Perl pour manipuler du texte..
 
Etant une merde en programmation, avez-vous des conseils ou des liens pour que je réussisse à faire mon prog de recherche et d'extraction.
 
Merci bien
 
:jap:

mood
Publicité
Posté le 05-05-2006 à 11:00:30  profilanswer
 

n°1360277
Elmoricq
Modérateur
Posté le 05-05-2006 à 11:10:38  profilanswer
 

D'abord, plutôt que de rechercher un mot, et en extraire le paragraphe correspondant, je te propose de faire l'inverse : séparer les paragraphes, puis y rechercher ta liste de mots.
 
Séparer un paragraphe, c'est facile. Mettons qu'on travaille avec un fichier texte tout à fait banal, les paragraphes y sont séparés par au moins une ligne vide.
Si tu travailles sur d'autres types de textes, à toi de concevoir la manière de les extraire. Quoi qu'il en soit, tu peux tout simplement lire ton fichier, et le stocker dans un tableau de paragraphes.
 
Ensuite, il te suffit de parcourir ton tableau, avec grep(), et de ne retenir que les paragraphes contenant au moins l'un, voire tous les mots recherchés.
 
Lien à connaître :
http://perldoc.perl.org
 
Tu y trouveras toute la documentation PERL dont tu as besoin. Et si tu as des questions plus spécifiques, tu peux les poser ici bien évidemment.

n°1360291
sytembenla​get
Posté le 05-05-2006 à 11:16:31  profilanswer
 

Merci bien !
Je m'y penche de suite !

n°1360408
pospos
Posté le 05-05-2006 à 14:03:13  profilanswer
 

pour extraire le smots clé il y a beaucoup de techniques possibles, plus ou moins complexe
sur CPAN (search.cpan.org) tu trouvera quelques modules pour le faire, mais qui marchent surtout pour l'anglais:
http://search.cpan.org/search?quer [...] s&mode=all
 
sinon tu a l'API yahoo (que tu peux utiliser avec certains de ces modules d'ailleurs) qui marche tres bien, mais qui est forcement limitée (et lente)

n°1360416
sytembenla​get
Posté le 05-05-2006 à 14:10:41  profilanswer
 

C quoi l'API yahoo ?

n°1360468
pospos
Posté le 05-05-2006 à 15:01:44  profilanswer
 

c'est le webservice de yahoo
en gros il rendent disponible une partie de leurs outils en ligne, à travers internet.
Tu peux par exempel faire des recherches web à partir de ton application au lieu de le faire sur leur page web, et dans l'exemple qui t'interesse tu peux demander à yahoo de trouve rles mots clé dans un extrait que tu leur fourni.
Google a le meme genre d'API (mais dans les mots clés)

n°1360525
sytembenla​get
Posté le 05-05-2006 à 15:58:30  profilanswer
 

OK  
mais moi je veux en fait extraire tout le paragraphe ou j'ai trouvé le mot clé. et d'autrs manips de fichiers textes (qui font bien 700pages)
 
merci !

n°1360589
pospos
Posté le 05-05-2006 à 16:53:57  profilanswer
 

ok excuse, j'ai mal lu ton post initial !!
je pensais que tu voulais extraire des mots clés nouveaux, et non chercher une liste de mots clé deja connue!
au temps pour moi


Aller à :
Ajouter une réponse
  FORUM HardWare.fr
  Programmation
  Perl

  [Perl] Débutant : Rechercher mot-clé et extraire paragraphe

 

Sujets relatifs
Extraire le jour d'une date MySQL[debutant] Structure de mon fichier correcte ?
écoles d'info et perl[C] [Debutant] Petit problème avec un programme tout bete
Gtk perl et connection [PHP] Extraire les liens http dans un code source html
[Débutant] C avec GTK+/GNOME[CSS débutant] Problème sur un bouton
[Débutant]générer un tableau contenant des valeurs de différents types[PERL] [CGI] suprimer du contenu entre deux balises
Plus de sujets relatifs à : [Perl] Débutant : Rechercher mot-clé et extraire paragraphe


Copyright © 1997-2022 Hardware.fr SARL (Signaler un contenu illicite / Données personnelles) / Groupe LDLC / Shop HFR