Perl

reconnaissance de plusieurs mots sur une même ligne

Recherche :

Mot : Pseudo : Filtrer
Bas de page
Auteur	Sujet : reconnaissance de plusieurs mots sur une même ligne

lucie 25

bonjour,
connaîtriez-vous la façon dont on peut faire lire une ligne entière à perl?
j'ai éclusé toutes mes ressources internet et sur papier, je ne trouve pas de solution.
ils parlent souvent du fait que perl cherche toujours l'expression rationnelle le plus tôt possible dans la chaîne, mais nulle part ils ne disent comment contrecarrer ce phénomène.
si vous pouviez m'éclairer un peu, je vous en serai reconnaissante.
de plus sauriez-vous comment on peut faire lire plusieurs textes à la suite pour un même programme??
à l'avance merci

Message édité par lucie 25 le 18-04-2009 à 14:57:19

Publicité

gilou

Modosaurus Rex

Si vous pouviez être plus claire dans ce que vous cherchez a faire, ca nous permettrait de repondre, parce que la...

> lire une ligne entière à perl
perl, ca execute des scripts, alors ce n'est pas tres clair. Faire lire une ligne entiere a un script? Une ligne qui vient d'ou?

> ils parlent souvent du fait que perl cherche toujours l'expression rationnelle le plus tôt possible dans la chaîne, mais nulle part ils ne disent comment contrecarrer ce phénomène.
Expression rationelle?? vous voulez dire expression réguliere je suppose. Au contraire perl cherche le plus grand texte matchant une expression régulière. Mais il y a moyen de lui faire chercher le plus petit texte matchant une expression régulière, c'est dans la doc perl pour les expressions régulieres (on y remplace * par *?, + par +? et ? par ??)

>> de plus sauriez-vous comment on peut faire lire plusieurs textes à la suite pour un même programme??
Tout dépend de comment votre script perl lit un texte.

A+,

---------------
There's more than what can be linked! -- Le capitaine qui ne veut pas obéir à la carte finira par obéir aux récifs. -- Les paroles s'envolent, les APIs REST -- Hacker vaillant rien d'impossible -- (╯°□°)╯︵ ┻━┻

lucie 25

alors en fait j'ai un texte qui est lu par perl ligne par ligne, jusque là aucun problème.
ensuite, je fais reconnaitre des scripts dans mon texte. mon problème est que sur une même ligne écrite lorsque perl me reconnait un script si un autre est présent sur cette même ligne, il ne le reconnaitra pas car il va directement à la ligne suivante... et je voudrai éviter cela.
alors, comment faire???
merci

Message cité 1 fois

gilou

Modosaurus Rex

lucie 25 a écrit :

Je suis désolé, mais ce que vous avez écrit ici ne veut rien dire du tout.

Citation :

j'ai un texte qui est lu par perl ligne par ligne

?? Vous avez un texte lu par un script perl? (car je vous le rappelle, perl n'est qu'un moteur a script, ce qui fait le boulot, comme par exemple de lire une ligne, c'est le script).
Ce script est dans un fichier? alors pourquoi ne pas nous le montrer ici? et si c'est juste une ligne de commande, pourquoi ne pas nous la recopier ici?

Le texte lu ligne par ligne, il est dans un fichier je suppose. Comment le script y accède t'il? le nom du fichier est sur la ligne de commande? ou bien le nom du fichier est écrit dans le script perl?

Citation :

ensuite, je fais reconnaitre des scripts dans mon texte.

Je suppose qu'ici, vous voulez dire je fais reconnaitre des suites de lettres vérifiant une expression régulière dans mon texte.

Citation :

mon problème est que sur une même ligne écrite lorsque perl me reconnait un script si un autre est présent sur cette même ligne, il ne le reconnaitra pas

Il faut le code de l'expression régulière au minimum ici, pour savoir comment la modifier.

A+,

lucie 25

mon vocabulaire laisse à désirer mais c'est bien ce que vous avez dit.
voici donc mon script à exécuter par perl :

open(FICH,"texte19moutons.txt" ) || die "Impossible d'ouvrir le fichier.";
$cpt = 0;
while(<FICH> )
{
$a = $_;
if(/\bmoutons?\b/)
{
$cpt = $cpt+1;
}
}
print "'moutons' existe dans le fichier.\n";
print "J'ai trouve $cpt occurrences de 'moutons'.\n";
close (FICH);

portant sur ce texte :

les moutons sont méchants.
les moutons sont des moutons blancs.
les moutons noirs ne sont pas des moutons blancs.

Ce texte est sur un fichier séparé du script, dans le dossier bin de perl.
lorsque j'exécute mon script sous commande ms-dos sont reconnues trois des cinq occurrences de "moutons" dans mon texte. et j'ai lu que c'est parce que la reconnaissance d'expressions rationnelles se fait toujours au plus tôt et après le script passe à la ligne suivante. je voudrai donc pouvoir éviter cela et pouvoir compter toutes les occurrences présentes dans mon texte.
merci

couak

Code :

open(FICH,"test.txt" ) || die "Impossible d'ouvrir le fichier.";
$cpt = 0;
while(<FICH> )
{
    $a = $_;
    while ($a=~/moutons/g)
    {
        $cpt = $cpt+1;
    }
}
 
print "cpt = $cpt\n";

lucie 25

merci, votre solution fonctionne très bien.
cependant, pour une recherche de thème dans un texte, je dois tenir compte de plusieurs possibilités, et il me semble que cela ne puisse fonctionner avec while... :

Code :

open(FICH_A,"dossier_part01.txt" ) || die "Impossible d'ouvrir le fichier.";
    while(<FICH_A> )
    {
        @a = @_;
        if($religion =~/\bdieu\b/i||/\bfoi\b/i||/\bprofane\b/i||/\bprieres?\b/i||/\bames?\b/i||/\banges?\b/i||/\bcroire\b/i||/\beglises?\b/i||/\bcloches?\b/i||/\bciel\b/i)
        {
            print "Le theme de la religion est present dans le fichier.\n";
        }
        elsif($violence =~ /\bviole?\b/i||/\bsouffrir\b/i||/\bpoings?\b/i||/\bcoups?\b/i||/\bdrames?\b/i||/\blames?\b/i||/\bcanons?\b/i||/\btirer\b/i||/\bfureur\b/)
        {
            print "Le theme de la violence est present dans le fichier.\n";
        }
        elsif($tristesse =~ /\bpeine\b/i||/\bpleure?s?\b/i||/\btriste\b/i||/\blarmes?\b/i||/\bchagrins?\b/i||/\bsanglots?\b/i||/\bdrame\b/i)
        {
            print "Le theme de la tristesse est present dans le fichier.\n";
        }
        elsif($amour =~ /\bamours?eux?\b/i||/\baimer?ent?\b/i||/\bbaisers\b/i||/\b(mon|ton) autre\b/i||/\bcoeurs?\b/i||/\btendre\b/i||/\bcaresses?\b/i)
        {
            print "Le theme de l'amour est present dans le fichier.\n";
        }
        elsif($vie =~ /\bnaitre\b/i||/\bmourir\b/i||/\bmort\b/i||/\bvies?\b/i||/\bexister?\b/i||/\bla fin\b/i||/\ben cloque\b/i||/\bgrandir\b/i||/\bvivre\b/i||/\btemps\b/i)
        {
            print "Le theme de la vie est present dans le fichier.\n";
        }
        elsif($joie =~ /\bsourires?\b/i||/\brigoler?\b/i||/\brires?\b/i||/\bbonheur\b/i||/\bjoie\b/i)
        {
                print "Le theme de la joie est present dans le fichier.\n";
        }
        elsif($hiver =~ /\bnoel\b/i||/\bfroid\b/i||/\bmanteau blanc\b/i||/\bneige\b/i)
        {
            print "Le theme de l'hiver est present dans le fichier.\n";
        }
        else
        {
            print "Il n'y a pas d'autres themes reconnus dans ce fichier.\n";
        }
    }
    close (FICH_A);

merci de votre aide

édité par Elmoricq : ajout des balises [code] pour plus de lisibilité

Message édité par Elmoricq le 23-04-2009 à 13:58:27

couak

tu n'as pas besoin du while si tu n'as pas besoin de compter plus d'une occurence sur la ligne

lucie 25

et bien justement c'est plus ou moins le même problème que pour compter c'est-à-dire que si j'ai plusieurs mots-clés sur une même ligne, il n'en reconnaitra qu'un seul (le premier)...
et je voudrai éviter cela
merci

couak

normalement non si ta regex est bien construite
pour faire des OU logique il faut utiliser un seul pipe "|"
et au pire tu peux faire des boucles while au lieu de ton if

Publicité

lucie 25

ok
mais comment puis-je savoir si ma regex est bien construite?? je débute totalement...

gilou

Modosaurus Rex

Une solution parmi d'autres possibles, que j'ai pas mal commenté, puisque tu débutes.

Code :

#!/usr/bin/perl
use warnings;
use strict;
 
#Une liste de fichiers a lire, sous forme d'un array
my @fichiers = ("dossier_part01.txt" );
 
#les themes sous une forme plus facile a saisir:
#Un hash, avec pour cle le nom du theme et valeur un array anonyme
#contenant les mots a chercher pour le theme
my %themes = (
    "la religion"  => ["dieux?", "foi", "profanes?", "prieres?", "ames?",
                       "anges?", "croire", "eglises?", "cloches?", "ciel"],
    "la violence"  => ["viole?s?", "souffrir", "poings?", "coups?", "drames?",
                       "blames?", "canons?", "tirer", "fureurs?"],
    "la tristesse" => ["peines?", "pleure?s?", "tristes?", "larmes?", "chagrins?",
                       "sanglots?", "drames?"],
    "l'amour"      => ["amours?eux?", "aimer?ent?", "baisers?", "(mon|ton) autre", "coeurs?",
                       "tendres?", "caresses?"],
    "la vie"       => ["naitre", "mourir", "mort", "vies?", "exister?",
                       "la fin", "en cloque", "grandir", "vivre", "temps"],
    "la joie"      => ["sourires?", "rigoler?", "rires?", "bonheur", "joie"],
    "l'hiver"      => ["noel", "froid", "manteau blanc", "neige"],
    );
 
#je fabrique par programme un nouveau hash, qui va avoir les memes cles (les noms de themes),
#et pour valeur un array anonyme a deux elements, en premier, un flag initialise a zero
#et en second la chaine expression reguliere correspondant au theme
my %recherche;
foreach my $i (keys(%themes)) {
   $recherche{$i} = [0, make_regexp($themes{$i})];
}
 
#en entree, une reference sur un array anonyme de mots, on colle des \b autour des mots,
#puis des | entre, pour fabriquer l'expression reguliere.
sub make_regexp {
    my $liste_mot = shift;
    my $regexp = join '|', map {'\b'.$_.'\b'} @$liste_mot;
    return $regexp;
}
 
foreach my $fichier (@fichiers) {
    open(FICH_A, $fichier)
        || (print "Impossible d'ouvrir le fichier $fichier.\n" and next);
    while (<FICH_A> ) {
        foreach my $i (keys(%themes)) { #pour chaque expression reguliere
            unless ($recherche{$i}->[0]) { #si on n'a pas déja trouvé une ligne qui colle
                if (/$recherche{$i}->[1]/i) { #on cherche l'expression dans la ligne en cours du fichier
                    ++$recherche{$i}->[0]; #si trouvé, on positionne le flag
                }
            }
        }
    }
    close (FICH_A);
 
    my $found = 0; #un flag global qui va indiquer si au moins un theme a ete trouve
    foreach my $i (keys(%themes)) { #on boucle sur les themes
        if ($recherche{$i}->[0]) { #si le flag est mis
            print "Le theme de ", $i, " est present dans le fichier $fichier.\n";
            ++$found;
            #remise a zero du flag pour la recherche sur le fichier suivant.
            $recherche{$i}->[0] = 0;
        }
    }
    if ($found) {
        print "Il n'y a pas d'autres themes reconnus dans le fichier $fichier.\n";
    }
    else {
        print "Il n'y a pas de themes reconnus dans le fichier $fichier.\n";
    }
}
 
exit;

A+,

Message édité par gilou le 24-04-2009 à 04:11:07

lucie 25

je te remercie pour ton aide!! malheureusement, cela ne convient pas...
mon but est un peu complexe... mais merci quand même

gilou

Modosaurus Rex

Et si au lieu de nous dire que ça ne te convient pas, tu nous expliquais ce qui te conviendrait. Ou pourquoi cela ne te convient pas...
Ce serait peut être plus constructif.
A+,

lucie 25

Alors, pour faire simple, mon prof me demande de faire un projet me permettant d'extraire un thème de chaque texte présenté et de faire un résumé automatique de chacun de ces textes. Je me suis restreinte à 11 textes portant sur 5 thèmes.
J'ai donc écrit un script qui permet de faire demander en premier lieu sur quel texte on veut travailler et par la suite faire ouvrir le texte en question il s'agit de mon script principal.
Ensuite, j'ai écrit un sous programme permettant de faire reconnaître mes expressions régulières associées à chacun de mes thèmes. Cependant dans un même texte, plusieurs thèmes peuvent être présent, et j'ai tenté de mettre en place un compteur qui pourrait me permettre d'évaluer la fréquence d'expressions régulières la plus important et ainsi n'en ressortir qu'un seul thème (ce qui, au passage, n'a aboutit) avec un deuxième sous-dossier.
Et pour le moment je n'ai pas osé tenter le résumé automatique.
Voici mon programme :

Code :

#!/user/perl/bin
 
print "\n";
print "Entrez le numero du texte a analyser (de 1 a 11) : ";
chop($z = <STDIN> );
print "\n";
sub theme
{
    @a = @_;
    $cptA = 0;
    $cptB = 0;
    $cptC = 0;
    $cptD = 0;
    $cptE = 0;
    if($tsunami =~/\bdéferlante\b/i|/\bvagues?\b/i|/\braz-de-marée\b/i|/\btsunami\b/i|/\bcôtes?\b/i|/\bondes?\b/i)
    {
        $cptA = $cptA + 1;
        print "Le theme des tsunamis est present dans le fichier.\n";
    }
    elsif($seisme =~ /\bsecousses?\b/i|/\béchelle de msk\b/i|/\béchelle de richter\b/i|/\bépicentres?\b/i|/\bséismes?\b/i|/\bmagnitude\b/i|/\bhypocentres?\b/i|/\btremblement de terre\b/i|/\bfailles?\b/i|/\btectonique\b/i|/\bplaques?\b/i|/\bcollisions?\b/i)
    {
        $cptB = $cptB + 1;
        print "Le theme des seismes est present dans le fichier.\n";
    }
    elsif($volcan =~ /\béruptions?\b/i|/\bnuées? ardentes?\b/i|/\bcendres?\b/i|/\bvolcans?\b/i|/\bmagma\b/i|/\btendre\b/i|/\bfumées?\b/i|/\bpoussières?\b/i|/\blave\b/i|/\bcoulées\b/i|/\bvolcanique\b/i)
    {
        $cptC = $cptC + 1;
        print "Le theme des volcans est present dans le fichier.\n";
    }
    elsif($cyclone =~ /\bcyclones?\b/i|/\bdépression\b/i|/\bouragans?\b/i|/\btyphons?\b/i|/\bpluies torrentielles\b/i|/\bvents violents\b/i|/\bfortes inondations\b/i|/\bnuages?\b/i)
    {
        $cptD = $cptD + 1;
        print "Le theme des cyclones est present dans le fichier.\n";
    }
    elsif($inondation =~ /\binondations?\b/i|/\bcrues?\b/i|/\bsubmergé?e?s?a?n?t?\b/i|/\bdébordements?\b/i|/\béchelle hydrométrique\b/i|/\bmontée des eaux\b/i)
    {
        $cptE = $cptE + 1;
        print "Le theme des inondations est present dans le fichier.\n";
    }
    else
    {
        print "Il n'y a pas d'autres themes reconnus dans ce fichier.\n";
    }
}
 
sub theme02
{
    if($cptA > $cptB & $cptA > $cptC & $cptA > $cptD & $cptA > $cptE)
    {
        print "Le texte parle de tsunami.\n";
    }
    elsif($cptB > $cptA & $cptB > $cptC & $cptB > $cptD & $cptB > $cptE)
    {
        print "Le texte parle de seisme.\n";
    }
    elsif($cptC > $cptA & $cptC > $cptB & $cptC > $cptD & $cptC > $cptE)
    {
        print "Le texte parle d'eruption volcanique.\n";
    }
    elsif($cptD > $cptA & $cptD > $cptB & $cptD > $cptC & $cptD > $cptE)
    {
        print "Le texte parle de cyclone.\n";
    }
    elsif($cptE > $cptA & $cptE > $cptB & $cptE > $cptC & $cptE > $cptD)
    {
        print "Le texte parle d'inondation.\n";
    }
    else
    {
        print "Il n'y a pas de theme traité ici.\n";
    }
}
 
if($z == 1)
{
    open(FICH01,"texte01.txt" ) || die "Impossible d'ouvrir le fichier.";
    while(<FICH01> )
    {
        theme;
    }
    close (FICH01);
    
}
elsif($z == 2)
{
    open(FICH02,"texte02.txt" ) || die "Impossible d'ouvrir le fichier.";
    while(<FICH02> )
    {
        theme;
    }
    close (FICH02);
}
elsif($z == 3)
{
    open(FICH03,"texte03.txt" ) || die "Impossible d'ouvrir le fichier.";
    while(<FICH03> )
    {
        theme;
    }
    close (FICH03);
}
elsif($z == 4)
{
    open(FICH04,"texte04.txt" ) || die "Impossible d'ouvrir le fichier.";
    while(<FICH04> )
    {
        
        theme;
    }
    close (FICH04);
}
elsif($z == 5)
{
    open(FICH05,"texte05.txt" ) || die "Impossible d'ouvrir le fichier.";
    while(<FICH05> )
    {
        theme;
    }
    close (FICH05);
}
elsif($z == 6)
{
    open(FICH06,"texte06.txt" ) || die "Impossible d'ouvrir le fichier.";
    while(<FICH06> )
    {
        theme;
    }
    close (FICH06);
}
elsif($z == 7)
{
    open(FICH07,"texte07.txt" ) || die "Impossible d'ouvrir le fichier.";
    while(<FICH07> )
    {
        theme;
    }
    close (FICH07);
}
elsif($z == 8)
{
    open(FICH08,"texte08.txt" ) || die "Impossible d'ouvrir le fichier.";
    while(<FICH08> )
    {
        theme;
    }
    close (FICH08);
}
elsif($z == 9)
{
    open(FICH09,"texte09.txt" ) || die "Impossible d'ouvrir le fichier.";
    while(<FICH09> )
    {
        theme;
    }
    close (FICH09);
}
elsif($z == 10)
{
    open(FICH10,"texte10.txt" ) || die "Impossible d'ouvrir le fichier.";
    while(<FICH18> )
    {
        theme;
    }
    close (FICH10);
}
elsif($z == 11)
{
    open(FICH11,"texte11.txt" ) || die "Impossible d'ouvrir le fichier.";
    while(<FICH11> )
    {
        theme;
    }
    close (FICH11);
}
else
{
    print "Vous n'avez pas selectionne un nombre compris entre 1 et 22!\n";
}

Le second sous programme n'est pas mis pour être effectué car je ne veux pas qu'il tourne en boucle en l'incluant dans la boucle while, cependant ailleurs il ne fonctionne pas du tout...
Je pense que je me suis compliqué les choses mais je ne vois malheureusement pas comment me simplifier...
merci quand même

Message édité par gilou le 06-05-2009 à 16:20:04

gilou

Modosaurus Rex

Bon, déja, on peut simplifier tout ce qui se passe en dehors de la routine theme:

Code :

#!/usr/bin/perl
 
use warnings;
use strict;
 
# le programme principal
my $numero = numero_texte(); #on recupere le numero, ou bien on quitte le programme
my $filename = sprintf("texte%02d.txt", $numero); #on fabrique le nom du fichier
open(FICHIER, "<", $filename) || die "Impossible d'ouvrir le fichier $filename";
while(<FICHIER> )
{
    theme();
}
close(FICHIER);
 
# les subroutines
 
# recupere le numero, ou bien on quitte le programme
# appel: numero_texte()
# retour: le numero (si on n'a pas quitte le programme)
sub numero_texte {
    my $numero;
    while (1) { # boucle infinie
        print STDOUT "Entrez le numero du texte a analyser (de 1 a 11): ";
        if (valider_entree("0*([1-9]||1[0-1])", \$numero)) {
            return $numero;
        } else {
            print STDOUT "Le numero entre n'est pas valide.\n";
            print STDOUT "Voulez vous recommencer? ";
            unless (valider_simple("O(ui)?" )) {
                exit;
            }
        }
    }
}
 
# valide l'entree utilisateur par rapport a un pattern
# et recupere la valeur validee
# appel: valider_entree($pattern, \$entree)
# retour: 0 si entree non validee, 1 si validee, et en ce cas
# $entree contient la valeur validee
sub valider_entree { 
    my $pattern = shift;
    my $entree  = shift;
    $| = 1;
    my $reponse = <STDIN>;
    clean($reponse);
    $$entree = $reponse;
    return ($reponse && $reponse =~ /^$pattern$/i);
}
 
# valide l'entree utilisateur par rapport a un pattern
# appel: valider_entree($pattern)
# retour: 0 si entree non validee, 1 si validee
sub valider_simple {
    my $pattern = shift;
    $| = 1;
    my $reponse = <STDIN>;
    clean($reponse);
    return ($reponse && $reponse =~ /^$pattern$/i);
}
 
sub clean {
    $_[0]=~ s/^\s+//;
    $_[0]=~ s/\s+$//;
}
 
sub theme {
    # a implementer
}

En particulier, quand on a des routines avec une entrée utilisateur, mieux vaut les traiter a part, afin de boucler tant que l'entrée n'est pas correcte, etc.
Plutôt que de coder en dur 11 cas différents pour vos noms de fichier, il était plus simple de construire le nom du fichier à partir du numéro et d'utiliser un code commun.

A+,

gilou

Modosaurus Rex

Bon, j'ai regardé la suite du pb.
Voici un exemple que tu peux adapter en fonction de tes besoins. J'ai gardé les thèmes de la précédente fois.

Code :

#!/usr/bin/perl
 
use warnings;
use strict;
 
#les themes sous une forme plus facile a saisir:
# Un hash, avec pour cle le nom du theme et valeur un array anonyme
# contenant les mots a chercher pour le theme
my %themes = (
    "la religion"  => ["dieux?", "foi", "profanes?", "prieres?", "ames?",
                       "anges?", "croire", "eglises?", "cloches?", "ciel"],
    "la violence"  => ["viole?s?", "souffrir", "poings?", "coups?", "drames?",
                       "blames?", "canons?", "tirer", "fureurs?"],
    "la tristesse" => ["peines?", "pleure?s?", "tristes?", "larmes?", "chagrins?",
                       "sanglots?", "drames?"],
    "l'amour"      => ["amours?(eux)?", "aimer?(ent)?", "baisers?", "(mon|ton) autre", "coeurs?",
                       "tendres?", "caresses?"],
    "la vie"       => ["naitre", "mourir", "mort", "vies?", "exister?",
                       "la fin", "en cloque", "grandir", "vivre", "temps"],
    "la joie"      => ["sourires?", "rigoler?", "rires?", "bonheur", "joie"],
    "l'hiver"      => ["noel", "froid", "manteau blanc", "neige"],
    );
 
# je fabrique par programme un nouveau hash, qui va avoir les memes cles (les noms de themes),
# et pour valeur un array anonyme a trois elements, en premier, un compteur du nombre d'occurences
# en second un compteur de lignes ou le theme apparait
# et en troisieme la chaine expression reguliere correspondant au theme
my %recherche;
foreach my $i (keys(%themes)) {
   $recherche{$i} = [0, 0, make_regexp($themes{$i})];
}
 
 
# le programme principal
my $numero = numero_texte(); #on recupere le numero, ou bien on quitte le programme
my $filename = sprintf("texte%02d.txt", $numero);
open(FICHIER, "<", $filename) || die "Impossible d'ouvrir le fichier $filename";
while (<FICHIER> ) {
    foreach my $i (keys(%themes)) { #pour chaque expression reguliere
        #on cherche l'expression dans la ligne en cours du fichier
        if (/$recherche{$i}->[2]/i) {
            ++$recherche{$i}->[1]; # et on incremente le compteur de lignes ou il y a occurence
            while (/$recherche{$i}->[2]/gi)
                {
                    ++$recherche{$i}->[0]; # et on incremente le compteur d'occurence
                }
        }
    }
}
close(FICHIER);
 
my $found = 0; #un flag global qui va indiquer si au moins un theme a ete trouve
foreach my $i (keys_by_occurences(\%themes)) { #on boucle sur les themes
    if ($recherche{$i}->[0]) { #si le compteur n'et pas à zero
        if ($recherche{$i}->[1] > 1) {
            print "Le theme de ", $i, " est present $recherche{$i}->[0] fois ",
                "dans $recherche{$i}->[1] lignes du fichier $filename.\n";
        }
        else {
            print "Le theme de ", $i, " est present $recherche{$i}->[0] fois ",
                "dans 1 ligne du fichier $filename.\n";
        }
        ++$found;
    }
}
if ($found) {
    print "Il n'y a pas d'autres themes reconnus dans le fichier $filename.\n";
}
else {
    print "Il n'y a pas de themes reconnus dans le fichier $filename.\n";
}
 
exit;
 
# les subroutines
 
# recupere le numero, ou bien on quitte le programme
# appel: numero_texte()
# retour: le numero (si on n'a pas quitte le programme)
sub numero_texte {
    my $numero;
    while (1) { # boucle infinie
        print STDOUT "Entrez le numero du texte a analyser (de 1 a 11): ";
        if (valider_entree("0*([1-9]||1[0-1])", \$numero)) {
            return $numero;
        } else {
            print STDOUT "Le numero entre n'est pas valide.\n",
                "Voulez vous recommencer? ";
            exit unless (valider_simple("O(ui)?" ));
        }
    }
}
 
# valide l'entree utilisateur par rapport a un pattern
# et recupere la valeur validee
# appel: valider_entree($pattern, \$entree)
# retour: 0 si entree non validee, 1 si validee, et en ce cas
# $entree contient la valeur validee
sub valider_entree { 
    my $pattern = shift;
    my $entree  = shift;
    $| = 1;
    my $reponse = <STDIN>;
    clean($reponse);
    $$entree = $reponse;
    return ($reponse && $reponse =~ /^$pattern$/i);
}
 
# valide l'entree utilisateur par rapport a un pattern
# appel: valider_entree($pattern)
# retour: 0 si entree non validee, 1 si validee
sub valider_simple {
    my $pattern = shift;
    $| = 1;
    my $reponse = <STDIN>;
    clean($reponse);
    return ($reponse && $reponse =~ /^$pattern$/i);
}
 
sub clean {
    $_[0]=~ s/^\s+//;
    $_[0]=~ s/\s+$//;
}
 
#en entree, une reference sur un array anonyme de mots, on colle des \b autour des mots,
#puis des | entre, pour fabriquer l'expression reguliere.
sub make_regexp {
    my $liste_mot = shift;
    my $regexp = join '|', map {'\b'.$_.'\b'} @$liste_mot;
    return $regexp;
}
 
# en sortie, les cles de %themes ordonnées en fonction du compteur d'occurence du theme
# lequel est le premier champ de recherche et en cas d'égalité du nombre d'occurences
# en fonction du nombre de lignes ou il y a occurences
# voir mon topic sur les astuces en perl pour en comprendre le fonctionnement
sub keys_by_occurences {
    my $array = shift;
    return map $_->[0],
        sort {
            $b->[1] <=> $a->[1]
            or
            $b->[2] <=> $a->[2]
        }
            map [$_, $recherche{$_}->[0], $recherche{$_}->[1]], keys(%$array);
}

A+,

Message édité par gilou le 06-05-2009 à 23:18:10

lucie 25

merci beaucoup, je vais essayer de me faire avec tout ça (bien que par moment je ne comprenne pas tout...)
encore merci
à plus

FORUM HardWare.fr

Programmation

Perl

reconnaissance de plusieurs mots sur une même ligne

Sujets relatifs
[Réglé](Regex) Récupération d'une chaîne située entre deux mots	Recuperer ligne de fichier dans variables séparées
Supprimer plusieurs lignes dans une sélection	ne conserver que la dernière ligne d' un fichier texte
Plusieurs comptes à rebours sur la même page html	Script Performant de Densité de mots clefs
Densité des mots clefs & Occurences	OCR (reconnaissance texte dans image) + coordonnées X, Y
[Résolu] Edit mono-ligne avec retour à la ligne ?	tri de plusieurs tableau
Plus de sujets relatifs à : reconnaissance de plusieurs mots sur une même ligne

Page générée en 0.206 secondes