Perl

[Perl] Arrêt traitement si doublons dans champ d'un fichier

Recherche :

Mot : Pseudo : Filtrer
Bas de page
Auteur	Sujet : [Perl] Arrêt traitement si doublons dans champ d'un fichier

web_olivier

R1 Powaaaaa

Bonjour,

Je m'arrache les cheveux sur mon problème.

J'ai bien essayé d'adapter la solution du topic : http://forum.hardware.fr/hfr/Progr [...] 5185_1.htm mais je n'y arrive pas.

Voila mon problème.

J'ai un fichier sous la forme :

cmd1 param1 valeur1
cmd2 param2 valeur2
...

Les champs cmd et valeur peuvent être identique mais pas le champ param qui doit être unique.

Avant de faire mon traitement je veux donc analyser mon fichier pour contrôler que je n'ai pas deux fois la même valeur dans le champ param.
Si c'est le cas il faut que j'arrêt la.

Par exemple si mon fichier est le suivant :

cmd1 param1 valeur1
cmd2 param2 valeur2
cmd3 param1 valeur3
cmd1 param3 valeur4
cmd2 param2 valeur5
cmd4 param4 valeur6
cmd5 param2 valeur7

Je dois sortir en précisant que le param1 a été trouvé 2 fois et que le param2 à été trouvé 3 fois.

Voila ce que j'ai essayé de faire :

Code :

open(F, 'cmd.txt') || die "Problème à l\'ouverture : $!";
my $num_cmd = 0;
while(<F> )
{
push @cmd,$_;
$num_cmd ++;
}
close F || die "Problème à la fermeture : $!";
########################################################
# compte le nombre de fois ou le paramètre est présent #
########################################################
my %myhash;
my @parsed;
my $arret=0;
my $h=0;
foreach (@cmd)
{
@parsed = split /\s*\ \s*/, $_;
$myhash{$parsed[1]}++;
}
foreach (sort {$myhash{$b} <=> $myhash{$a}} (keys(%myhash)))
{
m/([^.]+)\.(.*)/;
if ($myhash{$_} != 1)
{
print LOG "Une action sur $2 est present $myhash{$_} fois\n";
$arret=1;
}
}
####################################################
# arrêt si le paramètre est présent plusieurs fois #
####################################################
if ($arret == 1)
{
print LOG "ARRET de l'update\n";
print "Probleme UPDATE non fait, voir la log\n";
exit;
}

Ca fonctionne sauf que j'ai le message suivant :
Use of uninitialized value in concatenation (.) or string at E:\Outils\update\maj.pl line 114.
Use of uninitialized value in concatenation (.) or string at E:\Outils\update\maj.pl line 114.
Probleme UPDATE non fait, voir la log

Et dans mon fichier de LOG :

Une action sur est present 2 fois
Une action sur est present 3 fois
ARRET de l'update

Merci de votre aide :jap:

Publicité

gilou

Modosaurus Rex

Donc un truc dans ce gout ci:

Code :

#!/usr/bin/env perl
use strict;
use warnings;
use autodie;
 
my %params;
 
open(my $fh, '<', 'cmd.txt');
while (<$fh> ) {
    $params{$1}++ if (/^\s*(?:\S+)\s+(\S+)\s+(?:\S+)\s*$/);
}
close($fh);
 
# classement par nb de fois
foreach (sort {$params{$b} <=> $params{$a}} (keys(%params))) {
    if ($params{$_} > 1) {
    print "le $_ a ete trouve $params{$_} fois\n";
    }
}

Et pour classer par nom de param, il suffit de virer le {$params{$b} <=> $params{$a}} devant sort.

Et pour une version bien organisee permettant une sortie sans passer par un appel a exit:

Code :

#!/usr/bin/env perl
use strict;
use warnings;
use autodie;
 
my %params;
 
open(my $fh, '<', 'cmd.txt');
while (<$fh> ) {
    $params{$1}++ if (/^\s*(?:\S+)\s+(\S+)\s+(?:\S+)\s*$/);
}
close($fh);
 
foreach (keys(%params)) {
    delete $params{$_} if ($params{$_} < 2);
}
 
if (%params) {
    # classement par nb de fois
    foreach (sort {$params{$b} <=> $params{$a}} (keys(%params))){
        print "le $_ a ete trouve $params{$_} fois\n";
    }
    # message de fin de traitement, en erreur
}
else {
    # proceder au traitement
}

A+,

Message édité par gilou le 03-02-2017 à 00:38:07

---------------
There's more than what can be linked! -- Le capitaine qui ne veut pas obéir à la carte finira par obéir aux récifs. -- Les paroles s'envolent, les APIs REST -- Hacker vaillant rien d'impossible -- (╯°□°)╯︵ ┻━┻

web_olivier

R1 Powaaaaa

Bonjour,

Merci beaucoup Gilou ça fonctionne très bien. :bounce:

J'ai juste oublié de préciser une petite chose, mais elle est importante.
Il n'y a pas forcément de champ valeur et dans ce cas ça ne fonctionne plus.

J'essaie de comprendre ce que tu as fais, mais je ne trouve pas la solution si le champ valeur est absent.

:jap:

gilou

Modosaurus Rex

Bonjour, s'il n'y a pas de champ valeur, ça simplifie les choses:
/^\s*\S+\s+(\S+)/
On ne parse plus que les deux champs obligatoires en début de ligne.
(bon, on pouvait déjà aussi faire comme ça avant, parser la ligne complète permettait juste de s'assurer qu'on ne parsait que les lignes a trois champs obligatoires).

A+,

Message édité par gilou le 04-02-2017 à 11:44:10

web_olivier

R1 Powaaaaa

Bonjour,

Encore une fois un grand merci Gilou ça fonctionne parfaitement.
Si je peux me permettre peux tu m'expliquer la regex /^\s*\S+\s+(\S+)/ ?

:jap:

h3bus

Troll Inside

Tu peux utiliser ce site pour tester/expliquer des regexp, c'est très pratique.
https://regex101.com/

---------------
sheep++

web_olivier

R1 Powaaaaa

:jap:

gilou

Modosaurus Rex

/
^ Debut de ligne suivi de
\s* Blancs (SPACE ou TAB) optionnels en debut de ligne suivis de
\S+ un ou plusieurs caracteres differents de space et TAB (\S c'est le contraire de \s)
\s+ un ou plusieurs blancs
(\S+) un ou plusieurs caracteres differents de space et TAB copies dans groupe (donc $1)
/
Comme on est en mode greedy (on matche le plus grand nombre de caractères possibles), on sait que (\S+) va capturer tous les caractères jusqu’à ce qu'il rencontre un SPACE, TAB ou la fin de la ligne.

A+,

Message édité par gilou le 06-02-2017 à 17:40:06

web_olivier

R1 Powaaaaa

Milles Merci.

:jap:

Maintenant je dois faire la même chose en java
J'ouvre un autre Topic :bounce:

FORUM HardWare.fr

Programmation

Perl

[Perl] Arrêt traitement si doublons dans champ d'un fichier

Sujets relatifs
problème sur fichier launch.bat	Eliminer les doublons (résolu)
transformer un fichier texte en XML	recherche d'un mot dans un fichier
bon fichier	vba-copier des colonnes d'un fichier xls vers un autre fichier xls
Splitter (découper) un fichier CSV	Supprimez le fichier image uploded utilisant le code d'ajax
Choix de configurations a l'ouverture d'un fichier Excel	Lire ou Télécharger un fichier sur un FTP
Plus de sujets relatifs à : [Perl] Arrêt traitement si doublons dans champ d'un fichier

Page générée en 0.093 secondes