Perl

segmentation core dumped

Recherche :

Mot : Pseudo : Filtrer
Bas de page
Auteur	Sujet : segmentation core dumped

mouda

Pour un script perl permettant de segmenter une texte en mot , pour un fichier de taille 1,1 Go , j'ai obtenu l'erreur suivante :
panic: POPSTACK
Erreur de segmentation (core dumped)

le code est le suivant :

Code :

#Script de Segmentation de corpus en mots 
 
use strict;
use utf8;
use autodie;
 
use constant ARABIC_TEXT => '/home/lenovo/Bureau/MesTravaux/ARABICTEXT.txt';
use constant FICHIER_RESULAT   => '/home/lenovo/Bureau/MesTravaux/ARABICTEXT_2.txt';
 
 
open my $fh1, "<:utf8", ARABIC_TEXT;
open my $fh_resultat, '>:utf8', FICHIER_RESULAT;
 
my @tab = <$fh1>;
my $size = $#tab+1; 
 
for (my $i = 0; $i < $size; $i++)
{
    chomp();
    chomp($tab[$i]);
 
    my @words = split(/ /, $tab[$i]);
    chomp();
    foreach my $val ( @words ) 
    {
        chomp();
        chomp($val);
        print $fh_resultat "$val\n"; chomp($val);
    }
    
}
    
close $fh1;
close $fh_resultat;
 
 comment je peux résoudre  ce type de problème ??

Publicité

rat de combat

attention rongeur méchant!

Citation :

comment je peux résoudre ce type de problème ??

Peut-être en essayant pas de lire tout le fichier d'un coup (ce que my @tab = <$fh1>; fait) mais en faisant la lecture et le traitement ligne par ligne?

D'ailleurs tout tes chomp() à part celui de la ligne 20 ne servent à rien.

rat de combat

attention rongeur méchant!

Même si j'ai l'impression que le forum (ou disons gilou) fait ton boulot...

CODE SANS GARANTIE etc!

De mémoire toutes les versions de Perl à peu près modernes font du Unicode par défault, je pense qu'il est inutile de spécifier utf8 mais je ne suis pas sûr. gilou?

Code :

use strict;
use warnings; #<--!!!!!!!!!!!!! OBLIGATOIRE pour un débutant
use utf8;
use autodie;
use constant ARABIC_TEXT => 't1.txt';
use constant FICHIER_RESULAT => 'ARABICTEXT_2.txt';
open my $fh1, "<:utf8", ARABIC_TEXT;
open my $fh_resultat, '>:utf8', FICHIER_RESULAT;
my $mot;
while(($mot=<$fh1> ))
{
chomp($mot);
print $fh_resultat join("\n", split(/ +/, $mot)),"\n";
}
close $fh1;
close $fh_resultat;

mouda

D'abord Merci pour la réponse !!!!
Même si j'ai l'impression que le forum (ou disons gilou) fait ton boulot...
je poste mes problèmes et gilou ,comme étant expert en perl, m'aide à les résoudre .. comme les autres font je pense.. ceci est l'objectif du forum non ??

Message cité 1 fois
Message édité par mouda le 31-03-2017 à 19:26:04

rat de combat

attention rongeur méchant!

mouda a écrit :

je poste mes problèmes et gilou ,comme étant expert en perl, m'aide à les résoudre .. comme les autres font je pense.. ceci est l'objectif du forum non ??

C'est que - à mon avis - tu postes beaucoup de problèmes et des choses (très) simples qui prouvent que tu devrais faire un effort pour améliorer ton niveau de Perl ou simplement utiliser un moteur de recherche plutôt que de venir poster pour chaque petit truc. M'enfin bon, inutile de passer 3h à discuter là-dessus, chacun est libre de te répondre ou pas finalement...

mouda

soit sure que poster est la dernière solution, je sais qu'il existe des moteurs de recherche ... peut etre pour toi se sont des petites trucs...
Dans tous les cas tu peux faire un vue et tu passes, tu n'est pas obligé à me répondre si mes problèmes te dérange..

Message édité par mouda le 31-03-2017 à 19:54:03

gilou

Modérateur
Modosaurus Rex

Si tu enlèves tous les chomp(); ça fait encore coredump?

De toute façon ca pouvait se réécrire

Code :

use strict;
    use warnings;
    use autodie;
     
    my $file1 = '/home/lenovo/Bureau/MesTravaux/ARABICTEXT.txt';
    my $file2 = '/home/lenovo/Bureau/MesTravaux/ARABICTEXT_2.txt';
     
     
    open my $fh1, "<", $file1;
    open my $fh_resultat, '>', $file2;
     
    my @tab = <$fh1>; 
    foreach (@tab) {
        chomp();
        my @words = split(/\s+/, $_);
        foreach (@words ) {
            chomp();
            print $fh_resultat "$_\n";
        }
    }
        
    close $fh1;
    close $fh_resultat;

A+,

Message édité par gilou le 31-03-2017 à 21:19:04

---------------
There's more than what can be linked! -- Le capitaine qui ne veut pas obéir à la carte finira par obéir aux récifs. -- No jab ? No job ! -- (╯°□°)╯︵ ┻━┻

rat de combat

attention rongeur méchant!

gilou, quel est l'intérêt du chomp() ligne 17 dans ton code? Il ne peut pas y avoir de \n à la fin d'un mot non?
Bonne idée le /\s+/ (et non / +/) pour split, j'ai pas fait gaffe.

gilou

Modérateur
Modosaurus Rex

Oui, tu as raison ça fait un chomp de trop.
Je peux aussi faire ca sans chomps... :whistle:

Code :

use strict;
    use warnings;
    use autodie;
     
    my $file1 = '/home/lenovo/Bureau/MesTravaux/ARABICTEXT.txt';
    my $file2 = '/home/lenovo/Bureau/MesTravaux/ARABICTEXT_2.txt';
     
     
    open my $fh1, "<", $file1;
    open my $fh_resultat, '>', $file2;
 
    print $fh_resultat join("\n", (split(/\s+/, $_))), "\n"  while (<$fh1> );
 
    close $fh1;
    close $fh_resultat;

A+,

Message cité 1 fois
Message édité par gilou le 31-03-2017 à 22:53:23

---------------
There's more than what can be linked! -- Le capitaine qui ne veut pas obéir à la carte finira par obéir aux récifs. -- No jab ? No job ! -- (╯°□°)╯︵ ┻━┻

mouda

le problème existe toujours, merci pour vos réponses .. je vais réfléchir et chercher encore.

Publicité

mouda

le problème existe toujours, merci pour vos réponses .. je vais réfléchir et chercher encore.

gilou

Modérateur
Modosaurus Rex

Euh chez moi ça marche (mon dernier post) avec un fichier de lignes de mots arabes (un de tes exemples d'une autre fois)

A+,

Message cité 1 fois

---------------
There's more than what can be linked! -- Le capitaine qui ne veut pas obéir à la carte finira par obéir aux récifs. -- No jab ? No job ! -- (╯°□°)╯︵ ┻━┻

mouda

gilou a écrit :

Euh chez moi ça marche (mon dernier post) avec un fichier de lignes de mots arabes (un de tes exemples d'une autre fois)

A+,

le pblme est du à la grande taille du fichier si nn sur un fichier de petite taille ça marche correctement

gilou

Modérateur
Modosaurus Rex

Ce pourquoi j'ai fait une lecture ligne a ligne avec un while.

A+,

---------------
There's more than what can be linked! -- Le capitaine qui ne veut pas obéir à la carte finira par obéir aux récifs. -- No jab ? No job ! -- (╯°□°)╯︵ ┻━┻

mouda

j'ai déjà testé mais le problème n'est pas résolu, il faut faire un break into chunks et traiter chaque chunk .. ceci permet de résoudre le pblme de memoire

Message cité 1 fois

rat de combat

attention rongeur méchant!

gilou a écrit :

Oui, tu as raison ça fait un chomp de trop.
Je peux aussi faire ca sans chomps... :whistle:

Code :

use strict;
    use warnings;
    use autodie;
     
    my $file1 = '/home/lenovo/Bureau/MesTravaux/ARABICTEXT.txt';
    my $file2 = '/home/lenovo/Bureau/MesTravaux/ARABICTEXT_2.txt';
     
     
    open my $fh1, "<", $file1;
    open my $fh_resultat, '>', $file2;
 
    print $fh_resultat join("\n", (split(/\s+/, $_))), "\n"  while (<$fh1> );
 
    close $fh1;
    close $fh_resultat;

A+,

Ca c'est intéressant, il n'y a pas besoin de chomp() effectivement dans ce code puisque split(/\s+/, ...) l'enlève c'est bien ça? Je vois aussi que tu as viré les :utf8 pour open, j'avais donc raison que c'est le cas/comportement par défaut?

edit: perl -pne "s/\s+/\n/g;" <ARABICTEXT.txt >ARABICTEXT_2.txt

mouda a écrit :

j'ai déjà testé mais le problème n'est pas résolu, il faut faire un break into chunks et traiter chaque chunk .. ceci permet de résoudre le pblme de memoire

C'est quoi un chunk? J'ai pas testé faute d'un fichier adéquat mais en principe Perl c'est LE language pour faire du traitement de texte et il n'y a pas de limites de taille, en tout cas pas un truc ridicule comme 1,1 Go... (sachant que pour un fichier texte c'est énorme mais pour un fichier tout court non) Tu es sûr que ton problème ne vient pas d'ailleurs? C'est quoi ton code complet?

Message édité par rat de combat le 01-04-2017 à 00:07:40

gilou

Modérateur
Modosaurus Rex

Hier j'avais un document xml qui une fois sérialisé faisait 76Mo, en mémoire, donc plusieurs fois plus gros, manipulé en perl avec LibXML, sans pb.

A+,

Message édité par gilou le 01-04-2017 à 01:17:12

---------------
There's more than what can be linked! -- Le capitaine qui ne veut pas obéir à la carte finira par obéir aux récifs. -- No jab ? No job ! -- (╯°□°)╯︵ ┻━┻

rat de combat

attention rongeur méchant!

@gilou:

Citation :

un fichier de taille 1,1 Go

(à moins que ce soit une faute de frappe?)

gilou

Modérateur
Modosaurus Rex

Je le pense aussi, parce que la, 96Mo, c'est la taille d'une grosse encyclo juridique avec pas mal de volumes.
A+,

---------------
There's more than what can be linked! -- Le capitaine qui ne veut pas obéir à la carte finira par obéir aux récifs. -- No jab ? No job ! -- (╯°□°)╯︵ ┻━┻

mouda

ce n'est pas une faute de frappe c'est 1,1 Go (1 054 608 425 octets) (un fichier texte), je pense que c'est un pblme du taille parce que le code marche très bien pour un fichier de petite taille.

gilou

Modérateur
Modosaurus Rex

S'il y a toujours cela dans votre code: my @tab = <$fh1>;
c'est sur que ca posera probleme pour une grande taille.
Mais comme il y a aucune raison de transformer un fichier en array...

A+,

---------------
There's more than what can be linked! -- Le capitaine qui ne veut pas obéir à la carte finira par obéir aux récifs. -- No jab ? No job ! -- (╯°□°)╯︵ ┻━┻

Publicité

FORUM HardWare.fr

Programmation

Perl

segmentation core dumped

Sujets relatifs
ERREUR SEGMENTATION CORE DUMPED	Furmulaire php dans un core html/css
erreur de segmentation sur matrice	Core.
Core dumped en C	Problème core dumped sur pointeur de char
[ C ] Erreur de segmentation (core dumped)
Plus de sujets relatifs à : segmentation core dumped

Page générée en 0.180 secondes