Forum |  HardWare.fr | News | Articles | PC | S'identifier | S'inscrire | Shop Recherche
1395 connectés 

  FORUM HardWare.fr
  Programmation
  Perl

  perl et balisage: un algo? (xml inside)

 


 Mot :   Pseudo :  
 
Bas de page
Auteur Sujet :

perl et balisage: un algo? (xml inside)

n°558705
stphanie
Posté le 04-11-2003 à 15:21:50  profilanswer
 

Bonjour,
Je n'arrive pas à mettre au point un algo efficace pour traiter le problème suivant:  
j'ai trois fichiers d'entrée présentant un même texte balisé de façons différentes
ex:
premier fichier : mot à mot
<w id="word_0">Les</w>
<w id="word_1">Misérables</w>
 
deuxième fichier: phrase par phrase
<s>Les Misérables</s>
<s>Un roman de Victor Hugo</s>
 
troisième fichier: balisage structurel:
<text><body><div><head>Les Misérables</head><p>Un roman de Victor Hugo</p>
 
Ajoutons que le fichier mot-à-mot n'a pas exactement les mêmes mots que les autres fichiers  
(ex: <w id="word_12">de</w>  
<w id="word_13">le</w>
à la place de "du" )
et que les balises peuvent s'imbriquer. ex <div><div></div><div></div></div>
 
 
Mon but est de synchroniser les trois fichiers pour en obtenir un quatrième avec des pointeurs sur les identifiants de mot, qui en gros ferait ça
<text span=word_0..word_12000>
<body span=word_0..word 10000>  
<head id=head_0 span=word_0..word_1>
<s id=s_0 span=word_0..word_1>
par exemple
 
Je suppose que le mieux consiste à repérer les balises ouvrantes et à les pusher dans une pile pour les poper lorsqu'on rencontre la balise fermante correspondante, mais je n'arrive pas à mettre au point un algo me permettanr de faire ça tout en synchronisant les fichiers, c'est à dire en générant les bons pointeurs (span)  sur les mots.  
 
Si vous avez une idée à me soumettre, je vous en serai très reconnaissante :jap:


Message édité par stphanie le 04-11-2003 à 16:36:28
mood
Publicité
Posté le 04-11-2003 à 15:21:50  profilanswer
 

n°558864
nraynaud
lol
Posté le 04-11-2003 à 17:54:54  profilanswer
 

fait 2 phases : une phase où tu lis les 3 fichiers et mets les arbres syntaxiques en mémoire et une phase où tu synchronises les arbres syntaxiques.


---------------
trainoo.com, c'est fini

Aller à :
Ajouter une réponse
  FORUM HardWare.fr
  Programmation
  Perl

  perl et balisage: un algo? (xml inside)

 

Sujets relatifs
[perl] timerIE refuse d'afficher une image [super mysterieux inside]
[PHP] Algo : trouver les éléments pas commun à deux tableaux[PERL] Regular expression
IDE ou editeur special PERL[Algo] Séparer les mesures erronées et les tricheurs...
[Algo/PHP] Cassage de tête...gestion des perte d'unité(jeu en ligne)[PERL LDAP] Ajout d'un user dans un group
[algo] problème d'inclusion de boucle[LDAP] Création d'usager Java ou Perl?
Plus de sujets relatifs à : perl et balisage: un algo? (xml inside)


Copyright © 1997-2022 Hardware.fr SARL (Signaler un contenu illicite / Données personnelles) / Groupe LDLC / Shop HFR