Forum |  HardWare.fr | News | Articles | PC | S'identifier | S'inscrire | Shop Recherche
3109 connectés 

 


Dernière réponse
Sujet : [Algorithme][PERL] Trie, recherche sur des fichiers
stef_dobermann c ce que j'ai fait sauf que mettre tous en memoire, c pas ce que j'ai fait, je lit les lignes les une aprés les autres dans 1 fichiers, et je recherche cette ligne dans un autre fichier...
 
ca marche plus ou moins mais bon
Merci quand meme :D

Votre réponse
Nom d'utilisateur    Pour poster, vous devez être inscrit sur ce forum .... si ce n'est pas le cas, cliquez ici !
Le ton de votre message                        
                       
Votre réponse


[b][i][u][strike][spoiler][fixed][cpp][url][email][img][*]   
 
   [quote]
 

Options

 
Vous avez perdu votre mot de passe ?


Vue Rapide de la discussion
stef_dobermann c ce que j'ai fait sauf que mettre tous en memoire, c pas ce que j'ai fait, je lit les lignes les une aprés les autres dans 1 fichiers, et je recherche cette ligne dans un autre fichier...
 
ca marche plus ou moins mais bon
Merci quand meme :D
youdontcare he bien si ton fichier tient en mémoire, tu peux remplir un tableau contenant chaque ligne, puis le trier, puis enlever les doublons.
 
je n'ai jamais utilisé perl, mais tu dois pouvoir :
 
* créer une structure qui contient tous tes champs
* lire les 5000 champs dans un tableau de ces structures
* les trier (par ex avec qsort() du C, tu donnes un bout de code qui permet de faire le tri - ici, des comparaisons de chaînes suffiront, sur les 20 champs)
* une fois que ton tableau est trié, tu le parcours, puis tu écris chaque ligne à condition que la suivante soit différente.
 
une variation est de faire un hash des lignes, par ex un md5, associer à ce hash le numéro de ligne du fichier, trier les md5, et se servir du numéro de ligne pour relire le fichier source et écrire le fichier trié (en fait il vaut mieux stocker un offset de fichier et faire des seek() dedans).
 
la deuxième soluce implique que tes lignes soient identiques au caractère près. sinon, boum. tu peux aussi rajouter un bout de code qui transforme la ligne en une réprésentation interne pour créer ton hash (ie, convertir tout en minuscule, supprimer les espaces superflus, etc.)
stef_dobermann fichier texte (enfin CSV)
des adresses identiques (rue, code postal, ville)
 
Je l'aurais bien fait la main, mais sur plus de 5000 lignes et une vingtaines de colonnes, je  :pt1cable:
 
j'ai une solution mais elle n'a pas l'air de bien fonctionner !!
youdontcare quel type de doublons ? noms de fichiers, texte dans un fichier, etc. ?
stef_dobermann Vous avez des idée si vous plaise  :cry:
stef_dobermann :hello:
Je cherche un algorithme qui puisse m'enlever les doublon dans un fichier.
j'ai une solution, mais elle ne fonctionne pas très bien .....
 
Merici de votre participation :jap:

Copyright © 1997-2025 Groupe LDLC (Signaler un contenu illicite / Données personnelles)