Forum |  HardWare.fr | News | Articles | PC | S'identifier | S'inscrire | Shop Recherche
3395 connectés 

  FORUM HardWare.fr
  Linux et OS Alternatifs
  Codes et scripts

  Comment détecter l'encodage d'un fichier?

 


 Mot :   Pseudo :  
 
Bas de page
Auteur Sujet :

Comment détecter l'encodage d'un fichier?

n°1039093
Combi_A_Ve​ndre
Posté le 02-05-2008 à 13:38:13  profilanswer
 

Bonjour à tous,
 
J'ai besoin de faire un script qui détecte tous les fichiers texte dont l'encodage est différent de UTF8 pour les convertir en UTF8 avec iconv (iconv -f ISO-8859-15 -t UTF8 $i > tmp_$i ), mais, je n'ai pas trouvé comment détecter en script (perl, python, bash, C, peu importe) l'encodage utilisé par un fichier.
 
Une idée?
 
Merci,
vw.

mood
Publicité
Posté le 02-05-2008 à 13:38:13  profilanswer
 

n°1039103
Mjules
Modérateur
Parle dans le vide
Posté le 02-05-2008 à 14:14:10  profilanswer
 

file -i fait ça :

[jules@tue-amour ~]$ file -i licence
licence: text/plain charset=us-ascii
[jules@tue-amour ~]$ file -i paquets
paquets: text/plain charset=utf-8



Message édité par Mjules le 02-05-2008 à 14:18:54

---------------
Celui qui pose une question est idiot 5 minutes. Celui qui n'en pose pas le reste toute sa vie. |  Membre du grand complot pharmaceutico-médico-scientifico-judéo-maçonnique.
n°1039209
Combi_A_Ve​ndre
Posté le 03-05-2008 à 09:40:12  profilanswer
 

Merci beaucoup !

n°1125194
zezette
"Allez hop, au revoir"
Posté le 30-03-2009 à 14:07:25  profilanswer
 

Ca ne marche pas exactement comme ça ; file -i retourne l'en-tête mime du fichier. Alors, oui, sur certains fichiers, l'en-tête mime contient le codage, mais ce n'est pas toujours le cas (dans un fichier HTML par exemple, ça, va simplement retourner text/html)
 
Une autre solution ?


---------------
"Par moment j'me d'mande si chui pas con" G. de Suresnes
n°1125222
Taz
bisounours-codeur
Posté le 30-03-2009 à 14:44:15  profilanswer
 

ça reste un paquet d'octet. On ne peut pas détecter, on ne peut que deviner.

n°1125244
gug42
Posté le 30-03-2009 à 16:01:37  profilanswer
 

iconv éventuellement, ou des modules perls, mais effectivement comme le dit Taz, ca ne marche pas à tous les coups .... c'est uniquement des probas/statistiques/heristiques

n°1125275
zezette
"Allez hop, au revoir"
Posté le 30-03-2009 à 16:34:32  profilanswer
 

OK... je vais m'arranger pour ne passer à la moulinette que les fichiers dotn je suis sur qu'ils sont en iso (pcq un utf8 converti en utf8 c le bordel :))


---------------
"Par moment j'me d'mande si chui pas con" G. de Suresnes

Aller à :
Ajouter une réponse
  FORUM HardWare.fr
  Linux et OS Alternatifs
  Codes et scripts

  Comment détecter l'encodage d'un fichier?

 

Sujets relatifs
Help me: perte de fichier avec NTRawrite sur un disque usbBesoin d'aide pour un Cron et fichier .sh
Liaison fichier exel vers access : pb format cellules.afficher un fichier mais que sur un certain nombre de caractères
[FEDORA 8] - Serveur fichier sans écranProblème de transfert de fichier PHP de Mac OS X à Windows
script création de comptes à partir d'un fichier excel[script] Date fichier
Migrer Postfix de mbox vers Maildir 
Plus de sujets relatifs à : Comment détecter l'encodage d'un fichier?


Copyright © 1997-2025 Groupe LDLC (Signaler un contenu illicite / Données personnelles)