Forum |  HardWare.fr | News | Articles | PC | S'identifier | S'inscrire | Shop Recherche
2800 connectés 

  FORUM HardWare.fr
  Programmation
  PHP

  la meilleure façon de décoder les caractères html

 


 Mot :   Pseudo :  
 
Bas de page
Auteur Sujet :

la meilleure façon de décoder les caractères html

n°1725500
freed102
Arayashiki
Posté le 28-04-2008 à 11:57:12  profilanswer
 

bonjour à tous,
 
J'ai une question concernant le formatage des données provenant d'une BDD.
 
Lors de l'import des données, certains champs possedent des caractères HTML encodés, un coup avec des truc genre : "–" , d'autres fois avec des é ...il me semble bien qu'il ne s'agit pas du même type d'encodage des caractères.
 
Actuellement j'ai besoin d'extraire ces données pour en faire des fichiers CSV, le problème, c'est que dans "–" ou dans "é" ya un point-virgule, le point-virgule étant le caractère séparateur des champs, les données sortent donc completement erronées... D'autant plus que c'est illisible.
 
la solutions que j'avais trouvé :
 
 

Code :
  1. function unhtmlentities ($string)
  2. {
  3.    // Remplace les entités numériques
  4.    $string = preg_replace('~&#x([0-9a-f]+);~ei', 'chr(hexdec("\\1" ))', $string);
  5.    $string = preg_replace('~&#([0-9]+);~e', 'chr("\\1" )', $string);
  6.    // Remplace les entités litérales
  7.    $trans_tbl = get_html_translation_table (HTML_ENTITIES);
  8.    $trans_tbl = array_flip ($trans_tbl);
  9.    return strtr ($string, $trans_tbl);
  10.  
  11.   }


 
En soit ça fonctionne pas trop mal, mais à la place de "–"  j'ai un carré :   :heink:  
 
peut etre que vous avez une meilleure solution ?
 
Merci d'avance...
 
Freed

mood
Publicité
Posté le 28-04-2008 à 11:57:12  profilanswer
 

n°1725510
masterpsx
Aigloun foutougrafe
Posté le 28-04-2008 à 12:08:40  profilanswer
 

html_entity_decode() : http://fr.php.net/html_entity_decode

n°1725512
freed102
Arayashiki
Posté le 28-04-2008 à 12:10:27  profilanswer
 

deja essayé, mais ça ne fonctionne pas visiblement avec les encodages hexadecimaux


Aller à :
Ajouter une réponse
  FORUM HardWare.fr
  Programmation
  PHP

  la meilleure façon de décoder les caractères html

 

Sujets relatifs
[PHP] Communication Html/PHPIntegré une page web dans un blok html
Déclaration dynamique d'un tableau de chaine de caractèresInsérer un album photo dans une page html
[html+javascript] Envoi de formulaire par mail[RESOLU] "applet not initiated" : quelle erreur dans le code HTML ?
[HTML/CSS] Créer de nouvelles balises, authorisé ?Problème : code html à insérer dans le javascript
Problème au niveau d'une chaîne de caractèresles chaines de caracteres en assembleur
Plus de sujets relatifs à : la meilleure façon de décoder les caractères html


Copyright © 1997-2022 Hardware.fr SARL (Signaler un contenu illicite / Données personnelles) / Groupe LDLC / Shop HFR