erwan83 a écrit :
parce que si tu pars en ISO, tu vas te retrouver avec des ? à la place des éèà etc
|
Symptomatique UTF => ISO sur les caractères qui n'existent pas en ISO
erwan83 a écrit :
avec je sais plus quel alphabet tu vas te retrouver avec des Â@ et autres conneries...
|
Symptomatique de l'UTF affiché comme étant de l'ISO.
erwan83 a écrit :
maintenant tout dépend de tes données de départ. pour mon moteur de recherche par exemple, je repasse tout en UTF-8 et ben je galère:
si une page est en UTF-8 ca passe tout seul, sinon je dois choper le code hexa si le caractère est codé sur deux octets. bref je vais pas te raconter ma vie mais j'ai une fonction de environ 50 lignes pour environ 500 remplacements possibles et ça arrive encore à me retourner de la merde ....
|
Dis moi, tu ne peux pas utiliser les fonctions de détections d'encodage ? "mb_detect_encoding" marche très bien quand elle est disponible et qu'elle est bien configuré.
Couplé au choix à un "unicode_encode", "mb_convert_encoding" ou "iconv", on évite quasiment tous les problèmes de changement d'encodage en direction de l'UTF-8.