Ben tu te trompes:
> Unicode = codage des caractères sur 16 bits
Non. C'est pas sur 16 bits, c'est plus compliqué (par exemple avec l'utilsation des surrogates), et c'est pas un codage.
C'est un ensemble de caractere plus des tables de proprietes pour chaque caractere du jeu, et un ensemble d'algorithmes de tri. De plus pour certains caracteres composites, c'est une suite de code points (et plusieurs formes normalisées possibles)
Pour le codage lui meme, je te cite la norme:
Citation :
Unicode provides for three encoding forms: a 32-bit form (UTF-32), a 16-bit form (UTF-16), and an 8-bit form (UTF-8). The 8-bit, byte-oriented form, UTF-8, has been designed for ease of use with existing ASCII-based systems.
|
(en fait, avec les evolutions de la norme Unicode, on en est maintenant a 7 encodages specifies dans la norme Unicode: UTF-8 UTF-16, UTF-16BE, UTF-16LE, UTF-32, UTF-32BE, UTF-32LE)
Mais ce serait une erreur de considerer les code points comme etant le codage lui meme.
A+,
Message édité par gilou le 12-05-2004 à 16:59:57