Il suffit de lire les RFC se rapportant à l'encodage des URL (genre la RFC 1738).
En substance, tous les caractères qui ne sont pas présents dans la table ASCII US doivent être encodés en hexa, préfixés du caractère %.
La RFC 2279 précise comment encoder les caractères en UTF8.
Il est donc naturel que les URL au Japon, au Turkistan, au Yemen, en Russie, en Ouganda et en Egypte aient la même tête que les URL "françaises", vu qu'elles sont toutes régies par les mêmes règles.