Forum |  HardWare.fr | News | Articles | PC | S'identifier | S'inscrire | Shop Recherche
529 connectés 

  FORUM HardWare.fr
  Programmation
  C

  C - Recherche dans utf-8

 


Comment aimez vous vos citrons




Attention si vous cliquez sur "voir les résultats" vous ne pourrez plus voter

 Mot :   Pseudo :  
 
Bas de page
Auteur Sujet :

C - Recherche dans utf-8

n°1050675
chrisbk
-
Posté le 18-04-2005 à 14:07:51  profilanswer
 

bonjour [:god]
 
soit un document en utf(n) samere(tm)
 
est ce que a votre avis, est ce qu'on peut utliser des algos classique de recherche de chaine de caractere sur ledit document utf-8, ou le systeme d'encodage de ce dernier risque de tout ruiner ? (donc je rapelle en gros les trucs classiques : comparaisons octet par octet)
 
merci [:negueu]
 
 
exemple :
 
j'ai un document encodé en mac roman
j'ai une chaine de caractère en iso-8859-1
 
je converti tout ca en utf-8 et j'utilise un boyer moore classique la dessus


---------------
NP: HTTP Error 764 Stupid coder found
mood
Publicité
Posté le 18-04-2005 à 14:07:51  profilanswer
 

n°1050677
Taz
bisounours-codeur
Posté le 18-04-2005 à 14:10:01  profilanswer
 

ça marche mais si tu commences la balayage depuis le début de la chaine et que tu utilises des routines spécifiques pour de déplacer caractère par caractère. ou alors tu passes en utf-32 :)

n°1050680
chrisbk
-
Posté le 18-04-2005 à 14:12:11  profilanswer
 

Taz a écrit :

ça marche mais si tu commences la balayage depuis le début de la chaine et que tu utilises des routines spécifiques pour de déplacer caractère par caractère. ou alors tu passes en utf-32 :)


 
ca m'a l'air un peu casse gueule, non ? l'utf 32, oué, pourquoi pas, c'est une bonen feinte du pere la feinte, j'y avais pas pensé, tiens, c'est pas con.
 
edit : bon par contre pour le boyer moore faudra changer la table de lookup [:petrus75]


Message édité par chrisbk le 18-04-2005 à 14:12:40

---------------
NP: HTTP Error 764 Stupid coder found
n°1050681
Taz
bisounours-codeur
Posté le 18-04-2005 à 14:13:22  profilanswer
 

non, c'est pas trop casse gueule. j'utilise ça avec glib/gtk et ça marche pas trop mal. Faut juste oublier ses habitudes de ++p c'est tout.

n°1050684
Taz
bisounours-codeur
Posté le 18-04-2005 à 14:14:46  profilanswer
 
n°1050690
chrisbk
-
Posté le 18-04-2005 à 14:16:43  profilanswer
 


 
tiens, bin tant qu'on y est, y'a une feinte pour savoir quelle version de glib on a d'installé ? (on a pas un linux de derniere fraicheur, donc bon. Du redhat 7.4 si je ne m'abuse)


Message édité par chrisbk le 18-04-2005 à 14:17:20

---------------
NP: HTTP Error 764 Stupid coder found
n°1050904
Taz
bisounours-codeur
Posté le 18-04-2005 à 16:05:54  profilanswer
 

pkg-config --modversion glib-2.0

n°1050905
Taz
bisounours-codeur
Posté le 18-04-2005 à 16:06:53  profilanswer
 

pkg-config --list-all | grep glib
 
déjà
 
cela dit pour un bon support, je te conseille de mettre à jour ta glib (ou du moins d'utiliser une version récente à côté)

n°1050934
chrisbk
-
Posté le 18-04-2005 à 16:19:23  profilanswer
 

ah bin on a la 2.0 [:god]  
 
bin c'ets pas trop mon pc, mais plutot le serveur de prod, donc bon, en fait on prefere pas trop y toucher
 
Sinon, tiens, sans rapport et tant que je t'ai sous la main, y'a moyen de creer un fichier sous unix en specifiant directement la taille sur disque ? (genre pour ne pas avoir a le remplir a coup de fwrite tout pourri)
 
 


---------------
NP: HTTP Error 764 Stupid coder found
n°1050941
Taz
bisounours-codeur
Posté le 18-04-2005 à 16:23:25  profilanswer
 

1) ben tu peux installer ta glib-2.0 récente dans un coin, sans problème. pkg-config te rends service pour ajuster ton LDPATH et CPPPATH. Penses-y.
2) oui. tu ouvres, et tu fais un seek, t'écris 1 octets bidon, et voilà, t'as un fichier à trou.

mood
Publicité
Posté le 18-04-2005 à 16:23:25  profilanswer
 

n°1051304
Taz
bisounours-codeur
Posté le 18-04-2005 à 20:25:42  profilanswer
 

alors ça passe ?

n°1051337
chrisbk
-
Posté le 18-04-2005 à 20:50:45  profilanswer
 

pas eu le tps [:le kneu]
demain jmeclate avec tout ca [:le kneu]
 
merci [:le kneu]
 
par contre ton fseek j'ai pas tout compris [:le kneu]


---------------
NP: HTTP Error 764 Stupid coder found
n°1051378
Taz
bisounours-codeur
Posté le 18-04-2005 à 21:16:27  profilanswer
 

ben sous unix, tu as des fichiers à trou.
 
taille logique > espace disque occupé
 
donc pour faire un trou, c'est simple. exemple rapidos
 
 

Code :
  1. Python 2.3.5 (#2, Mar 26 2005, 17:49:17)
  2. [GCC 3.3.5 (Debian 1:3.3.5-12)] on linux2
  3. Type "help", "copyright", "credits" or "license" for more information.
  4. >>> fd = open("/tmp/sparse", "w" )
  5. >>> fd.seek(1 << 30)
  6. >>> fd.write("plop" )
  7. >>> fd.close()
  8. >>>
  9. [21:15:09][pts/2][~][#3][&0]
  10. benoit@ibook >>> ls -lh /tmp/sparse
  11. -rw-------  1 benoit benoit 1,1G 2005-04-18 21:15 /tmp/sparse
  12. [21:15:15][pts/2][~][#4][&0]
  13. benoit@ibook >>> du -h /tmp/sparse
  14. 1,1M    /tmp/sparse


 
vois ça comme une allocation paresseuse. c'est une technique très employée.

n°1051379
chrisbk
-
Posté le 18-04-2005 à 21:18:04  profilanswer
 

ah d'accord, je connaissais pas, interessant. question rapidos : si apres je map ce fichier en mémoire en MAP_SHARED, j'ai bien acces au 1.1go sans gag ? (juste pour etre sur)


---------------
NP: HTTP Error 764 Stupid coder found
n°1051426
chrisbk
-
Posté le 18-04-2005 à 22:01:12  profilanswer
 

mais jme demandais, c'est bien conforme aux normes ce comportements ? [:petrus75]


---------------
NP: HTTP Error 764 Stupid coder found
n°1051545
FlorentG
Unité de Masse
Posté le 18-04-2005 à 23:19:24  profilanswer
 

C'est style les Sparse Files de NTFS ?

n°1051553
Taz
bisounours-codeur
Posté le 18-04-2005 à 23:26:39  profilanswer
 

l'inverse !

n°1051554
Taz
bisounours-codeur
Posté le 18-04-2005 à 23:27:32  profilanswer
 

et oui, c'est normalisé ce genre de comportement, messieurs les dev de SGBD s'en servent beaucoup d'ailleurs


Aller à :
Ajouter une réponse
  FORUM HardWare.fr
  Programmation
  C

  C - Recherche dans utf-8

 

Sujets relatifs
Pouvez vous m'aider a installer un moteur de recherche svp.Recherche langage de programmation pour problème précis
Recherche le GFAbasic[Réglé] Comment insérer Google comme moteur de recherche sur son site
recherche programme de rpc[php] recherche d'un topic
[PHP] recherche textarea évoluéMoteur de recherche sans utiliser de base de données...
Recherche fonction pour ne pas afficher le curseur ds 1 appli VB[io]recherche de documentations en fr
Plus de sujets relatifs à : C - Recherche dans utf-8


Copyright © 1997-2022 Hardware.fr SARL (Signaler un contenu illicite / Données personnelles) / Groupe LDLC / Shop HFR