Forum |  HardWare.fr | News | Articles | PC | S'identifier | S'inscrire | Shop Recherche
2487 connectés 

  FORUM HardWare.fr
  Linux et OS Alternatifs
  Logiciels

  OCR xsane + cuneiform, pas de BMP !

 


 Mot :   Pseudo :  
 
Bas de page
Auteur Sujet :

OCR xsane + cuneiform, pas de BMP !

n°1446139
Mac Gyver ​974
Posté le 31-03-2020 à 16:50:40  profilanswer
 

Bonjour, j'ai un soucis avec xsane que j'essaye d'utiliser avec cuneiform:
 
Je lance xsane en ligne de commande, et je vois dans le terminal que cuneiform attend une image au format BMP, sauf que xsane est apparemment incapable de sortir du BMP :??:
 
Le soucis c'est que du coup, je dois scanner toutes les pages avec une image au format jpeg, que j'ouvre ensuite dans kolourpaint pour la convertir en BMP, BMP que je passe à la moulinette cuneiforme en ligne de commande...
 
... Mais j'ai 100000 pages environ devant moi à traiter ainsi, donc imaginer le bordel... (je ne sais d'ailleurs pas si mon scanner supportera 100000 scan mais bon, c'est un autre problème, vu le temps que ça me prendra sûrement j'ai le temps d'attendre la panne...)
 
Existe t-il une solution moins chiante ? gocr fonctionne dans xsane mais le résultat est pas fameux... (vieux livre style papier journal qui date de 1984, et ils sont tous comme ça)
 
cuneiform fonctionne super bien...
 
Merci d'avance !

mood
Publicité
Posté le 31-03-2020 à 16:50:40  profilanswer
 

n°1446152
Trit'
Posté le 31-03-2020 à 19:35:41  profilanswer
 

Tu peux pas employer les outils d’ImageMagick (en l’occurrence, convert ou mogrify, ici) pour convertir toutes tes images en une fois ?
 
Je ferais juste un « convert -format bmp *.jpg » (ou « mogrify […] » dans le dossier contenant tes JPEG et voilà.
Note que, contrairement à convert qui les conserve, mogrify remplace les fichiers d’origine. Choisis ton outil en connaissance de cause.

n°1446171
Mac Gyver ​974
Posté le 01-04-2020 à 00:08:16  profilanswer
 

Trit' a écrit :

Tu peux pas employer les outils d’ImageMagick (en l’occurrence, convert ou mogrify, ici) pour convertir toutes tes images en une fois ?
 
Je ferais juste un « convert -format bmp *.jpg » (ou « mogrify […] » dans le dossier contenant tes JPEG et voilà.
Note que, contrairement à convert qui les conserve, mogrify remplace les fichiers d’origine. Choisis ton outil en connaissance de cause.


 
MMh oui ça me semble bien, comme idée, que je n'ai pas eu car n'ayant pas eu connaissance de cette possibilité...(je suis plus serveur LAMP que ce genre de truc...)  Après, je peux c/c tout les dossiers contenant les images d'origines, pour être sûr de toujours avoir les originaux.
 
Donc merci
 :jap:

n°1446172
Trit'
Posté le 01-04-2020 à 01:25:40  profilanswer
 

C’est ce qui me semble le plus adapté (après avoir moi-même cherché, il y a quelque temps, une solution pour retourner à 90° en une fois des lots d’images mal orientées, ou convertir rapidement plusieurs images d’un format à un autre). Parce que si tu dois te farcir l’ouverture et la conversion de 100 000 images à la main, et une par une, tu en auras pour plusieurs vies entières avant d’en avoir fini ! Déjà que, même avec ces outils automatisés, ça va prendre un certain temps pour toutes les convertir (surtout si tes images sont enregistrées sur un HDD et non un SSD)…
 
Après, j’espère que tu as de la place, car le BMP, c’est du non compressé : 1 pixel = 3 octets (un pour chaque valeur RVB du pixel). Si tu bosses sur du grand format, tu vas te retrouver avec des Gio de bitmaps à la fin ! Une image FullHD en couleurs 24 bits, c’est donc 1 920 × 1 080 × 3 = 6 220 800 o ≈ 5,93 Mio. 100 000 comme ça, et ce sera près de 580 Gio qui seront occupés en tout.

n°1446184
Mac Gyver ​974
Posté le 01-04-2020 à 11:23:42  profilanswer
 

Trit' a écrit :

C’est ce qui me semble le plus adapté (après avoir moi-même cherché, il y a quelque temps, une solution pour retourner à 90° en une fois des lots d’images mal orientées, ou convertir rapidement plusieurs images d’un format à un autre). Parce que si tu dois te farcir l’ouverture et la conversion de 100 000 images à la main, et une par une, tu en auras pour plusieurs vies entières avant d’en avoir fini ! Déjà que, même avec ces outils automatisés, ça va prendre un certain temps pour toutes les convertir (surtout si tes images sont enregistrées sur un HDD et non un SSD)…
 
Après, j’espère que tu as de la place, car le BMP, c’est du non compressé : 1 pixel = 3 octets (un pour chaque valeur RVB du pixel). Si tu bosses sur du grand format, tu vas te retrouver avec des Gio de bitmaps à la fin ! Une image FullHD en couleurs 24 bits, c’est donc 1 920 × 1 080 × 3 = 6 220 800 o ≈ 5,93 Mio. 100 000 comme ça, et ce sera près de 580 Gio qui seront occupés en tout.


 
Mes images seront effectivement stockées dans un HDD  :(  
 
Les BMP sont des A4 mais en N&B, donc peut-être un peu moins de taille  :D je regarderais la taille qu'elles feront, mais j'ai du To en masse donc ça devrait aller de ce coté là  :whistle:  
 
Mais par contre tout cela va me prendre comme tu dis, énormément de temps, l'ampleur de la tâche est énorme; rien que le scan de 100000 pages prendra sûrement énormément de temps...
C'est pas rapide à scanner  :pt1cable:

n°1446193
Trit'
Posté le 01-04-2020 à 12:25:00  profilanswer
 

Mac Gyver 974 a écrit :

Les BMP sont des A4


Ça, c’est leur format géométrique, mais ça ne dit pas quelles sont leurs dimensions en pixels[:spamafote]
 
Enfin, comme je l’ai sous-entendu cette nuit : vu que c’est un format non compressé, si elles sont toutes aux mêmes dimensions (en pixels), tes BMP feront tous la même taille. Donc, quand tu en auras un, tu pourras estimer la taille totale de l’ensemble.

n°1446196
rat de com​bat
attention rongeur méchant!
Posté le 01-04-2020 à 14:22:15  profilanswer
 

T'as vraiment 100 000 pages? Alors autant demander à une entreprise spécialisée avec des grosses machines qui font ça automatiquement. Même si tu ne prends que 15s par feuille tu en as pour plus de 400h, tu ne tiendra jamais (et ton scanner peut-être pas non plus).

n°1446211
Mac Gyver ​974
Posté le 01-04-2020 à 18:12:28  profilanswer
 

rat de combat a écrit :

T'as vraiment 100 000 pages? Alors autant demander à une entreprise spécialisée avec des grosses machines qui font ça automatiquement. Même si tu ne prends que 15s par feuille tu en as pour plus de 400h, tu ne tiendra jamais (et ton scanner peut-être pas non plus).


 
400h est largement raisonnable, je tablais plutôt sur au moins 2 ans donc c'est dans mes prévisions  :o
 
Après je ne savais pas que des entreprises faisaient de l'OCR, le résultat doit être parfait ?
 
quel prix ?? Et en cette période de covid-19 ce n'est peut-être plus possible si ?
 
Et oui j'ai 100000 pages  :(
 
Edit: mon vieux scanner intégré à mon imprimante mp140 tiendra ?

Message cité 1 fois
Message édité par Mac Gyver 974 le 01-04-2020 à 18:13:21
n°1446212
rat de com​bat
attention rongeur méchant!
Posté le 01-04-2020 à 18:14:43  profilanswer
 

Mac Gyver 974 a écrit :

Après je ne savais pas que des entreprises faisaient de l'OCR, le résultat doit être parfait ?

L'OCR tu peux toujours faire toi-même si c'est automatique, par contre le scannage(??) perso j'externaliserais. Regarde genre "archivation documents" sur ton moteur de recherche, ça doit se trouver.

n°1446214
Mac Gyver ​974
Posté le 01-04-2020 à 18:36:21  profilanswer
 

rat de combat a écrit :

L'OCR tu peux toujours faire toi-même si c'est automatique, par contre le scannage(??) perso j'externaliserais. Regarde genre "archivation documents" sur ton moteur de recherche, ça doit se trouver.


 
Je vais regarder cela  :jap: (l'OCR n'est jamais parfait)


Message édité par Mac Gyver 974 le 01-04-2020 à 18:36:51
mood
Publicité
Posté le 01-04-2020 à 18:36:21  profilanswer
 

n°1446227
Mjules
Parle dans le vide
Posté le 01-04-2020 à 22:19:27  profilanswer
 

rat de combat a écrit :

L'OCR tu peux toujours faire toi-même si c'est automatique, par contre le scannage(??) perso j'externaliserais. Regarde genre "archivation documents" sur ton moteur de recherche, ça doit se trouver.


+1
 
à cette volumétrie, j'utiliserais un copieur pro avec chargeur qui fait au moins recto-verso automatiquement.


---------------
Celui qui pose une question est idiot 5 minutes. Celui qui n'en pose pas le reste toute sa vie. |  Membre du grand complot pharmaceutico-médico-scientifico-judéo-maçonnique.

Aller à :
Ajouter une réponse
  FORUM HardWare.fr
  Linux et OS Alternatifs
  Logiciels

  OCR xsane + cuneiform, pas de BMP !

 

Sujets relatifs
Reconnaissance de caractère (OCR) comme Acrobat ReaderOCRmyPDF ou créer des PDF/A avec OCR embarqué
Logiciel OCR maths[Xsane] - scanner uniquement detecté en root
OCR et Linux ?logiciel OCR ?
L'OCR sous GNU/Linux parlons-en !Freeze d'XMMS et BMP
Pb Cups et XsaneEnregistrement des images sous IE : que du BMP ?!?!?
Plus de sujets relatifs à : OCR xsane + cuneiform, pas de BMP !


Copyright © 1997-2025 Groupe LDLC (Signaler un contenu illicite / Données personnelles)