Forum |  HardWare.fr | News | Articles | PC | S'identifier | S'inscrire | Shop Recherche
1345 connectés 

  FORUM HardWare.fr
  Linux et OS Alternatifs
  Logiciels

  OCRmyPDF ou créer des PDF/A avec OCR embarqué

 


 Mot :   Pseudo :  
 
Bas de page
Auteur Sujet :

OCRmyPDF ou créer des PDF/A avec OCR embarqué

n°1347725
Sagittariu​s
Posté le 11-11-2013 à 14:06:56  profilanswer
 

Je trouve ce script fort utile.
 
Il permet de créer des fichiers PDF adressables embarquant l'OCR:
https://github.com/fritz-hh/OCRmyPDF/
 
Il faut un certain nombre de dépendances dont exactimage, tesseract... Mais le script vous le rappelle. C'est pratique.
La version 2 permet de faire le travail en parallèle.
 
Un simple:

./OCRmyPDF.sh -l fra -d -c -i -vv input.pdf out.pdf


 
recale les pages du document (-d) en français (-l fra) et nettoie les bordures (-c) pour inclure ou non (-i) les bitmaps redressés et nettoyés dans le PDF adressable.
 
Pour des documents vraiment moches, je commence avec scantailor.
 
Bref, le libre comme je l'aime.


Message édité par Sagittarius le 11-11-2013 à 14:21:31
mood
Publicité
Posté le 11-11-2013 à 14:06:56  profilanswer
 

n°1349282
firehard
Posté le 11-12-2013 à 13:31:11  profilanswer
 

toutafé !
 
je suis en train de tâtonner pour combiner ça avec xapian et omega (https://goldy.furry.fr/article4/indexer-ses-documents-personnels-avec-xapian-et-omega)
Mais pas là tout de suite car ma machine n'a pas appréciée ma tentative de passage d'olivia à petra (Mint)
 
As tu une idée pour faire un traitement de masse (traiter tout les fichiers d'un répertoire plus ou moins régulièrement avec un cron par exemple)
genre : /OCRmyPDF.sh -vv *.pdf *.pdf  (ça à l'air bien sale mais bon)

Code :
  1. for n in ~/Documents/*.pdf ; do  
  2. /opt/OCRmyPDF/OCRmyPDF.sh -vv  -f "$n" /scan/"$(basename "$n" )"; done
  3. #optionnel faire le ménage dan le répertoire
  4. #for i in  ~/Documents/*.pdf ; do
  5. #mv $i /scanpdfold/;
  6. #done


 
un petit coup de recoll et ça roule  
prochain arrêt xapian et oméga
Cdlt  
AD


Message édité par firehard le 19-01-2014 à 22:21:03
n°1349316
Sagittariu​s
Posté le 12-12-2013 à 00:04:34  profilanswer
 

J'ai dans l'idée de me faire un serveur webdavs/ftp qui intègre automatiquement ainsi dès son dépôt l'OCR embarqué dans les PDF. Je ferais un tri, par exemple sur le nom de fichier.
Cela serait utile dans mon travail. Pour l'heure cela reste au stade d'une idée faute de temps.
 
Je regarde aussi du côté des gestions intégrées de documents (libres) si l'embarquement OCR dans les PDF est à l'ordre du jour.

n°1399169
Sagittariu​s
Posté le 29-12-2016 à 08:14:22  profilanswer
 

v4.3.4 ici https://github.com/jbarlow83/OCRmyPDF
Toujours aussi pratique avec un service menu.

n°1399902
mbeasoaa
Posté le 20-01-2017 à 14:13:11  profilanswer
 

e regarde aussi du côté des gestions intégrées de documents (libres) si l'embarquement OCR dans les PDF est à l'ordre du jour. http://www.okhealthy.com/youjie/images/41.gif


Aller à :
Ajouter une réponse
  FORUM HardWare.fr
  Linux et OS Alternatifs
  Logiciels

  OCRmyPDF ou créer des PDF/A avec OCR embarqué

 

Sujets relatifs
[C/kernel] Creer une interface tunnel ipip en C[UNIX] Pourquoi créer un utilisateur par programme
A l'aide !!! EFI supprimer.[Samba] Créer un serveur à auth pour client windows
Créer sa distribution basé sur opensusecreer une clef USB bootable pour installer debian
Linux et VAIO PCG-SRX51P/A[ubuntu] comment créer un espace de partage entre utilisateurs ?
Créer un raccourci vers un shell en lancant un programmeCréer un template specifique
Plus de sujets relatifs à : OCRmyPDF ou créer des PDF/A avec OCR embarqué


Copyright © 1997-2022 Hardware.fr SARL (Signaler un contenu illicite / Données personnelles) / Groupe LDLC / Shop HFR