Forum |  HardWare.fr | News | Articles | PC | S'identifier | S'inscrire | Shop Recherche
1869 connectés 

  FORUM HardWare.fr
  Programmation
  C++

  Reconnaissance de caractère sur Ticket de caisse //OCR

 


 Mot :   Pseudo :  
 
Bas de page
Auteur Sujet :

Reconnaissance de caractère sur Ticket de caisse //OCR

n°2240794
torwood3
Posté le 20-10-2014 à 16:53:24  profilanswer
 

Bonjour,
 
Mon nouveau projet consiste a faire de la reconnaissance de caractère a partir d'une photo d'un ticket de caisse.
Je n'ai jamais travaillé dans le traitement d'image du coup je suis un peu perdu.
 
A la suite de mes recherches, je pense avoir trouvé la librairie qu'il me faut, Tesseract-ocr.
Cependant après quelques essai, je n'arrive pas a avoir de résultat correcte.  
 
Outre le manque d'exemple, je me demandais s'il fallait pas que je traite certaine opération a la main avant d'envoyer l'image a Tesseract comme par exemple supprimer le fond, mettre le ticket droit etc..
 
Du coup, j'aimerais votre avis concernant les taches post traitement, dois je le faire, ou tesseract le fait deja ? (ou c'est une config que je dois mettre)  
 
Merci d'avance,
PS : je prends tout retour d'expérience autour du domaine de reconnaissance de forme.
PS2: J'ai mis C++, mais je suis ouvert a d'autre langage ;) (python, java etc...)
 
torwood3


---------------
"La valeur d'un homme tient dans sa capacité à donner et non dans sa capacité à recevoir." Albert Einstein / "Dans la nature, tout a toujours une raison. Si tu comprends cette raison, tu n'as plus besoin de l'expérience." Léonard De Vinci
mood
Publicité
Posté le 20-10-2014 à 16:53:24  profilanswer
 

n°2240815
honrisse
Posté le 20-10-2014 à 23:52:11  profilanswer
 

torwood3 a écrit :

Bonjour,
 
Mon nouveau projet consiste a faire de la reconnaissance de caractère a partir d'une photo d'un ticket de caisse.
Je n'ai jamais travaillé dans le traitement d'image du coup je suis un peu perdu.
 
A la suite de mes recherches, je pense avoir trouvé la librairie qu'il me faut, Tesseract-ocr.
Cependant après quelques essai, je n'arrive pas a avoir de résultat correcte.  
 
Outre le manque d'exemple, je me demandais s'il fallait pas que je traite certaine opération a la main avant d'envoyer l'image a Tesseract comme par exemple supprimer le fond, mettre le ticket droit etc..
 
Du coup, j'aimerais votre avis concernant les taches post traitement, dois je le faire, ou tesseract le fait deja ? (ou c'est une config que je dois mettre)  
 
Merci d'avance,
PS : je prends tout retour d'expérience autour du domaine de reconnaissance de forme.
PS2: J'ai mis C++, mais je suis ouvert a d'autre langage ;) (python, java etc...)
 
torwood3


 
Bonjour,
 
Je préviens, je n'ai aucune expérience en reconnaissance de caractère.
Ce que je ferais :

  • essayer de redresser le ticket ? : passer d'un trapèze à un rectangle ==> méthode = homographie je crois
  • pré-traitement ? : débruitage (ouverture, fermeture morphologique, ...), binarisation, lissage (filtre gaussien)
  • séparer les caractères pour faire la reconnaissance de chaque caractère ? détection de contour ?
  • regarder sur SO les questions sur Tesseract OCR : https://stackoverflow.com/search?q=ocr+tesseract


En librairie de traitement d'images : OpenCV
 
Je serais intéressé par des retours sur les méthodes utilisées si c'est possible.

n°2240844
gilou
Modérateur
Modzilla
Posté le 21-10-2014 à 12:39:57  profilanswer
 

Ou alors, tu vas récupérer le code source de Scantailor, qui fait tout le traitement nécessaire avant OCR (redressement, élimination du bruit, etc) et tu t'en inspires.
A+,


---------------
There's more than what can be linked! --    Iyashikei Anime Forever!    --  AngularJS c'est un framework d'engulé!  --

Aller à :
Ajouter une réponse
  FORUM HardWare.fr
  Programmation
  C++

  Reconnaissance de caractère sur Ticket de caisse //OCR

 

Sujets relatifs
[Excel VBA] rech cellule comportant plusieurs chaines de caractère[Batch] selection d'une partie de chaine de caractère
[VBA] Donner une valeur numérique à une chaine de caractère[Résolu] Insérer un caractère dans une chaine à une position donnée
[Shell/Batch] Recherche d'une chaîne de caractère dans un fichier[BATCH] Stocker une chaine de caractère avec une boucle for.
problème saisi chaine de caractèreextraire un entier d'une chaîne de caractère ; string
Duplication de bloc de caractère 
Plus de sujets relatifs à : Reconnaissance de caractère sur Ticket de caisse //OCR


Copyright © 1997-2022 Hardware.fr SARL (Signaler un contenu illicite / Données personnelles) / Groupe LDLC / Shop HFR