Forum |  HardWare.fr | News | Articles | PC | S'identifier | S'inscrire | Shop Recherche
1350 connectés 

  FORUM HardWare.fr
  Programmation
  Divers

  reconnaissance de texte dans un fichier image

 


 Mot :   Pseudo :  
 
Bas de page
Auteur Sujet :

reconnaissance de texte dans un fichier image

n°1576626
Leelou10
Posté le 19-06-2007 à 09:39:08  profilanswer
 

Bonjour à tous,
 
Je dois chercher du texte dans de nombreux fichiers tifs de plusieurs pages chacun.
Un par un, j'ouvre le fichier, je fais edition puis rechercher. Là j'ai un message me disant "Microsoft Office Document Imaging doit reconnaitre le texte de ce document avant que vous puissiez executer cette opération". Il me convertit donc mon fichier puis me demande quel mot je recherche.
Tout ça est tres bien, mais vu le nombre impressionnant de fichier que je dois traiter, je cherche à faire un programme me permettant d'aller ouvrir les fichier et de faire ce traitement automatiquement...
 
Merci par avance de votre aide!
 
Je travaille sous Windows XP.

mood
Publicité
Posté le 19-06-2007 à 09:39:08  profilanswer
 

n°1576682
rufo
Pas me confondre avec Lycos!
Posté le 19-06-2007 à 11:28:14  profilanswer
 

là, comem ça, simpleme,t, je dirais qu'il faut que tu appliques une OCR (genre readiris, textbridge ou Omnipage) sur tous tes fichiers pour avoir en sortie des fichiers texte. Ensuite t'as plus qu'à rechercher ton texte dans tous ces fichiers (via l'explorateur de windows ou un programme plus évolué).

n°1576692
MagicBuzz
Posté le 19-06-2007 à 11:39:17  profilanswer
 

C'est con, on peut pas faire de macro avec Document Imaging :(

n°1576697
MagicBuzz
Posté le 19-06-2007 à 11:41:18  profilanswer
 

rufo > pas besoin d'OCR externe, celui d'Office est suffisant (testé à l'instant)

n°1576700
Leelou10
Posté le 19-06-2007 à 11:45:55  profilanswer
 

En effet, celui d'Office est satisfaisant.
Il me faudrait donc un programme qui ouvre mes fichiers images un par un et lance la reconnaissance OCR d'Office

n°1576702
MagicBuzz
Posté le 19-06-2007 à 11:49:35  profilanswer
 

Ca doit être jouable avec un simple VBS. Mais bon, c'est pas ce qu'il y a de plus propre :)

n°1576708
Leelou10
Posté le 19-06-2007 à 12:00:50  profilanswer
 

Je me doute. Mais je ne suis pas tres douée en programmation

n°1576710
rufo
Pas me confondre avec Lycos!
Posté le 19-06-2007 à 12:03:57  profilanswer
 

sinon AutoIt. Simple à mettre en oeuvre et fait pour développer des macro : pas besoin de bien maitriser la prog. On peut même faire de petites IHM assez facilement ;) Ca permet aussi de simuler les frappes clavier et les cliques de souris...


Message édité par rufo le 19-06-2007 à 12:05:05
n°1576726
MagicBuzz
Posté le 19-06-2007 à 12:40:00  profilanswer
 

Code :
  1. Option Explicit
  2.  
  3. Const picturesPath = "c:\in\tif\"
  4. Const officeImagingPath = """C:\Program Files\Common Files\microsoft shared\MODI\12.0\MSPVIEW.EXE"""
  5.  
  6. Dim objShell
  7. Dim cmdStr
  8. Dim fso
  9. Dim fol
  10. Dim fil
  11.  
  12. Set objShell = CreateObject("WScript.Shell" )
  13. Set fso = CreateObject("Scripting.FileSystemObject" )
  14.  
  15. Set fol = fso.GetFolder(picturesPath)
  16.  
  17. For Each fil In fol.Files
  18.  cmdStr = officeImagingPath & " """ & fil.Path & """"
  19.  objShell.Run cmdStr, 1
  20.  WScript.Sleep 2000
  21.  objShell.SendKeys "%ox"
  22.  WScript.Sleep 5000
  23.  objShell.SendKeys "%ot"
  24.  WScript.Sleep 500
  25.  objShell.SendKeys "{ENTER}"
  26.  WScript.Sleep 3000
  27.  objShell.SendKeys "%{TAB}"
  28.  WScript.Sleep 1000
  29.  objShell.SendKeys "%{F4}"
  30.  WScript.Sleep 500
  31.  objShell.SendKeys "n"
  32.  WScript.Sleep 500
  33. Next


 
Ca "marchouille".

n°1576729
MagicBuzz
Posté le 19-06-2007 à 12:42:35  profilanswer
 

Ca fait plus ou moins ce qu'on lui demande (ouvre toutes les images d'un répertoire, les reconnais et exporte le contenu dans Word) mais c'estun peu aléatoire le comportement (logiquement à la fin on n'a plus que les words ouverts mais bon là force est de constater que ça marche pas :D)
 
Pour plus d'infos sur ce qu'on peut envoyer comme touches au programme en cours d'exécution :
http://www.devguru.com/technologies/wsh/17420.asp
 
Notamment il ne serait pas con de faire un %fs suivit d'un File.ShortName & ".doc" puis %{F4} dans Word histoire d'enregistrer le document word sous le même nom que l'image d'origine.
 
En tout cas c'est pas mal comme truc, ça oblige à apprendre les raccourcis clavier :D


Message édité par MagicBuzz le 19-06-2007 à 12:46:12
mood
Publicité
Posté le 19-06-2007 à 12:42:35  profilanswer
 

n°1576736
rufo
Pas me confondre avec Lycos!
Posté le 19-06-2007 à 12:59:14  profilanswer
 

l'avantage de AutoIt, c'est qu'il a un mode record de la macro : tu enregistre toutes les actions que tu fais pour un tiff -> ça te génère un script autoit que t'as plus qu'à modifié si besoin est ;)
 
Je l'avais utilisé pour installer des softs automatiquement (style drivers, winzip, photoshop...) à partir d'un fichier de paramétrage.


Aller à :
Ajouter une réponse
  FORUM HardWare.fr
  Programmation
  Divers

  reconnaissance de texte dans un fichier image

 

Sujets relatifs
Défilement d'un fichier texte dynamique de gauche à droiteComment verrouiller un fichier avec flock
Comment acceder un fichier sur le reseau avec un programme exeRedimensioner une image
Image.FromResource ?[Javascript] inclure un fichier .js dans un fichier .js
Installation Hardware fichier inf besoin d'aideInsertion image Excel à la place d'un caractére
Insertion image Word (remplacer texte) 
Plus de sujets relatifs à : reconnaissance de texte dans un fichier image


Copyright © 1997-2022 Hardware.fr SARL (Signaler un contenu illicite / Données personnelles) / Groupe LDLC / Shop HFR