Forum |  HardWare.fr | News | Articles | PC | S'identifier | S'inscrire | Shop Recherche
1183 connectés 

 


 Mot :   Pseudo :  
 
 Page :   1  2
Page Suivante
Auteur Sujet :

[Algo] Détecter l'orientation d'une image (et étapes intermédiaires)

n°370224
Masure
Posté le 24-04-2003 à 11:20:36  profilanswer
 

Reprise du message précédent :

skeye a écrit :

Bon, l'utilisation du poids gauche/droite fonctionne pas top...si j'avais que du manuscrit ce serait pas mal, mais bon si j'ai du texte avec une photo sombre sur le coté droit c DMC...:/
Va falloir que je trouve autre chose...
Pendant que j'y pense, et le poids haut/bas? Voire une combinaison des 2...
 
Mon boss pensait pour les cas ou il y a un doute à essayer de reconnaitre des "modèles" tout prêts (une lettre, du papier millimétré, une photo, etc.), mais là c chaud à faire!
 
Remarquez, maintenant que j'ai quelques caractéristiques plus ou moins significatives pour mes images, je peux p-e m'en servir en entrée d'un réseau de neurones!
 
Je pourrais avoir par ex:
1) dimensions de l'image
2) Moyenne des valeurs de pix. sur l'image
3) Ecart-type correspondant
4) Le resultat de la technique de Mara's dad
5) nb de lignes horizontales et verticales
6) poids gauche/droite et haut/bas
 
Avec ca vous pensez que le réseau a une chance de se démerder?
Ca commence à faire pas mal de traitements...:/


 
Pour décider je pense que tu dois tester séparément les résultats que donne l'analyse d'une caractéristique. Tu en tires une efficacité moyenne en % (un ordre d'idees hein...) et un temps de traitement (approximatif aussi) pour cette carac. De là tu calcules des indices d'efficacité par rapport au temps (efficacité / temps). Il t'apparaitra les caractéristiques les plus interessantes a utiliser.
 
Ensuite tu croises les techniques retenues jusqu'à arriver à un croisement qui te donnera une efficacité >99%.  
 
Pour l'instant comme on est parti, c'est a dire sans solution miracle, je crois que c'est comme ça qu'il faut procéder.
 
Etant donné que c'est une phase de test et d'etude de faisabilité, ne paufine pas tes algos pour chaque caractéristique. C'est pour voir si tu peux facilement avoir du 99% en croisant les caractéristiques.
 
Si tu y arrive facilement alors c'est faisable et là tu donnes tout pour optimiser (arriver a 100% et diminuer les temps).
Si tu vois qu'avec tous tes tests de croisements tu n'approcheras pas les 99% (ou alors avec des temps de m****) alors tu peux laisser tomber et tu n'auras pas passer trop de temps à optimiser.
 
Faudrait l'avis de mara's dad quand meme pour voir si je t'envoie pas au casse pipe pendant une semaine.

mood
Publicité
Posté le 24-04-2003 à 11:20:36  profilanswer
 

n°370257
Mara's dad
Yes I can !
Posté le 24-04-2003 à 11:46:32  profilanswer
 

Bon, j'ai tout lu, mais je ne sais pas trop quoi en dire.
 
Pour le moment, vu que t'est pas pressé, ne cherche pas à optimiser les algos qui marchent.
 
Pour ceux qui marchent pas, laisses les de coté pour le moment au lieu de les compliquer dans l'espoir qu'ils donnent quelquechose. Cherche plutôt d'autres idées, si t'en trouve pas tu pourras toujours y revenir.
 
Garder en tête que les théories les plus simples sont souvent les meilleures. En gros çà veux dire qu'il y à peu de chance d'arriver à un résultat en multipliant les cas particulers. Par exemple, la notion d'horizontalité est très générale, c'est pour çà que les résultats sont bons. L'algo qui permet de trouver l'horizontalité (écarts types) est accessoire. S'il existe un algo, ben tu le trouveras. Pour le poids droite/gauche, si çà ne marche pas, c'est que ce n'est pas assez général. Faut trouver autre chose !
 
Idées :
Dans quel sens sont les images scannées ?
Je veux dire est-ce que tu as n'importe quoi, ou bien les images sont-elles toujours ou souvent dans le sens vertical en terme de pixel, par exemple 600 de large et 800 de haut.
Si c'est le cas, une page d'orientation verticale est sans doute scannée dans le bon sens. De même pour une page horizontale, y'a des chances que le haut soit à gauche.
 
Autre idée :
Faire un classement des documents.
Déterminer si un document contient seulement du texte, ou si c'est un dessin, ou du texte avec de images...
 
Si tu arrive à faire çà, tu pourras choisir l'algo le plus adapté à la détection de l'orientation.
 
 
Idée pour diminuer les temps de traitement :
Si j'ai bien compris, tes images sont assez lourdes. Peut-être serait-il judicieux de commencer par diminuer leurs taille. Si çà n'a pas d'influence sur les traitements de détection d'orientation, çà en aurra sur le temps !
 
Je continue à réfléchir à tout çà.


---------------
Laissez l'Etat dans les toilettes où vous l'avez trouvé.
n°370264
Masure
Posté le 24-04-2003 à 11:51:01  profilanswer
 

Tout a fait d'accord avec mara's dad, car ce que je proposais c'etait dans le cas ou tu voudrais partir sur une mer un peu houleuse. Mais il ne faut pas perdre de vue qu'il vaut mieux trouver un algo qui marche bien plutot que plusieurs moisis. Donc +1 avec mara's

n°370352
skeye
Posté le 24-04-2003 à 13:26:04  profilanswer
 

Mara's dad a écrit :

Pour le moment, vu que t'est pas pressé, ne cherche pas à optimiser les algos qui marchent.


J'essaie de les faire tourner, c'est déjà pas mal pour l'instant en effet...;)
 

Citation :


Pour ceux qui marchent pas, laisses les de coté pour le moment au lieu de les compliquer dans l'espoir qu'ils donnent quelquechose. Cherche plutôt d'autres idées, si t'en trouve pas tu pourras toujours y revenir.


 
C'est tout à fait l'esprit dans lequel je fais ces recherches pour l'instant...j'essaie des choses, je regarde ce que ca donne, et je recommence!
 

Citation :


Garder en tête que les théories les plus simples sont souvent les meilleures. En gros çà veux dire qu'il y à peu de chance d'arriver à un résultat en multipliant les cas particulers. Par exemple, la notion d'horizontalité est très générale, c'est pour çà que les résultats sont bons. L'algo qui permet de trouver l'horizontalité (écarts types) est accessoire. S'il existe un algo, ben tu le trouveras. Pour le poids droite/gauche, si çà ne marche pas, c'est que ce n'est pas assez général. Faut trouver autre chose !


 
C'est là que ca se complique...C'est vrai que j'ai un peu de mal à rester dans des théories vraiment générales, vu que la difficulté réside dans les cas particuliers!
Mais je cherche toujours!
 

Citation :


Idées :
Dans quel sens sont les images scannées ?
Je veux dire est-ce que tu as n'importe quoi, ou bien les images sont-elles toujours ou souvent dans le sens vertical en terme de pixel, par exemple 600 de large et 800 de haut.
Si c'est le cas, une page d'orientation verticale est sans doute scannée dans le bon sens. De même pour une page horizontale, y'a des chances que le haut soit à gauche.


 
A priori je n'ai pas connaissance du sens dans lequel sont scannées les pages, et encore moins du sens dans lequel le client les présente. Même si c'est la majorité des cas, c'est donc difficilement exploitable.
 

Citation :


Autre idée :
Faire un classement des documents.
Déterminer si un document contient seulement du texte, ou si c'est un dessin, ou du texte avec de images...
 
Si tu arrive à faire çà, tu pourras choisir l'algo le plus adapté à la détection de l'orientation.


 
C'est la solution que je garde pour l'instant de coté pour la fin...ca risque d'être très gourmand à faire, je préfèrerais ne le réaliser que sur les images difficiles!
 

Citation :


Idée pour diminuer les temps de traitement :
Si j'ai bien compris, tes images sont assez lourdes. Peut-être serait-il judicieux de commencer par diminuer leurs taille. Si çà n'a pas d'influence sur les traitements de détection d'orientation, çà en aurra sur le temps !


 
J'y ai déjà pensé un peu...Je ferai des tests en baissant la résolution, notamment!
 

Citation :


Je continue à réfléchir à tout çà.


C'est gentil!:jap:

n°370354
skeye
Posté le 24-04-2003 à 13:27:05  profilanswer
 

masure a écrit :

Tout a fait d'accord avec mara's dad, car ce que je proposais c'etait dans le cas ou tu voudrais partir sur une mer un peu houleuse. Mais il ne faut pas perdre de vue qu'il vaut mieux trouver un algo qui marche bien plutot que plusieurs moisis. Donc +1 avec mara's


Ca c'est sûr...mais je doute sérieusement de l'existence d'un algo universel concernant ce pb!:sweat:

n°400825
xilebo
noone
Posté le 20-05-2003 à 09:22:56  profilanswer
 

il se passe quoi si 2 documents orientés differement sont scannés sur la meme feuille (je pense par exemple a 2 billets de train l un vertical et l autre horizontal) :??:
 
sinon une idee pour detecter le "haut" du "bas" : en general les points sur les i,j et autres sont plutot vers le haut  :)


Message édité par xilebo le 20-05-2003 à 09:24:59
n°400826
skeye
Posté le 20-05-2003 à 09:25:39  profilanswer
 

xilebo a écrit :

il se passe quoi si 2 documents orientés differement sont scannés sur la meme feuille (je pense par exemple a 2 billets de train l un vertical et l autre horizontal)
 
 


Là il se passe qu'en gros on s'en fout du résultat, puisque le document n'a pas de sens...:whistle:  
M'attendais pas à le voir remonter ce ptit topic...:D
 
[edit]
En fait dans l'idéal c'est typiquement un cas dans lequel mon prog devrait flagger l'image afin qu'elle soit vérifiée par un humain... :D


Message édité par skeye le 20-05-2003 à 09:30:38
n°434295
rufo
Pas me confondre avec Lycos!
Posté le 20-06-2003 à 14:56:22  profilanswer
 

Une question en passant comme ça : comment sont scannées les pages? Par une machine automatique ou par une personne qui utilise un scanner à plat (il met la page à scanner, utilise le soft pour scanner et nomme le fichier obtenu)???
 
Si c'est la 2ème solution, est-ce-que le mec qui nomme le fichier pourrait pas mettre dans le nom de celui-ci une indication concernant l'orientation de l'image? Je sais que am solution est très conne mais bon, des fois, ce sont les solutions les plus simples qui sont les plus difficiles à trouver. :)
 
Autre proposition : pourquoi ne pas chercher une lettre en particulier ou plusieurs (par exemple une voyelle, vu qu'un mot est obligatoirement composé d'au moins une voyelle, le 'e' par ex) et regarder si elle est présente dans le document en effectuant la recherche sur les 4 orientations du documents. A part pour les images qui sont des photos (mais vu que t'en auras peu), il suffit que ton image ne contienne qu'un mot pour que ça marche. :D Non?

n°434299
skeye
Posté le 20-06-2003 à 15:00:11  profilanswer
 

rufo a écrit :

Une question en passant comme ça : comment sont scannées les pages? Par une machine automatique ou par une personne qui utilise un scanner à plat (il met la page à scanner, utilise le soft pour scanner et nomme le fichier obtenu)???
 
Si c'est la 2ème solution, est-ce-que le mec qui nomme le fichier pourrait pas mettre dans le nom de celui-ci une indication concernant l'orientation de l'image? Je sais que am solution est très conne mais bon, des fois, ce sont les solutions les plus simples qui sont les plus difficiles à trouver. :)
 
Autre proposition : pourquoi ne pas chercher une lettre en particulier ou plusieurs (par exemple une voyelle, vu qu'un mot est obligatoirement composé d'au moins une voyelle, le 'e' par ex) et regarder si elle est présente dans le document en effectuant la recherche sur les 4 orientations du documents. A part pour les images qui sont des photos (mais vu que t'en auras peu), il suffit que ton image ne contienne qu'un mot pour que ça marche. :D Non?


Pour la première question ca dépend bcp des images...On a pas de scan automatique pour les plans A0... [:skeye]
Utiliser une convention de nommage serait encore plus lourd que de faire les rotations à la main (ca se fait en 2 clics, ca), on ne veut plus que les opérateurs aient à se soucier du sens des images...
Et pour ta proposition je garde en effet l'ocr sous le coude au cas ou, mais c'est très couteux en termes de perfs, et ne marchera ni sur du manuscrit, ni sur des photos...donc mon boss préfère que je fasse sans.:/
 
[edit]
C'est marrant comme il remonte tout seul de temps en temps ce topic:D


Message édité par skeye le 20-06-2003 à 15:02:42
n°434362
Willyzekid
Posté le 20-06-2003 à 15:42:39  profilanswer
 

Marrant, j'ai un copain qui avait fait la même chose dans un context un peu similaire...
 
Il s'agissait en fait de photo (et non de doc, ce qui peut changer beaucoup de chose). L'idée de base s'était de reconnaitre un certain nombre d'éléments "habituels". ie. du bleu tout en haut -> c'est du ciel -> c'est le haut de la photo. Bien sûr, c'est grossier d'où l'implementation derrière d'un système d'apprentissage...Chaque image scanné, avec son orientation correcte rentrée, est enregistrée et elle sera utilisé plus tard pour améliorer le jugement de l'ordi.
 
Toujours est-il qu'il y a ENOREMENT de recherche sur ce sujet (dans le cadre des photos, cela dit). J'ai vu plusieurs papiers universitaires canadiens/us là dessus.


---------------
Horizon pas Net, reste à la buvette!!
mood
Publicité
Posté le 20-06-2003 à 15:42:39  profilanswer
 

n°434370
skeye
Posté le 20-06-2003 à 15:47:15  profilanswer
 

Willyzekid a écrit :

Marrant, j'ai un copain qui avait fait la même chose dans un context un peu similaire...
 
Il s'agissait en fait de photo (et non de doc, ce qui peut changer beaucoup de chose). L'idée de base s'était de reconnaitre un certain nombre d'éléments "habituels". ie. du bleu tout en haut -> c'est du ciel -> c'est le haut de la photo. Bien sûr, c'est grossier d'où l'implementation derrière d'un système d'apprentissage...Chaque image scanné, avec son orientation correcte rentrée, est enregistrée et elle sera utilisé plus tard pour améliorer le jugement de l'ordi.
 
Toujours est-il qu'il y a ENOREMENT de recherche sur ce sujet (dans le cadre des photos, cela dit). J'ai vu plusieurs papiers universitaires canadiens/us là dessus.


Je sais que la recherche est pas mal active de ce coté...moi j'ai de la chance que ce soient plutot des documents bureautiques, ça aide pas mal...

n°705743
Masure
Posté le 22-04-2004 à 10:53:19  profilanswer
 

Au fait 1 an après, t as éussi ?

n°705747
skeye
Posté le 22-04-2004 à 10:58:01  profilanswer
 

Masure a écrit :

Au fait 1 an après, t as éussi ?


Au final c'est mitigé...Les résultats étaient satisfaisants sur des documents bureautiques, mais j'ai été obligé d'être très strict sur les critères choisi pour déterminer que l'algo était sur de lui...du coup il ressortait un pourcentage un peu trop élévés d'images comme "incertaines", et nécéssitant une vérification manuelle.
Bref, comme c'était court au niveau timing pour faire de vrais tests grandeur nature le projet a fini au placard pour une durée indéterminée! :(
 
[edit]
 
Et finalement je persiste à penser qu'un système avec apprentissage aurait été pas mal sur ce problème.


Message édité par skeye le 22-04-2004 à 11:00:55
n°705781
Masure
Posté le 22-04-2004 à 11:30:51  profilanswer
 

Ben je suis triste pour toi que ca ai pas marché a 99%, mais pour le truc de l apprentissage, c'est clair que ca doit etre adapté

n°705783
skeye
Posté le 22-04-2004 à 11:33:47  profilanswer
 

Masure a écrit :

Ben je suis triste pour toi que ca ai pas marché a 99%


 
Franchement j'y ai jamais trop cru...;)
Et de toute manière j'ai eu mon dess quand même![:ddr555]
 

Masure a écrit :


mais pour le truc de l apprentissage, c'est clair que ca doit etre adapté


Yep, c'est mon plus gros regret sur ce stage, après coup. J'aurais dû me lancer dedans tout de suite.
 

n°705787
red factio​n
Posté le 22-04-2004 à 11:36:44  profilanswer
 

tu parle dun reseau de neurone avec genetic algo et tout et tout :ouch:

n°705789
skeye
Posté le 22-04-2004 à 11:37:28  profilanswer
 

red faction a écrit :

tu parle dun reseau de neurone avec genetic algo et tout et tout :ouch:  


ce style de choses oui...

n°705791
Moktar1er
No one replies...
Posté le 22-04-2004 à 11:38:41  profilanswer
 

idée 1: hough
idée 2: matrice de covariance(X,Y), calcul des valeurs propres, calcul du premier vecteur propre qui te donnera une orientation
 
pour mon boulot je travaille avec un algo qui dérive de celui de la transformée Hough, qui permet de corriger l'inclinaison d'un document manuscrit numèrisé de travers

n°705792
skeye
Posté le 22-04-2004 à 11:40:23  profilanswer
 

moktar1er a écrit :

idée 1: hough
idée 2: matrice de covariance(X,Y), calcul des valeurs propres, calcul du premier vecteur propre qui te donnera une orientation
 
pour mon boulot je travaille avec un algo qui dérive de celui de la transformée Hough, qui permet de corriger l'inclinaison d'un document manuscrit numèrisé de travers


:jap:
Dommage que t'aies pas été là il y a un an, je pense que tu aurais été la personne du forum la plus à même de me donner de bons conseils...;)

n°712161
christophe​_d13
L'efficacité à tout prix.
Posté le 29-04-2004 à 18:31:16  profilanswer
 

Juste pour poursuivre topic très interressant...
 
Je pensais (je fais des recherches dans ce domaine) aux wavelets, à la vectorisation du document et à la détection de formes...
 
Pourquoi ? Les documents sont tous différents et peuvent contenir des photos, du texte, les deux, des schémas, dessins...
 
Ce qui veut dire qu'il faudrait un algo spécifique à la forme "photo" par rapport aux autres formes.
 
Le tout en se basant sur le sens de lecture horizontal puis vertical. Mais si c'est vertical puis horizontal (kanji) il faut également traîter cette spécificité.
 
Dommage que le projet soit tombé à l'eau. Un très bon logiciel vendable à prix d'or chez tous les archiveurs !

n°712187
Masure
Posté le 29-04-2004 à 19:04:46  profilanswer
 

jcrois que t as pas du tout compris . Mais quelque part j ai rien compris a ce que t as ecrit donc c ptet moi :)

n°712220
christophe​_d13
L'efficacité à tout prix.
Posté le 29-04-2004 à 19:35:35  profilanswer
 

masure> MDR... Parlez-vous chinois ou chez moi ?

n°712234
Masure
Posté le 29-04-2004 à 19:44:03  profilanswer
 

christophe_d13 a écrit :

masure> MDR... Parlez-vous chinois ou chez moi ?


 
dslé j ai fait ce que j ai pu :)

n°712240
christophe​_d13
L'efficacité à tout prix.
Posté le 29-04-2004 à 19:53:23  profilanswer
 

Moi aussi j'ai cru que hough c'est parce qu'il s'était cogné la tête... Mais maintenant je suis sur qu'il a mal donc "hough" !

mood
Publicité
Posté le   profilanswer
 

 Page :   1  2
Page Suivante

Aller à :
Ajouter une réponse
 

Sujets relatifs
[js ? vbs?] récupérer l'image associée d'un programme (icone) ?[html]Mettre une image pour un bouton de formulaire ?
[PHP] Intercépter un chemain pour l'utiliser comme source d'une image?Algo de Dijkstra en C : j'y arrive pas !!!!
Probleme avec JPGraph et generation d'image[Vb.net] Intégration d'image au projet....
barre d'outil image sous IE...[HTML/CSS] comment positionner verticalement une image ?
[Résolu] Espace non désiré sous une image dans un tableau[algo - tris par tas] le parallèliser
Plus de sujets relatifs à : [Algo] Détecter l'orientation d'une image (et étapes intermédiaires)


Copyright © 1997-2022 Hardware.fr SARL (Signaler un contenu illicite / Données personnelles) / Groupe LDLC / Shop HFR