Forum |  HardWare.fr | News | Articles | PC | S'identifier | S'inscrire | Shop Recherche
582 connectés 

  FORUM HardWare.fr
  Video & Son
  Traitement Audio

  Logiciel open sources de reconnaissance de la parole en C++

 


 Mot :   Pseudo :  
 
Bas de page
Auteur Sujet :

Logiciel open sources de reconnaissance de la parole en C++

n°875634
webmaster_​aprepa
Posté le 28-05-2005 à 14:20:57  profilanswer
 

edit: moderation


Message édité par webmaster_aprepa le 29-05-2005 à 22:32:43
mood
Publicité
Posté le 28-05-2005 à 14:20:57  profilanswer
 

n°875635
dr-freuder​ick
Asymétrie Cognitive.
Posté le 28-05-2005 à 14:21:13  profilanswer
 

ca sert a quoi  ?
 
Ca ressemble a un spam futile :o


Message édité par dr-freuderick le 28-05-2005 à 14:21:27

---------------
The Toast, un docu-fiction qui teste la loi de murphy et les films en carton
n°875658
webmaster_​aprepa
Posté le 28-05-2005 à 15:02:53  profilanswer
 

Absolument pas ! ! !
Mais je me suis peut être tromper de forum si on ne peut pas parler de reconnaissance de la parole ici :-/

n°875665
dr-freuder​ick
Asymétrie Cognitive.
Posté le 28-05-2005 à 15:10:53  profilanswer
 

Et il sert quoi exactement ton log ?


---------------
The Toast, un docu-fiction qui teste la loi de murphy et les films en carton
n°875718
webmaster_​aprepa
Posté le 28-05-2005 à 16:19:06  profilanswer
 

C'est bien pour ça que j'ai fais un site :-/
Sinon tout est dans le non APREPA (APprentissage et REconnaissance de la PArole) il est basé sur les MMC.

n°875749
dr-freuder​ick
Asymétrie Cognitive.
Posté le 28-05-2005 à 17:47:07  profilanswer
 

Si tu présente pas plus ton logiciel, tu vas te faire fermer.
 
Ca sert a rien de balancer ton site en disant allez y toutes les explications y sont.


---------------
The Toast, un docu-fiction qui teste la loi de murphy et les films en carton
n°875804
webmaster_​aprepa
Posté le 28-05-2005 à 20:04:00  profilanswer
 

C?est marrant mais sur d'autres forum j?ai fais la même chose et les gens sont allé voir le site il on regardé la présentation du projet. Certain on même télécharger les sources. Après on a discuté :
"Ça c?est bien..." "ça c?est pas bien..." "ici tu devrais faire comme ça..."
 
aucun mec ne m?a menacé de fermé la discussion ! ! !  
et si ça t'amuse de le faire te gène pas !
j?ai pas besoin de venir sur un forum où le modérateur est aussi con ! ! ! !  
 

n°875828
angturil
Posté le 28-05-2005 à 20:22:15  profilanswer
 

Citation :

Un autre projet devrait voir le jour pour la reconnaissance des notes jouées par un instrument de musique(piano pour le moment) en collaboration avec Jean-François L.


 
J'attend avec impatience de voir çà, et surtout voir comment vous allez vous dépatouiller pour de la reconnaissance de fréquences de notes groupées (accords), résonnantes, harmoniques etc... :whistle:
 
Sinon bravo pour l'initiative, juste qu'une présentation sommaire dans ce topic aurait été probablement mieux perçue plutôt qu'un simple lien (assimilé à du spam).


Message édité par angturil le 28-05-2005 à 20:23:46
n°875845
dr-freuder​ick
Asymétrie Cognitive.
Posté le 28-05-2005 à 20:57:38  profilanswer
 

webmaster_aprepa a écrit :

C?est marrant mais sur d'autres forum j?ai fais la même chose et les gens sont allé voir le site il on regardé la présentation du projet. Certain on même télécharger les sources. Après on a discuté :
"Ça c?est bien..." "ça c?est pas bien..." "ici tu devrais faire comme ça..."
 
aucun mec ne m?a menacé de fermé la discussion ! ! !  
et si ça t'amuse de le faire te gène pas !
j?ai pas besoin de venir sur un forum où le modérateur est aussi con ! ! ! !


 
 
Oh du calme. Je peux pas fermer de sujet de toute façon hein.
Je te repproche juste de manquer un peu de conversation...


---------------
The Toast, un docu-fiction qui teste la loi de murphy et les films en carton
n°876373
B@chi-Bouz​ouk
asocial, misanthrope
Posté le 29-05-2005 à 19:27:54  profilanswer
 

je suis absolument pas un pro du son, mais (question d'ordre général) pourquoi découper le son en gaussiennes? Je sais pas, mais une "bête" transformée de fourrier ne serait pas mieux? (c'est peut être plus/moins compliqué, plus difficilement interprétable etc.. je sais absolument pas..)
 
est-ce que les gaussiennes modélisent bien la  parole?
 
parceque vu qu'une transformée de fourier transforme tout en fonction sinusoïdales, c'est à priori plutot sympa pour le son non?


Message édité par B@chi-Bouzouk le 29-05-2005 à 19:41:23
mood
Publicité
Posté le 29-05-2005 à 19:27:54  profilanswer
 

n°876452
webmaster_​aprepa
Posté le 29-05-2005 à 21:28:22  profilanswer
 

Ok ok on oubli le démarrage de la discussion et on parle un peut de reco.
 
Pour la reco des notes de piano on va devoir changer l'extraction acoustique et trouver les informations pertinentes à extraire. A priori ce sont les fréquences des piques et leurs amplitudes. Après comment on va faire, je sais pas encore ! On attend que j'ai fini la version 1.1 pour vraiment y réfléchire. Affaire à suivre...
 
Le son n'est pas découper en gaussiennes. Pour commencer on fait une fft après on la passe dans un banc de filtre, on prend le log des énergies et on fait une ifft ce traitement donne les MFCC(enfin c'est un traitement de ce style, c'est de mémoire). C'est sur les MFCC que ce fait la reconnaissance. Les MFCC servent à extraire l'information pertinente de la parole (il y  a d?autre méthode mais c'est la plus utilisé). C'est ensuite sur les coefficients des vecteurs MFCC que l'on fait des statistiques. On utilise les MMC (modèle de Makov caché) pour faire de l'apprentissage et de la reconnaissance.
Tous ça pour dire que ce n'est pas si simple que ça. ;-)


Message édité par webmaster_aprepa le 29-05-2005 à 21:38:11
n°876474
angturil
Posté le 29-05-2005 à 21:55:06  profilanswer
 

webmaster_aprepa a écrit :

Pour la reco des notes de piano on va devoir changer l'extraction acoustique et trouver les informations pertinentes à extraire. A priori ce sont les fréquences des piques et leurs amplitudes. Après comment on va faire, je sais pas encore ! On attend que j'ai fini la version 1.1 pour vraiment y réfléchire. Affaire à suivre...

Ah ok, donc toute nouvelle technologie alors puisque dans l'état actuel de la recherche acoustique, il est absolument impossible de définir une procédure permettant la reconnaissance de notes/rythmes depuis un échantillon audio polyphonique, notes par notes. La seule reconnaissance possible concerne du monophonique, avec plus ou moins de succès.


Message édité par angturil le 29-05-2005 à 21:55:27
n°876516
webmaster_​aprepa
Posté le 29-05-2005 à 22:22:08  profilanswer
 

Disons qu'on va essayer, pour une reco monophonique on devrait avoir de bons résultats. Mais pour le polyphonique c'est une autre histoire, c'est un peut comme chercher quelques aiguilles dans une tonne de botte de foin. Mais si on arrive à bien apprendre comme la rechercher et où, ça peut marcher ! ! !


Message édité par webmaster_aprepa le 29-05-2005 à 22:30:42
n°876541
cirius
Je m'outre :o
Posté le 29-05-2005 à 22:31:59  profilanswer
 

webmaster_aprepa a écrit :

C?est marrant mais sur d'autres forum j?ai fais la même chose et les gens sont allé voir le site il on regardé la présentation du projet. Certain on même télécharger les sources. Après on a discuté :
"Ça c?est bien..." "ça c?est pas bien..." "ici tu devrais faire comme ça..."
 
aucun mec ne m?a menacé de fermé la discussion ! ! !  
et si ça t'amuse de le faire te gène pas !
j?ai pas besoin de venir sur un forum où le modérateur est aussi con ! ! ! !


 
 
ok, spams, insultes... jolie.  AU revoir :hello:


---------------
Bowers & Wilkins

Aller à :
  FORUM HardWare.fr
  Video & Son
  Traitement Audio

  Logiciel open sources de reconnaissance de la parole en C++

 

Sujets relatifs
Au secours besion d'un logiciel de compression[Audio] bande son avec enchainement de mp3 > quel logiciel ?
firmware open source pour archos av120?Branchement de 2 sources sur 1 source audio avec un dédoubleur Jack ?
Logiciel de création de musique symphoniqueLogiciel gratuit qui convertit en 3gp
Comment s'apelle le logiciel pour trafiquer les carac. d'un file vidéoLogiciel pour créer des vidéos au format rm
Logiciel de lecture de flux DVB-T (Tnt)Quel logiciel utiliser pour montage vidéo ?
Plus de sujets relatifs à : Logiciel open sources de reconnaissance de la parole en C++


Copyright © 1997-2022 Hardware.fr SARL (Signaler un contenu illicite / Données personnelles) / Groupe LDLC / Shop HFR