Forum |  HardWare.fr | News | Articles | PC | S'identifier | S'inscrire | Shop Recherche
980 connectés 

  FORUM HardWare.fr
  Programmation
  Algo

  Reconnaissance sonore

 



 Mot :   Pseudo :  
 
Bas de page
Auteur Sujet :

Reconnaissance sonore

n°746226
Kyle_Katar​n
The World Is A Vampire ....
Posté le 31-05-2004 à 15:46:21  profilanswer
 

Bonjour,
 
est ce que quelqu'un sait comment fonctionnent les services téléphoniques qui envoient le titre de la chason qu'on leur fait écouter ?
 
En effet, si c'est de la "reconnaissance pûre", c'est à dire sans utiliser les programmations des radios, je serait très intéressé pour programmer un truc similaire pour K-MP3, quitte à rendre publique la Db ainsi constituée.


---------------
KC Softwares - VideoInspector (Codec Viewer) - AudioGrail
mood
Publicité
Posté le 31-05-2004 à 15:46:21  profilanswer
 

n°746411
Ace17
Posté le 31-05-2004 à 17:50:06  profilanswer
 

drapal

n°746416
Kyle_Katar​n
The World Is A Vampire ....
Posté le 31-05-2004 à 17:52:06  profilanswer
 

heureux de voir que je suis pas le seul que ça intéresse ... ;-)


---------------
KC Softwares - VideoInspector (Codec Viewer) - AudioGrail
n°746458
jagstang
Pa Capona ಠ_ಠ
Posté le 31-05-2004 à 18:08:29  profilanswer
 

y'a-t'il un rapport avec soundex ?

n°746472
Kyle_Katar​n
The World Is A Vampire ....
Posté le 31-05-2004 à 18:14:20  profilanswer
 

C'est à dire ?


---------------
KC Softwares - VideoInspector (Codec Viewer) - AudioGrail
n°746537
bjone
Insert booze to continue
Posté le 31-05-2004 à 19:31:17  profilanswer
 

ché pas, mais je commençerais par une analyse fréquentielle (FFT), pour obtenir le bpm de la musique, afin de faire une présélection des musiques possible....
 
déjà si c'est par téléphone, ça s'arrête à 4Khz.

n°746593
Kyle_Katar​n
The World Is A Vampire ....
Posté le 31-05-2004 à 20:06:26  profilanswer
 

yep mais c'est la procédure complète que j'aimerai voir ...


---------------
KC Softwares - VideoInspector (Codec Viewer) - AudioGrail
n°746665
red factio​n
Posté le 31-05-2004 à 20:52:05  profilanswer
 

Kyle_Katarn a écrit :

Bonjour,
 
est ce que quelqu'un sait comment fonctionnent les services téléphoniques qui envoient le titre de la chason qu'on leur fait écouter ?
 
En effet, si c'est de la "reconnaissance pûre", c'est à dire sans utiliser les programmations des radios, je serait très intéressé pour programmer un truc similaire pour K-MP3, quitte à rendre publique la Db ainsi constituée.


 
ya un monsieur qui ecoute et qui appuie sur la bonne touche http://users.skynet.be/polo021/tinostar.gif

n°746671
Kyle_Katar​n
The World Is A Vampire ....
Posté le 31-05-2004 à 20:57:45  profilanswer
 

J'y ai pensé aussi et ça m'embêtterai un peu de faire pareil dans mon soft .... ;)


---------------
KC Softwares - VideoInspector (Codec Viewer) - AudioGrail
n°746673
bjone
Insert booze to continue
Posté le 31-05-2004 à 20:59:39  profilanswer
 

ché pas heuristiques, reconnaissance bpm, analyse de critères entre deux beats, ché po...

mood
Publicité
Posté le 31-05-2004 à 20:59:39  profilanswer
 

n°746679
Kyle_Katar​n
The World Is A Vampire ....
Posté le 31-05-2004 à 21:02:33  profilanswer
 

argh... personne n'a d'info précises à ce sujet ?


---------------
KC Softwares - VideoInspector (Codec Viewer) - AudioGrail
n°746685
Ace17
Posté le 31-05-2004 à 21:06:23  profilanswer
 

J'avais parcouru un bouquin sur le DSP (digital signal processing) ou ils expliquaient qu'on pouvait mesurer le degré de ressemblance entre deux signaux en les multipliant entre eux et en calculant la valeur moyenne, ou un truc du genre ...
Le livre online
C'est dans "Fundamentals"


Message édité par Ace17 le 31-05-2004 à 21:07:21
n°746755
black_lord
Truth speaks from peacefulness
Posté le 31-05-2004 à 22:06:27  profilanswer
 

[:abnocte invictus]

n°746891
Kyle_Katar​n
The World Is A Vampire ....
Posté le 01-06-2004 à 00:21:23  profilanswer
 

Le problème est qu'on peut pas comparer un signal donné à tous les signaux de la base de donnée en un temps décent... d'autant plus quand on n'a accès (cf telephone) qu'à une fraction du morceau !


---------------
KC Softwares - VideoInspector (Codec Viewer) - AudioGrail
n°747125
pospos
Posté le 01-06-2004 à 11:57:01  profilanswer
 

il faut que tu regarde du coté des signatures sonores.
 
En gros plutot que de comparer chaque morceau avec tous les autres (donc en O(n2)) tu tire une signature representative pour chaque morceau de ta base, tu fais la meme chose pour le morceau passé en test, et tu cherche la signature la plus proche...
C'est forcement une recherche approchée, dans plusieurs dimension (les dimensions c'est par exemple BMP, energie dans telle ou telle bande de frequence, ecarts dynamiques, etc...), et c'est pas tout gateau...

n°747131
Kyle_Katar​n
The World Is A Vampire ....
Posté le 01-06-2004 à 12:01:39  profilanswer
 

je suis d'accord avec toi mais comment calcule tu la signature sonore ? Grosso modo comment pourrait on définir un "hash" sur un signal sonore sachant qu'on veut quand même un truc "permittif" ?


---------------
KC Softwares - VideoInspector (Codec Viewer) - AudioGrail
n°747161
pospos
Posté le 01-06-2004 à 12:18:40  profilanswer
 

ben justement comme tu veux faire une recherche apporchée, et en plus dans plusieurs dimensions, c'est galere...
 
tu pourrais faire un truc de ce genre:
tu maintient une liste triée pour chaqune des dimensions (donc faut retrier à chaque nouveau morceau inseré dans ta base), avec à chaque ligne (on va dire que ta liste est un fichier) la valeur et un ID du morceau dans la base
 
Par exemple ca donnerais ca pour la dimension "BPM":
 
90 0001
140 0042
150 0012
...
 
ensuite tu fait une recherche par dichotomie dans chaque dimension, en prenant les n id de morceaux les plus proches, tu recoupe le tout entre tes differentes dimensions, et si tout va bien le morceau sera pile à l'intersection de toutes les dimensions (enfin ca va rarement bien....)
 
le truc qui serait chiant c'est retrier tes liste à chaque nouveau morceau, mais tu peu par exemple mettre tout ca à jour uniquement apres que 10 morceau ai été inserés par exemple. Et puis de toutes facon tu peu faire ca en batch la nuit ou autre, c'est pas vraiment trop chiant. Le tout c'est que le systeme repone rapidement au requetes (et qq dichotomies ca va vite)
 
apres il te faut les algos qui te permettent de remplir ces dimensions (et bien choisir ces dimensions et calibrer tes algos)
 
a mon avis un bon choix de dimensions ca serait:
-BPM
- energie dans les extremes basses (par exemple en dessous de 120hz)
- energie dans les basses (120-400 par exemple)
- energie dans les medium (on va dire 400-2000)
- energie dans les aigues (enfin ce qui en reste dans le telephone, donc jusque 4 ou 5khz)
- ecarts dynamiques (un genre d'ecart type sur la dynamqiue)
 
mais il doit y en avoir beaucoup d'autres!

n°755253
pospos
Posté le 07-06-2004 à 18:59:24  profilanswer
 

alors, t'en es ou de ton projet?

n°755289
Kyle_Katar​n
The World Is A Vampire ....
Posté le 07-06-2004 à 19:25:00  profilanswer
 

Pour cette idée là, c'est encore au stade de réflexion / documentation...


---------------
KC Softwares - VideoInspector (Codec Viewer) - AudioGrail

Aller à :
Ajouter une réponse
  FORUM HardWare.fr
  Programmation
  Algo

  Reconnaissance sonore

 

Sujets relatifs
[HTML - CSS- JS] Rollover sonore [Résolu][Eclipse] Pb de reconnaissance des imports + lancer VisualEditor
Reconnaissance de la version de internet ExplorerReconnaissance des fonctions Turbo PASCAL par Word
Reconnaissance des mots[résolu] Problème de reconnaissance des nouveaux messages ...
boite avec reconnaissance du texte que l'utilisateur écritprojet c++ simple traduire une phrase en morse "sonore"
Fond SonoreAppliquer un style sur du texte, par reconnaissance syntaxique
Plus de sujets relatifs à : Reconnaissance sonore


Copyright © 1997-2022 Hardware.fr SARL (Signaler un contenu illicite / Données personnelles) / Groupe LDLC / Shop HFR