tetedeiench a écrit :
Essayez ca, je viens de tomber dessus :
Des commentaires sur un truc aussi hallucinant ?
Comment ils font exactement ?
|
Je n'ai pas pu acceder a ton lien toutefois je peux essayer d'expliquer en gros comment ca marche.
Il y a toute une phase d'analyse syntaxique/linguistique pour déterminer la prosodie (hauteur, ton, durée) des phrases et la transcription phonetique de la phrase.
Il y a une grosse base de données de parole naturelle.
Ensuite on extrait de cette base de données les unités accoustiques à concaténer (cela peut être des syllabes, des bouts de mots voire des mots entiers) et on effectue un peu de traitement de signal sur ces unités pour coller à la prosodie définie à la première étape.
Pour modifier la prosodie et coller les unités accoustiques, il faut regarder du côté des technologies TD-PSOLA (Time
Domain - Pitch Synchronous OverLap and Add), HNM (Harmonique plus Noise Model)...
Message édité par marmotte.tranquille le 28-11-2003 à 18:18:06