Master 2013 2014
Stages de la spécialité SAR
Transformation Statistique de la Voix


Site :ircamTRAX
Lieu :Analyse et Synthèse des Sons - IRCAM
Encadrant : Nicolas Obin Axel Roebel
Dates :01/03/2011 au 31/07/11
Rémunération : 400€ (rémunération légale)
Mots-clés : Parcours ATIAM : Traitement du signal

Description

L’objectif de ce stage est d’élaborer un cadre statistique pour améliorer le contrôle de la transformation de la voix (homme/femme, âge, qualité vocale, émotion, etc…) : du singulier (spécificités de la voix d’un individu) au multiple (plusieurs types de vieillissement de la voix, etc…).

L’enjeu principal du stage sera l’implémentation d’une méthode de transformation statistique de la voix pour modéliser la diversité des transformations possibles, et adapter la transformation en fonction des caractéristiques spécifique de la voix d’un individu.

Le stage commencera par l’étude d’un cas simple sur une base de données multi-locuteurs : la transformation du genre (homme/femme) et/ou de l’âge d’un individu ; pour s’étendre graduellement vers des cas plus complexes (qualité vocale : voix soufflée, craquée, rauque, etc…).

Le stage s’appuiera sur les connaissances de l’équipe Analyse et Synthèse des Sons sur la modélisation statistique en synthèse et transformation de la voix (identité, émotion, style), et sur les moteurs de synthèse de la voix (vocodeur de phase, synthèse paramétrique).

Il sera envisagé d’intégrer les travaux de recherche au plugin de transformation de la voix ircamTRAX (http://ircamtools.com).

Bibliographie

[Toda 2009] T. Toda "Eigenvoice-based approach to Voice Conversion and Voice Quality control". Proc. NCMMSC, International Symposium, pp. 492-497, Lanzhou, China, Aug. 2009.