Master 2018 2019
Stages de la spécialité SAR
Modèles stochastiques de réverbération pour la séparation de sources audio


Site : Groupe Signal, Statistique et Apprentissage (S2A)
Lieu : Télécom ParisTech, Département Image, Données, Signal (IDS), 46 rue Barrault, 75013 Paris
Encadrant : Roland Badeau
Dates :du 18/02/2019 au 14/08/2019
Rémunération :rémunération forfaitaire de l’ordre de 570 € par mois
Mots-clés : Parcours ATIAM : Traitement du signal

Cliquer ici pour vous authentifier


Description

Contexte : Le problème de séparation de sources [Cardoso 98] consiste à estimer les "signaux sources" émis par différentes sources sonores (locuteur humain, instruments de musique, etc.), à partir de l’observation d’un ou plusieurs signaux composés d’un "mélange" de ces sources, captés par différents microphones. Les deux principales difficultés de ce problème sont dues à l’utilisation d’un nombre de capteurs inférieur au nombre de sources (mélange "sous-déterminé"), et au phénomène de réverbération (mélange "convolutif"). Ces dernières années, les efforts de recherche ont principalement porté sur la modélisation des signaux sources, qui est indispensable pour traiter le cas sous-déterminé. En revanche, la réverbération n’a reçu qu’une attention récente, et les modèles de réverbération utilisés à ce jour restent assez simples.

Sujet de stage : Le phénomène de réverbération se modélise par la convolution entre le signal source et une réponse impulsionnelle de salle. Le début de cette réponse de salle, appelé réverbération précoce, est constitué du chemin direct entre la source et le microphone, et des premières réflexions de l’onde sonore sur les différentes surfaces de la salle (murs, plafond, sol, etc.). La suite de cette réponse est appelée réverbération tardive : les réflexions deviennent si nombreuses que l’information de directivité est perdue : le champ sonore devient diffus (uniforme et isotrope). Les premiers modèles de réverbération utilisés en séparation de sources audio ont notamment été proposés par [Duong 10] et [Leglaive 16]. Ces travaux pionniers ont démontré l’intérêt de cette approche pour améliorer la qualité des sources sonores séparées, mais reposent sur des modèles simplifiés de réverbération. Dans ce stage, il est proposé d’étudier l’applicabilité de modèles plus réalistes, récemment proposés à Télécom Paristech pour la séparation de sources audio [Badeau 18].

Mots clés : Séparation de sources, réverbération, modèles probabilistes, méthodes bayésiennes

Profil du candidat : les conditions exigées pour ce stage sont les suivantes :
- deuxième année de Master Recherche ;
- des connaissances en traitement du signal audio ;
- des connaissances en probabilités, statistiques et estimation bayésienne ;
- la maîtrise du langage Matlab.

Contact : Les candidats intéressés peuvent contacter Roland Badeau (roland.badeau@telecom-paristech.fr) pour plus d’informations, ou directement adresser par courriel une lettre de candidature incluant un Curriculum Vitae.

Bibliographie

[Cardoso 98] J. F. Cardoso, "Blind signal separation : statistical principles," in Proceedings of the IEEE, vol. 86, no. 10, pp. 2009-2025, octobre 1998.

[Duong 10] N. Q. K. Duong, E. Vincent and R. Gribonval, "Under-Determined Reverberant Audio Source Separation Using a Full-Rank Spatial Covariance Model," in IEEE Transactions on Audio, Speech, and Language Processing, vol. 18, no. 7, pp. 1830-1840, sept. 2010.

[Leglaive 16] S. Leglaive, R. Badeau & G. Richard, "Multichannel Audio Source Separation with Probabilistic Reverberation Priors", IEEE/ACM Tr. on Audio, Speech, and Language Processing, vol. 24, no. 12, pp. 2453 – 2465, décembre 2016.

[Badeau 18] R. Badeau, “Research report on unified stochastic reverberation modeling,” Télécom ParisTech, Paris, France, Tech. rep. n° 2018D001, février 2018.


Sujet de stage