Master 2014 2015
Stages de la spécialité SAR
Mesure et correction de la netteté des sons


Site :page perso de Gaël Mahé
Lieu :LIPADE et MAP5 Université Paris Descartes 45 rue des Saints-Pères Paris 6e
Encadrant : Gaël Mahé (LIPADE), Lionel Moisan et Mihai Mitréa (MAP5) Contact : gael.mahe@parisdescartes.fr
Dates :du 01/02/2015 au 30/06/2015 (modifiable)
Rémunération :436 euros nets par mois
Mots-clés : Parcours ATIAM : Traitement du signal

Description

Projet :

Nous souhaitons définir de nouvelles mesures objectives de netteté intrinsèque du son (sans comparaison avec une référence), ainsi que des algorithmes non-supervisés de correction de la qualité audio (débruitage, déréverbération...) fondés sur l’optimisation de ces mesures.

Ce travail contribue au projet I’CityForAll (Age Sensitive ICT Systems For Intelligible City For All) du programme européen de recherche Ambient Assisted Living.

La netteté d’un son est une grandeur subjective, dont la meilleure mesure repose sur des tests d’écoute formels impliquant un grand nombre de sujets, ce qui est coûteux en temps et financièrement. C’est pourquoi divers indices objectifs de netteté ont été proposés, fondés sur les propriétés physiques du son ou du système de transmission. Par exemple, en acoustique des salles, le Speech Transmission Index (STI) [Houtgast1985] est bien corrélé avec la netteté perçue, pour diverses conditions de bruit et de réverbération.

Ces indices ont l’inconvénient de reposer sur une comparaison entre le son dégradé et le son original, alors que ce dernier n’est pas toujours disponible. D’autre part, cette approche définit implicitement la netteté comme un degré de dégradation et non comme une propriété intrinsèque d’un son.

Le même problème se pose dans les algorithmes de correction automatique de la qualité des sons, qui sont souvent fondés sur une comparaison avec des propriétés du son original. Dans le cas fréquent où celles-ci ne sont pas disponibles, elles doivent être estimées, au prix d’hypothèses trop fortes (par exemple, en débruitage, on suppose la stationarité du bruit de fond).

Récemment, nous avons adapté au son de nouvelles mesures objectives de netteté issues du traitement d’image : la cohérence globale de phase (GPC) [Blanchet2008] et le sharpness index (SI) [Leclaire2014]. Ces indices caractérisent la capacité des phases de la transformée de Fourier d’une image à collaborer pour produire des contours nets et des régions très régulières. Ils ont l’avantage de ne pas reposer sur une comparaison avec une version originale du signal.

L’idée de la GPC et du SI peut être généralisée comme la sensibilité d’une mesure de régularité du signal à une certaine distorsion. Nos travaux actuels portent sur la définition de la mesure de régularité et de la distorsion les plus appropriés au son, en tenant compte à la fois des propriétés mathématiques des signaux sonores et de celles de l’audition humaine.

Plan de travail :

Le stage consistera principalement à concevoir des algorithmes de correction non-supervisée de la qualité audio, fondés sur l’optimisation de ces nouvelles mesures objectives de la netteté du son.

Différents traitements correctifs du son sont visés :
- réduction du bruit d’environnement ou du bruit généré par les systèmes de transmission (microphone et codage-décodage) ;
- déréverbération lors d’une prise de son distante de la source sonore dans un environnement réverbérant ;
- dans les communications en mode mains-libres, traitement de l’écho en situation de double parole (mal traitée par les annuleurs d’écho actuels).

Ces différents cas sont traditionnellement traités de manière différente, par des algorithmes fondés sur une modélisation ad hoc des sources de dégradation du signal audio. Les indices de netteté proposés seront à la base d’une approche unifiée où, sans a priori sur le type de dégradation, ils seront exploités comme critères d’optimisation d’algorithmes de correction non-supervisée. Il pourra s’agir soit d’un post-traitement dans un contexte de télécommunications ou de restauration d’enregistrement, soit d’une pré-distorsion du son dans un contexte de diffusion d’annonces sonores dans des lieux bruyants et réverbérants (halls de gare, stations de métro...)

Parallèlement, selon le temps disponible et l’avancement du travail, le stagiaire pourra participer à la définition des nouvelles mesures objectives de netteté du son, en particulier le spectro-GPC, fondé sur une analyse temps-fréquence intégrant une approche psycho-acoustique.

Profil requis
- Bonnes connaissances en traitement du signal, notamment analyse temps-fréquence et optimisation adaptative.
- Maîtrise de matlab ou scilab
- Goût pour le traitement du son

Bibliographie

[Blanchet 2008] G. Blanchet, L. Moisan, and B. Rougé. Measuring the global phase coherence of an image. In Proc. Int. Conf.on Image Processing, pages 1176–1179, 2008.

[Houtgast 1985] T. Houtgast and H.J.M. Steeneken. A review of the MTF concept in room acoustics and its use for estimating speech intelligibility in auditoria. Journal of the Acoustical Society of America, pages 1096–1077, 1985.

[Leclaire 2014] Arthur Leclaire and Lionel Moisan. No-reference image quality assessment and blind deblurring with sharpness metrics exploiting Fourier phase information. pre-print MAP5, 2014.