Master 2014 2015
Stages de la spécialité SAR
Codage audio par méthodes variationnelles


Site :LMA, équipe Sons
Lieu :Laboratoire de Mécanique et d'Acoustique 31, chemin Joseph Aiguier Marseille 9e
Encadrant : Olivier DERRIEN
Dates :01/03/2015 au 31/07/2015 (aménagements possibles)
Rémunération :436 € mensuels
Mots-clés : Parcours ATIAM : Traitement du signal

Description

Le Contexte : Les codeurs audio compressifs courants (MP3, AAC …) sont construits autours d’une transformée temps-fréquence qui est associée à des bases en cosinus (MDCT). La structure rigide de ces bases induit de nombreux artefacts de codage à bas ou moyen débit (par exemple le pré-écho) et nuit à l’efficacité du codage. Des approches plus souples utilisant des dictionnaires redondants (typiquement des unions de bases MDCT de tailles différentes) ont été proposées (Ravelli et al, Yagoobi et al) et ont prouvé qu’elles pouvaient améliorer sensiblement l’efficacité du codage. La décomposition du signal n’étant ni unique, ni exacte, l’algorithme d’analyse est nécessairement complexe. Les méthodes les plus courantes sont les approches déplétives (dérivant de l’algorithme de « Matching Pursuit »), qui ont déjà été bien étudiées. On peut aussi utiliser des méthodes variationnelles, consistant à minimiser une fonction de coût. Ces méthodes n’ont fait l’objet que de travaux préliminaires, et c’est à elles qu’on s’intéresse. Le comportement de l’algorithme dépend fortement de la fonction de coût choisie. On choisit une mesure de distorsion perceptive (pour s’assurer que la qualité du signal reconstruit sera subjectivement bonne) à laquelle on ajoute une contrainte de parcimonie (pour s’assurer que l’information à coder ne comporte qu’un faible nombre de coefficients non-nuls). Une telle mesure de distorsion dépend donc du choix du dictionnaire de codage, et de la mesure de distorsion perceptive choisie.

Travail à réaliser : Le but du stage est de tester un grande variété de couples dictionnaires de codage - distorsion perceptive dans un contexte de codage, de caractériser précisément le comportement de l’algorithme d’optimisation, et d’évaluer, au moyen de tests d’écoute sur des auditeurs réels, la configuration qui offre la meilleure efficacité de codage. On comparera aussi avec une méthode de référence à base de Matching Pursuit et un codec standard (typiquement AAC). Il est à noter que la très grande majorité des algorithmes nécessaires à la réalisation du stage sont déjà disponibles en Matlab.

Pré-requis : Méthodes classiques en traitement du signal (filtrage, transformées temps-fréquence), méthodes d’optimisation itératives et programmation en Matlab. Une bonne connaissance des méthodes spécifiques aux signaux audio est indispensable.