Master 2013 2014
Stages de la spécialité SAR
Estimation de l’émotion musicale : approche catégorielle/paramétrique


Site :Equipe Analyse/Synthèse
Lieu :IRCAM
Encadrant : Geoffroy Peeters
Dates :01/03/2014 au 31/07/2014
Rémunération :420 Euro/mois

Description

Dans les modèles d’estimation automatique de l’émotion musicale, deux formes de représentations sont utilisées : une description catégorielle et l’utilisation de modèles paramétriques. La description catégorielle recherche des attributs « émotionnels » permettant de décrire le contenu de la musique (Hevner-1936 utilise 66 adjectifs organisés en 8 groupes, Zentner-2008 146 adjectifs, Hu-2007 5 catégories dérivées de l’annotation manuelle de All Music Guide). L’utilisation de modèles paramétriques permet la description de l’humeur dans un continuum/ espace multidimensionnels (modèles à deux dimensions « Valence/ Arousal » A/V de Russel-1980). Selon l’aspect catégoriel ou paramétrique, la reconnaissance de l’émotion musicale peut alors être formalisée comme un problème multi-classes/ multi-label ou comme un problème de régression.

Lorsque l’estimation de l’émotion est effectuée à partir de l’analyse du signal audio, les différentes approches se distinguent premièrement par les descripteurs audio utilisés ; ensuite par les systèmes d’apprentissage. Dans l’approche catégorielle [Li, 2003], les variations de l’apprentissage concernent : la sélection automatique des meilleurs descripteurs audio (Sequential Feature Selection, IRMFSP), ainsi que le choix du classificateur (Principal Component Analysis, Linear Discriminant Analysis, GMM, Support Vector Machine, Gaussian-Super-Vector suivi d’un SVM, AdaBoost). Dans l’approche par modèle paramétrique [Yang, 2008], les variations de l’apprentissage concernent la discrétisation ou non de l’espace V/A (dans le cas de la discrétisation le problème est ramené au cas catégoriel préalablement mentionnés) ou choix de la méthode de régression (Support Vector Regression, Partial Lest-Square Regression, Multiple Lienar Regression).

L’objectif de ce stage est d’étudier comment une approche catégorielle et paramétrique peuvent être simultanément utilisée et bénéficiée l’une à l’autre.

Bibliographie

Li, T. and M. Ogihara (2003). Detecting emotion in music. Proc. of ISMIR, Baltimore, MD

Yang, Y.-H., Y.-C. Lin, et al. (2008). Advances in Multimedia Information Processing. Lecture Notes in Computer Science. S. B. Heidelberg

Lu, L., D. Liu, et al. (2006). “Automatic mood detection and tracking of music audio signals.” IEEE Transactions on Audio Speech and Language Processing 14(1) : 5-18