Aller au contenu  Aller au menu Aller à la recherche

accès rapides, services personnalisés

Rechercher

Recherche détaillée

Contact

Jacqueline Collet-Narboni
Responsable administrative

courriel : jacqueline.collet-narboni@upmc.fr

Cette page est la page de garde du site consacré à l' unité d'enseignement « Statistiques pour la classification et fouille de données en génomique (5I753) »

Ressources annuelles

Responsable de l'UE : Wuillemin, pierre-henri



Description de l'UE :

Objectifs : Introduire les méthodes d'analyse de données complexes, depuis l'analyse statistique classique jusqu'aux plus récentes techniques d'apprentissage automatique. Présenter les principales questions analytiques en génomique fonctionnelle et les approches méthodologiques permettant une analyse exploratoire ou la construction automatique de modèles prédictifs en intégrant des données hétérogènes: transcriptomiques, cliniques, génomiques, métabolomiques ou métagénomiques, etc. On abordera en particulier les données haut-débits rencontrées en transcriptomique et métagénomique. Différentes applications médicales seront présentées pour illustrer les problèmes posés par l'analyse du transcriptome.

Programme prévisionnel : - Statistique non paramétrique ; - Modèle linéaire et linéaire généralisé ; - Analyse de données (analyse multivariée, statistique euclidienne, ACP, analyse des correspondances multiples, analyse canonique, etc.) ; - Méthodes à noyaux ; - L'étude du transcriptome par les données puces et séquençage (NGS), standards de représentation et stockage, la normalisation ; - Principales directions analytiques, ressources et approches utilisées, tests statistiques, ajustement multiples, l'échantillonnage et les techniques de validation utilisées pour l'analyse du transcriptome ; - Etude de l'expression différentielle, ressources et approches d'analyse fonctionnelle transcriptomique ; - Echantillonnage, classification supervisée (arbre de décision, règles de décision, k-PPV, Séparateurs à Vastes Marges (SVM), etc.) ; - Classification non supervisée (classification ascendante hiérarchique, k-means, règles d'associations, etc.) des données et applications aux données transcriptomiques dont cinétiques d'expression ; - L'analyse intégrative des réseaux transcriptionnels : utilité, approches conventionnelles et intégratives, applications ; - Directions futures de développement d'approches computationnelles intégratives pour la biologie des systèmes dont le "séquençage de nouvelle génération" (NGS).