Retour accueil UPMCPhoto1 UPMCPhoto2 UPMC
Anneaux UPMC
Spécialité Intelligence Artificielle et Décision Thématique « Fouille intelligente de données »

Ce site présentra bientôt les évolutions de nos formations pour la rentrée 2009, dont une ouverture plus marquée d'ACSI aux systèmes embarqués sur puces, et la création d'une spécialité Bioinformatique et modélisation.

Objectifs et description de la thématique « Fouille intelligente de données »

L'explosion de l'information est un des phénomènes les plus marquants de ces dernières années. Les développements technologiques liés à l'internet, aux grandes bases de données réparties ou encore aux échanges pair à pair, à l'essor de domaines comme le multimédia ou la biologie génèrent une quantité gigantesque de données. Ces données sont de natures très diverses. Elles peuvent se présenter en vrac, sous forme semi-structurée ou être déjà organisées dans des bases de données. Elles peuvent posséder un fort contenu sémantique (sites webs, corpus textuels, vidéo, musique, etc) ou un faible degré d'interprétabilité humaine (données financières, séquences biologiques, paquets IP, etc). L'objet de la fouille de données et de la recherche d'information est de développer les outils permettant de traiter ces données à grande échelle, de les analyser, de les représenter de façon synthétique et exploitable. La problématique touche plusieurs domaines de l'intelligence artificielle ainsi que plusieurs grands domaines applicatifs. Au sein du laboratoire par exemple, les équipes de recherche développent leurs techniques pour des applications comme les moteurs de recherche, l'analyse d'informations textuelles, l'indexation de vidéos, le filtrage et l'extraction d'information sur le web, les interfaces stylo (type palm, tablet-PC), les entrepôts de données, le web sémantique, l'analyse d'usages. La thématique Fouille intelligente de données introduit aux principaux enjeux du domaine et fournit les outils, théoriques ou pratiques, permettant de les aborder.

Parmi l'ensemble des problématiques de la fouille de données, nous avons choisi de focaliser le cours @@rfidon sur le traitement de données à fort contenu sémantique : texte, image et vidéo ainsi que le cas des données issues du web. On y aborde en particulier les problèmes de recherche et d'extraction d'information. Trois modules complètent cette initiation au domaine et fournissent des éclairages variés sur les outils et les problématiques. La problématique de la décision est abordée par le biais de la décision multicritère (dmdc) qui fournit un éclairage complémentaire aux grandes familles de techniques vues dans le tronc commun (apprentissage symbolique et numérique, modélisation du raisonnement). L'interaction utilisateur qui est centrale pour la fouille et la recherche d'information au travers des interfaces, de la visualisation des contenus et des données ainsi que par l'usage des différentes modalités d'interaction, est traitée dans le cours ihm. Les grands entrepôts de données et les BD réparties font l'objet de @@bdwa. Enfin, les modules tadti et @@ssc, organisés sous la forme de TD/TP, permettent de se familiariser avec des méthodes et problèmes pratiques.

Retour à la spécialité et aux parcours

Choisissez un des parcours ci-dessous pour voir sa description détaillée.

(ouvrir dans la même fenêtre ou dans une autre )

Parcours en M2 :

coin