Toutes les entreprises collectent et stockent de grandes quantités de données. Ces mégabases de données, qui ne cessent d'augmenter jour après jour, sont peu exploitées, alors qu'elles cachent de connaissances décisives face au marché et à la concurrence. Pour combler ce besoin, une nouvelle industrie est en train de naître : le Data Mining (qu'on appellerait en français la fouille de données). Le but de cette UV est d'initier les élèves-ingénieurs aux méthodes et algorithmes issus des statistiques et utilisés en Data Mining. La première partie de ce cours aborde les méthodes de représentation de données multidimensionnelles (analyse en composantes principales, ...). Dans la seconde partie, le cours se concentre sur les méthodes de "clustering", méthodes permettant de regrouper les individus ressemblant dans des classes représentatives. La dernière partie du cours porte sur la notion de discrimination, c'est à dire les méthodes permettant de construire une fonction d'association entre un individu et une classe. Des séances de TD assurent une mise en application des algorithmes vus dans le cours afin de bien observer les différents problèmes pratiques posés, les limites, avantages et inconvénients de chaque méthode, etc ..

PropertyValue
suplomfrOnto:audience
suplomfrOnto:contribution
suplomfrOnto:cout
dc:description
  • Toutes les entreprises collectent et stockent de grandes quantités de données. Ces mégabases de données, qui ne cessent d'augmenter jour après jour, sont peu exploitées, alors qu'elles cachent de connaissances décisives face au marché et à la concurrence. Pour combler ce besoin, une nouvelle industrie est en train de naître : le Data Mining (qu'on appellerait en français la fouille de données). Le but de cette UV est d'initier les élèves-ingénieurs aux méthodes et algorithmes issus des statistiques et utilisés en Data Mining. La première partie de ce cours aborde les méthodes de représentation de données multidimensionnelles (analyse en composantes principales, ...). Dans la seconde partie, le cours se concentre sur les méthodes de "clustering", méthodes permettant de regrouper les individus ressemblant dans des classes représentatives. La dernière partie du cours porte sur la notion de discrimination, c'est à dire les méthodes permettant de construire une fonction d'association entre un individu et une classe. Des séances de TD assurent une mise en application des algorithmes vus dans le cours afin de bien observer les différents problèmes pratiques posés, les limites, avantages et inconvénients de chaque méthode, etc .. (fre)
suplomfrOnto:discipline
dc:format
  • application/pdf
  • text/html
dc:identifier
  • URI##http://ori.unit-c.fr/uid/unit-ori-wf-1-103
dc:langage
  • fre
suplomfrOnto:localisation
suplomfrOnto:niveauAggregation
suplomfrOnto:proprieteIntellectuelle
dc:rights
  • Ressources en libre accès, propriété exclusive de leurs auteurs et de l'INSA de Rouen. (fre)
suplomfrOnto:structure
dc:subject
  • Matlab (fre)
  • algorithme (fre)
  • analyse statistique des données (fre)
  • bases de données (fre)
  • classification (fre)
  • classification hiérarchique ascendante (fre)
  • clustering (fre)
  • data mining (fre)
  • discrimination (fre)
  • extraction automatique d?informations (fre)
  • fouille de données (fre)
  • modélisation (fre)
  • proximité (fre)
dc:title
  • Data Mining (fre)
dc:type
rdf:type
suplomfrOnto:typePedagogique
suplomfrOnto:version
  • 18/12/2007 (fre)

Metadata

<http://SemUNT.supelec.fr/pubby/data/ressource/unit/_1619_Data_Mining>  
expand all