ECTS
3
Volume horaire
61h
Établissement
INSTITUT NATIONAL DES SCIENCES APPLIQUEES TOULOUSE
Description
Programme (contenu détaillé) :
- Introduction à l’exploration de données.
- Programmation en R et rédaction d’un rapport avec Rmarkdown
- Méthodes factorielles : rappel de l’analyse en composantes principales (ACP). Variantes de l’ACP pour les données qualitatives (analyse des correspondances), la classification supervisée (analyse linéaire discriminante), les données définies par des distances (positionnement multidimensionnel)
- Méthodes de clustering : K-means et ses variantes, classification hiérarchique, DBSCAN, modèles de mélange et algorithme EM.

