• Statistique inférentielle
  • Analyse factorielle
  • Mathématiques informatiques
  • Système exploitation informatique

Analyse multivariée approfondie

Mis à jour le

Responsable(s) : M. Giorgio RUSSOLILLO

  • Cours
Code Cnam : STA201-PAR
  • Durée : 70 heures (+/- 10%)
  • A la carte
  • Soir & samedi
  • 9 crédits
  • Distanciel, Présentiel

Présentation

Public, conditions d'accès et prérequis

Prérequis

Etre inscrit en M2 du master Statistique MR123 (ancien MR085) ou du master Actuariat MR126000A (ancien MR088) ou être agréé (niveau requis STA101 et STA102) .
 Pour obtenir l'agrément, les auditeurs adresseront par courrier électronique à l'enseignant responsable, Mme Niang (ndeye.niang_keita@cnam.fr ) un CV détaillé et une lettre de motivation indiquant les raisons de la demande et le projet pédagogique dans lequel elle s'inscrit.

Objectifs

Approfondir les méthodes statistiques d'analyse exploratoire, de régression et de classification

L'avis des auditeurs

Les dernières réponses à l'enquête d'appréciation pour cet enseignement : Fiche synthétique au format PDF

Informations pratiques

Contact

Logo école santé Cnam

Programme

Contenu

Méthodes d’analyse exploratoire et confirmatoire :

  • Analyse factorielle exploratoire et confirmatoire
  • Codage optimal
  • Positionnement Multidimensionnel
  • Classification non supervisée et modèles de mélanges

Méthodes prédictives :

Méthodes de régression

  • Estimation des paramètres par ré-échantillonnage (Bootstrap, Jackknife)
  • Multicolinéarité et stabilité des estimations
  • Complexité du modèle, trade-off biais-variance et précision des prédictions
  • Méthodes de sélection des variables (Best subset regression, méthodes pas à pas)
  • Méthodes de régularisation par composantes : Régression sur Composantes Principales, Régression PLS
  • Méthodes de régularisation par contraintes : Régression Ridge, LASSO, Elastic Net
  • Sélection de modèle par procédures d'apprentissage statistique
  • Régression robuste
  • Régression non paramétrique

Méthodes de classification supervisée

  • Régression logistique binaire
  • Régression Logistique multinomiale et ordinale
  • Analyse factorielle discriminante
  • Discrimination sur variables qualitatives
  • Analyse discriminante probabiliste Linéaire et Quadratique
  • Approche non paramétrique : Méthode des noyaux, Méthode des k plus proches voisins

Traitement des données manquantes

 

Modalités d'évaluation

Le travail consistera à rédiger un rapport qui sera présenté et discuté lors d’une soutenance orale. L'étudiant pourra choisir entre deux types de projets : une étude de cas ou une synthèse d’articles.

Bibliographie

  • G.GOVAERT . Analyse des données ( Hermes,2003)
  • M.BARDOS . Analyse discriminante (Dunod,2001)
  • J.P.NAKACHE, J.CONFAIS . Statistique explicative appliquée (Technip, 2003)
  • G.SAPORTA . Probabilités, analyse des données, statistique 3ème édition (Technip,2010)
  • S.TUFFERY . Data mining et statistique décisionnelle, 3ème édition (Technip, 2010)
  • T.HASTIE, J.FRIEDMAN, F.TIBSHIRANI . The Elements of Statistical Learning (Springer 2009). Téléchargeable ici : http://www-stat.stanford.edu/~tibs/ElemStatLearn/download.html
  • K.V. Mardia, J.T. Kent and J.M. Bibby . Multivariate Analysis, Academic Press, 1979
  • G. James, D. Witten, T. Hastie and R. Tibshirani . An Introduction to Statistical Learning with application in R, 2ème édition (Springer, 2021))
  • G. James, D. Witten, T. Hastie, R. Tibshirani and J.Taylor . An Introduction to Statistical Learning with application in Python (Springer ,2023)

Formation mère

Analyse multivariée approfondie

Ces formations pourraient vous intéresser