• Statistique inférentielle
  • Statistique descriptive
  • Statistique appliquée
  • Analyse de données
  • Gestion données massives
  • Data science
  • Data Mining
  • Intelligence artificielle

Apprentissage statistique en grande dimension

Mis à jour le

  • Cours
Code Cnam : STA217

Envie d'en savoir plus sur cette formation ?

Afin d’obtenir les tarifs, le calendrier de la formation, en distanciel, en présentiel, le lieu de la formation et un contact, remplissez les critères suivants :

Afficher le centre adapté à mes besoins

Afin d’obtenir les tarifs, le calendrier de la formation et le lieu de la formation, remplissez les critères suivants :

  • Durée : 70 heures
  • A la carte
  • Soir & samedi
  • 9 crédits
  • Hybride (présentiel et distanciel), Présentiel

Présentation

Public, conditions d'accès et prérequis

Prérequis

Avoir le niveau des unités d'enseignement : STA201, STA211. Avoir de bonnes connaissances en calcul matriciel, probabilités et inférence statistique. 

Objectifs

Maîtriser les méthodes d'apprentissage statistique pour l'analyse de données de grande dimension
 

Compétences et débouchés

Compétences

Maîtriser les méthodes d'apprentissage statistique pour l'analyse de données structurées ou non mettant en jeu un grand nombre de variables et/ou d'individus

Informations pratiques

Contact

Retrouvez cette formation en centre :

Lieux de formation

Programme

Contenu

  1. Définition et enjeux de l’apprentissage statistique 
  2. Présentation des problématiques liées à la grande dimension 
  3. Méthodes statistiques pour la grande dimension
    1. Méthode non supervisées
      1. Analyse factorielle sparse
      2. Méthode de classification : Sparse Kmeans, Subspace clustering, Consensus de partitions
      3. Méthodes descriptives pour données multiblocs 
      4. ACP fonctionnelle 
      5. Classification de données fonctionnelles 
    2. Méthodes supervisées
      1. Méthodes de sélection de variables en grande dimension
      2. Méthodes de régularisation  
      3. Méthodes de classification supervisée
      4. Méthodes supervisées pour données multiblocs
      5. Méthodes de régression pour données fonctionnelles 
    3. Méthodes Clusterwise pour un grand nombre d’observations hétérogènes

 

Modalités d'évaluation

Un examen écrit  + un projet personnel sanctionneront la fin des cours.
Le projet personnel devra mettre en application les techniques décrites en cours. Il pourra faire l'objet d'un présentation orale

Bibliographie

  • Ramsay J.O. and Silverman B.W. . Functional Data Analysis. Second Edition (Springer Series in Statistics, 2005)
  • Ramsay J.O. and Silverman B.W. . Applied Functional Data Analysis (Springer, 2002)
  • Crainiceanu C.M., Goldsmith J., Leroux A. and Cui E. . Functional Data Analysis with R. (Chapman & Hall, 2024)
  • G.GOVAERT . Analyse des données ( Hermes,2003)
  • J.P.NAKACHE, J.CONFAIS . Statistique explicative appliquée (Technip, 2003)
  • G.SAPORTA . Probabilités, analyse des données, statistique 3ème édition (Technip,2011))
  • T.HASTIE, J.FRIEDMAN, F.TIBSHIRANI . The Elements of Statistical Learning (Springer 2009). Téléchargeable ici : https://www.sas.upenn.edu/~fdiebold/NoHesitations/BookAdvanced.pdf
  • James, G., Witten, D., Hastie, T., Tibshirani, R., & Taylor, J. . An introduction to statistical learning: With applications in python. (Springer Nature 2023). Téléchargeable ici:https://www.statlearning.com/
  • James, G., Witten, D., Hastie, T., & Tibshirani, R. . An introduction to statistical learning: With applications in R. (Springer Nature 2021). Téléchargeable ici:https://www.statlearning.com/
  • Leskovec, J., Rajaraman, A., & Ullman, J. D. . Mining of massive data sets. (Cambridge university press 2020)
  • K.V. Mardia, J.T. Kent and J.M. Bibby . Multivariate Analysis, (Academic Press, 1979)

Ces formations pourraient vous intéresser