• Prise décision
  • Statistique inférentielle
  • Analyse factorielle

Entreposage et fouille de données

Mis à jour le

Responsable(s) : M. Vincent AUDIGIER

  • Cours
Code Cnam : STA211

Envie d'en savoir plus sur cette formation ?

Afin d’obtenir les tarifs, le calendrier de la formation, en distanciel, en présentiel, le lieu de la formation et un contact, remplissez les critères suivants :

Afficher le centre adapté à mes besoins

Afin d’obtenir les tarifs, le calendrier de la formation et le lieu de la formation, remplissez les critères suivants :

  • Durée : 70 heures
  • A la carte
  • Soir & samedi
  • 9 crédits
  • Distanciel, Présentiel

Présentation

Public, conditions d'accès et prérequis

Prérequis

être admis en M2 du master STIC, mention statistique ou être agréé.

La demande d'agrément est à faire uniquement pour les auditeurs qui souhaitent suivre STA211 en présentiel au semestre 1. Pour obtenir l'agrément, les auditeurs adresseront, à partir du 25 Août,   par courrier électronique à l'enseignant responsable : ndeye.niang_keita@cnam.fr, un CV détaillé et une lettre de motivation indiquant les raisons de  la demande et le projet pédagogique dans lequel elle s'inscrit . Une réponse sera donnée dans un délai d'une dizaine de jours.
Niveau requis : NFA008 (bases de données) et STA101 (analyse des données, méthodes descriptives). Ces prérequis sont indispensables pour obtenir l'agrément. Vérifier avant d'envoyer une demande d'agrément.

L'avis des auditeurs

Les dernières réponses à l'enquête d'appréciation pour cet enseignement : Fiche synthétique au format PDF

Présence et réussite aux examens

Pour l'année universitaire 2023-2024 :

  • Nombre d'inscrits : 90
  • Taux de présence à l'évaluation : 54%
  • Taux de réussite parmi les présents : 29%

Compétences et débouchés

Informations pratiques

Contact

Retrouvez cette formation en centre :

Lieux de formation

Logo école santé Cnam
Logo Ecole numérique et IA Cnam

Programme

Contenu

Modèles prévisionnels et systèmes de gestion de l'entreprise 
- structures spécifiques des bases de données de Data warehouse (star schema)
- OLAP
Méthodologies générales 
- Méthodologies de Data Mining
Pré-traitement des données 
- Analyses de la qualité des données,
- Techniques d'appréhension des valeurs manquantes ou aberrantes
- Techniques de construction de bases de travail (agrégations, etc. . . )
Données et techniques de fouille 
Méthodes non supervisées : 
- Cartes de Kohonen,  Règles d'association 
Méthodes supervisées : 
- Rappels de théorie de l'apprentissage
- Arbres de décision, forêts aléatoires, Réseaux de neurones, deep learning
- Méta-algorithmes : 
- boosting, bagging
Fouille dans de nouveaux types de données et méthodes associées : 
- Données textuelles - Données multivues - Images et Multimedia
Outils : 
- Environnements freeware : R, Python
- Outils spécifiques : SAS-EM,  SPAD
- Data Mining et bases de données : OLAP Business Object

 

Modalités d'évaluation

L'évaluation s'effectuera à la fois :

  • sous la forme d'un examen sur table pour la partie cours
  • sous la forme d'un projet consistant en une fouille de données pour la partie pratique

Bibliographie

  • M.BARDOS . Analyse discriminante (Dunod, 2001)
  • G.SAPORTA . Probabilités, analyse des données et statistique (Technip, 2006)
  • S.TUFFERY . Data mining et statistique décisionnelle (Technip, 2005)
  • S.TUFFERY . Etude de cas en statistique décisionnelle (Technip, 2009)
  • T.HASTIE, J.FRIEDMAN, F.TIBSHIRANI . The Elements of Statistical Learning (Springer, 2009). Téléchargeable ici : https://hastie.su.domains/ElemStatLearn/printings/ESLII_print12_toc.pdf.download.html
  • G.GOVAERT (ed) . Analyse des données (Hermes,2003)
  • L. LEBART, A. MORINEAU, M. PIRON . Statistique exploratoire multidimensionnelle (1995)
  • J.P.NAKACHE, J.CONFAIS . Statistique explicative appliquée (Technip, 2003)
  • G. JAMES D. WITTEN, T. HASTIE, R. TIBSHIRANI . An Introduction to Statistical Learning (2021) with Applications in R. Téléchargeable ici : https://hastie.su.domains/ISLR2/ISLRv2_corrected_June_2023.pdf.download.html
  • G. JAMES D. WITTEN, T. HASTIE, R. TIBSHIRANI and J. TAYLOR . An Introduction to Statistical Learning (2023) with Applications in Python. Téléchargeable ici : https://hastie.su.domains/ISLP/ISLP_website.pdf.download.html

Ces formations pourraient vous intéresser