Entreposage et fouille de données
Code UE : STA211
- Cours
- 9 crédits
- Volume horaire de référence
(+ ou - 10%) : 70 heures
Responsable(s)
Ndeye NIANG KEITA
Vincent AUDIGIER
Public, conditions d’accès et prérequis
être admis en M2 du master STIC, mention statistique ou être agréé.
La demande d'agrément est à faire uniquement pour les auditeurs qui souhaitent suivre STA211 en présentiel au semestre 1. Pour obtenir l'agrément, les auditeurs adresseront, à partir du 25 Août, par courrier électronique à l'enseignant responsable : ndeye.niang_keita@cnam.fr, un CV détaillé et une lettre de motivation indiquant les raisons de la demande et le projet pédagogique dans lequel elle s'inscrit . Une réponse sera donnée dans un délai d'une dizaine de jours.
Niveau requis : NFA008 (bases de données) et STA101 (analyse des données, méthodes descriptives). Ces prérequis sont indispensables pour obtenir l'agrément. Vérifier avant d'envoyer une demande d'agrément.
La demande d'agrément est à faire uniquement pour les auditeurs qui souhaitent suivre STA211 en présentiel au semestre 1. Pour obtenir l'agrément, les auditeurs adresseront, à partir du 25 Août, par courrier électronique à l'enseignant responsable : ndeye.niang_keita@cnam.fr, un CV détaillé et une lettre de motivation indiquant les raisons de la demande et le projet pédagogique dans lequel elle s'inscrit . Une réponse sera donnée dans un délai d'une dizaine de jours.
Niveau requis : NFA008 (bases de données) et STA101 (analyse des données, méthodes descriptives). Ces prérequis sont indispensables pour obtenir l'agrément. Vérifier avant d'envoyer une demande d'agrément.
L'avis des auditeurs
Les dernières réponses à l'enquête d'appréciation pour cet enseignement :
Présence et réussite aux examens
Pour l'année universitaire 2020-2021 :
- Nombre d'inscrits : 141
- Taux de présence à l'évaluation : 52%
- Taux de réussite à l'évaluation : 41%
Contenu
Modèles prévisionnels et systèmes de gestion de l'entreprise
- structures spécifiques des bases de données de Data warehouse (star schema)
- OLAP
Méthodologies générales
- Méthodologies de Data Mining
Pré-traitement des données
- Analyses de la qualité des données,
- Techniques d'appréhension des valeurs manquantes ou aberrantes
- Techniques de construction de bases de travail (agrégations, etc. . . )
Données et techniques de fouille
Méthodes non supervisées :
- Cartes de Kohonen, Règles d'association
Méthodes supervisées :
- Rappels de théorie de l'apprentissage
- Arbres de décision, forêts aléatoires, Réseaux de neurones, deep learning
- Méta-algorithmes :
- boosting, bagging
Fouille dans de nouveaux types de données et méthodes associées :
- Données textuelles - Données multivues - Images et Multimedia
Outils :
- Environnements freeware : R, Python
- Outils spécifiques : SAS-EM, SPAD
- Data Mining et bases de données : OLAP Business Object
- structures spécifiques des bases de données de Data warehouse (star schema)
- OLAP
Méthodologies générales
- Méthodologies de Data Mining
Pré-traitement des données
- Analyses de la qualité des données,
- Techniques d'appréhension des valeurs manquantes ou aberrantes
- Techniques de construction de bases de travail (agrégations, etc. . . )
Données et techniques de fouille
Méthodes non supervisées :
- Cartes de Kohonen, Règles d'association
Méthodes supervisées :
- Rappels de théorie de l'apprentissage
- Arbres de décision, forêts aléatoires, Réseaux de neurones, deep learning
- Méta-algorithmes :
- boosting, bagging
Fouille dans de nouveaux types de données et méthodes associées :
- Données textuelles - Données multivues - Images et Multimedia
Outils :
- Environnements freeware : R, Python
- Outils spécifiques : SAS-EM, SPAD
- Data Mining et bases de données : OLAP Business Object
Modalité d'évaluation
- Mémoire
- Projet(s)
Bibliographie
- M.BARDOS : Analyse discriminante (Dunod, 2001)
- G.SAPORTA : Probabilités, analyse des données et statistique (Technip, 2006)
- S.TUFFERY : Data mining et statistique décisionnelle (Technip, 2005)
- S.TUFFERY : Etude de cas en statistique décisionnelle (Technip, 2009)
- T.HASTIE, J.FRIEDMAN, F.TIBSHIRANI : Elements of Statistical Learning (Springer, 2009)
- G.GOVAERT (ed) : Analyse des données (Hermes,2003)
- L. LEBART, A. MORINEAU, M. PIRON : Statistique exploratoire multidimensionnelle (1995)
- J.P.NAKACHE, J.CONFAIS : Statistique explicative appliquée (Technip, 2003)
- James, Witten, Hastie, & Tibshirani : An Introduction to Statistical Learning (2013) Téléchargeable ici:http://web.stanford.edu/~hastie/local.ftp/Springer/ISLR_print1.pdf
Cette UE apparaît dans les diplômes et certificats suivants
Rechercher une formation
RECHERCHE MULTI-CRITERES
Plus de critères de recherche sont proposés:
-
Vous pouvez sélectionner des formations, en recherchant une chaîne de caractères présente dans l’intitulé ou dans les index (discipline ou métier visé): ex: "documenta".
Des index sont suggérés à partir du 3e caractère saisi, mais vous pouvez aussi saisir librement tout autre mot . - Les différents items sélectionnés sont croisés.
ex: "Comptabilité" et "Région Grand Est"
- Cette recherche s'effectue à travers toutes les fiches formation, y compris régionales. Les codes de ces dernières se distinguent par le suffixe de la région (ex: «-PDL pour Pays-de-la-Loire» ).
Par défaut, les fiches régionales reprennent le contenu de la fiche nationale correspondante, mais dans certains cas, comportent des informations spécifiques. - Certains diplômes se déclinent selon plusieurs parcours (codés à la fin: A, B,...). Pour afficher tous les parcours, tapez la racine du code (ex : « LG035 »).
- Dans tous les cas, veillez à ne pas insérer d'espace ni de caractère séparateur.
Plus de critères de recherche sont proposés:
- Type de diplôme
- Niveau d'entrée
- Modalité de l'enseignement
- Programmation semestrielle
Chargement du résultat...

Intitulé de la formation |
Type |
Modalité(s) |
Lieu(x) |
|
---|---|---|---|---|
Lieu(x)
Package
|
Lieu(x)
Paris
|
|||
Intitulé de la formation
Master Droit, économie et gestion mention Finance Parcours Finance de marché et gestion des capitaux
|
Lieu(x)
Package
|
Lieu(x)
Paris
|
||
Intitulé de la formation
Diplôme d'ingénieur Spécialité informatique Parcours Informatique modélisation optimisation
|
Type
Diplôme d'ingénieur
|
Lieu(x)
À la carte
|
||
Intitulé de la formation
Diplôme d'ingénieur Spécialité informatique Parcours Informatique modélisation optimisation
|
Type
Diplôme d'ingénieur
|
Lieu(x)
Package
|
Lieu(x)
Grand-Est
|
|
Lieu(x)
À la carte
|
Lieu(x)
Liban, Paris
|
|||
Intitulé de la formation
Certificat de spécialisation Bio-informatique avancée
|
Lieu(x)
À la carte
|
Lieu(x)
Paris
|
||
Intitulé de la formation
Certificat de spécialisation Analyste de données massives
|
Lieu(x)
À la carte
|
|||
Intitulé de la formation | Type | Modalité(s) | Lieu(x) |
Contact
EPN06 Mathématiques et statistiques
2 rue conté Accès 35 3 ème étage porte 19
75003 Paris
Sabine Glodkowski
2 rue conté Accès 35 3 ème étage porte 19
75003 Paris
Sabine Glodkowski
Voir le site
Voir le calendrier, le tarif, les conditions d'accessibilité et les modalités d'inscription dans le(s) centre(s) d'enseignement qui propose(nt) cette formation.
UE
-
-
Paris
-
Centre Cnam Paris
- 2023-2024 1er semestre : Présentiel soir ou samedi
-
Centre Cnam Paris
-
Paris
Code UE : STA211
- Cours
- 9 crédits
- Volume horaire de référence
(+ ou - 10%) : 70 heures
Responsable(s)
Ndeye NIANG KEITA
Vincent AUDIGIER