Business Intelligence (1) - Data Warehouses

Code UE : NFE211

  • Cours
  • 6 crédits

Responsable(s)

Elisabeth METAIS

Public et conditions d'accès

Ce cours s'adresse aux auditeurs préparant le diplôme d'ingénieur informatique option système d'information et/ou aux étudiants suivant le Master STIC mention Informatique Spécialité Systèmes d'Information et de Décision
Prérequis : Bonnes connaissances en bases de données et en systèmes d'information.

Objectifs pédagogiques

Acquérir une bonne connaissance de l'informatique décisionnelle  (Business Intelligence), et en particulier de tous les processus liés à une architecture d'entrepôt de données (Data Warehouses).
Cette UE cible tout particulièrement la conception de l'entrepôt de données, la gestion du projet, et sa mise en œuvre, en particulier la mise en œuvre de la partie ETL.
Remarque : Pour une maitrise complète du processus, tant du point de vue gestion des données que du point de vue analyse des données (data Science) il est conseiller de suivre également le NFE212 (semestre 2) qui fait suite au NFE211 (semestre 1)

Compétences visées

Capacité d'intégration dans une équipe de développement de système d'information décisionnel. En particulier compétences en conception d'entrepôts de données :
  • Capacité à concevoir et implémenter la partie ETL d’un Data Warehouse
  • Capacité à concevoir et implémenter des cubes décisionnels
  • Capacité à concevoir dans sa totalité une chaîne décisionnelle
  • Capacité à mettre en œuvre une chaîne décisionnelle à l’aide des outils du marché
  • Capacité à gérer un projet décisionnel

Contenu

Introduction
  • la Business Intelligence
  • Data Warehouse et Big Data
  • Objectifs d'un entrepôt de données
  • OLAP versus OLTP
Architecture d'un entrepôt de données
  • Architecture matérialisée /architecture médiateur
  • Dualité Entrepôt / magasins, Architecture de Inmon, Architecture de Kimball
  • Data Warehouse /Data Lake
  • Self BI
  • Les méta-données, gestion, standardisation CWMI
Modélisation multidimensionnelle
  • La modélisation multidimensionnelle, faits, dimensions, hiérarchies, indicateurs
  • Modèles OLAP, ROLAP, MOLAP, mixte
  • Modélisation en étoile, en flocon, en constellation
  • L'algèbre multidimensionnelle
  • Les dimensions à changement lent
  • Les différents types de table de faits (récapitulatifs, transactions)
Méthodes de modélisation d'un entrepôt de données
  • Méthode par matrice
  • Méthode par indicateurs
  • Méthode MAP
  • Méthode par analyse des requêtes
  • Volumétrie, choix de la granularité, choix des Data Marts
  • Méthodes de projets BI

Ingénierie d'extraction et d'intégration des données
  • L’extraction des données
  • Le nettoyage des données
  • L'intégration sémantique des données
  • Le rafraichissement des données
  • Solution par programmation (Embedded SQL, déclencheurs)
  • Solution par outils ETL
L’environnement technologique
  • Outils ETL, Systèmes de gestion de bases de données OLAP, outils de modélisation multidimensionnelle
  • Data Warehouse et Cloud,
  • Data Warehouse et Big Data

Modalité d'évaluation

L’UE sera validée par un examen final et par un projet réalisé individuellement, en binôme ou en trinôme.
Le projet - dont le sujet sera choisi par l’élève en accord avec le professeur - permettra de mettre en place une chaîne décisionnelle fondée sur les outils du marché (parmi l’offre industrielle ou celle du logiciel libre).    Le projet peut aussi permettre d’approfondir un point théorique (par exemple la prise en compte du RGPD dans le Data Warehouse).
La note finale sera la moyenne de l'examen et du projet (avec la contrainte note examen >= 10).

Bibliographie

  • M. Jarke , M. Lenzerini, Y. Vassiliou, P. Vassiliadis : Fundamentals of datawarehouses (2d édition, Springer, 2003).
  • E. Métais : Systèmes d'aide à la décision et entrepôts de données (Encyclopedia Universalis) http://www.universalis.fr/encyclopedie/systemes-informatiques-systemes-d-aide-a-la-decision/
  • W.H. Inmon : Building the Datawarehouse
  • Kimball R, Ross M. : Entrepôts de données, guide pratique de modélisation multidimensionnelle, Vuibert 2003

Cette UE apparaît dans les diplômes et certificats suivants

Contact

Informatique d'entreprise
2D4P10, 33, 2 rue Conté
75003 Paris
Tel :01 58 80 84 71
Alexandre LESCAUT

Voir les dates et horaires, les lieux d'enseignement et les modes d'inscription sur les sites internet des centres régionaux qui proposent cette formation

UE

    • Paris
      • Centre Cnam Paris
        • 2019-2020 1er semestre : FOAD 100%
        • 2019-2020 1er semestre : Présentiel soir ou samedi
        • 2020-2021 1er semestre : FOAD 100%
        • 2020-2021 1er semestre : Présentiel soir ou samedi
        • 2021-2022 1er semestre : FOAD 100%
        • 2021-2022 1er semestre : Présentiel soir ou samedi
        Comment est organisée cette formation ?

        Organisation de la modalité FOAD 100%

        Planning

        1er semestre

        • Date de démarrage : 01/10/2019
        • Date limite d'inscription : 02/11/2019
        • Regroupements facultatifs : 3 pour une totalité de 9 heures
        • Date de 1ère session d'examen : la date sera publiée sur le site du centre ou l'ENF
        • Date de 2ème session d'examen : la date sera publiée sur le site du centre ou l'ENF

        Accompagnement

        • Plateforme Moodle
        • Forum
        • Messagerie intégrée à la plateforme

        Ressources mises à disposition de l'auditeur

        • Documents de cours
        • Enregistrement de cours
        • Documents d'exercices, études de cas activités
        • Bibliographie et webographie

        Modalités de validation

        • Projet
        • Examen sur table
        • 1 projet individuel
        :