Analyse des données : méthodes descriptives

Code UE : STA101

  • Cours
  • 6 crédits

Responsable national

Pierre-Louis GONZALEZ

Responsable opérationnel

Pierre-Louis GONZALEZ

Public et conditions d'accès

Cette formation s'adresse à toute personne souhaitant :
- analyser des données statistiques multidimensionnelles (chargé d'études, ingénieur, chercheur, technicien, etc)
- se spécialiser par la suite dans le traitement de données massives.
Elle nécessite des connaissances de base en statistique descriptive et des notions de calcul matriciel.

Objectifs pédagogiques

Explorer, décrire et interpréter des données dans leur aspect multidimensionnel. Le cours s'appuiera sur la pratique du logiciel SPAD.

Compétences visées

Etre en mesure à l'issue de l'enseignement de produire des études statistiques (rédaction d'un rapport) mettant en jeu les techniques d'analyse factorielle et de classification.

Contenu

Traitements préalables à une analyse factorielle
Étude des variables : corrélation linéaire, corrélation des rangs
Représentation des individus : diagramme de dispersion, diagramme sous forme d'icônes:
étoiles, rayons de soleil, profils
Outils mathématiques de l'analyse des données
Rappels d'algèbre linéaire
Notion de métrique, projecteur
L'analyse en composantes principales
Principe de l'ACP
Calcul des facteurs principaux et des composantes principales
Mesure de qualité des résultats, techniques d'interprétation
Utilisation de variables illustratives
Les méthodes de classification automatique
Méthodes non hiérarchiques : centres mobiles, nuées dynamiques
Méthodes hiérarchiques : méthode de Ward, construction et lecture du dendrogramme
Aspects pratiques de la classification : méthodes mixtes
Interprétation d'une partition à l'aide des variables initiales, en liaison avec une analyse factorielle
L'analyse des correspondances simples
Tableau de contingence : test de l'indépendance de deux variables qualitatives, khi-deux
L'analyse des correspondances simples
Représentation des profils-lignes et des profils-colonnes, représentation simultanée
Règle d'interprétation des résultats
L'analyse des correspondances multiples
Principes de mise en oeuvre et interprétation
Application au dépouillement d'enquêtes
Classification des individus à l'issue d'une ACM.
Cet enseignement comprend une formation au logiciel statistique SPAD.
Logiciels recommandés outre SPAD : STATGRAPHICS, UNIWIN, XLSTAT,R

Modalité d'évaluation

Le contrôle des connaissances est basé sur une étude de cas et la rédaction d'un projet réalisés avec le logiciel SPAD.

Bibliographie

  • SAPORTA G. : Probabilités, analyse des données et statistique. 3 ème édition (Technip, 2011)
  • TENENHAUS M. : Statistique. Méthodes pour décrire, expliquer et prévoir (Dunod, 2010)
  • LEBART L., MORINEAU A., PIRON M. : Statistique exploratoire multidimensionnelle (Dunod, 4ème édition, 2006)
  • BRY X. : Analyses factorielles simples (Economica, 1995)
  • BOUROCHE J.M., G. SAPORTA : L'analyse des données (Que-Sais-Je ? PUF, 9ème édition, 2006)
  • NAKACHE J.-P., CONFAIS J. : Approche pragmatique de la classification. Technip 2005
  • Pierre-André Cornillon, Arnaud Guyader, Julie Josse .... : Statistiques avec R. Presses universitaires de Rennes 2012
  • François Husson, Sébastien Lê et Jérôme Pagès : Analyse de données avec R. Presses universitaires de Rennes 2009

Cette UE apparaît dans les diplômes et certificats suivants

Chargement du résultat...
Patientez
Type
Intitulé
Equipe pédagogique
Modalité(s) / Lieu(x)
Code
Equipe pédagogique Mathématique et statistique
Modalité(s) / Lieu(x)
  • - Enseignée en formation présentielle et/ou partiellement à distance : Paris
  • Equipe pédagogique Mathématique et statistique
    Modalité(s) / Lieu(x)
  • - Enseignée en formation présentielle et/ou partiellement à distance : Paris
  • Equipe pédagogique Mathématique et statistique
    Modalité(s) / Lieu(x)
  • - Enseignée en formation présentielle et/ou partiellement à distance : Liban, Paris
  • Equipe pédagogique Informatique
    Modalité(s) / Lieu(x)
  • - Enseignée en formation présentielle et/ou partiellement à distance : Paris
  • Type Intitulé Equipe pédagogique Modalité(s) / Lieu(x) Code

    Contact

    EPN06 Mathématiques et statistiques
    2 rue conté Accès 35 3 ème étage porte 19
    75003 Paris
    Sabine Glodkowski
    Voir les sites

    Voir les dates et horaires, les lieux d'enseignement et les modes d'inscription sur les sites internet des centres régionaux qui proposent cette formation

    UE

      • Liban
        • Liban
          • 2017-2018 1er semestre : Présentiel
          • 2018-2019 1er semestre : Présentiel
          • 2019-2020 1er semestre : Présentiel
      • Paris
        • Paris
          • 2017-2018 1er semestre : Présentiel
          • 2018-2019 1er semestre : Présentiel
          • 2019-2020 1er semestre : Présentiel