• Analyse factorielle
  • Statistique
  • Statistique appliquée
  • Analyse de données
  • Sciences
  • Data science

Données catégorielles

Mis à jour le

Responsable(s) : M. Vincent AUDIGIER

  • Cours
Code Cnam : STA212

Envie d'en savoir plus sur cette formation ?

Afin d’obtenir les tarifs, le calendrier de la formation, en distanciel, en présentiel, le lieu de la formation et un contact, remplissez les critères suivants :

Afficher le centre adapté à mes besoins

Afin d’obtenir les tarifs, le calendrier de la formation et le lieu de la formation, remplissez les critères suivants :

  • Durée : 70 heures
  • A la carte
  • 9 crédits
  • Distanciel

Présentation

Public, conditions d'accès et prérequis

Prérequis

Ce cours s'adresse en priorité aux auditeurs préparant le master MR123.
Il s'adresse également à des auditeurs préparant le diplôme d'actuaire.
Niveau requis : STA101 (méthodes exploratoires multidimensionnelles), STA102 (régression et analyse de la variance) et STA104 (statistique mathématique).

Objectifs

Permettre aux ingénieurs, cadres d'entreprises ou d'administrations, médecins, chercheurs, de construire des modèles explicatifs de variables qualitatives. Le cours s'appuie sur la pratique du logiciel R.

L'avis des auditeurs

Les dernières réponses à l'enquête d'appréciation pour cet enseignement : Fiche synthétique au format PDF

Présence et réussite aux examens

Pour l'année universitaire 2023-2024 :

  • Nombre d'inscrits : 26
  • Taux de présence à l'évaluation : 50%
  • Taux de réussite parmi les présents : 62%

Compétences et débouchés

Informations pratiques

Contact

Retrouvez cette formation en centre :

Lieux de formation

Logo école santé Cnam

Programme

Contenu

Présentation des méthodes statistiques traitant des variables qualitatives
Principes généraux d'estimation d'un modèle (maximum de vraisemblance)

La régression logistique simple
Notion de variable latente
Les modèles PROBIT, LOGIT
Le modèle logistique et son interprétation
Analyse des résidus, des observations

La régression logistique multiple 
Le modèle : prédicteurs quantitatifs ou qualitatifs
Sélection de variables
Résumé des tests de validité générale d'un modèle
Tables de classement, courbe ROC
Interprétation des coefficients de la régression logistique : odds ratio
La régression logistique dans le cas où Y est une variable polytomique ordonnée
Aspects pratiques de la mise en oeuvre des méthodes de régression logistique

Modélisation d'une réponse multinomiale
Estimation par maximum de vraisemblance ou par moindres carrés généralisés

Comparaison de la régression logistique avec d'autres méthodes de modélisation d'une réponse qualitative
Analyse discriminante sur variables quantitatives et qualitatives
Arbres de décision
Eléments pratiques de création d'un score 
 
Méthodes PLS
Présentation de NIPALS, PLS1,PLS2
Applications: régression logistique PLS, analyse discriminante PLS
 

Modalités d'évaluation

Rédaction d'un mémoire utilisant les méthodes présentées en cours

Bibliographie

  • HOSMER D., LEMESHOW S. . Applied logistic regression 2ième édition (Wiley, 2000)
  • NAKACHE J.P., CONFAIS J. . Statistique explicative appliquée (Technip, 2003)
  • Editeurs DROESBEKE, LEJEUNE, SAPORTA; Auteurs: CROUX, GONZALEZ.... . Modèles statistiques pour données qualitatives (Technip 2005)
  • STOKES M.E., DAVIS C.S. & KOCH G.G. . Categorical Data Analysis using the SAS System (SAS Institute Inc, Cary, NC, 2000)
  • BARDOS M. . Analyse discriminante (Dunod, 2001)
  • AGRESTI A. . Categorical data analysis 2ième édition (Wiley, 2002)

Ces formations pourraient vous intéresser