Données catégorielles
Code UE : STA212-PAR
- Cours
- 9 crédits
- Volume horaire de référence
(+ ou - 10%) : 70 heures
Responsable(s)
Vincent AUDIGIER
Public, conditions d’accès et prérequis
Ce cours s'adresse en priorité aux auditeurs préparant le master MR123.
Il s'adresse également à des auditeurs préparant le diplôme d'actuaire.
Niveau requis : STA102 (régression et analyse de la variance) et STA104 (statistique mathématique).
Il s'adresse également à des auditeurs préparant le diplôme d'actuaire.
Niveau requis : STA102 (régression et analyse de la variance) et STA104 (statistique mathématique).
Présence et réussite aux examens
Pour l'année universitaire 2022-2023 :
- Nombre d'inscrits : 26
- Taux de présence à l'évaluation : 35%
- Taux de réussite parmi les présents : 78%
Objectifs pédagogiques
Permettre aux ingénieurs, cadres d'entreprises ou d'administrations, médecins, chercheurs, de construire des modèles explicatifs de variables qualitatives. Le cours s'appuie sur la pratique du logiciel SAS, mis à disposition des auditeurs.
Présentation des méthodes statistiques traitant des variables qualitatives
Principes généraux d'estimation d'un modèle (maximum de vraisemblance)
La régression logistique simple
Notion de variable latente
Les modèles PROBIT, LOGIT
Le modèle logistique et son interprétation
Analyse des résidus, des observations
La régression logistique multiple
Le modèle : prédicteurs quantitatifs ou qualitatifs
Sélection de variables
Résumé des tests de validité générale d'un modèle
Tables de classement, courbe ROC
Interprétation des coefficients de la régression logistique : odds ratio
La régression logistique dans le cas où Y est une variable polytomique ordonnée
Aspects pratiques de la mise en oeuvre des méthodes de régression logistique
La procédure LOGISTIC
Présentation des modèles linéaires généralisés et de la procédure GENMOD
Régression de Poisson
Etude de contrastes
Modélisation d'une réponse multinomiale
Estimation par maximum de vraisemblance ou par moindres carrés généralisés
Etude de cas avec la procédure CATMOD
Comparaison de la régression logistique avec d'autres méthodes de modélisation d'une réponse qualitative
Analyse discriminante sur variables quantitatives et qualitatives
Arbres de décision
Eléments pratiques de création d'un score
Méthodes PLS
Présentation de NIPALS, PLS1,PLS2
Applications: régression logistique PLS, analyse discriminante PLS
Modèles linéaires généralisés PLS
Principes généraux d'estimation d'un modèle (maximum de vraisemblance)
La régression logistique simple
Notion de variable latente
Les modèles PROBIT, LOGIT
Le modèle logistique et son interprétation
Analyse des résidus, des observations
La régression logistique multiple
Le modèle : prédicteurs quantitatifs ou qualitatifs
Sélection de variables
Résumé des tests de validité générale d'un modèle
Tables de classement, courbe ROC
Interprétation des coefficients de la régression logistique : odds ratio
La régression logistique dans le cas où Y est une variable polytomique ordonnée
Aspects pratiques de la mise en oeuvre des méthodes de régression logistique
La procédure LOGISTIC
Présentation des modèles linéaires généralisés et de la procédure GENMOD
Régression de Poisson
Etude de contrastes
Modélisation d'une réponse multinomiale
Estimation par maximum de vraisemblance ou par moindres carrés généralisés
Etude de cas avec la procédure CATMOD
Comparaison de la régression logistique avec d'autres méthodes de modélisation d'une réponse qualitative
Analyse discriminante sur variables quantitatives et qualitatives
Arbres de décision
Eléments pratiques de création d'un score
Méthodes PLS
Présentation de NIPALS, PLS1,PLS2
Applications: régression logistique PLS, analyse discriminante PLS
Modèles linéaires généralisés PLS
Rédaction d'un mémoire utilisant les méthodes présentées en cours
- HOSMER D., LEMESHOW S. : Applied logistic regression 2ième édition (Wiley, 2000)
- NAKACHE J.P., CONFAIS J. : Statistique explicative appliquée (Technip, 2003)
- Editeurs DROESBEKE, LEJEUNE, SAPORTA : Modèles statistiques pour données qualitatives (Technip 2005)
- STOKES M.E., DAVIS C.S. & : Categorical Data Analysis using the SAS System (SAS Institute Inc, Cary, NC, 2000)
- BARDOS M. : Analyse discriminante (Dunod, 2001)
- AGRESTI A. : Categorical data analysis 2ième édition (Wiley, 2002)
Cette UE apparaît dans les diplômes et certificats suivants
Rechercher une formation
RECHERCHE MULTI-CRITERES
Plus de critères de recherche sont proposés:
-
Vous pouvez sélectionner des formations grâce à un mot ou à une expression (chaîne de caractères) présent dans l’intitulé de la formation, sa description ou ses index (discipline ou métier).
Des mots-clés sont suggérés à partir du 3e caractère saisi, mais vous pouvez aussi rechercher librement. - Les différents items sélectionnés sont croisés.
ex: "Comptabilité" et "Diplôme" - Les résultats comprennent des formations de la région (UE, diplômes, certificats, stages) et des formations proposées à distance par d'autres centres du Cnam.
- Les codes des formations à Paris se terminent par le suffixe PAR01 (pour le centre Cnam Paris) et PAR02 (pour Cnam Entreprises).
- Certains diplômes se déclinent selon plusieurs parcours. Pour afficher tous les parcours, tapez la racine du code (ex : « LG035 »).
- Dans tous les cas, veillez à ne pas insérer d'espace ni de ponctuation supplémentaire.
Plus de critères de recherche sont proposés:
- Type de diplôme
- Niveau d'entrée
- Modalité de l'enseignement
- Programmation semestrielle
Chargement du résultat...
Intitulé de la formation |
Type |
Modalité(s) |
Lieu(x) |
|
---|---|---|---|---|
Intitulé de la formation
Master Informatique — Parcours Traitement de l'information et exploitation des données (TRIED)
|
Lieu(x)
Package
|
Lieu(x)
Paris
|
||
Intitulé de la formation
Master Sciences des données
|
Lieu(x)
Package
|
Lieu(x)
Paris
|
||
Intitulé de la formation
Master Sciences des données
|
Lieu(x)
À la carte
|
Lieu(x)
Liban
|
||
Intitulé de la formation | Type | Modalité(s) | Lieu(x) |
Contact
EPN06 Mathématiques et statistiques
2 rue conté Accès 35 3 ème étage porte 19
75003 Paris
Sabine Glodkowski
2 rue conté Accès 35 3 ème étage porte 19
75003 Paris
Sabine Glodkowski
Voir le site
Centre(s) d'enseignement proposant cette formation
-
Paris
- 2024-2025 2nd semestre : Formation ouverte et à distance (FOAD)
- 2025-2026 2nd semestre : Formation ouverte et à distance (FOAD)
- 2026-2027 2nd semestre : Formation ouverte et à distance (FOAD)
Comment est organisée cette formation ?2024-2025 2nd semestre : Formation ouverte et à distance
Dates importantes
- Période des séances du 03/02/2025 au 07/06/2025
- Période d'inscription : du 10/06/2024 à 10:00 au 14/03/2025 à 23:59
- Date de 1ère session d'examen : la date sera publiée sur le site du centre ou l'ENF
- Date de 2ème session d'examen : la date sera publiée sur le site du centre ou l'ENF
Précision sur la modalité pédagogique
- Une formation ouverte et à distance (FOAD) est une formation dispensée 100% à distance, qui peut être suivie librement, à son rythme.
- Regroupements physiques facultatifs : Aucun
Organisation du déploiement de l'unité
- Nombre d'élèves maximum à distance par classe : 40
- Nombre d'heures d'enseignement par élève : 77
- Délai maximum de réponse à une solicitation : sous 96 heures (Jours ouvrés)
Modes d'animation de la formation
- Forum
- Messagerie intégrée à la plateforme
- Organisation d'une séance de démarrage
- Evaluation de la satisfaction
- Hot line technique
Ressources mises à disposition sur l'Espace Numérique de Formation
- Documents de cours
- Documents d'exercices, études de cas ou autres activités pédagogiques
- Rstudio intégré dans moodle
Modalité de contrôle de l'acquisition des compétences et des connaissances (validation de l'UE)
- Projet(s) individuel(s)
Code UE : STA212-PAR
- Cours
- 9 crédits
- Volume horaire de référence
(+ ou - 10%) : 70 heures
Responsable(s)
Vincent AUDIGIER