Analyse des données : méthodes descriptives
Code UE : STA101-PAR01
- Cours
- 6 crédits
- Volume horaire de référence
(+ ou - 10%) : 50 heures
Responsable(s)
Vincent AUDIGIER
Public, conditions d’accès et prérequis
Cette formation s'adresse à toute personne souhaitant :
- analyser des données statistiques multidimensionnelles (chargé d'études, ingénieur, chercheur, technicien, etc)
- se spécialiser par la suite dans le traitement de données massives.
Elle nécessite des connaissances de base en statistique descriptive (univariée et bivariée) et des notions de calcul matriciel.
- analyser des données statistiques multidimensionnelles (chargé d'études, ingénieur, chercheur, technicien, etc)
- se spécialiser par la suite dans le traitement de données massives.
Elle nécessite des connaissances de base en statistique descriptive (univariée et bivariée) et des notions de calcul matriciel.
L'avis des auditeurs
Les dernières réponses à l'enquête d'appréciation pour cet enseignement :
Présence et réussite aux examens
Pour l'année universitaire 2020-2021 :
- Nombre d'inscrits : 125
- Taux de présence à l'évaluation : 25%
- Taux de réussite à l'évaluation : 68%
Objectifs pédagogiques
Explorer, décrire et interpréter des données dans leur aspect multidimensionnel. Le cours s'appuiera sur la pratique du logiciel R.
Compétences visées
Etre en mesure à l'issue de l'enseignement de produire des études statistiques (rédaction d'un rapport) mettant en jeu les techniques d'analyse factorielle et de classification.
Traitements préalables à une analyse factorielle
Analyses univariées et bivariées
Outils mathématiques de l'analyse des données
Rappels d'algèbre linéaire
Notion de métrique, projecteur
L'analyse en composantes principales
Principe de l'ACP
Calcul des facteurs principaux et des composantes principales
Mesure de qualité des résultats, techniques d'interprétation
Utilisation de variables illustratives
Gestion des données manquantes
L'analyse des correspondances simples
Principe et métrique associée
Représentation des profils-lignes et des profils-colonnes, représentation simultanée
Règle d'interprétation des résultats
L'analyse des correspondances multiples
Principes de mise en oeuvre et interprétation
Application au dépouillement d'enquêtes
L'Analyse factorielle des données mixtes
Equilibre entre variables de natures différentes
Principe de mise en oeuvre et interprétation
Les méthodes de classification automatique
Méthodes non hiérarchiques : centres mobiles, nuées dynamiques
Méthodes hiérarchiques : méthode de Ward, construction et lecture du dendrogramme
Aspects pratiques de la classification : méthodes mixtes
Interprétation d'une partition à l'aide des variables initiales, en liaison avec une analyse factorielle
Analyses univariées et bivariées
Outils mathématiques de l'analyse des données
Rappels d'algèbre linéaire
Notion de métrique, projecteur
L'analyse en composantes principales
Principe de l'ACP
Calcul des facteurs principaux et des composantes principales
Mesure de qualité des résultats, techniques d'interprétation
Utilisation de variables illustratives
Gestion des données manquantes
L'analyse des correspondances simples
Principe et métrique associée
Représentation des profils-lignes et des profils-colonnes, représentation simultanée
Règle d'interprétation des résultats
L'analyse des correspondances multiples
Principes de mise en oeuvre et interprétation
Application au dépouillement d'enquêtes
L'Analyse factorielle des données mixtes
Equilibre entre variables de natures différentes
Principe de mise en oeuvre et interprétation
Les méthodes de classification automatique
Méthodes non hiérarchiques : centres mobiles, nuées dynamiques
Méthodes hiérarchiques : méthode de Ward, construction et lecture du dendrogramme
Aspects pratiques de la classification : méthodes mixtes
Interprétation d'une partition à l'aide des variables initiales, en liaison avec une analyse factorielle
Le contrôle des connaissances est basé uniquement sur une étude de cas donnant lieu à la rédaction d'un rapport.
- SAPORTA G. : Probabilités, analyse des données et statistique. 3 ème édition (Technip, 2011)
- TENENHAUS M. : Statistique. Méthodes pour décrire, expliquer et prévoir (Dunod, 2010)
- LEBART L., MORINEAU A., PIRON M. : Statistique exploratoire multidimensionnelle (Dunod, 4ème édition, 2006)
- BRY X. : Analyses factorielles simples (Economica, 1995)
- BOUROCHE J.M., G. SAPORTA : L'analyse des données (Que-Sais-Je ? PUF, 9ème édition, 2006)
- NAKACHE J.-P., CONFAIS J. : Approche pragmatique de la classification. Technip 2005
- Pierre-André Cornillon, Arnaud Guyader, Julie Josse .... : Statistiques avec R. Presses universitaires de Rennes 2012
- François Husson, Sébastien Lê et Jérôme Pagès : Analyse de données avec R. Presses universitaires de Rennes 2009
Cette UE apparaît dans les diplômes et certificats suivants
Rechercher une formation
RECHERCHE MULTI-CRITERES
Plus de critères de recherche sont proposés:
-
Vous pouvez sélectionner des formations grâce à un mot ou à une expression (chaîne de caractères) présent dans l’intitulé de la formation, sa description ou ses index (discipline ou métier).
Des mots-clés sont suggérés à partir du 3e caractère saisi, mais vous pouvez aussi rechercher librement. - Les différents items sélectionnés sont croisés.
ex: "Comptabilité" et "Diplôme" - Les résultats comprennent des formations de la région (UE, diplômes, certificats, stages) et des formations proposées à distance par d'autres centres du Cnam.
- Les codes des formations à Paris se terminent par le suffixe PAR01 (pour le centre Cnam Paris) et PAR02 (pour Cnam Entreprises).
- Certains diplômes se déclinent selon plusieurs parcours. Pour afficher tous les parcours, tapez la racine du code (ex : « LG035 »).
- Dans tous les cas, veillez à ne pas insérer d'espace ni de ponctuation supplémentaire.
Plus de critères de recherche sont proposés:
- Type de diplôme
- Niveau d'entrée
- Modalité de l'enseignement
- Programmation semestrielle
Chargement du résultat...

Intitulé de la formation |
Type |
Modalité(s) |
Lieu(x) |
|
---|---|---|---|---|
Lieu(x)
Package
|
Lieu(x)
Paris
|
|||
Lieu(x)
Package
|
Lieu(x)
Paris
|
|||
Intitulé de la formation
Master Systèmes d'Information et Business Intelligence
|
Lieu(x)
Package
|
Lieu(x)
Paris
|
||
Intitulé de la formation
Master Sciences, technologies, santé mention Informatique Parcours Recherche opérationnelle
|
Lieu(x)
À la carte
|
Lieu(x)
Paris
|
||
Intitulé de la formation
Master Sécurité informatique, cybersécurité et cybermenaces
|
Lieu(x)
Package
|
Lieu(x)
Bretagne
|
||
Intitulé de la formation
Master Réseaux et Objets Connectés - formation continue
|
Lieu(x)
Package
|
Lieu(x)
Paris
|
||
Intitulé de la formation
Master Réseaux et Objets Connectés - formation continue
|
Lieu(x)
À la carte
|
Lieu(x)
Pays de la Loire
|
||
Intitulé de la formation
Licence Sciences des données
|
Lieu(x)
À la carte
|
Lieu(x)
Paris
|
||
Intitulé de la formation
Certificat de compétence Data analyst - Chargé(e) d'études statistiques
|
Lieu(x)
À la carte
|
Lieu(x)
Paris
|
||
Intitulé de la formation | Type | Modalité(s) | Lieu(x) |
Contact
EPN06 Mathématiques et statistiques
2 rue conté Accès 35 3 ème étage porte 19
75003 Paris
Sabine Glodkowski
2 rue conté Accès 35 3 ème étage porte 19
75003 Paris
Sabine Glodkowski
Centre(s) d'enseignement proposant cette formation
-
Centre Cnam Paris
- 2023-2024 1er semestre : Présentiel soir ou samedi
Code UE : STA101-PAR01
- Cours
- 6 crédits
- Volume horaire de référence
(+ ou - 10%) : 50 heures
Responsable(s)
Vincent AUDIGIER