Analyses multivariées, classification (ACP, AFC, ACM, CAH, k-means, AFD) Mixte : présentiel / à distance

Dernière mise à jour : 30/08/2024

Cette formation s'adresse à des personnes souhaitant maîtriser les concepts et la mise en œuvre des analyses factorielles multivariées. Ces analyses ont pour objectif d’extraire des informations de données :



• Volumineuses en nombre de variable

M'inscrire à la formation

Détail des créneaux de la session sélectionnée :
Ajouter au panier

Public visé

  • Toute personne souhaitant comprendre et mettre en Å“uvre des méthodes d'analyses factorielles multivariées.

Prérequis

  • Il est nécessaire que les participants aient de bonnes connaissances sur les outils statistiques de base : corrélation, écart-type, variance, intervalles de confiance, tests d'hypothèses.

Objectifs de la formation

A l'issue de cette formation, l'apprenant sera capable de :

  • Identifier quelle méthode d'analyse multivariée ou de classification utiliser selon le contexte
  • Décrire les concepts mathématiques inhérents à ces méthodes
  • Mettre en Å“uvre les analyses factorielles multivariées suivantes : ACP, AFC, AFCM, AFD
  • Interpréter les résultats et les graphiques qui découlent des analyses ci-dessus
  • Maitriser les coefficients et les paramètres permettant d'estimer la qualité des analyses statistiques ci-dessus
  • Expliquer la différence entre les notions de contribution et de cosinus carré 
  • Expliquer les distances et les méthodes d'agrégation les plus adaptées à l'objectif de classification
  • Comprendre les différences entre la CAH et les k-means
  • Mettre en Å“uvre et interpréter les résultats d'une méthode de classification de type CAH et k-means

Contenu de la formation

visuel

Généralités sur les différentes méthodes d'analyses multidimensionnelles

  • Limites des statistiques classiques
  • Champs d'application des différentes méthodes d'analyses multidimensionnelles
  • Introduction sur le data mining - Les objectifs
    • Objectifs de description
    • Objectifs de prédiction
  • Structure des jeux de données
  • Présentation de l'éventail des méthodes
    • Analyse en composantes principales
    • Analyse factorielle des correspondances simples et multiples
    • Analyse canonique des corrélations
    • Analyse factorielle discriminante
    • Méthodes de classification : classification ascendante hiérarchique, k-means
  • Principes généraux des différentes méthodes - Notions de : 
    • Distance, 
    • Inertie et variance 
    • Axes factoriels


Notion de corrélation

  • Définition du coefficient de corrélation
  • Interprétation de la valeur du coefficient de corrélation
  • Les confusions : corrélation, causalité, pente…
  • Les différents coefficients de corrélation
    • Coefficient de Pearson
    • Coefficient de Spearman


Mise en Å“uvre d'une analyse en composante principales (ACP)

  • Structure du jeu de données et contexte d'application
  • Objectifs détaillés de l'ACP
  • Choix des axes de représentation (choix du nombre de composantes principales)
  • Interprétation des sorties graphiques : cercle factoriel et graphique des individus
  • Interprétation des axes factoriels
  • Contribution des individus et des variables aux axes
  • Qualité de représentation des individus et des variables sur les axes : les cosinus carrés
  • Les différentes ACP :
    • ACP normée et non normée
    • ACP non paramétrique
  • Positionnement d'une variable illustrative catégorielle
  • Les confusions et erreurs à ne pas commettre
  • Présentation rapide des Analyses des correspondances simple et multiple si souhaité
  • Différences entre ACP et AFC


Mise en Å“uvre d'une analyse factorielle des correspondances (AFC)

  • Structure du jeu de données : tableau de contingence, données individuelles (variables qualitatives)
  • Contexte d'application et objectifs détaillés de l'AFC
  • Différence entre ACP et AFC
  • Méthodologie de l'AFC 
    • Distance du Chi²
    • Profils lignes
    • Profils colonnes
  • Choix des axes de représentation (choix du nombre d'axes)
  • Interprétation des sorties graphiques : graphique des modalités
  • Contributions et cosinus carrés des modalités aux axes
  • Les confusions et erreurs à ne pas commettre


Mise en Å“uvre d'une analyse des correspondances multiples (ACM ou AFCM)

  • Structure du jeu de données
  • Contexte d'application et objectifs détaillés de l'AFCM
  • Différence entre AFC et AFCM
  • Méthodologie de l'AFCM
  • Choix des axes de représentation (choix du nombre d'axes)
  • Correction de Benzecri : valeurs propres et taux d'inertie expliquée corrigés
  • Interprétation des sorties graphiques : 
    • Graphique des modalités
    • Graphique des variables
  • Contributions et cosinus carrés des modalités aux axes
  • Les confusions et erreurs à ne pas commettre


Mise en œuvre d'une classification par une classification ascendante hiérarchique (CAH)

  • Structure du jeu de données
  • Contexte d'application et objectifs détaillés de la CAH
  • Lecture d'un dendrogramme
  • Choix du nombre de classes
  • Classification sur les individus
  • Classification sur les variables
  • Classification sur les modalités
  • Choix de la distance selon le contexte : classification sur les individus, les variables ou les modalités
  • Choix du linkage (saut, critère de « rapprochement » entre les classes) : méthode de Ward, lien simple, lien complet…
  • Interprétation des sorties logiciel


Mise en Å“uvre d'une classification par une k-means

  • Présentation des objectifs de la méthode des k-means
  • Avantages et inconvénients de la CAH et des k-means
  • Détermination des clusters
  • Présentation des différentes versions de l'algorithme
  • Utilisation de la k-means en complément de l'ACP
  • Classification sur grand jeu de données
  • Conseils de mise en Å“uvre 
  • Interprétation des sorties logiciel


Mise en Å“uvre d'une analyse factorielle discriminante (AFD)

  • Structure du jeu de données et contexte d'application
  • Objectifs détaillés de l'AFD
  • Notions de classement et de discrimination
  • Méthodologie de l'AFD
  • Comparaison avec l'ACP
  • Interprétation des sorties logiciel : cercle factoriels, corrélations variables x axes
  • Qualité de l'AFD (de la discrimination obtenue)
    • Tests univariés et multivariés (lambda de Wilks)
    • Graphique des individus
    • Matrice de confusion (et éventuellement courbe ROC)
  • Les confusions et erreurs à ne pas commettre

Compétences acquises à l'issue de la formation

  • Identifier quelle méthode danalyse multivariée ou de classification utiliser selon le contexte
  • Décrire les concepts mathématiques inhérents à ces méthodes
  • Mettre en uvre les analyses factorielles multivariées suivantes : ACP, AFC, AFCM, AFD
  • Interpréter les résultats et les graphiques qui découlent des analyses ci-dessus
  • Maitriser les coefficients et les paramètres permettant destimer la qualité des analyses statistiques ci-dessus
  • Expliquer la différence entre les notions de contribution et de cosinus carré
  • Expliquer les distances et les méthodes d'agrégation les plus adaptées à l'objectif de classification
  • Comprendre les différences entre la CAH et les k-means
  • Mettre en uvre et interpréter les résultats d'une méthode de classification de type CAH et k-means

Modalités pédagogiques

  • Explications théoriques suivies de pratiques guidées puis de mises en autonomie.
  • Exercices autonomes et réguliers pour assurer l'assimilation

Moyens et supports pédagogiques

Méthodes et moyens

  • Evaluation préformation pour définir ses besoins et ses priorités d'usage de l'outil
  • Approche participative des connaissances à transmettre
  • Mise en situation concrète des outils et méthodes
  • Adaptation du rythme et des exercices au niveau du groupe
  • Utilisation des 3 vecteurs de communication : oral (vulgarisation du vocabulaire), visuel (vidéoprotection du logiciel) et kinesthésique (travaux pratiques)

 

Support stagiaire

  • Support papier ou électronique (dématérialisé)
  • Les exercices d'accompagnement peuvent être récupérés sur clef USB
  • Exercices supplémentaires téléchargeables sur notre site

Modalités d'évaluation et de suivi

  • Alternance d'exercices d'accompagnement et d'exercices d'application
  • Réalisation de travaux pratiques en autonomie pour identifier les acquis et les axes de progrès

Profil du formateur

Nos formateurs procèdent les certifications techniques (Microsoft Office Specialist, PCIE, TOSA, …) et pédagogiques (Certification de Compétence Pédagogique - CCP)

Informations sur l'accessibilité

Cette formation est accessible à toute personne en situation de handicap. Notre référent handicap prendra contact avec les stagiaires concernés pour adapter l'animation à leurs besoins et rendre l'apprentissage accessible à tous. Enfin, nos centres de formation sont accessibles aux personnes à mobilité réduite.

Prochaines Sessions

  • 05/11/24 → 08/11/24
    Classe virtuelle 6 places restantes

Partager cette formation

Notre nouveau catalogue est en cours de déploiement. Aussi, pour connaître tous nos indicateurs, veuillez nous contacter directement.

Â