XLSTAT Analyses multivariées, classification et PLS (ACP, CAH, K-MEANS, AFD, PLS) Mixte : présentiel / à distance

Dernière mise à jour : 07/01/2025

Optimisez vos analyses avec notre formation "XLSTAT : Analyses multivariées, classification et PLS". Maîtrisez les techniques avancées comme l'ACP, CAH, K-MEANS, AFD et PLS pour des décisions éclairées et une compréhension approfondie de vos données.

M'inscrire à la formation

Votre situation :
- Je travaille pour une organisation et souhaite m'inscrire personnellement
- Je suis un particulier et souhaite m'inscrire personnellement
- Je suis en charge de la formation dans mon organisation
- Je suis salarié Je suis travailleur non-salarié Je suis bénévole Je suis agent public Autre
- Je suis indépendant / profession libérale Je suis salarié (Financement propre ou via CPF) Je suis en recherche d'emploi Je suis en reconversion professionnelle
- Je souhaite organiser une formation en INTRA (concernera seulement mes collaborateurs) Je souhaite inscrire un ou plusieurs participants en INTER
Vous avez défini votre situation au moment de sélectionner une formation.
Pour la corriger, vous devez réinitialiser mon panier.

Veuillez décrire votre situation :

Aucune formation INTER-ENTREPRISE n'est programmée pour le moment. Contactez-nous via le formulaire ou par téléphone au 04.37.24.36.78 afin de connaitre les dates possibles ou les autres modalités d'inscription.

Ajouter au panier

Public visé

Toute personne souhaitant comprendre et mettre en œuvre les procédures d'analyses factorielles multivariées en intégrant la régression PLS avec mise en application sous XlStat

Prérequis

Il est nécessaire que les participants aient de bonnes connaissances sur les outils statistiques de base : corrélation, écart-type, variance, intervalles de confiance, tests d'hypothèses.

Objectifs de la formation

A l'issue de cette formation, l'apprenant sera capable avec XlStat :

Identifier quelle méthode d'analyse multivariée ou de classification utiliser selon le contexte
Décrire les concepts mathématiques inhérents à ces méthodes
Mettre en œuvre les analyses suivantes : ACP, CAH, K-MEANS, AFD, PLS
Maitriser les coefficients et les paramètres permettant d'estimer la qualité des analyses statistiques ci-dessus
Expliquer la différence entre les notions de contribution et de cosinus carré
Identifier les contextes d'utilisation des différentes versions de la régression PLS
Comprendre les concepts mathématiques inhérents à la régression PLS
Interpréter les résultats et les graphiques qui découlent des analyses

Contenu de la formation

Prise en main de l'interface d'XlStat

Généralités et interface utilisateur
- Interface de base
- Rappel sur quelques outils Excel nécessaires à la manipulation d'XlStat.
- Activation, chargement et fermeture d'XlStat
- Gestion et organisation des données
- L'interface XlStat
- Menus et barre d'outils
- Principes de paramétrage des boîtes de dialogue
- Gestion des classeurs et des feuilles Excel
- Paramétrage de base de l'outil
- Présentations des différentes analyses statistiques disponibles
- Complémentarités entre Excel et XlStat
Outils XlStat non statistiques
- Repérage de données selon critères
- Différents types de fonctionnalités de préparation des données
- Regroupement des données en classes
- Transformation de données
- Outils complémentaires aux graphiques (étiquettes, axes, facteur de zoom…)
- Codage de données

Généralités sur les différentes méthodes d'analyses multidimensionnelles

Limites des statistiques classiques
Champs d'application des différentes méthodes d'analyses multidimensionnelles
Introduction sur le data mining - Les objectifs
- Objectifs de description
- Objectifs de prédiction
Structure des jeux de données
Présentation de l'éventail des méthodes
- Analyse en composantes principales
- Analyse factorielle des correspondances simples et multiples
- Analyse factorielle discriminante
- Méthodes de classification : classification ascendante hiérarchique, k-means
- Régressions PLS et PLS-DA
Principes généraux des différentes méthodes - Notions de :
- Distance,
- Inertie et variance
- Axes factoriels
- Variables latentes

Notions de corrélation

Définition du coefficient de corrélation
Interprétation de la valeur du coefficient de corrélation
Les confusions : corrélation, causalité, pente…
Les différents coefficients de corrélation
- Coefficient de Pearson
- Coefficient de Spearman

Mise en œuvre d'une Analyse en Composante principales (ACP)

Structure du jeu de données et contexte d'application
Objectifs détaillés de l'ACP
Choix des axes de représentation (choix du nombre de composantes principales)
Interprétation des sorties graphiques : cercle factoriel et graphique des individus
Interprétation des axes factoriels
Contribution des individus et des variables aux axes
Qualité de représentation des individus et des variables sur les axes : les cosinus carrés
Les différentes ACP :
- ACP normée et non normée
- ACP non paramétrique
Positionnement d'une variable illustrative catégorielle
Les confusions et erreurs à ne pas commettre
Présentation rapide des Analyses des correspondances simple et multiple si souhaité
Différences entre ACP et AFC

Mise en œuvre d'une classification par une classification ascendante hiérarchique (CAH)

Présentation des objectifs de la classification ascendante hiérarchique
Structure du jeu de données
Choix de la distance
Choix du linkage (saut, critère de « rapprochement » entre les classes) : méthode de Ward…
Lecture d'un dendrogramme
Choix du nombre de classes
Classification sur les individus
Classification sur les variables
Interprétation des sorties logiciel

Mise en œuvre d'une classification par une k-means

Présentation des objectifs de la méthode des k-means
Avantages et inconvénients de la CAH et des k-means
Détermination des clusters
Présentation des différentes versions de l'algorithme
Utilisation de la k-means en complément de l'ACP
Classification sur grand jeu de données
Conseils de mise en œuvre
Interprétation des sorties logiciel

Mise en œuvre d'une analyse factorielle fiscriminante (AFD)

Structure du jeu de données et contexte d'application
Objectifs détaillés de l'AFD
Notions de classement et de discrimination
Méthodologie de l'AFD
Comparaison avec l'ACP
Interprétation des sorties logiciel : cercle factoriels, corrélations variables x axes
Qualité de l'AFD (de la discrimination obtenue)
- Tests univariés et multivariés (lambda de Wilks)
- Graphique des individus
- Matrice de confusion (et éventuellement courbe ROC)
Les confusions et erreurs à ne pas commettre

Mise en œuvre d'une analyse discriminante PLS (PLS-DA)

Problématique :
- Des multi colinéarités
- Des petits échantillons
Présentation de la PCR (Principal Component Regression)
Méthodologie générale de PLS
Présentation des différentes versions de la régression PLS
Structure du jeu de données et contexte d'application de la PLS-DA
Objectifs détaillés de la PLS-DA
Choix du nombre de composante de la PLS : critère du Q carré
Interprétation des sorties logiciel : cercle factoriels, corrélations variables x axes
Importance des variables pour la discrimination des groupes : les VIP
Qualité de la PLS-DA
- Indicateurs Q carrés et R carrés
- Matrice de confusion
Les confusions et erreurs à ne pas commettre

Mise en œuvre d'une régression PLS

Contexte et objectifs
Présentation des différentes méthodes de régression sur des données colinéaires : PCR, régression de Ridge et PLS
Principes et concepts mathématiques inhérents à la PCR et la régression PLS
Présentation des différentes versions de la régression PLS
Mise en œuvre et interprétation des résultats : graphiques, coefficients du modèle…
Choix du nombre de composantes (validation croisée)
Composantes et coefficients de régression
Qualité d'ajustement, qualité de prédiction
Coefficients Q² et R²
Importance des variables explicatives pour la prédiction
- Coefficients normalisés
- VIP
Sélection de variables

Compétences acquises à l'issue de la formation

Identifier quelle méthode danalyse multivariée ou de classification utiliser selon le contexte
Décrire les concepts mathématiques inhérents à ces méthodes
Maitriser les coefficients et les paramètres permettant destimer la qualité des analyses statistiques ci-dessus
Expliquer la différence entre les notions de contribution et de cosinus carré
Mettre en uvre les analyses suivantes : ACP, CAH, K-MEANS, AFD, PLS
Identifier les contextes dutilisation des différentes versions de la régression PLS
Comprendre les concepts mathématiques inhérents à la régression PLS
Interpréter les résultats et les graphiques qui découlent des analyses

Modalités pédagogiques

Explications théoriques suivies de pratiques guidées puis de mises en autonomie.
Exercices autonomes et réguliers pour assurer l'assimilation

Moyens et supports pédagogiques

Votre formation a lieu en présentiel :

1 vidéoprojecteur par salle
1 ordinateur

Votre formation se déroule à distance avec :

1 ordinateur
1 connexion Internet
1 adresse e-mail valide
1 équipement audio (micro et enceintes ou casque)
1 Webcam (facultatif – dans l'idéal)
1 deuxième écran (facultatif – dans l'idéal)

Votre formation se déroule sur notre plate-forme de formation avec :

1 ordinateur
1 connexion Internet
1 adresse e-mail valide
1 équipement audio (micro et enceintes ou casque - facultatif)

Support stagiaire :

À l'issue de la formation, les exercices et travaux pratiques réalisés, leurs corrigés ainsi qu'un support de cours dématérialisé sera fourni à chaque stagiaire par e-mail ou via la plate-forme FOAD.

Modalités d'évaluation et de suivi

L'acquisition des compétences de la formation se fait à travers le suivi du formateur tout au long de la formation (séquences synchrones et asynchrones). Elle s'appuie également sur la réalisation d'exercices et de TP. Enfin, des quiz s'ajoutent aux différents outils de validation de l'acquisition des compétences visées. Une évaluation est systématiquement réalisée par chaque stagiaire, à l'issue de la formation.

Profil du formateur

Nos formateurs sont certifiés à l'issue d'un parcours organisé par nos soins. Ils bénéficient d'un suivi de maintien et d'évolution de leurs compétences aussi bien au niveau technique que pédagogique.
Chacun de nos formateurs a bénéficié d'une formation spécifique à l'animation de classe virtuelle et à l'utilisation des solutions de formation à distance du Groupe ARKESYS.

Informations sur l'accessibilité

Cette formation est accessible à toute personne en situation de handicap. Notre référent handicap prendra contact avec les stagiaires concernés pour adapter l'animation à leurs besoins et rendre l'apprentissage accessible à tous. Enfin, nos centres de formation sont accessibles aux personnes à mobilité réduite.

Catégorie : Logiciels statistiques
Sous-Catégorie : XlStat
Durée : 28h
Prix : 3 000 € Net de taxe

Prix INTRA : 6 200 € Net de taxe

Télécharger le programme

Prochaines Sessions

Aucune formation INTER-ENTREPRISE n'est programmée pour le moment. Contactez-nous via le formulaire ou par téléphone au 04.37.24.36.78 afin de connaitre les dates possibles ou les autres modalités d'inscription.

Dans la même catégorie

XLSTAT Anova et régression (régression simple) Présentiel / à distance
XLSTAT Notions fondamentales, Tests d’hypothèses et Traitement des petits échantillons Présentiel / à distance

Partager cette formation

Notre nouveau catalogue est en cours de déploiement. Aussi, pour connaître tous nos indicateurs, veuillez nous contacter directement.