Rappels sur les notions de corrélation
- Définition du coefficient de corrélation
- Interprétation de la valeur du coefficient de corrélation
- Les confusions : corrélation, causalité, pente…
- Les différents coefficients de corrélation
- Coefficient de Pearson
- Coefficient de Spearman
Modélisation de type régression linéaire simple
- Principes et concepts mathématiques inhérents à la régression linéaire simple
- Tests d'hypothèse de significativité du modèle
- Qualité du modèle,
- Coefficient de détermination R², R² ajusté, R² Prev
- Utilisation du modèle
- Prédiction de valeurs individuelles
- Intervalles de confiance des prédictions
- Traitement graphique des résultats
- Principes et concepts mathématiques inhérents à la régression linéaire multiple
- Inférence du modèle, inférence des variables (statistique de Fisher)
- Analyse des résidus
- Calculs des résidus
- Sens physique et statistique
- Homogénéité
- Distribution, Normalité
- Valeurs suspectes
- Analyses graphiques
- Valeurs suspectes et points influents
- Résidus : résidus studentisés
- Effet levier
- Distance de Cook
- Qualité du modèle
- Qualité d'ajustement, coefficient de détermination R², R² ajusté
- Qualité de prédiction, erreur d'estimation
- Utilisation du modèle
- Prédiction (prévision) de valeurs individuelles
- Intervalles de confiance des prédictions (prévisions)
- Illustration graphique des résultats
Le modèle de régression multiple
- Significativité des coefficients
- Hiérarchie des coefficients
- Problèmes liés à la multi-colinéarité
- Mesures des colinéarités
- Coefficient de corrélation
- Vifs
- Résolution des problèmes de multi-colinéarité
Analyse des problèmes de multi colinéarité à travers la sélection des variables
- Détection de la colinéarité
- Effets nocifs de la colinéarité entre variables explicatives
- Outils de détection : corrélation, VIF, cohérence des signes
- Les solutions proposées
- Expérimentation structurée
- Sélection de variables
- PLS
- Traitement de la colinéarité – Sélection de variables
- Sélection par optimisation. Critère du R², du R² ajusté, de l'AIC et du BIC
- Algorithmes de sélection « pas à pas » : Forward selection, Backward selection, Stepwise regression
Mise en œuvre et interprétation des résultats d'une régression PLS
- Contexte et objectifs
- Présentation des différentes méthodes de régression sur des données colinéaires : PCR, régression de Ridge et PLS
- Principes et concepts mathématiques inhérents à la PCR et la régression PLS
- Présentation des différentes versions de la régression PLS
- Mise en œuvre et interprétation des résultats : graphiques, coefficients du modèle…
- Choix du nombre de composantes (validation croisée)
- Composantes et coefficients de régression
- Qualité d'ajustement, qualité de prédiction
- Coefficients Q² et R²
- Importance des variables explicatives pour la prédiction
- Coefficients normalisés
- VIP
- Sélection de variables
Mise en œuvre et interprétation des résultats d'une ANCOVA (modèles linéaires généraux)
- Contexte et objectifs
- Notion d'interaction entre les variables explicatives qualitatives et quantitatives
- Modèle à droites confondues
- Modèle additif
- Modèle complet
- Mise en œuvre et interprétation des résultats des différents modèles
- Lecture et utilisation du modèle
- Tests de significativité des différents termes (F de Fisher)
- Epuration du modèle (sélection des termes et des variables influents)
- Conditions d'utilisation de l'ANCOVA
Modélisation de type régression logistique
- Contexte et objectifs
- Différences entre la régression linéaire et la régression logistique
- Définition du modèle Logit
- Mise en œuvre et interprétation des résultats
- Découpage en classes des variables explicatives quantitatives
- Estimation et interprétation des coefficients du modèle
- Tests d'apport d'une variable (test de Wald, tests sur les rapports de vraisemblance)
- Interprétation du Khi² de Wald
- Odds-ratios
- Parallèle odds ratios et risques relatifs
- Analyse du tableau de classement
- Taux de réussite, taux d'échec
- Vrais positifs, vrais négatifs, faux positifs, faux négatifs
- Probabilités ajustées et utilisation du modèle à des fins de prédiction
- Conditions d'utilisation