Fondamentaux sur le logiciel R
- Fonctionnement général du logiciel et documentation en ligne
- Conseils sur l'organisation d'un projet R
- Affichage, sauvegarde, suppression et chargement des objets en mémoire
- Importation des données contenues dans un classeur Excel
- Installation et utilisation d'un package
- Utilisation d'interfaces type Rcmdr
- Trucs et astuces
Manipulation avancée de l'information des dataframes
- Création et manipulation efficace des variables qualitatives (facteurs) et quantitatives
- Ajout d'observation ou de variables à un tableau de données
- Empilement / désempilement d'un tableau de données
- Conversion des objets et contrôle du type des objets
- Commandes is.something
- Commandes as.something
- Gestion des données manquantes
- Présentation et utilisation des fonctions de type apply : apply, tapply …
- Création de tableaux de synthèse (tableaux croisés)
Création de scripts avancés
- Exécution des scripts
- dans la console R
- à partir d'un autre script
- Création de scripts personnalisés
- Utilisation des scripts pour l'automatisation des analyses
Mise en œuvre d'analyses statistiques de base
- Analyse descriptive des données
- Intervalles de confiance
- Tests d'hypothèse paramétriques et non paramétriques
- Comparaison des moyennes (Student)
- Comparaison des médianes (Wilcoxon, Mann-Whitney)
- Comparaison des variances (Fisher)
- Comparaison de proportions (χ^2)
- Test de Normalité (Shapiro-Wilk) et QQ-plot
Mise en œuvre une ANOVA sous R
- Les commandes aov() et lm()
- Mise en œuvre d'une ANOVA à un facteur
- Tableau d'analyse de la variance et estimation des coefficients du modèle
- Vérification des conditions d'utilisation du modèle : Normalité et homogénéité des dispersions (test de Bartlett, test de Levene)
- Représentation graphique des résultats de l'analyse
- Tests post-Hoc (comparaisons multiples)
- Les commandes de base (TukeyHSD, paiwise.t.test)
- Package spécifique (multcomp)
- Tests non paramétriques : Kruskal-Wallis, Friedman
- Mise en œuvre d'une ANOVA multi-facteurs
- Éléments de syntaxe : *, |, /, Error…
- Effets simples, effets croisés
- ANOVA à mesures répétées
- ANOVA à facteur imbriqué
- Graphique des interactions
- Somme des carrés de type I / somme des carrés de type III
Mise en œuvre une régression linéaire sous R
- Commande summary() / commande anova()
- Régression linéaire simple
- Régression linéaire multiple
- Tableau d'analyse de la variance et estimation des coefficients du modèle
- Vérification des conditions d'utilisation d'une régression linéaire
- Normalité des résidus
- Homogénéité des résidus
- Prédiction et intervalles de confiance d'une prédiction
- Diagnostic des problèmes de multicolinéarité
- Régression linéaire pas à pas
Mise en oeuvre une analyse factorielle multivariée et une classification sous R
- Présentation des principaux packages
- ACP (Analyse en Composantes Principales)
- Réaliser une ACP sous R
- Valeurs propres et diagramme des valeurs propres
- Contributions et cosinus² des variables
- Contributions et cosinus² des individus
- Cercle factoriel
- Graphique des individus
- AFC (Analyse Factorielle des Correspondances)
- Profils-lignes et profils-colonnes
- Réaliser une AFC sous R
- Valeurs propres et diagramme des valeurs propres
- Coordonnées, cosinus² et contributions des lignes, des colonnes
- Représentation des modalités dans le plan factoriel
- CAH (Classification Ascendante Hiérarchique)
- Commandes hclust(), kmeans() et hcpc()
- Création de la matrice des distances
- Dendrogramme
- Récupération des classes
Mise en œuvre d'autres analyses statistiques (à la carte)
- La mise en œuvre d'autres analyses statistiques « avancées » des données pourra être réalisée sur demande au cours de la formation en fonction des attentes des participants.
- Par exemple, nous pourrons aborder la mise en place d'analyses statistiques telles que :
- L'ACM, l'AFD, les k-means… (analyses factorielles multivariées et méthodes de classements)
- La régression PLS
- La régression logistique
- Les modèles linéaires généraux (ANCOVA…)