Rappels sur les fondamentaux sur le logiciel R
- Lire efficacement l'aide en ligne des commandes
- Rechercher les commandes
- Affichage, sauvegarde, suppression et chargement des objets en mémoire
- Trucs et astuces
Utilisation des fonctions les plus courantes du logiciel R
- Fonctions d'information sur les objets : which, unique, sort, duplicated…
- Principales fonctions mathématiques : log, mean, median, cumsum…
- Fonctions de type apply : apply, lapply, sapply, tapply
- Fonctions dédiées au traitement des chaînes de caractères : paste, grep, match, %in%...
Manipulation des objets R
- Création des objets R : vecteurs, facteurs, data frames, listes, listes imbriquées…
- Manipulation efficace des objets R ci-dessus
- Dimension de l'objetü Modification des noms
- Extraction des éléments : à partir des indices, par le biais de conditions
- Ajout et suppression d'un élément
- Contrôle du type des objets et conversion des objets
- Commandes is.something
- Commandes as.something
- Conversion d'une variable numérique en facteur
- Conversion d'un facteur en variable numérique
- Transformation d'une liste en vecteur
Manipulation des chaines de caractères et des dates
- Concaténation des chaines de caractères
- Extraction d'une partie d'une chaine de caractères
- Recherche d'un pattern (motif)
- Découpage des chaines de caractères
- Remplacement d'une partie d'une chaine de caractères
- Les commandes %in% et match
- Gestion des dates par le package lubridate
Manipulation avancée des tableaux de données sous R
- Tri un tableau de données
- Filtrage des données d'un tableau (lignes et/ou colonnes)
- Par le biais des noms des éléments
- Par le biais des indices des éléments
- Par le biais des opérateurs de comparaison (extraction par condition)
- Par le biais des opérateurs de comparaison et des opérateurs logiques (extraction par conditions)
- Extraction aléatoire d'observations d'un tableau
- Fusion de plusieurs tableaux de données
- Commandes rbind et cbind
- Commande merge
- Commandes stack et unstack
- Commandes melt et dcast du package reshape2
- Commandes reshape
Création de tableaux de synthèses
- Moyennes (et écart-types) par groupe
- Commande tapply
- Commande aggregate
- Synthèse de Normalité de toutes les variables quantitatives
- Synthèse des résultats des analyses statistiques : tableaux des p-values de toutes les variables…
Utilisation des commandes de type apply
- Commande apply
- Commande sapply
- Commande lapply
- Utilisation de ces commandes sur des cas concrets
- Comparaison des commandes lapply et sapply
Création et exécution de scripts élaborés
- Exécution des scripts : dans la console, à partir d'un autre script
- Entrées clavier et sorties écran
- Commande scan(), package svDialogs
- Commandes cat et print
- Structure de contrôle
- Sélection : if, if else, ifelse, switch
- Boucles : for, while, repeat
- Commandes break, stop, next
- Extraire les éléments d'une analyse statistique : p-values d'une ANOVA, résidus d'une régression…
Création et exécution de fonctions utilisateurs
- Accéder au programme d'une fonction R (pour s'en inspirer, pour la modifier)
- Expression générale des fonctions
- Chargement d'une fonction utilisateur en mémoire
- Appel à une fonction utilisateur
- Valeur par défaut des arguments d'une fonction
- Les « … »
- Création d'une fonction d'automatisation de tâches complexes
Optimisation d'un programme
- Les erreurs à ne pas commettre
- Les solutions permettant d'éviter les boucles et les instructions de sélection
- Vectorisation d'un programme
- Les bonnes pratiques
- Structuration en projet R
RMarkdown
- Objectifs de RMarkdown
- Configuration d'un projet
- La démarche des blocs
- Mise en place de chunks R
- Sorties des résultats en mode onglets
- Exportation en Html
- Exportation vers Word, PowerPoint
- Portage des fichiers