Introduction
- Présentation de Python : Historique
- Pourquoi utiliser Python ?
- Le langage de programmation
- Installation de Python
- Description de l'environnement et de l'interface de Python
Présentation du Machine Learning
- Qu'appelle-t-on Machine Learning ?
- Pourquoi faire du Machine Learning, dans quel contexte ?
- Définition des problèmes d'apprentissage : classification et régression
- Exemples de projets/problématiques de Machine Learning
- Quelles sont les méthodes de Machine Learning ?
Syntaxe du langage Python
- Conventions et règles
- Définition des blocs et des commentaires
- Les différents types de données
- Les variables
- Les différentes manipulations des types de données de base : numérique et chaîne de caractères
- Les structures conditionnelles
- Les opérateurs de comparaisons
- Les fonctions
Définition des données en Python
- Notion de variable
- Création de variables
- Les différents types de données en Python
- Qu'est-ce qu'un « type » de données ?
- Définition des types de données
- Quels sont les différents types de manipulation de données en Python ?
La bibliothèque Scikit-learn
- Présentation et outils de la bibliothèque
- Importation de la bibliothèque
Création de modèles prédictifs
- Différentes techniques d'apprentissage : Méthode des K-NN (K plus proches voisins) et arbre de décision
- Création d'un modèle d'apprentissage avec les outils de Scikit-learn
Analyse de modèles prédictifs
- Evaluation de la performance d'un modèle
- Critères de performance
- Procédure d'évaluation
- Les différents critères d'évaluation de performance d'un modèle
- Accuracy
- Matrice de confusion et de coût (classification)
- R²
- Indicateurs d'écarts : Analyse des résidus
- MSE (Erreur quadratique moyenne)
- MAPE
- Analyse des erreurs individuelles
Optimisation de modèles prédictifs
- Définition des potentiels risques liés aux modèles prédictifs : Risques de sous-apprentissage et de sur-apprentissage
- Ajustement / calibration du modèle pour éviter les risques de sous-apprentissage et de sur-apprentissage
- Amélioration de la capacité de prédiction d'un modèle : Réalisation d'un ensemble de modèles. Cas des arbres de décisions - Forêts aléatoires (Random Forest)
- Optimisation de la classification
- Procédure de validation croisée
- Evaluation et recherche des meilleurs paramètres d'un modèle