MACHINE LEARNING Modèle prédictif avec l'algorithme KNN Mixte : présentiel / à distance
Dernière mise à jour : 07/01/2025
M'inscrire à la formation
Public visé
Prérequis
- Une connaissance des outils statistiques de base est souhaitée
- Une connaissance des approches prédictives classiques (régression) est un plus mais pas strictement nécessaire.
Objectifs de la formation
- Comprendre la démarche de l'algorithme knn
- Comprendre les avantages et les inconvénients du knn
- Trouver l'optimalité du paramètre k
- Valider le modèle en appliquant les différentes méthodes de validation
- Mettre en œuvre sous des logiciels comme R l'algorithme Knn
Contenu de la formation

Jour 1 – Matin
Rappeler la démarche de la modélisation
- Que veut-on prédire
- Variable Qualitative
- Variable Quantitative
- Quantification de l'erreur du modèle
- Modèles à Y Quantitatif
- Modèles à Y Qualitatif
Maîtriser le fonctionnement du knn
- Préparation des données
- Problèmes d'échelle sur les X
- Centrage des valeurs de X
- La démarche du knn
- Cas d'une prédiction qualitative
- Cas d'une prédiction quantitative
Appliquer le Knn sur des variables X qualitatives
- Comment transformer des X qualitatives en X quantitatives
- Méthodes de l'Analyse factorielles de Correspondances
- Récupération des coordonnées des individus
- Mise en place du Knn
Jour 1 – Après-midi
Comprendre le sous et surajustement
- Notions de biais d'un modèle
- Notions de variance d'un modèle
- Optimalité variance & biais
- Jugement de la qualité d'un modèle
- Matrice de confusion
- Méthode du Data Train / Data test
- Validation croisée
- Classique LOO (Leave One Out)
- Validation croisée par k fold
Réaliser des exercices pratiques
- Applications avec R
- Démonstration avec Excel
- Cas d'études sur données des apprenants
Jeux de données
Afin de s'approcher au mieux des réalités quotidiennes des praticiens, nous suggérons de nous appuyer pour l'animation pratique de thématiques et surtout de jeux de données reflétant le quotidien des apprenants.
Cet élément est un facteur de réussite pour la formation. Elle permet aux apprenants de :
- Se "reconnaitre" dans les thèmes abordés,
- Mieux percevoir l'intérêt des notions étudiées
- S'approprier le contenu de la formation
Il sera donc pertinent que les apprenants puissent réfléchir en amont de la formation à des problématiques, jeux de données ou documents susceptibles d'être utilisés en support lors de la formation.
Outil logiciel
Cette formation n'est pas strictement dédiée à un logiciel. Les exercices et les illustrations se feront généralement sous R ou sous un autre logiciel partant de l'hypothèse que celui-ci intègre les outils techniques abordés.
Dans le cas où la formation serait effectuée avec le logiciel R, une connaissance de base de ce logiciel est préconisée.
Modalités pédagogiques
- Explications théoriques suivies de pratiques guidées puis de mises en autonomie.
- Exercices autonomes et réguliers pour assurer l'assimilation
Moyens et supports pédagogiques
Votre formation se déroule à distance avec :
- 1 ordinateur
- 1 connexion Internet
- 1 adresse e-mail valide
- 1 équipement audio (micro et enceintes ou casque)
- 1 Webcam (facultatif – dans l'idéal)
- 1 deuxième écran (facultatif – dans l'idéal)
Modalités d'évaluation et de suivi
- Questionnaire de vérification de connaissances (Quiz),
- Réalisation de Travaux Pratiques : production ou amélioration d'un fichier,
- Mises en situation et grilles d'analyse,
- Serious Game : jeu de rôles et analyse,
- Activités interactives à travers l'utilisation d'une plate-forme connectée.