Machine Learning & Méthodes statistiques appliquées aux processus de classification Mixte : présentiel / à distance

Dernière mise à jour : 30/08/2024

Cette formation s'adresse à des personnes souhaitant appréhender les méthodes de classement. Les méthodes étudiées porteront sur le classement d’individus à attributs qualitatifs.



Même si l’essentiel des méthodes étudiées sont des méthodes supe

M'inscrire à la formation

Ajouter au panier

Public visé

  • Toute personne souhaitant comprendre le contexte d'utilisation, les concepts, et la mise en œuvre des méthodes de classements et de prédiction d'une variable qualitative.

Prérequis

  • Il est nécessaire que les participants aient des connaissances sur les outils statistiques de base : corrélation, écart-type, variance, intervalles de confiance, tests d'hypothèses.
  • Dans le cas où la formation serait effectuée avec le logiciel R, une connaissance de base de ce logiciel est préconisée.

Objectifs de la formation

A l'issue de cette formation, l'apprenant sera capable de :

  • Maîtriser le vocabulaire spécifique aux méthodes d'apprentissage à finalité de classement
  • Identifier le contexte et les conditions d'application des méthodes d'apprentissage supervisé et non supervisé
  • Connaître les objectifs et les différences entre les méthodes de classement
  • Décrire la méthodologie inhérente à ces méthodes
  • Mettre en œuvre et interpréter les résultats des méthodes d'apprentissage supervisé
  • Connaître les principaux indicateurs de cohérence liés aux méthodes d'apprentissage 
  • Maitriser les paramètres permettant d'estimer la qualité de ces analyses

Contenu de la formation

visuel

VOLET 1 : LES ALGORITHMES


Généralités sur les différentes méthodes d'apprentissage supervisé

  • Différences entre méthodes supervisées et non supervisées 
  • Objectifs de l'apprentissage supervisé
    • Objectifs de description
    • Objectifs de prédiction
  • Structure des jeux de données
  • Présentation générale de l'éventail des méthodes


La méthode knn

  • Principe de la méthode des plus proches voisins
  • Algorithme de calcul
  • Distances entre individus
  • Choix des proximités
  • Définition du paramètre k


La régression logistique

  • Variable explicative et variable expliquée (continue / binaire)
  • Différences entre la régression linéaire classique et la régression logistique
  • Variables explicatives qualitatives, variables explicatives quantitatives
  • Objectifs de la régression logistique
  • Définition du modèle Logit (courbe sigmoïde)
  • Conditions d'utilisation à respecter
  • Estimation et interprétation des coefficients du modèle
  • Test de significativité du modèle (validation du modèle)
  • Tests d'apport d'une variable (test de Wald, tests sur les rapports de vraisemblance)
  • Interprétation du Khi² de Wald
  • Odds-ratios
  • Parallèle odds ratios et risques relatifs
  • Mise en œuvre et analyse des résultats d'un modèle de régression logistique multiple
  • Estimation et interprétation des coefficients du modèle multiple


L'analyse factorielle discriminante

  • Structure du jeu de données et contexte d'application
  • Objectifs détaillés de l'AFD
  • Notions de classement et de discrimination
  • Méthodologie de l'AFD
  • Comparaison avec l'ACP
  • Interprétation des sorties logiciel : cercle factoriels, corrélations variables x axes
  • Qualité de l'AFD (de la discrimination obtenue)
    • Tests univariés et multivariés (lambda de Wilks)
    • Graphique des individus
    • Matrice de confusion (et éventuellement courbe ROC)
  • Les confusions et erreurs à ne pas commettre


Les supports vecteurs machines (SVM)

  • Démarche des svm
  • Notions de marge
  • Séparation linéaire
  • Séparation non linéaire
  • Fonction noyau


Les arbres de décision

  • Structure du jeu de données
  • Principes, vocabulaire et objectifs 
  • Notion d'échantillon d'apprentissage, de validation et de test
  • Comparaison de méthodes de type régression linéaire / logistique aux arbres de décision
  • Principe de la segmentation selon le type de variable : Arbre de régression ou arbre de classification
  • Définir les conditions d'arrêt de construction d'un arbre : Notion de pré-élagage
  • Définition des groupes après construction de l'arbre
  • Indicateurs de qualité
  • Comparaison d'arbre de décision selon un certain type d'algorithme : CHAID vs CART
  • Avantages et inconvénients : limites des arbres de décision
  • Mise en œuvre et interprétation des résultats obtenus après application d'une analyse par arbre de décision

 

De l'arbre à la foret - Random Forest

  • Pourquoi avoir recourt aux forêts aléatoires ? 
  • Principes et objectifs
    • Instabilité de l'arbre
    • Notion de Bagging
    • Les erreurs liées à l'échantillonnage (Out-Of-Bag)
    • Prédiction avec un algorithme de Forêt aléatoire : Les paramètres
  • Evaluer l'importance des variables
    • Notion d'importance
    • Comportement de l'importance 
    • Lien entre diversité des arbres et l'importance
    • Influence des paramètres
  • Sélection de variables
    • Généralités et principes de la sélection
    • Procédure de sélection
    • Les paramètres de sélection
    • Validation


VOLET 2 : VALIDATIONS DES METHODES, MESURE DES PERFORMANCES

 

  • Partitionnement des données disponibles
    • Jeu d'entrainement
    • Jeu de validation
    • Tests sur le jeu d'entrainement
    • Tests sur le jeu de validation
  • La validation croisée
    • Leave one out
    • K fold
    • Leave v out
  • Compromise biais / variance
  • Mesures des performances des classifications
    • Matrices de confusions
    • Courbe Roc
    • Aire sous la courbe (AUC)
    • Sensibilité & spécificité

Compétences acquises à l'issue de la formation

  • Identifier le contexte et les conditions dapplication des méthodes dapprentissage supervisé et non supervisé
  • Maîtriser le vocabulaire spécifique aux méthodes dapprentissage à finalité de classement
  • Connaître les objectifs et les différences entre les méthodes de classement
  • Décrire la méthodologie inhérente à ces méthodes
  • Mettre en uvre et interpréter les résultats des méthodes dapprentissage supervisé
  • Connaître les principaux indicateurs de cohérence liés aux méthodes dapprentissage
  • Maitriser les paramètres permettant destimer la qualité de ces analyses

Modalités pédagogiques

  • Explications théoriques suivies de pratiques guidées puis de mises en autonomie.
  • Exercices autonomes et réguliers pour assurer l'assimilation

Moyens et supports pédagogiques

Votre formation a lieu en présentiel :

  • 1 vidéoprojecteur par salle
  • 1 ordinateur

 

Votre formation se déroule à distance avec :

  • 1 ordinateur
  • 1 connexion Internet
  • 1 adresse e-mail valide
  • 1 équipement audio (micro et enceintes ou casque)
  • 1 Webcam (facultatif – dans l'idéal)
  • 1 deuxième écran (facultatif – dans l'idéal)

 

Votre formation se déroule sur notre plate-forme de formation avec :

  • 1 ordinateur
  • 1 connexion Internet
  • 1 adresse e-mail valide
  • 1 équipement audio (micro et enceintes ou casque - facultatif)

 

Support stagiaire :

À l'issue de la formation, les exercices et travaux pratiques réalisés, leurs corrigés ainsi qu'un support de cours dématérialisé sera fourni à chaque stagiaire par e-mail ou via la plate-forme FOAD.

Modalités d'évaluation et de suivi

L'acquisition des compétences de la formation se fait à travers le suivi du formateur tout au long de la formation (séquences synchrones et asynchrones). Elle s'appuie également sur la réalisation d'exercices et de TP. Enfin, des quiz s'ajoutent aux différents outils de validation de l'acquisition des compétences visées. Une évaluation est systématiquement réalisée par chaque stagiaire, à l'issue de la formation.

Profil du formateur

Nos formateurs sont certifiés à l'issue d'un parcours organisé par nos soins. Ils bénéficient d'un suivi de maintien et d'évolution de leurs compétences aussi bien au niveau technique que pédagogique.
Chacun de nos formateurs a bénéficié d'une formation spécifique à l'animation de classe virtuelle et à l'utilisation des solutions de formation à distance du Groupe ARKESYS.

Informations sur l'accessibilité

Cette formation est accessible à toute personne en situation de handicap. Notre référent handicap prendra contact avec les stagiaires concernés pour adapter l'animation à leurs besoins et rendre l'apprentissage accessible à tous. Enfin, nos centres de formation sont accessibles aux personnes à mobilité réduite.

Prochaines Sessions

  • Aucune formation INTER-ENTREPRISE n'est programmée pour le moment. Contactez-nous via le formulaire ou par téléphone au 04.37.24.36.78 afin de connaitre les dates possibles ou les autres modalités d'inscription.

Partager cette formation

Notre nouveau catalogue est en cours de déploiement. Aussi, pour connaître tous nos indicateurs, veuillez nous contacter directement.