Initiation au Text Mining Mixte : présentiel / à distance
Dernière mise à jour : 17/02/2026
M'inscrire à la formation
Public visé
- Toute personne souhaitant découvrir le Text mining et sa mise en application sous R
Prérequis
- L'apprenant devra avoir des notions de bases en statistique (statistique descriptive, estimation), en Data Mining (apprentissage supervisé, non supervisé, ACP) ainsi que des notions de R.
Objectifs de la formation
A l'issue de cette formation, l'apprenant sera capable de :
- Importer une base de données textuelles sous R
- Représenter les données textuelles sous un format approprié
- Préparer les données en effectuant les principaux pré-traitements spécifiques aux données textuelles
- Visualiser les données textuelles
- Effectuer une recherche d'informations
- Effectuer une classification de documents (apprentissage supervisé)
- Extraire des thématiques d'une base de données textuelles (apprentissage non supervisé)
Contenu de la formation
Jour 1 – Matin
Introduction au Text Mining
- Contexte
- Exemple de données
- Application du Text Mining
Particularité des données textuelles
- Multiplicité des représentations
- Fléau de la dimension
- Subjectivité des données
Â
Jour 1 – Après-midi
Représentations des données textuelles
- Sac de mots
- Vectorisation
Pré-traitements
- Tokenization
- Nettoyage (majuscule, nombre, ponctuations…)
- Stopwords
- Stemming
Â
Jour 2 – Matin
Visualisation
- Histogramme
- Nuage de mots
Recherche d'informations
- Comparaison de textes
- Pondération des termes (TF-IDF…)
- Text ranking
Â
Jour 2 – Après-midi
Application du text mining
- Recherche d'information
- Classification de documents
- Analyse de sentiments
- Classification de documents
- Extraction de thématiques avec le modèle LDA
Compétences acquises à l'issue de la formation
- Importer une base de données textuelles sous R
- Représenter les données textuelles sous un format approprié
- Préparer les données en effectuant les principaux pré-traitements spécifiques aux données textuelles
- Visualiser les données textuelles
- Effectuer une recherche dinformations
- Effectuer une classification de documents (apprentissage supervisé)
- Extraire des thématiques dune base de données textuelles (apprentissage non supervisé)
Modalités pédagogiques
- Explications théoriques suivies de pratiques guidées puis de mises en autonomie.
- Exercices autonomes et réguliers pour assurer l'assimilation
Moyens et supports pédagogiques
Votre formation a lieu en présentiel :
- 1 vidéoprojecteur par salle
- 1 ordinateur
Â
Votre formation se déroule à distance avec :
- 1 ordinateur
- 1 connexion Internet
- 1 adresse e-mail valide
- 1 équipement audio (micro et enceintes ou casque)
- 1 Webcam (facultatif – dans l'idéal)
- 1 deuxième écran (facultatif – dans l'idéal)
Â
Votre formation se déroule sur notre plate-forme de formation avec :
- 1 ordinateur
- 1 connexion Internet
- 1 adresse e-mail valide
- 1 équipement audio (micro et enceintes ou casque - facultatif)
Â
Support stagiaire :
À l'issue de la formation, les exercices et travaux pratiques réalisés, leurs corrigés ainsi qu'un support de cours dématérialisé sera fourni à chaque stagiaire par e-mail ou via la plate-forme FOAD.
Modalités d'évaluation et de suivi
Profil du formateur
Chacun de nos formateurs a bénéficié d'une formation spécifique à l'animation de classe virtuelle et à l'utilisation des solutions de formation à distance du Groupe ARKESYS.