Text Mining

Statut actuel

Non-inscrit

Tarif

24,90 €

Commencer

Apprenez à extraire et analyser des informations précieuses à partir de données textuelles grâce à notre formation complète en Text Mining. Vous découvrirez comment transformer des textes bruts en données exploitables à l’aide de techniques avancées telles que la tokenisation, l’analyse de sentiment, le clustering, et les modèles de langage comme BERT et GPT. Vous explorerez également des outils populaires comme Python, NLTK, SpaCy et Gensim pour le traitement de texte.

Au programme :

  • Préparation des données textuelles : nettoyage, normalisation, représentation (BoW, TF-IDF, Word Embeddings)
  • Analyse de texte : fréquence des mots, co-occurrence, clustering et réduction de dimensionnalité
  • Techniques avancées : classification de texte, analyse de sentiment, et NLP

Visualisation des résultats et mise en production de modèles

Ce cours contient :

- Une version écrite et très détaillée de tous les chapitres ;

- Une vidéo de chaque chapitre de la formation ;

- Des quiz après chaque chapitre pour tester la compréhension ;

- Des exercices et travaux pratiques corrigés ;

- Des projets et cas réels ;

- Un quiz final pour tester et valider la maitrise du module.

 

Un Certificat qui atteste de la bonne maitrise de ce cours est délivré à l'apprenant qui a réussi les différentes évaluations.

 

Un suivi régulier par un collaborateur progcours est possible moyennant des frais supplémentaires.

Contenu Cours

Introduction au Text Mining
Définition et importance
Différences Text Mining / Text Analytics / NLP
Applications
Outils : Python, R, NLTK, SpaCy, Gensim
Préparation des Données Textuelles
Types de données : textes, documents, corpus
Nettoyage : suppression des caractères spéciaux, stop words
Normalisation : minuscules, stemming, lemmatisation
Tokenisation et n-grams
Représentation : Bag-of-Words, TF-IDF, Word Embeddings (Word2Vec, GloVe)
Exploration des Techniques de Text Mining
Analyse de la fréquence des mots — Word Clouds
Analyse de la co-occurrence et graphes de mots
Clustering de texte (K-means…)
Réduction de dimensionnalité : PCA, LDA
Techniques Avancées
Classification de texte : SVM, Random Forest, Naive Bayes
Modèles de langage et NLP — Introduction aux transformers (BERT, GPT)
Analyse de sentiment : techniques de base et avancées
Visualisation des Résultats
Nuages de mots, graphes de réseaux, fréquence des termes
Visualisation des résultats de clustering (cartes de chaleur)
Relations entre documents et clusters
Applications Pratiques
Analyse de documents : contrats, articles, brevets
1 de 2