Pandas – M016

Statut actuel

Non-inscrit

Tarif

à la demande

Commencer

Cette formation sur pandas, l’outil incontournable pour l’analyse et la manipulation de données en Python, vous permettra de transformer vos ensembles de données bruts en informations exploitables. Adaptée aux débutants et aux utilisateurs intermédiaires, elle couvre :

  • Les bases des séries et des DataFrames pour structurer vos données.
  • La manipulation avancée : nettoyage, transformation, fusion et regroupement.
  • L’analyse statistique, les tableaux croisés dynamiques et les séries temporelles.
  • La gestion des fichiers : CSV, Excel, bases de données SQL.
  • L’optimisation des performances pour traiter de grands volumes de données.

Avec des exercices pratiques et des projets concrets (analyse client, séries chronologiques, préparation pour le machine learning), cette formation vous donnera les compétences nécessaires pour exceller dans vos projets de data science.

Ce cours contient :
- Une version écrite et très détaillée de tous les chapitres ;
- Deux Masterclass organisés en visio ;
- Des quiz après chaque chapitre pour tester la compréhension ;
- Des exercices et travaux pratiques corrigés ;
- Des projets et cas réels ;
- Un quiz final pour tester et valider la maitrise du module.

Un Certificat qui atteste de la bonne maitrise de ce cours est délivré à l'apprenant qui a réussi les différentes évaluations.

Un suivi régulier par un collaborateur progcours est possible moyennant des frais supplémentaires.

Contenu Cours

Introduction à pandas
Présentation de pandas
Concepts clés : séries, DataFrames et index
Comparaison avec NumPy : complémentarité et différences
Les bases des séries et des DataFrames
Création d’une série et d’un DataFrame 2 Chapitres
Structure des DataFrames 2 Chapitres
Contenu de la Leçon
0% Terminé 0/2 Etapes
Affichage et exploration des données 2 Chapitres
Manipulation des données
Sélection des données 2 Chapitres
Ajout, modification et suppression de colonnes ou lignes
Renommage des colonnes et réindexation
Gestion des données manquantes
Détection des données manquantes (isnull, notnull)
Traitement des valeurs manquantes 2 Chapitres
Contenu de la Leçon
0% Terminé 0/2 Etapes
Impact des données manquantes sur les calculs
Opérations sur les colonnes et les lignes
Opérations vectorisées avec des colonnes
Application de fonctions personnalisées (apply, map, applymap)
Opérations de concaténation et de fusion 3 Chapitres
Nettoyage et préparation des données
Gestion des doublons (drop_duplicates)
Gestion des colonnes de type datetime (pd.to_datetime)
Utilisation des méthodes de chaîne (str.contains, str.replace, etc.)
Analyse statistique et exploratoire
Calculs statistiques sur les colonnes et lignes (mean, sum, min, max)
1 de 2