Hive

Statut actuel

Non-inscrit

Tarif

29,90 €

Commencer

Apache Hive : Analyse de Données Massives avec Hive

Apprenez à maîtriser Apache Hive, l’outil essentiel pour l’analyse de grandes quantités de données dans des environnements Hadoop. Cette formation vous guidera à travers la création, la gestion et l’optimisation des requêtes Hive pour traiter des volumes massifs de données. Vous découvrirez le langage HiveQL, l’intégration avec HDFS, la gestion des partitions, l’utilisation des UDFs et l’optimisation des performances des requêtes. Grâce à des cas pratiques, vous serez capable d’utiliser Hive pour des applications réelles, telles que l’analyse de données financières, le traitement de logs ou la création d’entrepôts de données. Rejoignez-nous pour devenir expert dans le traitement de données avec Apache Hive.

Ce cours contient :

- Une version écrite et très détaillée de tous les chapitres ;

- Une vidéo de chaque chapitre de la formation ;

- Des quiz après chaque chapitre pour tester la compréhension ;

- Des exercices et travaux pratiques corrigés ;

- Des projets et cas réels ;

- Un quiz final pour tester et valider la maitrise du module.

 

Un Certificat qui atteste de la bonne maitrise de ce cours est délivré à l'apprenant qui a réussi les différentes évaluations.

 

Un suivi régulier par un collaborateur progcours est possible moyennant des frais supplémentaires.

Contenu Cours

Introduction à Apache Hive et l'Écosystème Hadoop
Architecture d’Hadoop et son rôle
Qu’est-ce qu’Apache Hive ?
Composants : Hive Metastore, HQL, moteur d’exécution
Différences avec les bases de données traditionnelles
Cas d’utilisation dans les environnements Big Data
Fondamentaux de HiveQL
Syntaxe et structure des requêtes HQL
Création et gestion de bases, tables, partitions
Types de données : primitifs, complexes, UDFs
SELECT, WHERE, GROUP BY et autres opérateurs
INSERT, UPDATE, DELETE, SELECT INTO
Partitions et bucketing
Traitement de Données avec Hive
Gestion des données dans HDFS
Importation et exportation (CSV, JSON, Parquet, ORC…)
Jointures : INNER, LEFT JOIN…
Fonctions d’agrégation et sous-requêtes
Optimisation des requêtes
Avancées dans l'Utilisation de Hive
MapReduce et exécution de tâches complexes
Optimisation des performances : indexes, partitions
Gestion de la mémoire et configuration des ressources
Formats optimisés : ORC, Parquet, Avro
1 de 2