Hadoop

Statut actuel

Non-inscrit

Tarif

29,90 €

Commencer

Hadoop : Maîtrisez le Traitement de Données Massives

Cette formation complète vous guide à travers les concepts fondamentaux et avancés de Hadoop, l’écosystème essentiel pour le Big Data. Apprenez à déployer et gérer des clusters Hadoop, à utiliser HDFS pour le stockage distribué et à écrire des applications MapReduce pour traiter de grandes quantités de données. Vous explorerez les outils puissants de l’écosystème Hadoop, tels que Hive, Pig, HBase et Spark, et apprendrez à optimiser les performances des requêtes et des jobs. À travers des cas pratiques et des études de cas, vous développerez des compétences en traitement de données massives, en analyse de données en temps réel et en sécurisation des clusters Hadoop. Cette formation est idéale pour les développeurs, analystes et architectes de données souhaitant devenir des experts du Big Data.

Ce cours contient :

- Une version écrite et très détaillée de tous les chapitres ;

- Une vidéo de chaque chapitre de la formation ;

- Des quiz après chaque chapitre pour tester la compréhension ;

- Des exercices et travaux pratiques corrigés ;

- Des projets et cas réels ;

- Un quiz final pour tester et valider la maitrise du module.

 

Un Certificat qui atteste de la bonne maitrise de ce cours est délivré à l'apprenant qui a réussi les différentes évaluations.

 

Un suivi régulier par un collaborateur progcours est possible moyennant des frais supplémentaires.

Contenu Cours

Introduction à Hadoop et son Écosystème
Qu’est-ce qu’Hadoop ?
Architecture : HDFS, MapReduce, YARN
Comparaison avec bases de données traditionnelles
Outils de l’écosystème : Hive, Pig, HBase, Spark, Oozie
Cas d’utilisation dans l’industrie
HDFS
Introduction et fonctionnement du système de fichiers distribué
Création et gestion de répertoires et fichiers
Réplication des données et gestion des nœuds
Sécurisation avec Kerberos
Outils de ligne de commande HDFS
Introduction à MapReduce
Qu’est-ce que MapReduce ?
Modèle : Mapper, Reducer, InputFormat, OutputFormat
Écrire une application MapReduce en Java
Exécution des jobs sur le cluster
Gestion des erreurs et optimisation
Hive et Pig
Pig : Pig Latin, scripts pour transformer et analyser des données
Stockage et Gestion avec HBase
Introduction à HBase et son architecture
HBase vs HDFS
Création de tables et familles de colonnes
1 de 2