Spark streaming

Statut actuel

Non-inscrit

Tarif

29,90 €

Commencer

Spark Streaming : Maîtriser le Traitement de Flux en Temps Réel Apprenez à maîtriser Spark Streaming, un outil essentiel pour le traitement des données en temps réel. Cette formation vous guidera à travers les concepts clés de Spark Streaming, y compris la gestion des flux de données, l’intégration avec Kafka et d’autres systèmes, et le traitement de données par fenêtres. Vous explorerez des techniques avancées pour optimiser les performances, gérer les erreurs et déployer vos applications dans des environnements cloud ou distribués. Grâce à des exercices pratiques, vous serez capable de développer et déployer des solutions de streaming robustes pour des cas d’utilisation réels, comme l’analyse de données en temps réel ou la gestion des logs. Rejoignez-nous pour maîtriser Spark Streaming et transformer vos données en informations exploitable

Ce cours contient :

- Une version écrite et très détaillée de tous les chapitres ;

- Une vidéo de chaque chapitre de la formation ;

- Des quiz après chaque chapitre pour tester la compréhension ;

- Des exercices et travaux pratiques corrigés ;

- Des projets et cas réels ;

- Un quiz final pour tester et valider la maitrise du module.

 

Un Certificat qui atteste de la bonne maitrise de ce cours est délivré à l'apprenant qui a réussi les différentes évaluations.

 

Un suivi régulier par un collaborateur progcours est possible moyennant des frais supplémentaires.

Contenu Cours

Introduction à Spark Streaming
Qu’est-ce que Spark Streaming ?
Introduction à Apache Spark et son écosystème
Streaming vs traitement par lots
Architecture : DStreams, RDDs, micro-batch
Cas d’utilisation
Concepts de Base
Modèle de données DStream
Créer des DStreams depuis des fichiers, Kafka, Flume…
Transformations : map, reduce, filter, windowed operations
Notion de micro-batching
Intégration avec Kafka et autres Systèmes
Kafka comme source de données en streaming
Intégration avec HBase
Connexion à Flume, Kinesis…
Lecture et traitement depuis différentes sources
Traitement Avancé
Traitement des données à fenêtres (windowing)
Délais et événements en temps réel
Traitement par session
Agrégation et jointure en temps réel
Analyse de séries temporelles
Performance et Optimisation
Configuration pour améliorer les performances
Gestion de la latence et de la mémoire
1 de 2