Skip to main Content

Implémenter une solution Data Analytics Solution avec Azure Databricks (DP-3011)

  • Référence M-DP3011
  • Durée 1 Jour

Modalité pédagogique

Classe inter en présentiel Prix

Nous contacter

Demander une formation en intra-entreprise S'inscrire

Modalité pédagogique

La formation est disponible dans les formats suivants:

  • Classe inter à distance

    Depuis n'importe quelle salle équipée d'une connexion internet, rejoignez la classe de formation délivrée en inter-entreprises.

  • Classe inter en présentiel

    Formation délivrée en inter-entreprises. Cette méthode d'apprentissage permet l'interactivité entre le formateur et les participants en classe.

  • Intra-entreprise

    Cette formation est délivrable en groupe privé, et adaptable selon les besoins de l’entreprise. Nous consulter.

Demander cette formation dans un format différent

Apprenez à exploiter la puissance d'Apache Spark et des clusters performants fonctionnant sur la plateforme Azure Databricks pour exécuter d’importants workloads d'ingénierie des données dans le cloud.

  • Azure Databricks est un service cloud qui fournit une plateforme évolutive pour l'analyse de données à l'aide d'Apache Spark.
  • Azure Databricks est construit sur Apache Spark et permet aux ingénieurs de données et aux analystes d'exécuter des tâches Spark pour transformer, analyser et visualiser les données à l'échelle.
  • Delta Lake est une zone de stockage relationnel open source pour Spark que vous pouvez utiliser pour mettre en œuvre une architecture de lac de données dans Azure Databricks.
  • Azure Databricks fournit des entrepôts SQL qui permettent aux analystes de données de travailler avec des données en utilisant des requêtes SQL relationnelles familières.
  • L'utilisation de pipelines dans Azure Data Factory pour exécuter des notebooks dans Azure Databricks vous permet d'automatiser les processus d'ingénierie des données à l'échelle du cloud.

Cette formation vous aide à préparer à l'examen DP-203 : Data Engineering on Microsoft Azure

Mis à jour le 17/02/2025

Prochaines dates

Haut de page
Ce cours s'adresse aux personnes souhaitant travailler avec Azure Spark et Azure Databricks pour manipuler des données dans le cloud.

Objectifs de la formation

Haut de page
À l'issue de la formation, les participants seront capables :
  • D'explorer Azure Databricks
  • D'utiliser Apache Spark dans Azure Databricks
  • D'utiliser Delta Lake dans Azure Databricks
  • D'utiliser SQL Warehouse dans Azure Databricks
  • D'exécuter Azure Databricks Notebooks avec Azure Data Factory

Programme détaillé

Haut de page

Module 1 : Explorer Azure Databricks

  • Provisionner un espace de travail Azure Databricks.
  • Identifier les charges de travail principales et les personas pour Azure Databricks.
  • Décrire les concepts clés d'une solution Azure Databricks.

Module 2 : Utiliser Apache Spark dans Azure Databricks

  • Décrire les éléments clés de l'architecture Apache Spark.
  • Créer et configurer un cluster Spark.
  • Décrire les cas d'utilisation de Spark.
  • Utiliser Spark pour traiter et analyser des données stockées dans des fichiers.
  • Utiliser Spark pour visualiser les données.

Module 3 : Utiliser Delta Lake dans Azure Databricks

  • Décrire les principales caractéristiques et capacités de Delta Lake.
  • Créer et utiliser des tables Delta Lake dans Azure Databricks.
  • Créer des tables de catalogue Spark pour les données Delta Lake.
  • Utiliser les tables Delta Lake pour les données en continu.

Module 4 : Utiliser les entrepôts SQL dans Azure Databricks

  • Créer et configurer les entrepôts SQL dans Azure Databricks.
  • Créer des bases de données et des tables.
  • Créer des requêtes et des tableaux de bord.

Module 5 : Exécuter les Notebooks Azure Databricks avec Azure Data Factory

  • Décrire comment les notebooks d'Azure Databricks peuvent être exécutés dans un pipeline.
  • Créer un service lié Azure Data Factory pour Azure Databricks.
  • Utiliser une activité Notebook dans un pipeline.
  • Transmettre des paramètres à un notebook.

Pré-requis

Haut de page

Les stagiaires doivent avoir le prérequis suivant :

  • une connaissance du Cloud et de l'analyse des données.

Bon à savoir

Haut de page

Les participants réalisent un test d'évaluation des connaissances en amont et en aval de la formation pour valider les connaissances acquises pendant la formation.

Un support de cours officiel sera remis aux stagiaires