Microsoft

Stockage et gestion des données pour le Big Data

Profitez de l'une de nos meilleures offres et renforcez vos compétences avec 50 % de réduction sur Coursera Plus. Économisez maintenant.

Microsoft

Stockage et gestion des données pour le Big Data

 Microsoft

Instructeur : Microsoft

Inclus avec Coursera Plus

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
niveau Intermédiaire

Expérience recommandée

3 semaines à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme
Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
niveau Intermédiaire

Expérience recommandée

3 semaines à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme

Ce que vous apprendrez

  • - Gérer le stockage et les pipelines de big data avec les services Azure.

    - Traiter et analyser des ensembles de données volumineux à l'aide d'Apache Spark et de Databricks.

Compétences que vous acquerrez

  • Catégorie : Gouvernance des données
  • Catégorie : Transformation des données
  • Catégorie : Bases de données
  • Catégorie : Stockage des données
  • Catégorie : Pipelines de données
  • Catégorie : Analyse
  • Catégorie : Extraire, transformer, charger
  • Catégorie : Entreposage de données
  • Catégorie : Azure Synapse Analytics
  • Catégorie : Gestion des données
  • Catégorie : Données en temps réel
  • Catégorie : Intégration des données
  • Catégorie : Traitement des données
  • Catégorie : Architecture des données
  • Catégorie : Technologies de stockage des données

Outils que vous découvrirez

  • Catégorie : Systèmes de gestion de bases de données
  • Catégorie : Microsoft Azure
  • Catégorie : Systèmes de base de données
  • Catégorie : Lacs de données
  • Catégorie : NoSQL

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Récemment mis à jour !

janvier 2026

Enseigné en Anglais

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

 logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Élaborez votre expertise en Analyse des données

Ce cours fait partie de la Certificat Professionnel Gestion des données et analytique des données Microsoft (Big data)
Lorsque vous vous inscrivez à ce cours, vous êtes également inscrit(e) à ce Certificat Professionnel.
  • Apprenez de nouveaux concepts auprès d'experts du secteur
  • Acquérez une compréhension de base d'un sujet ou d'un outil
  • Développez des compétences professionnelles avec des projets pratiques
  • Obtenez un certificat professionnel partageable auprès de Microsoft

Il y a 5 modules dans ce cours

Le module « Technologies de stockage des données (SQL vs NoSQL) » présente aux apprenants les principes fondamentaux du stockage moderne des données ainsi que les compromis qui caractérisent les systèmes de big data actuels. Il examine comment les bases de données relationnelles gèrent les données structurées, où elles rencontrent des limites à grande échelle, et comment des techniques telles que le partitionnement, l’indexation et les architectures « lakehouse » permettent de pallier les baisses de performances. Les apprenants comparent les principales catégories de bases de données NoSQL — notamment les bases de données documentaires, clé-valeur et en familles de colonnes — afin de comprendre comment les schémas flexibles et les architectures distribuées prennent en charge des charges de travail à haut volume et à haut débit. Grâce à des exercices pratiques avec SQL Server, Azure Synapse et Azure Cosmos DB, les apprenants s’entraînent à effectuer des opérations essentielles, évaluent les technologies de stockage en fonction des exigences des charges de travail et acquièrent les compétences nécessaires pour sélectionner et mettre en œuvre des solutions de bases de données efficaces dans des environnements de big data.

Inclus

6 vidéos3 lectures8 devoirs

Le module « Utilisation des formats de données (structurés, semi-structurés, non structurés) » aide les apprenants à bien comprendre le fonctionnement des différents formats de données au sein des systèmes de mégadonnées, ainsi que l’importance du choix du format pour les performances, le stockage et la réussite des analyses. Ce module présente les formats structurés, tels que CSV et TSV, et explore les formats semi-structurés flexibles, notamment JSON et XML. Il examine également les types de fichiers optimisés, notamment Parquet, Avro et ORC, qui prennent en charge l’analyse à grande échelle. Les apprenants s'entraînent à convertir des données d'un format à l'autre à l'aide d'Azure Data Factory, à travailler avec des structures imbriquées, à appliquer l'inférence de schéma et à évaluer les compromis en termes de performances entre les différents types de fichiers. Grâce à des démonstrations, des exercices de codage et des travaux pratiques, ce module permet aux apprenants de sélectionner, de convertir et de gérer efficacement les formats de données pour divers scénarios de Big Data.

Inclus

6 vidéos3 lectures8 devoirs

Le module « Data Lakes et Data Warehouses » guide les apprenants à travers les principes architecturaux fondamentaux et les compétences pratiques nécessaires à la mise en place d’environnements analytiques modernes. Il explore l’objectif et la structure des lacs de données, en mettant l’accent sur les zones de données brutes, nettoyées, enrichies et curatées, et montre comment une conception réfléchie favorise la flexibilité, la gouvernance et l’analyse à grande échelle. Les apprenants étudient également les concepts CORE des entrepôts de données, notamment la modélisation dimensionnelle, les schémas en étoile et les data marts, afin de comprendre comment le stockage structuré permet des requêtes hautement performantes. Grâce à des travaux pratiques avec Azure Data Lake Storage Gen2 et Azure Synapse Analytics, les apprenants conçoivent des architectures par zones, mettent en œuvre des modèles dimensionnels, configurent des pools SQL et appliquent les meilleures pratiques en matière de partitionnement, de distribution et d’optimisation. À l’issue de ce module, ils sont capables d’organiser, de gouverner et d’intégrer les données à la fois dans des environnements de lacs de données et d’entrepôts de données, favorisant ainsi des analyses évolutives et adaptées aux entreprises.

Inclus

6 vidéos3 lectures7 devoirs

Le module « Création de pipelines de données (ETL/ELT avec Azure Data Factory) » permet aux apprenants d’acquérir les compétences nécessaires pour concevoir, mettre en œuvre et gérer des workflows d’intégration de données évolutifs à l’aide d’approches modernes et natives du cloud. Ce module examine les différences entre les méthodes ETL et ELT, aidant ainsi les apprenants à comprendre dans quelles circonstances chacune d’elles offre les meilleures performances, la plus grande flexibilité et la meilleure rentabilité. Les apprenants acquièrent une expérience pratique d’Azure Data Factory en configurant des services liés, des ensembles de données, des activités et des composants CORE d’orchestration, et s’entraînent à créer des pipelines simples et avancés. Le module présente également la logique de transformation, les modèles de flux de contrôle, la paramétrisation et les stratégies de gestion des erreurs qui sous-tendent les solutions d’ingénierie des données prêtes pour la production. À travers des démonstrations, des travaux pratiques, des exercices de codage et des prises de décision basées sur des scénarios, les apprenants apprennent à surveiller les pipelines, à résoudre les pannes et à concevoir des workflows de données fiables qui prennent en charge l’analyse à l’échelle de l’entreprise.

Inclus

6 vidéos3 lectures9 devoirs

Le module « Principes fondamentaux du traitement par lots et en temps réel » présente aux apprenants les principaux modèles de traitement qui sous-tendent les systèmes modernes de big data, en les aidant à comprendre dans quelles circonstances chaque approche offre le plus de valeur ajoutée. Ce module explore les architectures par lots, les méthodes de planification et les stratégies d’optimisation pour le traitement historique à grande échelle, tout en examinant les concepts du traitement de flux en temps réel, notamment la gestion des événements, les compromis en matière de latence et les exigences de débit. Les apprenants acquièrent une expérience pratique de la mise en œuvre de ces deux modèles : ils créent des workflows par lots avec Azure Data Factory et configurent des pipelines de streaming à l’aide d’Event Hubs et de Stream Analytics. Grâce à des analyses architecturales, des exercices de codage et des travaux pratiques, les apprenants apprennent à évaluer les besoins métier, à choisir l’approche de traitement la plus adaptée et à concevoir des systèmes hybrides combinant le traitement par lots et le traitement en continu pour une analyse complète des données.

Inclus

6 vidéos3 lectures9 devoirs

Obtenez un certificat professionnel

Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.

Instructeur

 Microsoft
346 Cours2 644 317 apprenants

Offert par

Microsoft

En savoir plus sur Analyse des données

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.

Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.

Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.

’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Foire Aux Questions

¹ Certains travaux de ce cours sont notés par l'IA. Pour ces travaux, vos Données internes seront utilisées conformément à Notification de confidentialité de Coursera.