Coursera

Spécialisation "Modern Data Architecture & Lakehouse Engineering"

Profitez de l'une de nos meilleures offres et renforcez vos compétences avec 50 % de réduction sur Coursera Plus. Économisez maintenant.

Coursera

Spécialisation "Modern Data Architecture & Lakehouse Engineering"

Design and Build Modern Data Platforms.

Learn to architect, secure, and optimize cloud-based lakehouse systems for enterprise analytics.

Hurix Digital

Instructeur : Hurix Digital

Inclus avec Coursera Plus

Approfondissez votre connaissance d’un sujet
niveau Intermédiaire

Expérience recommandée

4 semaines à compléter
Ă  10 heures par semaine
Planning flexible
Apprenez Ă  votre propre rythme
Approfondissez votre connaissance d’un sujet
niveau Intermédiaire

Expérience recommandée

4 semaines à compléter
Ă  10 heures par semaine
Planning flexible
Apprenez Ă  votre propre rythme

Ce que vous apprendrez

  • Architect and provision secure, resilient cloud data infrastructure using Infrastructure as Code and disaster recovery best practices.

  • Build lakehouse platforms with transactional integrity, automated pipelines, and seamless integration of diverse data sources.

  • Optimize data system performance through strategic partitioning, query tuning, security controls, and systematic benchmarking.

Compétences que vous acquerrez

  • CatĂ©gorie : SQL
  • CatĂ©gorie : Cloud Computing
  • CatĂ©gorie : Performance Tuning
  • CatĂ©gorie : Data Transformation
  • CatĂ©gorie : Data Security
  • CatĂ©gorie : Disaster Recovery
  • CatĂ©gorie : Database Architecture and Administration
  • CatĂ©gorie : Data Integration
  • CatĂ©gorie : Data Architecture
  • CatĂ©gorie : Data Governance
  • CatĂ©gorie : Infrastructure as Code (IaC)
  • CatĂ©gorie : Data Warehousing
  • CatĂ©gorie : Extract, Transform, Load
  • CatĂ©gorie : Data Pipelines
  • CatĂ©gorie : Cloud Infrastructure

Outils que vous découvrirez

  • CatĂ©gorie : Apache Spark
  • CatĂ©gorie : Data Lakes
  • CatĂ©gorie : Terraform
  • CatĂ©gorie : Apache Airflow
  • CatĂ©gorie : PySpark

Détails à connaître

Certificat partageable

Ajouter Ă  votre profil LinkedIn

Enseigné en Anglais
Récemment mis à jour !

février 2026

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

 logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Améliorez votre expertise en la matière

  • AcquĂ©rez des compĂ©tences recherchĂ©es auprès d’universitĂ©s et d’experts du secteur
  • MaĂ®trisez un sujet ou un outil avec des projets pratiques
  • DĂ©veloppez une comprĂ©hension approfondie de concepts clĂ©s
  • Obtenez un certificat professionnel auprès de Coursera

Spécialisation - série de 13 cours

Engineer Cloud Data for Resiliency & ROI

Engineer Cloud Data for Resiliency & ROI

COURS 1, 2 heures

Ce que vous apprendrez

  • Infrastructure as Code automates data platform deployments, replacing manual processes with version-controlled, repeatable systems.

  • Cost optimization uses performance benchmarking and data analysis to identify efficient compute/storage configs for specific workloads.

  • Business continuity requires proactive disaster recovery with automated failover and continuous replication for strict recovery goals.

  • Successful cloud data engineering balances performance, cost, and reliability through strategic design and continuous monitoring.

Compétences que vous acquerrez

Catégorie : Business Continuity
Catégorie : Disaster Recovery
Catégorie : Cloud Computing Architecture
Catégorie : Terraform
Catégorie : IT Infrastructure
Catégorie : Infrastructure as Code (IaC)
Catégorie : Data Warehousing
Catégorie : Data Infrastructure
Catégorie : Benchmarking
Catégorie : Cost Management
Catégorie : Performance Analysis
Catégorie : AWS CloudFormation
Catégorie : IT Automation
Catégorie : Data-Driven Decision-Making
Catégorie : Cloud Storage
Catégorie : Automation
Catégorie : Business Continuity Planning
Catégorie : Data Architecture
Catégorie : Cost Benefit Analysis
Catégorie : Infrastructure Architecture
Build & Analyze Your Data Lakehouse

Build & Analyze Your Data Lakehouse

COURS 2, 2 heures

Ce que vous apprendrez

  • External tables let query engines access distributed files without duplication, reshaping large-scale analytics design.

  • Choosing Delta, Iceberg, or Hudi requires evaluating schema changes, time travel needs, and performance goals.

  • Lakehouse architecture merges data lake flexibility with warehouse reliability using metadata and ACID support.

  • Automated ingestion with staging and transformation layers ensures consistent, high-quality data across analytics systems.

Compétences que vous acquerrez

Catégorie : Data Pipelines
Catégorie : Data Lakes
Catégorie : Automation
Catégorie : Apache Hive
Catégorie : Analysis
Catégorie : Data Warehousing
Transform, Analyze, and Optimize Your Data

Transform, Analyze, and Optimize Your Data

COURS 3, 3 heures

Ce que vous apprendrez

  • Batch data transformation converts raw semi-structured data into analysis-ready formats that support enterprise decisions.

  • Workload analysis guides database design by linking access patterns and query frequency to performance and cost gains.

  • Migration choices must rely on performance testing and quantitative analysis to ensure ROI-driven transformations.

  • System performance depends on storage, queries, and hardware, requiring holistic technical and business evaluation.

Compétences que vous acquerrez

Catégorie : Amazon Redshift
Catégorie : Database Design
Catégorie : Data Wrangling
Catégorie : Azure Synapse Analytics
Catégorie : Database Management
Catégorie : Data Transformation
Catégorie : Apache Hive
Catégorie : Database Theory
Catégorie : Data Architecture
Catégorie : Apache Cassandra
Unify, Reconcile, and Tune Data Systems

Unify, Reconcile, and Tune Data Systems

COURS 4, 3 heures

Ce que vous apprendrez

  • SQL MERGE offers atomic sync that maintains consistency in CDC pipelines with minimal overhead.

  • Field-level conflict analysis needs clear business rules and source-of-truth hierarchies for reliable reconciliation.

  • Integration performance improves through measurement, bottleneck detection, and targeted tuning, not large redesigns.

  • Sustainable data systems balance quality, speed, and reliability through ongoing monitoring and iterative improvement.

Compétences que vous acquerrez

Catégorie : Data Governance
Catégorie : Data Integration
Catégorie : Performance Metric
Catégorie : Performance Improvement
Catégorie : Performance Testing
Catégorie : Application Performance Management
Catégorie : Data Management
Catégorie : Data Manipulation
Catégorie : Systems Integration
Catégorie : Performance Measurement
Catégorie : SQL
Catégorie : Data Integrity
Catégorie : Operational Databases
Catégorie : Database Design
Catégorie : Data Quality
Catégorie : Consolidation
Catégorie : Data Cleansing
Catégorie : Performance Tuning
Catégorie : Data Validation
Catégorie : Data Pipelines
Secure Data: Mask, Monitor, and Audit

Secure Data: Mask, Monitor, and Audit

COURS 5, 2 heures

Ce que vous apprendrez

  • Data protection requires layered security controls that balance privacy with operational utility.

  • Proactive monitoring and anomaly detection are essential for identifying security threats before they escalate into breaches.

  • Compliance frameworks provide structured approaches to evaluating and strengthening organizational security postures.

  • Effective data governance integrates technical controls with policy frameworks to create comprehensive protection strategies.

Compétences que vous acquerrez

Catégorie : Security Architecture Review
Catégorie : Threat Management
Catégorie : IT Security Architecture
Catégorie : Data Management
Catégorie : Cyber Security Assessment
Provision Secure Cloud Data Infrastructure

Provision Secure Cloud Data Infrastructure

COURS 6, 2 heures

Ce que vous apprendrez

  • Security by design applies layered defenses across storage, identity, and networks from the start of infrastructure setup.

  • Infrastructure as Code ensures consistent, auditable security settings that reduce errors and support compliance needs.

  • The principle of least privilege must be embedded into every access control decision, granting only necessary permissions to specific resources.

  • Secure networks rely on segmentation with private subnets and controls to protect systems from public exposure.

Compétences que vous acquerrez

Catégorie : Terraform
Catégorie : Data Security
Catégorie : Infrastructure as Code (IaC)
Catégorie : Network Security
Catégorie : Encryption
Catégorie : Identity and Access Management
Catégorie : Cloud Infrastructure
Catégorie : Cloud Security
Catégorie : Private Cloud
Catégorie : Infrastructure Security
Catégorie : Cloud Storage
Catégorie : Data Infrastructure
Catégorie : Data Integrity
Catégorie : Security Controls
Apply Data Lake Transactions & Versioning

Apply Data Lake Transactions & Versioning

COURS 7, 2 heures

Ce que vous apprendrez

  • Transactional storage layers ensure data lake reliability, supporting concurrent operations and maintaining integrity.

  • Version control in data lakes enables auditing, compliance, time-travel queries, and error recovery for production systems.

  • Schema evolution strategies help data systems adapt to business changes while maintaining backward compatibility.

  • Converting raw files to transactional formats is a key pattern supporting both analytics and operational reliability.

Compétences que vous acquerrez

Catégorie : Data Pipelines
Catégorie : Data Management
Catégorie : Cloud Storage
Catégorie : Data Lakes
Evaluate Storage for Data Warehousing Success

Evaluate Storage for Data Warehousing Success

COURS 8, 2 heures

Ce que vous apprendrez

  • Storage format choice strongly affects query performance and should match workload needs, not general assumptions.

  • Column storage suits read-heavy analytics, while row storage performs better for transactional and write-focused workloads.

  • Benchmarking with real datasets and queries offers the best basis for sound storage architecture decisions.

  • Compression and ingestion speed must be balanced carefully to align performance with business priorities.

Compétences que vous acquerrez

Catégorie : Data Warehousing
Catégorie : Performance Testing
Catégorie : Query Languages
Catégorie : Data Architecture
Catégorie : Analytics
Catégorie : Snowflake Schema
Catégorie : Data Processing
Catégorie : Amazon Redshift
Catégorie : Analysis
Catégorie : Data Storage Technologies
Catégorie : Star Schema
Catégorie : Performance Tuning
Catégorie : Data Storage
Catégorie : Apache Hive
Build & Transform Data Pipelines

Build & Transform Data Pipelines

COURS 9, 2 heures

Ce que vous apprendrez

  • Modular pipeline design enables maintainable, scalable data systems that can adapt to changing business requirements.

  • Integration of complementary tools (Spark, dbt, Airflow) creates more robust and efficient data processing workflows than single-tool approaches.

  • Proper separation of concerns between ingestion, transformation, and loading stages reduces complexity and improves debugging capabilities.

  • Automation and orchestration are essential for reliable, production-grade data systems that minimize manual intervention and human error.

Compétences que vous acquerrez

Catégorie : Data Pipelines
Catégorie : Apache Airflow
Catégorie : Cloud Deployment
Catégorie : Data Architecture
Catégorie : Data Warehousing
Catégorie : Data Processing
Catégorie : Extract, Transform, Load
Catégorie : Data Infrastructure
Catégorie : Data Integration
Catégorie : Cloud Computing
Unify Diverse Data Sources

Unify Diverse Data Sources

COURS 10, 1 heure

Ce que vous apprendrez

  • Standardized connector configuration patterns apply across different data source types, making integration skills transferable.

  • Authentication and security considerations must be built into every connector setup to ensure enterprise-grade data protection.

  • Proper offset and parameter management in streaming and API connections prevents data loss and ensures complete data capture.

  • Unified staging approaches enable downstream analytics and business intelligence regardless of source system complexity.

Compétences que vous acquerrez

Catégorie : Data Integration
Catégorie : Application Programming Interface (API)
Catégorie : Enterprise Security
Catégorie : Systems Integration
Catégorie : Data Infrastructure
Catégorie : Databases
Catégorie : Enterprise Architecture
Catégorie : Database Management
Catégorie : Real Time Data
Catégorie : Authentications
Catégorie : Apache Kafka
Catégorie : Restful API
Catégorie : Relational Databases
Map Data Flows Fast

Map Data Flows Fast

COURS 11, 1 heure

Ce que vous apprendrez

  • Visual data flow docs are key for system clarity and form the base for good pipeline design and team communication.

  • Complete data flow diagrams must show the full journey from sources through transforms to final destinations.

  • Structured diagram creation follows steps: find sources, map processes, set destinations, and check connections.

  • Good data flow visuals connect technical work with business needs, enabling stakeholder alignment and decisions.

Compétences que vous acquerrez

Catégorie : Data Flow Diagrams (DFDs)
Catégorie : Data Transformation
Catégorie : Data Store
Catégorie : Technical Communication
Catégorie : Data Pipelines
Catégorie : Software Design Documents
Catégorie : Diagram Design
Catégorie : Data Literacy
Catégorie : Dataflow
Catégorie : Data Visualization
Catégorie : Data Mapping
Optimize Spark Performance: Analyze & Accelerate

Optimize Spark Performance: Analyze & Accelerate

COURS 12, 1 heure

Ce que vous apprendrez

  • Performance optimization is a systematic process requiring analysis of data access patterns, not random configuration changes.

  • Strategic partitioning minimizes expensive network shuffles and is the foundation of scalable Spark applications.

  • Intelligent caching of reusable intermediate datasets can dramatically reduce computation costs and improve job reliability.

  • The Spark UI provides actionable insights that guide optimization decisions and enable data-driven performance improvements.

Compétences que vous acquerrez

Catégorie : Performance Tuning
Catégorie : Apache Spark
Catégorie : Data Persistence
Catégorie : Data Pipelines
Catégorie : Systems Analysis
Optimize Query Performance for Data Success

Optimize Query Performance for Data Success

COURS 13, 2 heures

Ce que vous apprendrez

  • Proactive performance monitoring prevents system failures and ensures consistent user experience across production environments.

  • Systematic diagnosis of query bottlenecks requires understanding both query logic efficiency and underlying resource limitations.

  • Strategic resource allocation combines technical optimization with business requirements to maintain service level agreements.

  • Continuous performance analysis creates a feedback loop that improves system reliability over time.

Compétences que vous acquerrez

Catégorie : Performance Tuning
Catégorie : Service Level
Catégorie : Database Management
Catégorie : Scalability
Catégorie : SQL
Catégorie : System Monitoring
Catégorie : Query Languages

Obtenez un certificat professionnel

Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.

Instructeur

Hurix Digital
454 Cours62 768 apprenants

Offert par

Coursera

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.

Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.

Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.

’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Foire Aux Questions