Vous maîtriserez des techniques avancées d'optimisation des performances pour le traitement de données à grande échelle à l'aide de Spark et des technologies de stockage dans le cloud. Au cours de cette formation pratique, vous apprendrez à diagnostiquer et à résoudre les goulots d’étranglement qui affectent les systèmes de données distribués, à mettre en œuvre des stratégies de partitionnement et de mise en cache permettant d’améliorer les performances des tâches de 30 % ou plus, et à concevoir une infrastructure de données cloud sécurisée et rentable.

Optimiser Spark et le stockage de données dans le cloud pour l'analyse
Profitez de l'une de nos meilleures offres et renforcez vos compétences avec 50 % de réduction sur Coursera Plus. Économisez maintenant.

Optimiser Spark et le stockage de données dans le cloud pour l'analyse
Ce cours fait partie de Certificat Professionnel Ingénierie des données en open source avec Spark, dbt & Airflow

Instructeur : Professionals from the Industry
Inclus avec
Expérience recommandée
Ce que vous apprendrez
Optimiser les performances des tâches Spark grâce à un partitionnement et une mise en cache stratégiques, permettant ainsi de réduire la durée d'exécution de plus de 30 % grâce à l'analyse de l'accès aux données.
Mettez en place des lacs de données transactionnels au format Delta, permettant la gestion des versions, les opérations ACID et l'évolution du schéma, pour garantir la fiabilité des ensembles de données.
Mettre en place une infrastructure de données dans le cloud sécurisée à l'aide de politiques IAM, de réseaux privés et d'un stockage chiffré, conformément aux meilleures pratiques en matière de sécurité.
Évaluer et comparer les formats de stockage (Parquet, ORC, Avro) afin de sélectionner les solutions les mieux adaptées aux charges de travail analytiques et offrant le meilleur rapport coût-efficacité.
Compétences que vous acquerrez
- Catégorie : Informatique en nuage
- Catégorie : Architecture de l'infrastructure
- Catégorie : Infrastructure as Code (IaC)
- Catégorie : Gestion des données
- Catégorie : Architecture de l'informatique en nuage
- Catégorie : Sécurité de l'informatique en nuage
- Catégorie : Déploiement dans le nuage
- Catégorie : Infrastructure en nuage
- Catégorie : Technologies de stockage des données
- Catégorie : Contrôles de sécurité
- Catégorie : Stockage des données
- Catégorie : Optimisation des performances
- Catégorie : Traitement des transactions
- Catégorie : Intégrité des données
- Catégorie : Entreposage de données
- Catégorie : Sécurité des données
Outils que vous découvrirez
- Catégorie : Apache Spark
- Catégorie : Lacs de données
- Catégorie : PySpark
- Catégorie : Stockage en nuage
Détails à connaître

Ajouter à votre profil LinkedIn
mars 2026
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Élaborez votre expertise en Analyse des données
- Apprenez de nouveaux concepts auprès d'experts du secteur
- Acquérez une compréhension de base d'un sujet ou d'un outil
- Développez des compétences professionnelles avec des projets pratiques
- Obtenez un certificat professionnel partageable auprès de Coursera

Il y a 11 modules dans ce cours
Obtenez un certificat professionnel
Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.
Instructeur

Offert par
En savoir plus sur Analyse des données
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.
Foire Aux Questions
Plus de questions
Aide financière disponible,
¹ Certains travaux de ce cours sont notés par l'IA. Pour ces travaux, vos Données internes seront utilisées conformément à Notification de confidentialité de Coursera.








