Illinois Tech

Technologies du Big Data

Profitez de l'une de nos meilleures offres et renforcez vos compétences avec 50 % de réduction sur Coursera Plus. Économisez maintenant.

Illinois Tech

Technologies du Big Data

Ce cours fait partie de plusieurs programmes.

Yousef Elmehdwi

Instructeur : Yousef Elmehdwi

Inclus avec Coursera Plus

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
niveau Intermédiaire

Expérience recommandée

2.5 mois à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme
Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
niveau Intermédiaire

Expérience recommandée

2.5 mois à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme

Ce que vous apprendrez

  • Comprendre et identifier les cas d'utilisation et les domaines des problèmes liés aux Big Data

  • Sélectionner et mettre en œuvre des solutions techniques impliquant des systèmes Big Data

  • Développer et utiliser divers systèmes logiciels open source (Apache) dans la pile technologique Big Data

  • Exploiter et faire fonctionner divers services logiciels d'informatique en nuage (AWS) dans l'espace d'infrastructure Big Data

Compétences que vous acquerrez

  • Catégorie : Traitement des données
  • Catégorie : Informatique distribuée
  • Catégorie : Big Data
  • Catégorie : Éthique des données
  • Catégorie : Informatique en nuage
  • Catégorie : Architecture des données
  • Catégorie : Gestion des données
  • Catégorie : Technologies de stockage des données
  • Catégorie : Infrastructure de données
  • Catégorie : Bases de données
  • Catégorie : Données en temps réel

Outils que vous découvrirez

  • Catégorie : MongoDB
  • Catégorie : Apache Cassandra
  • Catégorie : Apache Hadoop
  • Catégorie : Apache Spark
  • Catégorie : Apache Kafka
  • Catégorie : Apache Hive
  • Catégorie : Systèmes de gestion de bases de données
  • Catégorie : NoSQL
  • Catégorie : Lacs de données

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Évaluations

54 devoirs

Enseigné en Anglais
Préparer un diplôme

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

 logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Élaborez votre expertise du sujet

Ce cours est disponible dans le cadre de
Lorsque vous vous inscrivez à ce cours, vous devez également sélectionner un programme spécifique.
  • Apprenez de nouveaux concepts auprès d'experts du secteur
  • Acquérez une compréhension de base d'un sujet ou d'un outil
  • Développez des compétences professionnelles avec des projets pratiques
  • Obtenez un certificat professionnel partageable

Il y a 9 modules dans ce cours

Bienvenue dans les technologies des Big Data ! Dans le module 1, les étudiants développeront une compréhension fondamentale des données analytiques, de leur valeur inhérente et des méthodes permettant de transformer les données brutes en informations précieuses. Ce module couvre les défis liés à la manipulation de grands ensembles de données, y compris leur collecte, leur traitement et leur analyse, tout en fournissant une vue d'ensemble des origines, des propriétés et des applications réelles du Big Data. En outre, les étudiants exploreront les préoccupations économiques, logistiques et éthiques associées au Big Data, ainsi que les avantages professionnels pour les data scientists compétents dans l'analyse du Big Data.

Inclus

16 vidéos10 lectures8 devoirs1 sujet de discussion

Le module 2 présente aux étudiants les défis liés à la construction et à la gestion de systèmes distribués pour le stockage et le traitement des données volumineuses (big data). Il couvre les origines, les concepts, les composants de base et les caractéristiques clés de Hadoop, tout en explorant les outils et les services de l'écosystème Hadoop. Les étudiants acquerront une compréhension des systèmes de fichiers distribués, en particulier HDFS, de la gestion des ressources YARN et des différentes technologies pour un stockage et une organisation efficaces des big data.

Inclus

13 vidéos7 lectures6 devoirs

Dans le module 3, les étudiants exploreront les différences entre le traitement de volumes de données petits à modérés et le traitement de volumes de données massifs par le biais de l'informatique distribuée. Ce module couvre les concepts clés du cadre MapReduce, y compris la façon dont il décompose les tâches de traitement de données volumineuses en tâches parallèles plus petites pour une exécution efficace. Les étudiants découvriront également les phases de MapReduce, le rôle des fonctions map et reduce, les modèles d'optimisation, ainsi que les avantages et les limites des différentes approches de développement, y compris MapReduce basé sur Java et Hadoop Streaming.

Inclus

18 vidéos8 lectures7 devoirs

Dans le module 4, les étudiants exploreront Apache Spark en tant que puissant cadre de traitement distribué pour les tâches interactives, par lots et en continu. Ce module couvre les fonctionnalités de base de Spark, notamment l'apprentissage automatique, le traitement des graphes et le traitement des données structurées et non structurées, tout en mettant en évidence son potentiel de traitement en mémoire et sa nature unifiée. Les étudiants compareront Spark à MapReduce, découvriront les principaux composants de Spark, l'architecture d'exécution, les RDD (Resilient Distributed Datasets), les DataFrames, les Datasets, ainsi que les différentes méthodes de création et d'optimisation des DataFrames pour un traitement efficace des données.

Inclus

25 vidéos7 lectures6 devoirs

Dans le module 5, les étudiants approfondiront les capacités de Spark en matière de manipulation et de transformation des données. Le module couvre les opérations essentielles telles que la sélection, le filtrage et le tri des données, ainsi que l'association de DataFrames et l'exécution d'agrégations. Les étudiants apprendront également à gérer les valeurs nulles, à utiliser Spark SQL pour les requêtes de données et à optimiser les performances avec la mise en cache. Les applications pratiques comprennent la création et la manipulation de DataFrames, l'exécution de transformations et d'actions, et l'écriture efficace de données dans différents formats.

Inclus

19 vidéos11 lectures10 devoirs

Le module 6 présente aux étudiants les limites du traitement par lots et l'importance du traitement des données en temps réel. Il couvre les aspects essentiels du traitement des flux, notamment l'ingestion et l'analyse des données, en mettant l'accent sur des outils tels qu'Apache Kafka pour l'ingestion de flux et Spark Structured Streaming pour un traitement des données évolutif et tolérant aux pannes. Les étudiants exploreront également divers modèles de conception pour organiser des clusters de big data, le concept de lacs de données et l'architecture Lambda pour unifier le traitement des données en temps réel et par lots dans les environnements de données modernes.

Inclus

16 vidéos6 lectures6 devoirs

Dans le module 7, les étudiants exploreront les avantages et les limites des bases de données relationnelles dans les contextes de big data et le concept de systèmes de bases de données distribuées. Ce module couvre les bases de données NoSQL, leurs divers modèles de données et leurs avantages en termes d'évolutivité et de flexibilité. Les étudiants découvriront également des cas d'utilisation réels, le partitionnement des données, les modèles de cohérence et le théorème CAP, ce qui leur permettra de comprendre comment les bases de données NoSQL gèrent de grands ensembles de données sur des clusters tout en garantissant l'évolutivité et la disponibilité.

Inclus

18 vidéos6 lectures6 devoirs

Dans le module 8, les étudiants exploreront des types de bases de données NoSQL spécifiques, à savoir les bases de données clé-valeur, large-colonne et document. Deux systèmes similaires, HBase et Cassandra, seront étudiés et comparés dans le contexte du théorème CAP et des compromis CP/AP associés. Des sujets tels que la cohérence et la disponibilité seront discutés dans le contexte de scénarios d'utilisation spécifiques pour HBase et Cassandra - et les domaines d'application généraux des deux systèmes seront mis en évidence. Enfin, la base de données documentaire MongoDB sera examinée dans le contexte des cas d'utilisation du langage naturel/traitement de texte - et l'utilisation et l'architecture de MongoDB seront analysées par rapport aux SGBDR traditionnels.

Inclus

9 vidéos4 lectures4 devoirs

Ce module contient l'évaluation sommative du cours qui a été conçue pour évaluer votre compréhension du matériel du cours et votre capacité à appliquer les connaissances que vous avez acquises tout au long du cours.

Inclus

1 devoir

Obtenez un certificat professionnel

Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.

Préparer un diplôme

Ce site cours fait partie du (des) programme(s) diplômant(s) suivant(s) proposé(s) par Illinois Tech. Si vous êtes admis et que vous vous inscrivez, les cours que vous avez suivis peuvent compter pour l'apprentissage de votre diplôme et vos progrès peuvent être transférés avec vous.¹

Instructeur

Yousef Elmehdwi
Illinois Tech
4 Cours7 712 apprenants

Offert par

Illinois Tech

En savoir plus sur Développement de logiciels

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.

Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.

Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.

’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Foire Aux Questions