Packt

Principes de la science des données

Profitez de l'une de nos meilleures offres et renforcez vos compétences avec 50 % de réduction sur Coursera Plus. Économisez maintenant.

Packt

Principes de la science des données

Inclus avec Coursera Plus

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
niveau Débutant

Expérience recommandée

3 semaines à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme
Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
niveau Débutant

Expérience recommandée

3 semaines à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme

Ce que vous apprendrez

  • Maîtrisez les étapes clés du processus de science des données grâce à des exemples concrets

  • Appliquer les statistiques avancées et l'apprentissage automatique pour résoudre des problèmes concrets

  • Acquérir les compétences nécessaires pour évaluer et améliorer les performances des modèles d'apprentissage automatique

Compétences que vous acquerrez

  • Catégorie : Visualisation des données
  • Catégorie : Probabilités et statistiques
  • Catégorie : Intégrité des données
  • Catégorie : Éthique des données
  • Catégorie : Traitement des données
  • Catégorie : L'IA responsable
  • Catégorie : Apprentissage automatique appliqué
  • Catégorie : Probabilité
  • Catégorie : Apprentissage automatique
  • Catégorie : Statistiques bayésiennes
  • Catégorie : Méthodes statistiques
  • Catégorie : Statistiques
  • Catégorie : Cartographie des données
  • Catégorie : Méthodes d'apprentissage automatique
  • Catégorie : Architecture des données
  • Catégorie : Maîtrise des données
  • Catégorie : Science des données
  • Catégorie : Traitement des données

Outils que vous découvrirez

  • Catégorie : Programmation Python
  • Catégorie : Pandas (paquetage Python)

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Récemment mis à jour !

mars 2026

Évaluations

15 devoirs

Enseigné en Anglais

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

 logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Il y a 15 modules dans ce cours

Dans cette section, nous définissons les principaux termes de la science des données, expliquons les trois domaines de cette discipline et présentons les bases de la syntaxe Python pour les tâches liées aux données.

Inclus

2 vidéos5 lectures1 devoir

Dans cette section, nous abordons la distinction entre données structurées et non structurées, ainsi qu'entre données quantitatives et qualitatives, et nous examinons les quatre niveaux de données nécessaires à une analyse et à une modélisation efficaces.

Inclus

1 vidéo5 lectures1 devoir

Dans cette section, nous abordons les cinq étapes de la science des données, en mettant l'accent sur la définition du problème, le prétraitement des données avec pandas, ainsi que la visualisation et la communication efficaces des données.

Inclus

1 vidéo6 lectures1 devoir

Dans cette section, nous abordons les concepts mathématiques fondamentaux, notamment les symboles, les logarithmes, la théorie des ensembles et les opérations matricielles, qui sont indispensables à la modélisation et à l'analyse dans le domaine de la science des données.

Inclus

1 vidéo4 lectures1 devoir

Dans cette section, nous explorons les principes fondamentaux des probabilités, comparons les approches fréquentialiste et bayésienne, et appliquons les règles des probabilités pour modéliser des événements incertains du monde réel.

Inclus

1 vidéo5 lectures1 devoir

Dans cette section, nous abordons des concepts avancés de probabilités, tels que le théorème de Bayes et les variables aléatoires, en mettant l'accent sur leur application à la modélisation prédictive et aux processus de prise de décision.

Inclus

1 vidéo5 lectures1 devoir

Dans cette section, nous abordons l'échantillonnage non biaisé des données, les mesures de centralité et de dispersion, les scores z, ainsi que la règle empirique permettant d'analyser et d'interpréter efficacement les données.

Inclus

1 vidéo6 lectures1 devoir

Dans cette section, nous abordons les tests d'hypothèse, les intervalles de confiance et le théorème de la limite centrale afin de tirer des conclusions sur la population à partir de données d'échantillon. Parmi les concepts clés figurent les estimations ponctuelles et les distributions d'échantillonnage, qui permettent une prise de décision fondée sur les données.

Inclus

1 vidéo6 lectures1 devoir

Dans cette section, nous abordons les méthodes permettant de communiquer efficacement des données, en mettant l'accent sur l'identification des visualisations trompeuses, la distinction entre corrélation et causalité, ainsi que la création de visuels clairs et pertinents destinés à des publics variés.

Inclus

1 vidéo5 lectures1 devoir

Dans cette section, nous abordons les principes fondamentaux de l'apprentissage automatique, notamment la régression, la classification et l'évaluation des modèles.

Inclus

1 vidéo6 lectures1 devoir

Dans cette section, nous abordons les algorithmes de Bayes naïf, les arbres de décision et l'analyse en composantes principales (ACP) dans le cadre de l'analyse et de la prédiction à partir de données réelles.

Inclus

1 vidéo6 lectures1 devoir

Dans cette section, nous abordons l'apprentissage par transfert et les modèles pré-entraînés, en mettant l'accent sur leur application aux tâches d'apprentissage automatique. Parmi les concepts clés, citons BERT, GPT et l'adaptation des modèles à la vision par ordinateur et au traitement du langage naturel.

Inclus

1 vidéo3 lectures1 devoir

Dans cette section, nous abordons les moyens d'atténuer les biais algorithmiques, la gestion de la dérive des modèles et des données, ainsi que les stratégies permettant de mettre en place des systèmes d'apprentissage automatique équitables et robustes.

Inclus

1 vidéo7 lectures1 devoir

Dans cette section, nous explorons des approches structurées en matière de données, d'apprentissage automatique et de gouvernance architecturale afin de favoriser la transformation numérique, de garantir la conformité et de créer de la valeur grâce à une gestion et à un contrôle efficaces.

Inclus

1 vidéo5 lectures1 devoir

Dans cette section, nous analysons l'ensemble de données COMPAS afin de détecter d'éventuels biais et nous mettons en œuvre des représentations textuelles à l'aide des modèles OpenAI. Nous nous concentrons sur la normalisation des caractéristiques, l'encodage et les applications pratiques en science des données.

Inclus

1 vidéo3 lectures1 devoir

Instructeur

Packt - Course Instructors
Packt
1 946 Cours575 115 apprenants

Offert par

Packt

En savoir plus sur Apprentissage automatique

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.

Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.

Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.

’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Foire Aux Questions