Un prétraitement inadéquat des données est à l'origine de 80 % des échecs de production en apprentissage automatique, ce qui rend la qualité des données plus cruciale que le choix de l'algorithme. Cette formation complète permet aux développeurs Java d'acquérir les compétences essentielles pour créer des pipelines de prétraitement de niveau entreprise, capables de transformer des données brutes issues du monde réel en caractéristiques prêtes pour l'apprentissage automatique. Grâce à des travaux pratiques utilisant OpenCSV et Apache Commons CSV, vous maîtriserez les techniques d’analyse de grands ensembles de données tout en mettant en œuvre des stratégies de normalisation, notamment la mise à l’échelle Min-Max et la standardisation par score Z.

Analyse et normalisation des données pour les pipelines de ML
Profitez de l'une de nos meilleures offres et renforcez vos compétences avec 50 % de réduction sur Coursera Plus. Économisez maintenant.

Analyse et normalisation des données pour les pipelines de ML
Ce cours fait partie de Spécialisation "Level Up : Apprentissage automatique basé sur Java"


Instructeurs : Aseem Singhal
Inclus avec
Demander à Coursera
Expérience recommandée
Ce que vous apprendrez
Créez des analyseurs CSV performants à l'aide de bibliothèques Java intégrant le mappage d'objets, la gestion des erreurs et le traitement en continu pour plus de 100 000 enregistrements.
Créez des pipelines de nettoyage des données intégrant plusieurs algorithmes de mise à l'échelle, la gestion des valeurs aberrantes et des paramètres sérialisables afin d'assurer la cohérence entre l'entraînement et l'inférence.
Concevoir des pipelines modulaires à l'aide de modèles de construction qui enchaînent les opérations, avec un suivi et l'intégration d'un framework d'apprentissage automatique pour les données à grande échelle.
Compétences que vous acquerrez
- Catégorie : Traitement des données
- Catégorie : Nettoyage des données
- Catégorie : Pipelines de données
- Catégorie : Traitement des données
- Catégorie : Transformation des données
- Catégorie : Intégrité des données
- Catégorie : Java
- Catégorie : Accès aux données
- Catégorie : Qualité des données
- Catégorie : Importation/exportation de données
- Catégorie : Big Data
- Catégorie : Contrôle continu
- Catégorie : Ingénierie des fonctionnalités
- Catégorie : Prétraitement des données
- Catégorie : Modèle de formation
- Catégorie : Validation des données
Outils que vous découvrirez
- Catégorie : Déploiement du modèle
- Catégorie : Programmation Java
- Catégorie : Workflows d'IA
Détails à connaître

Ajouter à votre profil LinkedIn
1 devoir
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Élaborez votre expertise du sujet
- Apprenez de nouveaux concepts auprès d'experts du secteur
- Acquérez une compréhension de base d'un sujet ou d'un outil
- Développez des compétences professionnelles avec des projets pratiques
- Obtenez un certificat professionnel partageable

Il y a 3 modules dans ce cours
Obtenez un certificat professionnel
Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.
Instructeurs

Offert par
En savoir plus sur Analyse des données
Statut : Essai gratuit
Statut : Essai gratuitCoursera
Statut : Essai gratuit
Statut : Essai gratuit
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.
Foire Aux Questions
Plus de questions
Aide financière disponible,




