Maîtrisez l'art de créer et d'optimiser des systèmes d'IA multimodaux de pointe capables de comprendre à la fois le langage et la vision. Ce cours vous permettra de créer des modèles basés sur les transformateurs qui intègrent de manière transparente le traitement du texte et des images, tout en tirant parti de l'apprentissage par transfert pour accélérer considérablement le développement. Vous apprendrez à concevoir des architectures sophistiquées à l’aide de PyTorch et TensorFlow, à mettre en œuvre des mécanismes de fusion pour la compréhension intermodale, et à appliquer des stratégies avancées de réglage fin permettant d’atteindre des performances optimales sur des ensembles de données personnalisés. En maîtrisant ces techniques, vous transformerez des mois de développement de modèles traditionnels en workflows efficaces qui fournissent des solutions d’IA multimodales prêtes à l’emploi. Ce cours combine de manière unique la mise en œuvre pratique et les stratégies d’optimisation, vous préparant ainsi à diriger des projets d’IA de nouvelle génération.

Apprentissage par transfert pour affiner les modèles multimodaux
Profitez de l'une de nos meilleures offres et renforcez vos compétences avec 50 % de réduction sur Coursera Plus. Économisez maintenant.

Apprentissage par transfert pour affiner les modèles multimodaux
Ce cours fait partie de plusieurs programmes.

Instructeur : Hurix Digital
Inclus avec
Demander à Coursera
Expérience recommandée
Ce que vous apprendrez
L'architecture multimodale nécessite des chaînes de traitement de type « encodeur-fusion-décodeur » qui concilient efficacité de calcul et capacités de compréhension intermodale.
L'apprentissage par transfert révolutionne l'IA en permettant une adaptation rapide des connaissances pré-entraînées à de nouveaux domaines, avec un minimum de données et d'exigences en matière d'entraînement.
Le réglage fin permet de trouver un juste équilibre entre la préservation des connaissances et l'adaptation aux tâches grâce à une sélection rigoureuse des hyperparamètres et à des techniques stratégiques de gel des couches.
Les systèmes multimodaux de production nécessitent des approches d'optimisation systématiques tenant compte à la fois des performances des modèles et des contraintes liées aux ressources de calcul.
Compétences que vous acquerrez
- Catégorie : Mise au point
- Catégorie : Optimisation du modèle
- Catégorie : Réseaux neuronaux artificiels
- Catégorie : Invitations multimodales
- Catégorie : Architectures de modèles génératifs
- Catégorie : Traitement des données
- Catégorie : Apprentissage profond
- Catégorie : Transfert de connaissances
- Catégorie : Modèle de formation
Outils que vous découvrirez
- Catégorie : Keras (bibliothèque de réseaux neuronaux)
- Catégorie : PyTorch (Bibliothèque d'apprentissage automatique)
- Catégorie : Tensorflow
Détails à connaître

Ajouter à votre profil LinkedIn
février 2026
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Élaborez votre expertise du sujet
- Apprenez de nouveaux concepts auprès d'experts du secteur
- Acquérez une compréhension de base d'un sujet ou d'un outil
- Développez des compétences professionnelles avec des projets pratiques
- Obtenez un certificat professionnel partageable

Il y a 2 modules dans ce cours
Obtenez un certificat professionnel
Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.
Instructeur

Offert par
En savoir plus sur Apprentissage automatique
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.
Foire Aux Questions
Plus de questions
Aide financière disponible,
¹ Certains travaux de ce cours sont notés par l'IA. Pour ces travaux, vos Données internes seront utilisées conformément à Notification de confidentialité de Coursera.








