Orchestration de l'IA : Des modèles locaux à l'informatique dématérialisée

Profitez de l'une de nos meilleures offres et renforcez vos compétences avec 50 % de réduction sur Coursera Plus. Économisez maintenant.

Orchestration de l'IA : Des modèles locaux à l'informatique dématérialisée

Ce cours fait partie de Spécialisation "Outil AI"

Instructeurs : Alfredo Deza

Inclus avec

4 modules

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.

niveau Débutant

Expérience recommandée

5 heures à compléter

Planning flexible

Apprenez à votre propre rythme

4 modules

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.

niveau Débutant

Expérience recommandée

5 heures à compléter

Planning flexible

Apprenez à votre propre rythme

Ce que vous apprendrez

Construire une pyramide d'ingénierie des prompts, allant des prompts de base au raisonnement par chaîne de pensée, en Rust, et évaluer les facteurs de décision entre une solution locale et une solution cloud
Mise en place d'une infrastructure IA locale avec Ollama, llamafile, aprender et la compilation GPU de Rust Candle, ainsi que des stratégies de mise en cache et d'optimisation RAG
Configurer une station de travail d'IA en production avec tmux, NVIDIA-smi et Zenith, et intégrer des flux de travail cloud avec AWS Spot, Hugging Face et GitHub AI

Compétences que vous acquerrez

Catégorie : Modélisation des grandes langues
Catégorie : Candidature au LLM
Catégorie : Analyse
Catégorie : Surveillance du système
Catégorie : Infographie
Catégorie : Infrastructure en nuage
Catégorie : Architecture de l'informatique en nuage
Catégorie : Intégrations AI
Catégorie : Optimisation du modèle
Catégorie : Technologies de l'informatique en nuage
Catégorie : Génération assistée par récupération
Catégorie : Déploiement dans le nuage
Catégorie : Motifs de l'invitation

Outils que vous découvrirez

Catégorie : AWS SageMaker
Catégorie : Ingénierie rapide
Catégorie : Orchestration de l'IA
Catégorie : Workflows d'IA
Catégorie : Déploiement du modèle
Catégorie : Rust (langage de programmation)
Catégorie : Visage étreint

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Récemment mis à jour !

avril 2026

Évaluations

4 devoirs

Enseigné en Anglais

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

En savoir plus sur Coursera pour les affaires

logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Élaborez votre expertise du sujet

Ce cours fait partie de la Spécialisation "Outil AI"

Lorsque vous vous inscrivez à ce cours, vous êtes également inscrit(e) à cette Spécialisation.

Apprenez de nouveaux concepts auprès d'experts du secteur
Acquérez une compréhension de base d'un sujet ou d'un outil
Développez des compétences professionnelles avec des projets pratiques
Obtenez un certificat professionnel partageable

Il y a 4 modules dans ce cours

Apprenez à orchestrer des systèmes d’IA dans des environnements locaux et cloud grâce à des exercices pratiques portant sur la configuration de l’infrastructure, le déploiement de modèles et l’intégration de workflows. Vous construirez une pyramide d’ingénierie des prompts, allant des prompts de base au raisonnement par chaîne de pensée implémenté en Rust, puis vous évaluerez six critères de décision permettant de choisir entre des modèles locaux et cloud, notamment la latence, le débit, le coût et la confidentialité. Ce cours aborde en détail l’infrastructure IA locale : exécution d’Ollama avec des fichiers de modèles personnalisés pour des assistants dédiés à des tâches spécifiques, déploiement de llamafile pour une inférence portable sans dépendance, compilation de Rust Candle avec CUDA pour une inférence locale accélérée par GPU, et optimisation du RAG local à l’aide de stratégies de mise en cache. Vous configurerez une station de travail IA complète avec tmux pour la gestion des sessions, nvidia-smi et Zenith pour la surveillance des GPU, ainsi que l’optimisation des GPU NVIDIA. Le dernier module aborde les workflows cloud, notamment les instances Spot d’AWS pour un calcul GPU économique, la découverte et le téléchargement de modèles sur Hugging Face, ainsi que l’intégration de modèles d’IA depuis GitHub. À l’issue de ce cours, vous serez en mesure de mettre en place une infrastructure d’IA locale, de déployer des modèles dans des environnements locaux et cloud, et de concevoir des workflows d’orchestration qui concilient coût, confidentialité et performances.

Une formation complète consacrée à l'ingénierie des prompts, avec une approche fondée sur la « chaîne de pensée », les moteurs d'inférence locaux (Ollama, llamafile, Candle), la configuration des stations de travail équipées de GPU, ainsi que le déploiement dans le cloud optimisé en termes de coûts grâce aux instances Spot d'AWS.

Inclus

7 vidéos2 lectures1 devoir

7 vidéosTotal 29 minutes

Introduction au cours2 minutes
Aperçu du cours2 minutes
Présentation de l'orchestration de l'IA8 minutes
Pyramide de l'ingénierie des prompts3 minutes
Sujet de réflexion « Rust »4 minutes
Démonstration de la ligne de commande Rust « Chain of thought »6 minutes
Explication du raisonnement dans l'invite de commande Rust3 minutes

2 lecturesTotal 2 minutes

Termes clés : Cours1 minute
Termes clés : Pyramide de l'ingénierie des prompts1 minute

1 devoirTotal 5 minutes

Principes fondamentaux de l'orchestration5 minutes

Aborde les compromis entre les modèles locaux et cloud, les stratégies de mise en cache, l'optimisation locale de RAG, Ollama avec des fichiers de modèle personnalisés, le déploiement portable via llamafile, ainsi que l'inférence Rust accélérée par GPU avec Candle.

Inclus

9 vidéos3 lectures1 devoir

9 vidéosTotal 41 minutes

Démonstration locale d'Ollama7 minutes
Débogueur Rust pour les fichiers de modèle Ollama7 minutes
Arc d'Ollama2 minutes
Modèles locaux vs modèles dans le cloud5 minutes
Mise en cache pour l'IA4 minutes
Optimisation du RAG local5 minutes
Premiers pas avec Llamafile – Gemma4 minutes
Llamafile simple3 minutes
Compilation du GPU « Rust candle »5 minutes

3 lecturesTotal 30 minutes

Mots-clés : Démonstration locale d'Ollama10 minutes
Termes clés : modèles locaux vs modèles cloud10 minutes
Termes clés : Llamafile : Premiers pas avec Gemma10 minutes

1 devoirTotal 5 minutes

Quiz : Infrastructure IA locale5 minutes

Ce guide aborde la gestion des sessions tmux, la surveillance des GPU via NVIDIA-smi et Zenith, l'orchestration des postes de travail locaux, le déploiement d'instances Spot sur AWS, les workflows de modèles d'IA sur Hugging Face et GitHub, ainsi que la structure des projets Rust.

Inclus

11 vidéos3 lectures1 devoir

11 vidéosTotal 47 minutes

Déploiement ML sur AWS Spot4 minutes
Modèles de workflow Hugging Face3 minutes
Flux de travail des modèles d'IA sur GitHub3 minutes
Structure du projet « Hello World » en Rust2 minutes
Utilisation de tmux sous Linux11 minutes
Utilisation de NVIDIA SMI5 minutes
Utilisation de la surveillance des GPU Zenith5 minutes
Station de travail locale dédiée à l'orchestration de l'IA5 minutes
Approches en matière de formation technique5 minutes
Apprentissage efficace de l'ingénierie de l'IA3 minutes
Conclusion du cours3 minutes

3 lecturesTotal 30 minutes

Termes clés : AWS Spot, Deploy ML10 minutes
Mots-clés : Utilisation de tmux sous Linux10 minutes
Termes clés : Approches de formation technique10 minutes

1 devoirTotal 30 minutes

Quiz : Flux de travail sur poste de travail et dans le cloud30 minutes

Comparaison directe entre Ollama et `apr` ([paiml/aprender](https://github.com/paiml/aprender)) exécutant Qwen2.5-Coder-1.5B sur la même suite de prompts et le même matériel. Construire un moteur de routage par chaîne de réflexion qui sélectionne les environnements d'exécution en fonction de la complexité des tâches et des exigences de validation, avec une analyse des coûts couvrant les postes de travail locaux, les instances Spot et Bedrock.

Inclus

4 lectures1 devoir

Obtenez un certificat professionnel

Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.

Instructeurs

Alfredo Deza

Pragmatic AI Labs

35 Cours2 985 apprenants

Offert par

Pragmatic AI Labs

En savoir plus sur Développement de logiciels

Statut : Essai gratuit
Coursera
Orchestrate, Analyze, and Evaluate AI Deployments
Cours
Statut : Essai gratuit
Pragmatic AI Labs
AI Tooling Capstone: Serverless Multi-Model Systems
Cours
Duke University
Local LLMs with llamafile
Projet Guidé
Statut : Essai gratuit
Edureka
AI Agent Orchestration and Scaling
Cours

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Étudiant(e) depuis 2018

’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.

Étudiant(e) depuis 2020

’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.

Étudiant(e) depuis 2021

’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.

’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Foire Aux Questions

Pour accéder aux supports de cours, aux devoirs et pour obtenir un certificat, vous devez acheter l'expérience de certificat lorsque vous vous inscrivez à un cours. Vous pouvez essayer un essai gratuit ou demander une aide financière. Le cours peut proposer l'option "Cours complet, pas de certificat". Cette option vous permet de consulter tous les supports de cours, de soumettre les évaluations requises et d'obtenir une note finale. Cela signifie également que vous ne pourrez pas acheter un certificat d'expérience.

Lorsque vous vous inscrivez au cours, vous avez accès à tous les cours de la spécialisation et vous obtenez un certificat lorsque vous terminez le travail. Votre certificat électronique sera ajouté à votre page Réalisations - de là, vous pouvez imprimer votre certificat ou l'ajouter à votre profil LinkedIn.

Oui, pour certains programmes de formation, vous pouvez demander une aide financière ou une bourse si vous n'avez pas les moyens de payer les frais d'inscription. Si une aide financière ou une bourse est disponible pour votre programme de formation, vous trouverez un lien pour postuler sur la page de description.