Maîtrisez l'ensemble du processus de réglage fin — des mécanismes internes des transformateurs au déploiement en production — grâce à des techniques économes en mémoire qui s'exécutent sur du matériel grand public.
Cette formation vous permettra de passer du statut d’utilisateur de grands modèles linguistiques à celui de développeur capable de les personnaliser. Vous apprendrez à affiner des modèles comportant 7 milliards de paramètres sur le GPU d’un ordinateur portable à l’aide de QLoRA, qui réduit les besoins en mémoire de 56 Go à seulement 4 Go grâce à une quantification intelligente et à une adaptation de rang faible. Ce qui distingue cette formation, c’est son approche scientifique rigoureuse. Vous appliquerez tout au long de la formation la méthodologie de falsification poppérienne : au lieu de vous demander « mon modèle fonctionne-t-il ? », vous chercherez systématiquement à le faire échouer. Cet état d’esprit sceptique — tester les cas limites de tokenisation, mener des études d’ablation de rang et valider la qualité du corpus à travers six catégories de falsification — développe les compétences de réflexion critique qui distinguent les ingénieurs prêts pour la production de ceux qui livrent des systèmes fragiles. À la fin de ce cours, vous serez en mesure, en toute confiance : de calculer les besoins en VRAM et de sélectionner le matériel approprié ; de suivre le processus d’inférence à travers le pipeline Transformer en six étapes ; de configurer le rang LoRA en fonction de la complexité de la tâche ; de construire des corpus d’entraînement de qualité à l’aide de l’extraction AST ; et de publier des ensembles de données sur HuggingFace avec des découpages et une documentation appropriés. Entièrement construit sur une pile d’IA souveraine, tout s’exécute localement sans aucune dépendance externe — une véritable indépendance en matière d’apprentissage automatique.


















