Les modèles open-weight comme Llama 3, Mistral ou Phi offrent des performances impressionnantes, mais comment les adapter à vos données spécifiques sans infrastructure colossale ?
Les techniques d’adaptation efficaces comme LoRA et QLoRA permettent de fine-tuner ces modèles avec des ressources limitées.
Cette formation, "Fine-Tuning Hugging Face : modèles open-source et LoRA", plonge au cœur de l’écosystème Hugging Face pour adapter des LLM open-source avec des méthodes de pointe.
Les participants apprennent à préparer des datasets, à utiliser la bibliothèque PEFT (LoRA, QLoRA), à entraîner des modèles sur des données multilingues, et à évaluer finement les résultats.
Les modèles cibles couvrent le spectre open-source : Mistral, Llama 3, GPT-OSS, Phi. L’évaluation va au-delà des métriques classiques (loss, perplexité) pour inclure des benchmarks domaine-spécifique et des tests A/B. Enfin, le déploiement est abordé via Hugging Face Spaces et Ollama pour l’inférence locale.
Cette formation permettra aux participants de :
- Préparer des datasets pour le fine-tuning (tokenisation, formatage conversationnel)
- Implémenter LoRA et QLoRA avec la bibliothèque PEFT
- Fine-tuner des modèles populaires (Mistral, Llama 3, Phi) sur des données multilingues
- Évaluer les modèles fine-tunés avec des métriques appropriées
- Comparer les performances via A/B testing
- Déployer les modèles sur Hugging Face Spaces et en local avec Ollama