Fine-tuning
iaDéfinition
Le fine-tuning est la phase de spécialisation d'un modèle d'IA pré-entraîné qui ré-entraîne tout ou partie de ses paramètres sur un dataset spécifique à un domaine ou une tâche. On distingue le full fine-tuning (mise à jour de tous les poids, très coûteux), le fine-tuning paramétrique efficace (LoRA, QLoRA, Prefix Tuning, Adapter Layers), et l'instruction tuning (alignement du modèle sur des paires instruction-réponse). Le RLHF (Reinforcement Learning from Human Feedback) est une forme avancée de fine-tuning pour l'alignement. Les risques de sécurité incluent le catastrophic forgetting (perte des capacités initiales), le model collapse (dataset de mauvaise qualité), et la possibilité d'injecter des backdoors via un dataset empoisonné. En pratique, le fine-tuning transforme un LLM généraliste en expert métier : cybersécurité, médical, juridique, avec des performances supérieures au prompting sur des tâches spécialisées.
En cybersécurité
Le fine-tuning permet de créer des modèles spécialisés : analyse de CVE, classification de malwares, audit de configuration, scoring de risques. Bien plus efficace que le prompting seul pour des tâches répétitives.
Précautions sécurité
- Anonymisation stricte des données d'entraînement
- Évaluation des données mémorisées par le modèle
- Contrôle d'accès au modèle résultant
- Déploiement on-premise pour les données sensibles
Besoin d'un expert sur ce sujet ?
Audit, pentest, conformité ISO 27001, développement IA sécurisé — demandez un devis gratuit.
Demander un devis