PEFT (Parameter-Efficient Fine-Tuning)
iaDéfinition
Famille de techniques de fine-tuning (LoRA, Prefix Tuning, Prompt Tuning) n'ajustant qu'une fraction des paramètres du modèle, réduisant drastiquement coûts GPU et risque de catastrophic forgetting.
Description
Le PEFT (Parameter-Efficient Fine-Tuning) est une famille de techniques de fine-tuning n'ajustant qu'une fraction des paramètres d'un LLM pré-entraîné. LoRA, Prefix Tuning, Prompt Tuning et Adapter Tuning permettent une spécialisation efficace sans le coût du full fine-tuning.
Fonctionnement
LoRA (Low-Rank Adaptation) est la technique PEFT dominante : elle approxime les mises à jour de poids par le produit de deux matrices de faible rang (r = 4 à 64), réduisant les paramètres entraînables de 99%. Les matrices LoRA sont fusionnées avec les poids originaux à l'inférence sans overhead.
Points clés
- LoRA permet de fine-tuner LLaMA-3 70B sur un seul GPU A100 là où le full fine-tuning nécessiterait 16+ GPU
- QLoRA combine quantization 4-bit et LoRA pour fine-tuner des LLM de 70B sur des GPU grand public
- Le catastrophic forgetting est minimisé par PEFT car les poids originaux restent gelés pendant le fine-tuning
Besoin d'un expert sur ce sujet ?
Audit, pentest, conformité ISO 27001, développement IA sécurisé — demandez un devis gratuit.
Demander un devis