Diffusion Models
iaDéfinition
Classe de modèles génératifs (ex: Stable Diffusion, DALL-E) qui apprennent à inverser un processus de bruitage pour générer des images ou données de haute qualité.
Description
Les Diffusion Models sont une classe de modèles génératifs qui apprennent à inverser un processus de bruitage progressif pour générer des images ou données de haute qualité. Des modèles comme Stable Diffusion, DALL-E 3 et Midjourney sont basés sur cette architecture.
Fonctionnement
Le forward process ajoute progressivement du bruit gaussien à une image sur T étapes jusqu'à obtenir un bruit pur. Le modèle apprend le reverse process : prédire le bruit à éliminer à chaque étape. Le conditioning par texte (CLIP embeddings) guide la génération vers le contenu décrit dans le prompt.
Points clés
- Supérieurs aux GAN pour la diversité et la qualité des images générées, sans les instabilités d'entraînement
- ControlNet et IP-Adapter étendent les diffusion models avec des signaux de contrôle structurels supplémentaires
- L'inpainting et l'outpainting permettent des manipulations ciblées d'images existantes pour les forensiques ou les deepfakes
Besoin d'un expert sur ce sujet ?
Audit, pentest, conformité ISO 27001, développement IA sécurisé — demandez un devis gratuit.
Demander un devis