Hallucination IA
iaDéfinition
L'hallucination IA désigne le phénomène par lequel un LLM génère des informations factuellement incorrectes, inventées ou incohérentes, présentées avec une apparente confiance linguistique. On distingue deux types : les hallucinations intrinsèques (contradictions avec le contexte fourni) et extrinsèques (inventions non vérifiables). Les causes incluent le biais de plausibilité statistique, la maximisation de la cohérence syntaxique au détriment de l'exactitude factuelle, et le manque de mécanisme d'incertitude natif. En cybersécurité, les hallucinations sont critiques : un LLM peut inventer des CVE, des IOC ou des procédures d'incident inexistants. Les techniques de mitigation incluent le RAG (ancrage sur des sources vérifiées), le chain-of-thought, les guardrails de vérification factuelle, le grounding et les méthodes d'uncertainty quantification.
Types d'hallucinations
- Hallucinations factuelles : informations fausses présentées comme vraies (dates, noms, événements)
- Hallucinations logiques : raisonnements incohérents malgré une apparence de logique
- Confabulation : invention de sources, citations ou références inexistantes
Causes
Les hallucinations proviennent de la nature probabiliste des LLM : ils génèrent le token le plus probable, pas le plus véridique. Le manque de grounding (ancrage dans des données réelles) amplifie le problème.
Mitigations
- RAG pour ancrer les réponses dans des documents vérifiés
- Chain-of-Verification pour l'auto-vérification
- Guardrails et fact-checking automatisé
Besoin d'un expert sur ce sujet ?
Audit, pentest, conformité ISO 27001, développement IA sécurisé — demandez un devis gratuit.
Demander un devis