RAG (Retrieval-Augmented Generation)
iaDéfinition
Le RAG (Retrieval-Augmented Generation) est une architecture d'IA combinant un LLM avec une base de connaissances externe interrogée dynamiquement pour chaque requête. Le pipeline RAG se décompose en trois phases : indexation (découpage en chunks, encodage en embeddings, stockage en base vectorielle), retrieval (la question de l'utilisateur est encodée, les chunks les plus similaires sont récupérés par recherche ANN), et génération (le LLM génère une réponse en s'appuyant sur les chunks récupérés comme contexte). Le RAG élimine les hallucinations sur les connaissances récentes et permet la citation de sources. Les variantes avancées incluent HyDE (Hypothetical Document Embeddings), RAG Fusion, Corrective RAG et Agentic RAG avec reranking. En cybersécurité, le RAG alimente les assistants SOC sur des bases de threat intelligence actualisées, les systèmes de recherche sur les CVE/exploits et les outils d'analyse de malwares basés sur des signatures vectorisées.
Architecture
- Indexation : documents découpés en chunks et convertis en embeddings vectoriels
- Retrieval : recherche sémantique des chunks les plus pertinents par similarité cosine
- Generation : le LLM génère sa réponse en s'appuyant sur les chunks retrouvés
Risques Sécurité
- Fuite de données sensibles via les embeddings
- Prompt injection indirect via les documents source
- Empoisonnement de la base vectorielle
- Absence de contrôle d'accès au niveau document
Besoin d'un expert sur ce sujet ?
Audit, pentest, conformité ISO 27001, développement IA sécurisé — demandez un devis gratuit.
Demander un devis