Retrieval (RAG)
iaDéfinition
Composant d'un pipeline RAG qui récupère les documents pertinents depuis une base vectorielle en réponse à une requête, avant de les fournir au LLM comme contexte.
Description
Le Composant Retrieval (RAG) est la partie d'un pipeline RAG qui récupère les documents les plus pertinents depuis une base vectorielle pour une requête donnée. La qualité de la récupération détermine directement la qualité de la réponse finale générée par le LLM.
Fonctionnement
La requête est encodée en embedding et comparée aux embeddings des documents indexés par similarité cosinus. Des stratégies avancées incluent la recherche hybride (dense + sparse BM25), le reranking avec CrossEncoder, la récupération HyDE (requête hypothétique) et la récupération parent-enfant pour les chunks.
Points clés
- Le chunking (découpage des documents) impacte fortement la qualité de récupération : trop petit perd le contexte, trop grand noie l'information
- Le reranking (Cohere Rerank, BGE Reranker) améliore significativement la précision après la récupération initiale
- Les bases vectorielles as-a-service (Pinecone, Weaviate) gèrent automatiquement l'indexation et la mise à l'échelle
Besoin d'un expert sur ce sujet ?
Audit, pentest, conformité ISO 27001, développement IA sécurisé — demandez un devis gratuit.
Demander un devis