RAG

Définition

02 Mar 26

Que veut dire

RAG

?

La définition technique

Le RAG (Retrieval-Augmented Generation) combine un système de recherche documentaire avec un LLM. Quand une question est posée, le système recherche d'abord les passages pertinents dans une base de données vectorielle, puis les injecte dans le prompt du LLM comme contexte.

En clair

Au lieu de laisser l'IA répondre de mémoire (avec le risque d'inventer), le RAG lui donne les bons documents à consulter avant de répondre. C'est comme passer un examen avec le cours sous les yeux.

RAG vs Fine-tuning

Le fine-tuning modifie le modèle lui-même pour qu'il intègre de nouvelles connaissances.
Le RAG garde le modèle intact et lui fournit le contexte à chaque requête. Plus flexible, moins coûteux.

RAG chez Fracktal

Nos agents Blog Factory utilisent du RAG : chaque agent accède aux données du projet (audit, personas, templates) stockées dans Supabase avant de générer du contenu.

Les questions en lien avec ce terme.

N’hésitez pas à nous contacter si vous avez besoin de renseignement complémentaire.

Contactez-nous

Le RAG élimine-t-il les hallucinations ?

Il les réduit significativement mais ne les élimine pas complètement. Le LLM peut encore mal interpréter le contexte fourni. Les guardrails restent nécessaires.

Quels outils pour mettre en place du RAG ?

Supabase (pgvector), Pinecone, Weaviate pour la base vectorielle. LangChain ou n8n pour l'orchestration. Claude ou GPT-4 pour la génération.

Le RAG coûte-t-il cher ?

Le surcoût principal est le stockage vectoriel et les embeddings. Avec Supabase et Claude, le coût reste très raisonnable pour des volumes moyens.

Peut-on utiliser le RAG avec des documents clients ?

Oui, c'est exactement le cas d'usage principal. On injecte les documents de marque, les briefs produit et les personas clients dans le contexte de nos agents.