Что такое RAG и зачем он нужен?
11 часов назад
Никита Вихров
Ответы
Что такое RAG и зачем он нужен
LLM знает всё, что было в её обучающих данных — и ничего сверх этого. Она не знает твою внутреннюю документацию, корпоративное API, приватный репозиторий или статьи, вышедшие после обучения модели.
RAG (Retrieval-Augmented Generation) решает это просто: перед тем как ответить, модель сначала ищет нужную информацию в твоей базе знаний — и отвечает уже с этим контекстом.
Как это работает без RAG
Модель не знает — и честно говорит об этом. Или, что хуже, выдумывает.
Как это работает с RAG
1. Пользователь задаёт вопрос
2. Система ищет релевантные куски документации
3. Найденный контекст добавляется в промпт
4. Модель отвечает, опираясь на реальную документацию
Полная схема RAG-системы
Документы → Разбивка на чанки → Создание embeddings → Векторная БД
↓
Вопрос → Embedding вопроса → Поиск похожих чанков → Контекст + Вопрос → LLM → Ответ
Каждый этап важен. Плохая разбивка на чанки — плохой поиск. Плохой поиск — нерелевантный контекст. Нерелевантный контекст — неправильный ответ, даже если модель хорошая.
Когда RAG нужен
- Корпоративная документация, которую модель не видела
- Приватный код и внутренние API
- Актуальные данные: цены, статусы, новости
- Большой объём документации, который не влезает в контекстное окно
Когда RAG не нужен
Если документации мало и она влезает в контекст — просто вставь её в системный промпт. RAG добавляет сложность, и усложнять стоит только когда это реально нужно.
11 часов назад
Никита Вихров