Почему RAG врёт и как это фиксить
11 часов назад
Никита Вихров
Ответы
Почему RAG врёт и как это фиксить
RAG уменьшает галлюцинации — но не убирает их полностью. Система может найти не тот документ, модель может неправильно его интерпретировать, а пользователь получит уверенный неправильный ответ. Разберём конкретные причины и способы их починить.
Причина 1: Поиск нашёл не тот документ
Самая частая проблема. Вопрос пользователя и нужный документ сформулированы по-разному — embedding-поиск нашёл что-то похожее, но не то.
Как фиксить:
Гибридный поиск — комбинируй semantic search с keyword search:
Причина 2: Чанки слишком большие или слишком маленькие
Документ разбит неправильно — в один чанк попало несколько несвязанных тем, в другой — только часть нужного контекста.
Причина 3: Модель игнорирует контекст и выдумывает
Даже с правильными документами модель может «съехать» на свои знания.
Причина 4: Нет порогового значения релевантности
Поиск всегда находит что-то — даже если это «что-то» совсем не по теме.
RAG кажется простым — нашли, вставили, спросили. На практике каждый этап можно сделать плохо, и ошибки складываются. Хорошая RAG-система — это итеративная работа: логируй что ищется, проверяй качество чанков, тестируй пороговые значения.
11 часов назад
Никита Вихров



.png)

