/
Вопросы и ответы
/
RAG
/

Чем RAG отличается от fine-tuning?

Чем RAG отличается от fine-tuning?

11 часов назад

Никита Вихров

Ответы

0

Чем RAG отличается от fine-tuning

Оба подхода решают одну задачу — научить модель знать что-то конкретное. Но делают это по-разному, стоят по-разному и подходят для разных ситуаций.


Fine-tuning — обучение модели на новых данных

Fine-tuning — это дообучение модели на твоих данных. Ты берёшь базовую модель и прогоняешь её через тысячи примеров из твоей предметной области. Модель меняет свои веса и «запоминает» новые знания.

# Концептуально fine-tuning выглядит так
training_data = [
    {"prompt": "Как создать пользователя в нашей системе?",
     "completion": "Используй endpoint POST /api/v2/users с телом {name, email, role}..."},
    {"prompt": "Что такое billing_period в нашей модели?",
     "completion": "billing_period — это период выставления счёта. Значения: monthly, quarterly, annual..."},
    # ... тысячи таких примеров
]

# После обучения модель знает эти ответы "из головы"
# Без поиска, без контекста в промпте

Плюсы fine-tuning:

  • Ответы быстрые — модель не ищет, просто знает
  • Работает с коротким промптом
  • Хорошо для устойчивых паттернов: форматирование, стиль, специфический жаргон

Минусы fine-tuning:

  • Дорого: нужны тысячи примеров и GPU для обучения
  • Знания устаревают — при изменении документации нужно переобучать
  • Модель уверенно выдумывает то, чего не было в обучающих данных («галлюцинирует»)
  • Непрозрачно: сложно понять, почему модель ответила именно так

RAG — поиск + генерация

RAG не меняет модель. Он добавляет этап поиска перед генерацией: находит нужные документы и передаёт их в контекст.

def rag_answer(question: str) -> str:
    # Ищем релевантные документы
    relevant_docs = vector_search(question, top_k=3)
    context = format_context(relevant_docs)

    # Модель отвечает с контекстом
    response = client.messages.create(
        model="claude-opus-4-5",
        max_tokens=1024,
        system=f"Отвечай на основе документации:\n{context}",
        messages=[{"role": "user", "content": question}]
    )
    return response.content[0].text

Плюсы RAG:

  • Документацию можно обновить без переобучения модели
  • Прозрачно: видно, какие источники использовались
  • Дешевле: не нужен GPU для обучения
  • Меньше галлюцинаций — модель опирается на реальный текст

Минусы RAG:

  • Если поиск нашёл не то — ответ будет неправильным
  • Медленнее: поиск добавляет задержку
  • Не подходит для знаний о стиле и формате — это лучше через fine-tuning

Когда что выбирать

СитуацияRAGFine-tuning
Документация часто меняется
Нужен специфический стиль ответов
Большая база документов
Фиксированный набор Q&A
Нужно видеть источники
Ограниченный бюджет

На практике для большинства корпоративных задач RAG — правильный первый шаг. Fine-tuning — когда RAG уже работает, но нужно подстроить стиль или улучшить понимание специфического домена.

Их также комбинируют: fine-tuning для стиля и формата, RAG для актуальных знаний.

11 часов назад

Никита Вихров

+7 800 100 22 47

бесплатно по РФ

+7 495 085 21 62

бесплатно по Москве

108813 г. Москва, вн.тер.г. поселение Московский,
г. Московский, ул. Солнечная, д. 3А, стр. 1, помещ. 20Б/3
ОГРН 1217300010476
ИНН 7325174845