Чем RAG отличается от fine-tuning?

Question

Никита Вихров · Answer

# Чем RAG отличается от fine-tuning

Оба подхода решают одну задачу — научить модель знать что-то конкретное. Но делают это по-разному, стоят по-разному и подходят для разных ситуаций.

---

**Fine-tuning — обучение модели на новых данных**

Fine-tuning — это дообучение модели на твоих данных. Ты берёшь базовую модель и прогоняешь её через тысячи примеров из твоей предметной области. Модель меняет свои веса и «запоминает» новые знания.

```python
# Концептуально fine-tuning выглядит так
training_data = [
    {"prompt": "Как создать пользователя в нашей системе?",
     "completion": "Используй endpoint POST /api/v2/users с телом {name, email, role}..."},
    {"prompt": "Что такое billing_period в нашей модели?",
     "completion": "billing_period — это период выставления счёта. Значения: monthly, quarterly, annual..."},
    # ... тысячи таких примеров
]

# После обучения модель знает эти ответы "из головы"
# Без поиска, без контекста в промпте
```

**Плюсы fine-tuning:**
- Ответы быстрые — модель не ищет, просто знает
- Работает с коротким промптом
- Хорошо для устойчивых паттернов: форматирование, стиль, специфический жаргон

**Минусы fine-tuning:**
- Дорого: нужны тысячи примеров и GPU для обучения
- Знания устаревают — при изменении документации нужно переобучать
- Модель уверенно выдумывает то, чего не было в обучающих данных («галлюцинирует»)
- Непрозрачно: сложно понять, почему модель ответила именно так

---

**RAG — поиск + генерация**

RAG не меняет модель. Он добавляет этап поиска перед генерацией: находит нужные документы и передаёт их в контекст.

```python
def rag_answer(question: str) -> str:
    # Ищем релевантные документы
    relevant_docs = vector_search(question, top_k=3)
    context = format_context(relevant_docs)

# Модель отвечает с контекстом
    response = client.messages.create(
        model="claude-opus-4-5",
        max_tokens=1024,
        system=f"Отвечай на основе документации:
{context}",
        messages=[{"role": "user", "content": question}]
    )
    return response.content[0].text
```

**Плюсы RAG:**
- Документацию можно обновить без переобучения модели
- Прозрачно: видно, какие источники использовались
- Дешевле: не нужен GPU для обучения
- Меньше галлюцинаций — модель опирается на реальный текст

**Минусы RAG:**
- Если поиск нашёл не то — ответ будет неправильным
- Медленнее: поиск добавляет задержку
- Не подходит для знаний о стиле и формате — это лучше через fine-tuning

---

**Когда что выбирать**

| Ситуация | RAG | Fine-tuning |
|---|---|---|
| Документация часто меняется | ✓ | ✗ |
| Нужен специфический стиль ответов | ✗ | ✓ |
| Большая база документов | ✓ | ✗ |
| Фиксированный набор Q&A | — | ✓ |
| Нужно видеть источники | ✓ | ✗ |
| Ограниченный бюджет | ✓ | ✗ |

На практике для большинства корпоративных задач RAG — правильный первый шаг. Fine-tuning — когда RAG уже работает, но нужно подстроить стиль или улучшить понимание специфического домена.

Их также комбинируют: fine-tuning для стиля и формата, RAG для актуальных знаний.

Ситуация	RAG	Fine-tuning
Документация часто меняется	✓	✗
Нужен специфический стиль ответов	✗	✓
Большая база документов	✓	✗
Фиксированный набор Q&A	—	✓
Нужно видеть источники	✓	✗
Ограниченный бюджет	✓	✗

Чем RAG отличается от fine-tuning?

Ответы

Чем RAG отличается от fine-tuning

Каталог