Что такое ReAct — как агент думает и действует по шагам

Question

Никита Вихров · Answer

# Что такое ReAct — как агент думает и действует по шагам

ReAct (Reasoning + Acting) — паттерн, при котором агент чередует два шага: сначала рассуждает вслух («что мне нужно сделать?»), потом действует («вызываю инструмент»). Потом снова рассуждает на основе результата — и так по кругу.

Придумали его в 2022 году в Google Research. С тех пор он стал стандартом для большинства агентных систем.

---

**Как выглядит ReAct-цикл**

```
Задача: Найди самый популярный репозиторий на GitHub по теме "mcp server"
        и скажи сколько у него звёзд

Мысль: Мне нужно поискать репозитории на GitHub. Использую инструмент search_github.

Действие: search_github(query="mcp server", sort="stars")

Наблюдение: [{"name": "modelcontextprotocol/servers", "stars": 12400}, ...]

Мысль: Нашёл результаты. Самый популярный — modelcontextprotocol/servers с 12400 звёздами.
       Могу дать финальный ответ.

Ответ: Самый популярный репозиторий по теме "mcp server" — modelcontextprotocol/servers,
        у него 12 400 звёзд на GitHub.
```

---

**Реализация через system prompt**

ReAct — это не библиотека, это паттерн промптинга. Модели объясняют, как думать:

```python
REACT_SYSTEM_PROMPT = """Ты — агент, который решает задачи пошагово.

На каждом шаге:
1. Напиши "Мысль:" — что ты понимаешь о задаче и что нужно сделать
2. Напиши "Действие:" — какой инструмент вызвать и с какими аргументами
3. Дождись "Наблюдение:" — результата инструмента
4. Повтори, пока задача не решена
5. Напиши "Ответ:" — финальный ответ пользователю

Думай перед каждым действием. Не прыгай к ответу без промежуточных шагов."""

response = client.messages.create(
    model="claude-opus-4-5",
    max_tokens=2048,
    system=REACT_SYSTEM_PROMPT,
    tools=tools,
    messages=messages
)
```

---

**Зачем нужны явные мысли**

Без рассуждений модель действует импульсивно: видит задачу — сразу вызывает первый подходящий инструмент. С ReAct она сначала декомпозирует задачу, выбирает правильный инструмент и аргументы, замечает ошибки в наблюдениях.

Практический эффект: агент с ReAct справляется с многошаговыми задачами заметно лучше, чем без него. Особенно когда задача требует нескольких инструментов или когда первый инструмент вернул неожиданный результат.

Цепочка мыслей также помогает при отладке — видно, где именно агент свернул не туда.

Что такое ReAct — как агент думает и действует по шагам

Ответы

Что такое ReAct — как агент думает и действует по шагам

Каталог