/
Вопросы и ответы
/
AI-агенты
/

Что такое ReAct — как агент думает и действует по шагам

Что такое ReAct — как агент думает и действует по шагам

12 часов назад

Никита Вихров

Ответы

0

Что такое ReAct — как агент думает и действует по шагам

ReAct (Reasoning + Acting) — паттерн, при котором агент чередует два шага: сначала рассуждает вслух («что мне нужно сделать?»), потом действует («вызываю инструмент»). Потом снова рассуждает на основе результата — и так по кругу.

Придумали его в 2022 году в Google Research. С тех пор он стал стандартом для большинства агентных систем.


Как выглядит ReAct-цикл

Задача: Найди самый популярный репозиторий на GitHub по теме "mcp server" и скажи сколько у него звёзд Мысль: Мне нужно поискать репозитории на GitHub. Использую инструмент search_github. Действие: search_github(query="mcp server", sort="stars") Наблюдение: [{"name": "modelcontextprotocol/servers", "stars": 12400}, ...] Мысль: Нашёл результаты. Самый популярный — modelcontextprotocol/servers с 12400 звёздами. Могу дать финальный ответ. Ответ: Самый популярный репозиторий по теме "mcp server" — modelcontextprotocol/servers, у него 12 400 звёзд на GitHub.

Реализация через system prompt

ReAct — это не библиотека, это паттерн промптинга. Модели объясняют, как думать:

REACT_SYSTEM_PROMPT = """Ты — агент, который решает задачи пошагово.

На каждом шаге:
1. Напиши "Мысль:" — что ты понимаешь о задаче и что нужно сделать
2. Напиши "Действие:" — какой инструмент вызвать и с какими аргументами
3. Дождись "Наблюдение:" — результата инструмента
4. Повтори, пока задача не решена
5. Напиши "Ответ:" — финальный ответ пользователю

Думай перед каждым действием. Не прыгай к ответу без промежуточных шагов."""

response = client.messages.create(
    model="claude-opus-4-5",
    max_tokens=2048,
    system=REACT_SYSTEM_PROMPT,
    tools=tools,
    messages=messages
)

Зачем нужны явные мысли

Без рассуждений модель действует импульсивно: видит задачу — сразу вызывает первый подходящий инструмент. С ReAct она сначала декомпозирует задачу, выбирает правильный инструмент и аргументы, замечает ошибки в наблюдениях.

Практический эффект: агент с ReAct справляется с многошаговыми задачами заметно лучше, чем без него. Особенно когда задача требует нескольких инструментов или когда первый инструмент вернул неожиданный результат.

Цепочка мыслей также помогает при отладке — видно, где именно агент свернул не туда.

12 часов назад

Никита Вихров

+7 800 100 22 47

бесплатно по РФ

+7 495 085 21 62

бесплатно по Москве

108813 г. Москва, вн.тер.г. поселение Московский,
г. Московский, ул. Солнечная, д. 3А, стр. 1, помещ. 20Б/3
ОГРН 1217300010476
ИНН 7325174845