Что такое chain-of-thought и зачем заставлять модель думать вслух?
11 часов назад
Никита Вихров
Ответы
Что такое chain-of-thought и зачем заставлять модель думать вслух
Когда модель отвечает сразу — она часто ошибается на задачах, требующих рассуждения. Chain-of-thought (CoT) — техника, при которой модель сначала разбирает задачу по шагам, а потом даёт ответ. Качество растёт, потому что модель не прыгает к выводу, а идёт к нему через промежуточные шаги.
Без CoT — модель спешит и ошибается
С CoT — модель показывает ход мысли
Теперь видно, где ошибка если она есть. И легче проверить.
Как запускать CoT
Три способа, от простого к сложному:
1. Простая инструкция
2. Через системный промпт
3. Few-shot CoT — показываешь пример рассуждения
Когда CoT не нужен
CoT увеличивает количество токенов — а значит время ответа и стоимость. Для простых задач он избыточен.
Правило: если задача требует нескольких шагов рассуждения или могут быть ошибки в промежуточных вычислениях — используй CoT. Если задача простая и однозначная — не используй.
Скрытый CoT — думаем внутри тегов
Иногда хочется получить только финальный ответ, но с качеством CoT. Просишь модель думать внутри тегов, которые потом обрезаешь:
11 часов назад
Никита Вихров
Похожие вопросы