Как использовать языковую модель для разметки обучающих данных
17 дней назад
Никита Вихров
Ответы
0
Как использовать языковую модель для разметки обучающих данных
Ручная разметка — дорого и медленно. Языковая модель может размечать данные в несколько раз быстрее и дешевле человека, если задача хорошо сформулирована.
Подход: модель расставляет метки, человек проверяет выборку, исправляет ошибки.
Когда это работает
- Классификация текста (тональность, тема, намерение).
- Извлечение сущностей (имена, суммы, даты, организации).
- Оценка качества (релевантность, полнота, вежливость).
Пример: разметка намерений пользователя
Пример: пакетная разметка с отбором на проверку
Правила
- Всегда проверяйте случайную выборку — минимум 5–10% от всего объёма.
- Случаи с низкой уверенностью проверяйте вручную все.
- Сохраняйте версию промпта вместе с данными: при изменении инструкции метки могут расходиться.
- Не используйте разметку моделью как единственный источник правды для обучения другой модели.
17 дней назад
Никита Вихров
Похожие вопросы
108813 г. Москва, вн.тер.г. поселение Московский,
г. Московский, ул. Солнечная, д. 3А, стр. 1, помещ. 20Б/3
ОГРН 1217300010476
ИНН 7325174845


.png)


