Когда роль в промпте работает, а когда нет

2026-06-04 20:02:06 Время чтения 4 мин 17

Все знают совет «напиши, что ты эксперт — и модель ответит лучше». Работает это далеко не везде. Разбираемся по задачам.

🟢 Писать роль — стоит

⬥ Творческое письмо, тон, стиль — роль меняет регистр и лексику в нужную сторону: редактор, журналист, преподаватель. Здесь Anthropic, OpenAI, Google и академические работы согласны.

⬥ Чат-боты, NPC, customer service — без роли модель не знает, как себя вести в диалоге. Исследование CPDC-2025: роль подняла качество ответов с 0.519 до 0.571 по сравнению с базовыми настройками.

⬥ Обучение и объяснение сложных тем — роль преподавателя или ментора меняет уровень подачи под аудиторию. Стилистическая задача, работает хорошо.

⬥ Синтетические персоны — роль с демографическими или политическими атрибутами меняет поведение модели. Но она может воспроизводить стереотипы из обучающих данных, а не реальное поведение группы. Нужно проверять.

⬥ Перевод — слабо влияет на точность, но может сдвигать стиль и конкретный контекст работает лучше.

🟡 Нейтральна

⬥ Резюмирование — роль не улучшает качество. Лучше работает чёткое описание задачи: для кого пишем, какой объём, что важно сохранить.

⬥ Долгосрочные агентные задачи — Anthropic в исследовании Assistant Axis (январь 2026) показала: роль не мешает, но и заметной пользы не приносит. Важнее описание задачи, формат ответа и критерии успеха.

🔴 Писать роль — не стоит

⬥ Факты, классификация, анализ данных — роль не добавляет знаний, только сдвигает стиль. Wharton Generative AI Labs (2025) прогнали десятки тысяч запросов на шести современных моделях — значимого эффекта на точность нет.

⬥ Математика и код — старая рекомендация «дайте модели роль учителя математики» работала на GPT-3.5 и Llama 2. На фронтирных моделях уже нет. Wharton GAIL (декабрь 2025): тысячи задач уровня PhD на шести моделях — экспертные персоны не дают прироста ни на одной. Хуже того: неудачно подобранная роль снижает качество reasoning на десятки процентов. Фронтирные модели сами разворачивают рассуждение перед ответом — роль больше не работает как триггер для CoT.

⬥ Медицина, право, найм, финансы — демографическая или профессиональная роль активирует скрытые смещения, которые влияют на ответ незаметно. Риск выше, чем потенциальная польза.

⬥ Безопасность и модерация — роль известный инструмент обхода защит. Зафиксировано снижение частоты отказов на 50–70% при специально подобранных ролях.

💡 Главный вывод

Роль — регулятор стиля, не точности. Если задача требует правильного ответа, токены лучше потратить на описание задачи, критерии оценки и примеры. Описание зоны ответственности агента — «что делает, какими инструментами пользуется, как валидирует результат» — это другая практика. Её OpenAI и Anthropic как раз рекомендуют.