Американская компания OpenAI объяснила, почему обновление ChatGPT-4o сделало чат-бот чрезмерно льстивым. Основной проблемой стало добавление кнопок «лайк» и «дизлайк» в качестве дополнительного сигнала вознаграждения. Об этом компания сообщила в своем блоге.
25 апреля OpenAI выпустила обновление для ChatGPT-4o, которое сделало поведение чат-бота слишком заискивающим и льстивым, часто пользователи его описывали как подхалимское. 28 апреля компания откатила обновление и дало пользователям доступ к более ранней версии чат-бота с более сбалансированными ответами.
Одна из ключевых проблем была связана с процессом тестирования. Хотя офлайн-оценки модели и A/B-тестирование дали положительные результаты, некоторые эксперты-тестировщики предположили, что обновление заставит чат-бота казаться «немного не тем». Несмотря на это, OpenAI все равно продолжила обновление.
Добавление кнопок «лайк» и «дизлайк» ослабило влияние основного сигнала вознаграждения, который сдерживал подхалимство чат-бота. Отзывы пользователей могли способствовать тому, что ChatGPT-4o давал более льстивые ответы.
Кроме того, модуль запоминания контекста усиливал эффект подхалимства при длительном диалоге чат-бота с пользователем.
Ранее стало известно, что ChatGPT стал самым скачиваемым приложением в мире. В марте его загрузили 46 млн раз.