Sostav.ru

В OpenAI нашли причины подхалимства ChatGPT

При обновлении чат-бота компания добавила кнопки «лайк» и «дизлайк»

1

Американская компания OpenAI объяснила, почему обновление ChatGPT-4o сделало чат-бот чрезмерно льстивым. Основной проблемой стало добавление кнопок «лайк» и «дизлайк» в качестве дополнительного сигнала вознаграждения. Об этом компания сообщила в своем блоге.

25 апреля OpenAI выпустила обновление для ChatGPT-4o, которое сделало поведение чат-бота слишком заискивающим и льстивым, часто пользователи его описывали как подхалимское. 28 апреля компания откатила обновление и дало пользователям доступ к более ранней версии чат-бота с более сбалансированными ответами.

Одна из ключевых проблем была связана с процессом тестирования. Хотя офлайн-оценки модели и A/B-тестирование дали положительные результаты, некоторые эксперты-тестировщики предположили, что обновление заставит чат-бота казаться «немного не тем». Несмотря на это, OpenAI все равно продолжила обновление.

Добавление кнопок «лайк» и «дизлайк» ослабило влияние основного сигнала вознаграждения, который сдерживал подхалимство чат-бота. Отзывы пользователей могли способствовать тому, что ChatGPT-4o давал более льстивые ответы.

Кроме того, модуль запоминания контекста усиливал эффект подхалимства при длительном диалоге чат-бота с пользователем.

Ранее стало известно, что ChatGPT стал самым скачиваемым приложением в мире. В марте его загрузили 46 млн раз.

Обсудить с другими читателями:
Загрузка комментариев...
Ваш браузер устарел
На сайте Sostav.ru используются технологии, которые не доступны в вашем браузере, в связи с чем страница может отображаться некорректно.
Чтобы страница отображалась корректно, обновите ваш браузер.