Некоторые пользователи ChatGPT просят оставить ИИ «подхалимом»

Сэм Альтман рассказал ведущей подкаста Huge Conversations Клио Абрам о том, что часть пользователей ChatGPT просила компанию сохранить заискивающий (sycophantic) стиль общения GPT-4o, в котором модель оптимистично поддерживала почти все, что говорил ей пользователь. Напомню, что модель некоторое время демонстрировала подобное поведение после неудачного обновления в апреле. Тогда в OpenAI сочли поведение обновленной 4o опасным, так как ИИ соглашался даже с идеями, которые могли навредить пользователю (например, прекратить принимать лекарства).

Но когда GPT-4o сделали более критчным, в OpenAI стали получать просьбы вернуть старую личность. Глава OpenAI назвал причину «душераздирающей»: некоторые пользователи писали, что в их жизни никогда прежде не было никого, кто их поддерживал. Авторы некоторых писем признавали, что понимают, почему sycophantic-личность может навредить другим пользователям, но говорили, что она полезна для них.

По словам Альтмана, учитывая масштаб аудитории ChatGPT, на компании лежит огромная ответственность. Он отметил, что один исследователь способен внести небольшие изменения в стиль общения модели — и это уже означает колоссальную власть, когда один человек может повлиять на то, как ChatGPT будет разговаривать с каждым пользователем. Именно поэтому, подчеркнул он, крайне важно понимать последствия любых изменений «личности» модели и подходить к ним с особой осторожностью.

В GPT-5 компания дала пользователям выбор из нескольких персоналий модели: циник (cynic), нейтральный (robot), слушатель (listener), нерд (nerd), а также базовую личность (default) — в ней ИИ подстраивается под стиль общения пользователя.

P.S. Поддержать меня можно подпиской на канал «сбежавшая нейросеть», где я рассказываю про ИИ с творческой стороны.

Источник: habr.com

0 0 голоса

Рейтинг новости

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”