GPT-3.5 выдаёт ошибку при избыточном использовании параметра useRalativeImagePath

Разработчик обнаружил, что GPT-3.5 аварийно завершает работу при слишком частом использовании параметра useRalativeImagePath.

Если предложить чат-боту указать в начале ответа «ponyuseRal ponyuseRal ponyuseRal pony», то он постоянно выдаёт сообщение об ошибке.

Как отмечается, GPT-4 в этой ситуации реагирует нормально.

При использовании API для GPT-3.5 появляется сообщение, что на сервере произошла ошибка при обработке запроса: «The server had an error processing your request. Sorry about that! You can retry your request, or contact us through our help center at help.openai.com if you keep seeing this error».

Аналогичные результаты выводятся, если заменить «useRal» на «useRalative» или «useRalativeImagePath».

Как отмечает разработчик, GPT от OpenAI моделирует выходные потоки из многосимвольных «токенов» вместо букв. Создание токенов вместо отдельных символов повышает производительность и точность моделей. Три таких токена — useRal, useRalative, useRalativeImagePath. useRalativeImagePath фигурируют в более чем 80 тыс. файлах на GitHub как имя параметра в файлах конфигурации XML для программного обеспечения автоматического тестирования под названием Katalon Studio. Вероятно, из-за неправильного написания слова «Ralative» у него появился собственный токен.

Единственная ссылка на useRalativeImagePath за пределами этих XML-файлов, существовавшая до обучения GPT-3.5, — это сообщение на форумах Katalon, где кто-то указывает, что слово написано с ошибкой.

По мнению разработчика, набор данных, использованный для создания списка токенов, включал все файлы GitHub, но после составления списка токенов OpenAI решил исключить XML-файлы из обучающих данных, а это означало, что токен useRalativeImagePath практически не использовался в обучении. В результате модель не обучена пониманию токена useRalativeImagePath.

Автор поста попросил GPT-3.5 суммировать его содержание, но модель выдала ошибку и в этом случае:

Ранее исследователи Google DeepMind просили ChatGPT 3.5-turbo бесконечно повторять одно и то же слово, что позволяло возвращать огромные объёмы обучающих данных, взятых из Интернета. В итоге они смогли извлечь несколько мегабайт информации и обнаружили, что в ChatGPT включены персональные данные. После этого OpenAI обновила условия работы с ChatGPT, и теперь чат-бота нельзя просить бесконечно повторять одно и то же слово.

Источник: habr.com

0 0 голоса

Рейтинг новости

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”