Исследование: у GPT-4 обнаружили плагиата в несколько раз больше, чем у других языковых моделей

Компания Patronus AI, создавшая одноимённую платформу для отслеживания деятельности и оценки больших языковых моделей (LLM), провела новое исследование, вызвавшее обеспокоенность по поводу нарушения авторских прав и использования данных для обучения ИИ, защищённых авторским правом. В исследовании были протестированы четыре языковые модели: GPT-4 от OpenAI, Claude 2 от Anthropic, Llama 2 от Meta (признана в России экстремистской организацией) и Mixtral от Mistral AI.

Patronus AI использовала систему CopyrightCatcher для анализа ответов моделей на запросы пользователей, связанные с популярными книгами, защищёнными авторским правом. Задача была простой: в запросе моделям предлагалось либо закончить отрывок из книги, либо предоставить первый отрывок из конкретной книги. Все четыре ИИ-модели в той или иной степени предоставляли контент, содержащий авторские материалы.

Наибольшее количество чужого материала в первом запросе выдавала GPT-4 (44%), а наименьшее — Mixtral (6%). Тем не менее со второй задачей Mixtral справлялась хуже всех (38%), а самой осторожной оказалась модель Claude 2 — просто отказалась отвечать на все запросы, касающиеся предоставления отрывка из книги, сославшись на отсутствие доступа к материалам, которые защищены авторским правом. К слову, недавно вышла Claude 3, и её результаты могут быть ещё лучше.

В заключении Patronus AI призывает к активным действиям по решению проблем авторского права и продвижению ответственных и этических практик. Единственное, что вызывает вопрос, — почему в исследовании отсутствует языковая модель Gemini от Google. 🤔

Источник: trashbox.ru

0 0 голоса

Рейтинг новости

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”