Anthropic обучила LLM на книгах, защищённых авторским правом: суд не увидел в этом проблемы

В течение последних пары лет большие языковые модели демонстрируют внушительный рост, но при этом возникает множество этических споров относительно того, как эти LLM обучают. Например, довольно часто встаёт вопрос о том, стоит ли разрешать большим компаниям, занимающимся искусственным интеллектом, обучать свои модели на книгах, защищённых авторским правом. И вчера, 24 июня, Уильям Алсап (William Alsup), окружной судья США, дал ответ на этот вопрос, встав на сторону компании Anthropic, разработчика семейства больших языковых моделей Claude. Он заявил, что использование книг, защищённых авторским правом, для обучения больших языковых моделей попадает под критерии добросовестного использования. Подписывайтесь Telegram-канал про технологии

Вероятно, данное судебное решение станет огромным облегчением для компаний вроде OpenAI или Google, которые использовали тысячи или даже миллионы различного рода книг, тоже защищённых авторским правом, для обучения своих больших языковых моделей. Ведь теперь гиганты рынка могут не переживать, что им придётся тратить внушительные суммы на выплаты авторам, ссылаясь на добросовестное использование. Правда, в решении судьи есть довольно спорный момент — Уильям Алсап отметил, что хранение произведений авторов в «централизованной библиотеке» нарушает авторские права писателей, но это просто необходимо для предварительной подготовки данных перед началом обучения LLM.

Также судья отреагировал на жалобы авторов, которые заявили, что довольно часто книги, используемые для обучения больших языковых моделей, загружаются с пиратских сайтов. Уильям Алсап заявил, что такого рода манипуляции являются незаконными и нарушают авторские права писателей, так что компаниям, желающим обучать свои модели, стоит приобретать легальные копии книг. Что, вероятно, не сильно ударит по карманам крупнейших компаний на рынке, но существенно ограничит возможности менее «богатых» игроков в сегменте ИИ.

Безусловно, это дело имеет огромное значение для индустрии искусственного интеллекта, поскольку это, пожалуй, первое официальное судебное решение по вопросу добросовестного использования в контексте генеративного ИИ. Теперь американские компании смогут ссылаться на данный прецедент в будущих судебных прениях, имея гораздо больше шансов выйти сухим из воды. Но для авторов произведений, конечно, новость не очень приятная.

Источник: trashbox.ru

0 0 голоса

Рейтинг новости

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”