В течение последних пары лет большие языковые модели демонстрируют внушительный рост, но при этом возникает множество этических споров относительно того, как эти LLM обучают. Например, довольно часто встаёт вопрос о том, стоит ли разрешать большим компаниям, занимающимся искусственным интеллектом, обучать свои модели на книгах, защищённых авторским правом. И вчера, 24 июня, Уильям Алсап (William Alsup), окружной судья США, дал ответ на этот вопрос, встав на сторону компании Anthropic, разработчика семейства больших языковых моделей Claude. Он заявил, что использование книг, защищённых авторским правом, для обучения больших языковых моделей попадает под критерии добросовестного использования. Подписывайтесь Telegram-канал про технологии
Вероятно, данное судебное решение станет огромным облегчением для компаний вроде OpenAI или Google, которые использовали тысячи или даже миллионы различного рода книг, тоже защищённых авторским правом, для обучения своих больших языковых моделей. Ведь теперь гиганты рынка могут не переживать, что им придётся тратить внушительные суммы на выплаты авторам, ссылаясь на добросовестное использование. Правда, в решении судьи есть довольно спорный момент — Уильям Алсап отметил, что хранение произведений авторов в «централизованной библиотеке» нарушает авторские права писателей, но это просто необходимо для предварительной подготовки данных перед началом обучения LLM.
Также судья отреагировал на жалобы авторов, которые заявили, что довольно часто книги, используемые для обучения больших языковых моделей, загружаются с пиратских сайтов. Уильям Алсап заявил, что такого рода манипуляции являются незаконными и нарушают авторские права писателей, так что компаниям, желающим обучать свои модели, стоит приобретать легальные копии книг. Что, вероятно, не сильно ударит по карманам крупнейших компаний на рынке, но существенно ограничит возможности менее «богатых» игроков в сегменте ИИ.
Безусловно, это дело имеет огромное значение для индустрии искусственного интеллекта, поскольку это, пожалуй, первое официальное судебное решение по вопросу добросовестного использования в контексте генеративного ИИ. Теперь американские компании смогут ссылаться на данный прецедент в будущих судебных прениях, имея гораздо больше шансов выйти сухим из воды. Но для авторов произведений, конечно, новость не очень приятная.
Источник: trashbox.ru