Группа авторов подала в суд на компанию Anthropic, обвинив её в обучении своих моделей искусственного интеллекта на пиратских книгах. Коллективный иск был подан в суд Калифорнии.
Его авторы утверждают, что Anthropic «построила многомиллиардный бизнес, воруя сотни тысяч книг, защищённых авторским правом». По их словам, компания использовала обширный набор данных с открытым исходным кодом, известный как «The Pile», для обучения семейства чат-ботов Claude AI. В этом наборе данных есть библиотека пиратских электронных книг Books3, включающая работы Стивена Кинга, Майкла Поллана и тысяч других авторов.
Среди авторов, подавших в суд на Anthropic, — Андреа Бартц, автор книги «Мы никогда не были здесь»; Чарльз Грэбер, написавший «Добрую медсестру»; и Кирк Уоллес Джонсон, автор книги «Вор перьев». Хотя в иске признаётся, что Books3 удалили из «официальной» версии The Pile, оригинальная библиотека по-прежнему доступна в Интернете. Недавнее расследование также показало, что такие компании, как Anthropic и Apple, обучали свои модели ИИ на тысячах скопированных субтитров видео YouTube, доступных в The Pile.
Ранее в этом месяце Anthropic подтвердила, что использовала The Pile для обучения Claude.
Авторы хотят, чтобы суд потребовал от компании возместить им убытки и запретить компании использовать защищённые авторским правом материалы в будущем.
В июле 2023 года несколько авторов в США уже подавали два коллективных иска к OpenAI и Meta* за нарушение авторских прав. Они заявляли, что нейросети ChatGPT и LLaMA обучались на наборах данных из пиратских библиотек, таких как Bibliotik, Library Genesis и Z-Library.
В августе того же года датская группа по борьбе с пиратством Rights Alliance добилась удаления набора данных Books3. Хотя наиболее распространённая ссылка для скачивания Books3 сейчас недоступна, резервная копия файла по-прежнему хранится на Wayback Machine Интернет-архива, и также распространяется через альтернативные источники.
*Meta Platforms признана экстремистской, её деятельность в России запрещена
Источник: habr.com