Федеральный суд Калифорнии выдвинул обвинения в адрес Anthropic в крупномасштабном пиратстве

Федеральный суд Калифорнии одобрил коллективный иск на миллиард долларов против Anthropic, компании, создавшей языковую модель Claude, по обвинению в крупномасштабном нарушении авторских прав.

В иске утверждается, что в период с 2021 по 2022 год Anthropic загрузила с пиратских сайтов, таких как LibGen и PiLiMi, до семи миллионов книг. Это создает риск серьезных потерь для компании, даже несмотря на частичную победу в деле о добросовестном использовании, одержанную всего несколькими неделями ранее.

Дело о пиратстве в стиле Napster

Согласно постановлению суда от 17 июля 2025 года, Anthropic обвиняется в использовании протокола BitTorrent для загрузки пиратских книг с LibGen и PiLiMi. Эти файлы, как правило, в формате .epub, .pdf или .txt, хранились в центральной внутренней базе данных независимо от того, использовались ли они впоследствии для обучения моделей ИИ.

Судья Уильям Олсап охарактеризовал действия компании как «скачивание миллионов произведений в стиле Napster». В постановлении подробно описывается, как в период с января 2021 года по июль 2022 года один из соучредителей Anthropic сначала скачал около 200 000 книг из коллекции Books3, затем примерно пять миллионов книг из LibGen и ещё два миллиона из PiLiMi, ориентируясь на те книги, которых ещё не было в LibGen.

Суд постановил, что дело должно рассматриваться как коллективный иск, учитывая объём и сложность доказательств. Включены только работы, взятые из LibGen и PiLiMi, Books3 не был включён из-за отсутствия метаданных.

Финансовый риск для Anthropic значителен. Согласно законодательству США, ущерб от умышленного нарушения авторских прав может достигать 150 000 долларов за произведение.

Компания Anthropic должна предоставить полный список метаданных для загрузок LibGen и PiLiMi до 1 августа 2025 года, а истцы должны предоставить подробный список наименований и регистраций до 1 сентября 2025 года.

Добросовестное использование не относится к пиратству

В июне тот же суд постановил, что обучение моделей ИИ на книгах, полученных законным путём, может считаться добросовестным использованием, особенно если использование носит «преобразующий» характер и копии не распространяются. Но суд также дал понять, что хранение пиратских произведений во внутренней библиотеке не является добросовестным использованием.

Хотя правовой статус массового веб-скрапинга и использования общедоступных данных для обучения ИИ до сих пор не определён, решение суда устанавливает чёткую границу: пиратский контент не может считаться добросовестно использованным, даже для исследований или инноваций в области ИИ.

Дело Anthropic может стать важным прецедентом для отрасли и показать, что компании, занимающиеся искусственным интеллектом, не могут обходить законы об авторском праве при поиске обучающих данных, независимо от того, как они их используют. Это решение может повлиять на текущие судебные разбирательства против Meta*, OpenAI и других компаний, обвиняемых в использовании материалов, защищенных авторским правом, для обучения языковых моделей.

Хотите быть в курсе важных новостей из мира ИИ? Подписывайтесь на наш Telegram‑канал BotHub AI News.

*Meta и её продукты (Instagram, Facebook) запрещены на территории Российской Федерации

Перевод, источник новости здесь.

Источник: habr.com

0 0 голоса
Рейтинг новости
1
0
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии