Nvidia использовала 500 ТБ краденых книг для обучения ИИ

Компания прекрасно знала, что информация была получена с нарушением авторских прав, но это ее не остановило.

Американская компания Nvidia стала одним из центральных игроков в области ИИ не только за счет продажи востребованного оборудования, но и разработки собственных нейросетевых моделей. Но, как и остальные технологические гиганты, она столкнулась с очевидной проблемой — поиском данных для обучения искусственного интеллекта, которые не защищены авторским правом.

Так, еще в 2024 году несколько писателей подали в суд на Nvidia из-за нарушения авторских прав. В частности, предполагаемого обучения ИИ-моделей на наборе данных Books3, который включал в себя книги с пиратского сайта «Bibliotik». Компания пыталась откреститься от кражи, но истцы не отказались от обвинений и, в ходе расследования, смогли найти еще больше доказательств.

Именно поэтому в середине января 2026 года, всего несколько дней назад, писатели подали новую жалобу, которая значительно расширяла рамки иска. Оказалось, что Nvidia не просто использовала некоторые украденные книги, а намеренно скачивала миллионы рукописей, защищенных авторским правом. А также напрямую сотрудничала со скандально известной библиотекой Anna’s Archive.

Anna’s Archive, или «Архив Анны», — это некоммерческая система для пиратских библиотек, которая существует с 2022 года и ставит перед собой цель каталогизировать все существующие книги. Для того чтобы сделать всю информацию в мире максимально доступной каждому человеку.

Источник: hi-tech.mail.ru

0 0 голоса

Рейтинг новости