Reddit подала иск к Anthropic, обвинив стартап в несанкционированном использовании материалов с платформы для обучения нейросети Claude. Речь идёт о более чем 100 тыс. обращений к ресурсу с июля 2024 года — после того, как Anthropic якобы запретила веб-сканирование Reddit.
В иске Reddit указывает на двуличность Anthropic. Компания публично заявляет об уважении к границам и закону, но при этом игнорирует любые правила, которые мешают ей заработать, настаивают в Reddit.
Главный юрист Reddit Бен Ли заявил, что «коммерческая эксплуатация» контента Reddit будет стоить Anthropic миллиарды долларов. По его словам, живые дискуссии с Reddit и других платформ играют центральную роль в обучении языковых моделей, таких как Claude. В целом Ли подчеркнул уникальность материалов на Reddit.
Anthropic копирует контент Reddit минимум с декабря 2021 года, игнорируя технические меры, такие как robots.txt, уточнили истцы.
В феврале 2024 года Reddit заключила сделку с Google о предоставлении данных для обучения искусственного интеллекта. По данным Bloomberg, стоимость лицензии для неназванной компании составила $60 млн в год.
Reddit — не единственная компания, которая судится с Anthropic. Осенью 2023 года Universal Music и несколько других музыкальных лейблов подали иск к ИИ-стартапу, обвинив его в незаконном использовании текстов песен для обучения своих языковых моделей. К концу 2024 года ABKCO Records, Universal Music и Concord Music заключили соглашение с Anthropic.
В августе прошлого года три автора книг подали коллективный иск к Anthropic относительно авторских прав «сотен тысяч книг», которые использовали для обучения Claude.
Источник: habr.com