Cloudflare представила инструмент для борьбы с ботами, которые собирают данные для обучения ИИ

Компания Cloudflare, известная своими облачными услугами по предоставлению DNS и защите от DDoS-атак, запустила новый бесплатный инструмент для защиты веб-сайтов от ботов, которые несанкционированно извлекают данные для обучения моделей искусственного интеллекта. Это решение должно помочь владельцам сайтов защитить свой контент от незаконного использования.

Проблема сбора данных ботами ИИ стала особенно актуальной на фоне роста популярности генеративного ИИ. Многие сайты опасаются, что поставщики ИИ будут использовать их контент без разрешения и какой-либо компенсации. Согласно исследованию, около 26% из 100 крупнейших новостных сайтов заблокировали бота OpenAI, а 242 сайта из 1000 наиболее популярных также в настоящее время блокируют GPTBot. Более 600 крупных новостных издателей уже заблокировали различных ботов.

Cloudflare проанализировала трафик краулеров и разработала автоматические модели их обнаружения. Эти модели учитывают различные факторы, включая попытки ботов имитировать действия человека, использующего веб-браузер. Также создана специальная форма, позволяющая сообщать о подозрительных ботах и сканерах. На основе полученных данных Cloudflare будет вручную заносить ботов ИИ в черный список.

Некоторые крупные игроки в сфере ИИ, такие как Google, OpenAI и Apple, позволяют владельцам сайтов блокировать ботов через специальный файл robots.txt. Однако далеко не все владельцы подобных ботов соблюдают эти правила. Cloudflare отмечает, что некоторые компании ИИ намеренно обходят ограничения доступа к контенту, постоянно адаптируясь и меняя свои алгоритмы, чтобы избежать обнаружения.

Хотя инструменты, подобные разработке Cloudflare, могут помочь в борьбе с несанкционированным сбором данных, остается вопрос, насколько это окажется эффективным в долгосрочной перспективе. Введение новых методов защиты контента является важным шагом в обеспечении безопасности и справедливости в использовании данных для обучения ИИ.

Cloudflare заявляет, что новый инструмент защитит сайты, размещённые на их платформе, от извлечения контента для обучения ИИ-моделей. Эта инициатива направлена на то, чтобы предоставить владельцам сайтов больше контроля над своим контентом и предотвратить его несанкционированное использование.

Источник: overclockers.ru

0 0 голоса

Рейтинг новости

24539

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”