Анонимный разработчик выпустил специальный лабиринт с открытым исходным кодом, чтобы заманивать в ловушку обучающих ИИ веб-сканеров в бесконечно и случайно генерируемую серию страниц. Программу под названием Nepenthes могут развернуть владельцы ресурсов.
«Это больше на бесконечный лабиринт, в котором находится минотавр, за исключением того, что бот — это минотавр, который не может выбраться. У типичного веб-сканера, похоже, не так много логики. Он загружает URL, и, если видит ссылки на другие URL, то загружает и их. Nepenthes генерирует случайные ссылки, которые всегда указывают на него самого — сканер загружает их. Nepenthes с радостью возвращает всё больше и больше списков ссылок, указывающих на него самого», — объяснил создатель инструмента Аарон Б.
Разработчик отметил, что веб-сканеры масштабируются и непрерывно загружают ссылки из самых разных участков интернета, но Nepenthes зацикливает их работу, таким образом тратя ресурсы этих ботов.
Посмотреть, как работает Nepenthes, можно здесь. Видно, что страница загружается медленно и бесконечно ссылается на другие страницы с аналогичным темпом загрузки.
Разработчик пояснил, что его код можно использовать, чтобы «заполнить действительные URL-адреса в доменном имени сайта и свести к минимуму вероятность того, что веб-сканер получит доступ к реальному контенту». По его словам, Nepenthes можно применять и «в наступательных целях», чтобы проактивно бороться с ботами и тратить их вычислительную мощность: «Короче говоря, позвольте им всосать столько дерьма, сколько у них есть места на диске, и захлебнуться им».
Аарон Б. признал, что к разработке инструмента его подтолкнула «чистая ярость». Он пояснил, что «просто устал от того, как Интернет превращается в паноптикум для извлечения денег, как весь мир скатывается к фашизму, а олигархи всем заправляют — и стало настолько плохо, что мы не можем бойкотировать это».
По словам разработчика, страницы Nepenthes были атакованы интернет-ботами уже миллионы раз. Он также опроверг наличие способов обхода ловушки.
В прошлом году автор «Интернета для чайников» Джон Левин уже создал «самую убогую в мире ферму контента» из миллиардов взаимосвязанных одностраничных сайтов. Обучающий ИИ бот OpenAI переходил по этим ссылкам более 3 млн раз за один день.
Также сообщалось, что сайт компании 3D-моделей Triplegangers в первые выходные января перестал работать из-за распределённой атаки типа «отказ в обслуживании». Её вызвали поисковые боты от OpenAI. Владельцы других веб-сайтов пожаловались, что боты OpenAI обрушили их сайты и увеличили их счета AWS. Исследование компании по цифровой рекламе DoubleVerify показало, что веб-скраперы ИИ в 2024 году способствовали увеличению трафика на 86%.
Источник: habr.com