Представлен проект AI uBlock Origin Blacklist для блокировки сгенерированного нейросетями контента

В сети появился новый открытый проект под названием AI uBlock Origin Blacklist. Данная инициатива представляет собой специальный список правил для популярного браузерного расширения uBlock Origin, созданный с целью скрытия сайтов, которые используют искусственный интеллект для массовой генерации статей.

Создатель проекта отмечает, что в процессе поиска информации пользователи все чаще натыкаются на страницы, полностью состоящие из текстов от нейросетей. По его наблюдениям, подобные ресурсы обычно не несут никакой полезной нагрузки, отличаются посредственным качеством материала и существуют исключительно ради заработка на рекламе или реферальных ссылках. Как поясняет автор в описании своей работы, ключевая идея предельно проста. Если бы человек хотел получить ответ от искусственного интеллекта, он бы обратился к нему напрямую. Использование поисковых систем подразумевает желание найти информацию от живого человека, у которого есть реальный опыт, мнение, идеи и креативность, чего алгоритмы пока лишены.

Особое внимание инициатор проекта уделяет проблеме безопасности. Сгенерированные тексты публикуются в огромных масштабах и практически никогда не проходят проверку со стороны редакторов. В результате нейросети могут выдавать галлюцинации и советовать читателям потенциально опасные вещи. Например, искусственный интеллект может порекомендовать выполнить вредоносные команды на персональном компьютере или смешать несовместимые химические вещества при уборке.

Процесс пополнения черного списка происходит исключительно вручную. Разработчик осознанно отказался от автоматических инструментов парсинга, поскольку современным алгоритмам все еще трудно со стопроцентной точностью выявлять машинный текст. Для определения некачественных порталов используются характерные паттерны. К ним относятся чрезмерно длинные и неестественные вступления, отсутствие ссылок на первоисточники, агрессивное продвижение коммерческих продуктов, наличие фактических ошибок и публикация сотен статей в день от одного автора. База данных фильтра размещена на платформе GitHub, и любой желающий может предложить свои варианты сайтов для блокировки.

Источник: www.playground.ru

0 0 голоса
Рейтинг новости
1
0
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии