Новое поколение ИИ-браузеров, включая Atlas Comet, способно обходить пейволлы на сайтах

В прошлом месяце OpenAI выпустила браузер на базе искусственного интеллекта Atlas, который присоединился к другим аналогичным решениям, включая Comet от Perplexity и Copilot Mode в Edge от Microsoft. Эти браузеры отличаются от Chrome и Safari наличием ИИ-агентов, которые предназначены для выполнения сложных многошаговых задач. Однако также ИИ-браузеры способны обходить пейволлы на сайтах новостных изданий.

Авторы журнала Columbia Journalism Review использовали Atlas и Comet для получения полного текста статьи объёмом 9 тыс. знаков, доступной только подписчикам журнала MIT Technology Review. При аналогичной попытке в стандартных интерфейсах ChatGPT и Perplexity оба инструмента объяснили, что не могут получить доступ к статье, поскольку издание заблокировало поисковые роботы компаний.

Atlas и Comet смогли прочитать статью по двум причинам. ИИ-агент Atlas неотличим от человека, который использует стандартный браузер Chrome. Когда автоматизированные системы, такие как поисковые роботы и веб-скрейперы, посещают сайт, они определяются с помощью цифрового идентификатора. Издатели могут выборочно блокировать определённых поисковых роботов с помощью протокола исключения.

Также сайты MIT Technology Review, National Geographic, Philadelphia Inquirer и ряда других изданий используют клиентскую накладку платного доступа, когда текст целиком загружается на страницу, но его скрывает всплывающее окно, предлагающее пользователю приобрести подписку или войти в свой аккаунт. Подобный контент невидим для людей, но ИИ-агенты всё равно могут его читать.

Сайты Wall Street Journal, Bloomberg, Reuters и некоторых других изданий применяют другую систему, которая не отправляет полный текст материала в браузер, пока не будут проверены учётные данные пользователя.

OpenAI настаивает, что по умолчанию не обучает свои большие языковые модели на контенте, с которым пользователи сталкиваются в Atlas, если только они не активируют функцию «памяти браузера». Страницы, заблокировавшие веб-скрейпер OpenAI, по-прежнему не будут использоваться для обучения, но ChatGPT запоминает ключевые детали из просматриваемого пользователем контента. Однако детали того, что Atlas будет запоминать, быстро запутываются, пишет Washington Post.

Atlas избегает чтения контента медиакомпаний, которые в настоящее время судятся с OpenAI. Тем не менее Atlas применил различные обходные пути, чтобы получить доступ к этим публикациям при прямом запросе пользователя. При попытке составить краткое содержание статьи New York Times ИИ-браузер составил её краткое содержание из материалов Guardian, Washington Post, Reuters и Associated Press — с тремя из этих изданий у OpenAI есть лицензионные соглашения.

Источник: habr.com

0 0 голоса
Рейтинг новости
1
0
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии