OpenAI выпустила браузер ChatGPT Atlas с интегрированными языковыми моделями. Приложение уже можно скачать на macOS, а позже появятся версии для Windows и мобильных платформ. В этой статье проверяем, что умеет очередной ИИ-браузер и пробуем заказать товар в онлайн-магазине с помощью агента.
Браузер от OpenAI опоздал с выходом. Уже есть Comet от Perplexity, Dia от разработчиков Arc, решение от Opera и несколько вариантов с открытым исходным кодом. Чтобы выделиться на этом фоне надо предлагать уникальные функции. По первому впечатлению в ChatGPT нет возможностей, которые заставили бы перейти на него с других нейробраузеров.
Единственный плюс — единый с ChatGPT подписка. Если уже пользуетесь языковыми моделями от OpenAI, то не надо ничего докупать. Достаточно просто войти в свой аккаунт. История чатов и настройки автоматически синхронизируются.
Одна из вещей, которая меня останавливала от использования нейросетевых браузеров — дополнительная подписка за 20 долларов в месяц и дороже. Я уже плачу за доступ к моделям OpenAI и не хочу платить за них же, но в обёртке от другого разработчика. Тут этого стоп-фактора нет.
Установка и интерфейс
ChatGPT Atlas уже можно скачать на macOS с чипами Apple Silicon. Установщик доступен на официальном сайте, а сам процесс стандартный, как для всех приложений. После установки надо войти в свой аккаунт ChatGPT и перенести настройки из Chrome или Safari. Для этого надо выдать приложению доступ к диску.
После этого Atlas предложит активировать память браузера. Например, с её помощью можно будет искать файлы и сайты в истории. По задумке это должно персонализировать и улучшать ответы.
В конце установки приложение покажет, сколько вы уже пользуетесь ChatGPT. Я — 1046 дней. Похоже, что фишку с такими бейджами взяли у браузера Arc. Во всяком случае в первый раз я увидел её там.
Главный экран Atlas полностью копирует интерфейс ChatGPT. Есть строка ввода запроса, выбор языковой модели и подсказки. В верхней части окна отображаются открытые вкладки и закладки.
Если ввести запрос, то на главной появятся сначала результаты поиска, а следом — сгенерированный ответ от ChatGPT c основной информацией. Сверху будут находиться переключатели между главным экраном, поиском, картинками и видео.
На любой странице есть возможность открыть чат и задавать в нём вопросы. Например, можно попросить пересказать статью, проанализировать сайты сразу на нескольких вкладках или составить план путешествия.
Переключиться с привычного браузера на нейросетевой мне довольно сложно. Я просто не знаю, что можно переложить на языковую модель, а что до сих пор надо делать самому. Экспериментами довольно быстро прощупываются границы дозволенного, но всё равно есть скептицизм к ответам. Приходится перепроверять, что ответ не выдуманный и переходить по ссылкам источников.
Агентский режим
Особое внимание OpenAI уделяет агентскому режиму в Atlas. Нейросеть может сама переходить по ссылкам, анализировать страницы и выполнять действия на сайтах. Один из сценариев в презентации — онлайн-покупки. Его и решил проверить.
Мне надо было заказать протеин. Проверим, как с задачей справится агент. Сперва указываем запрос. В нём подробно описал, какой именно протеин мне нужен. Указал требования к оценке товара, вкусу, содержанию белка в порции и весу упаковки. Сперва хотел указать «вес не менее 1 кг», но вспомнил, что упаковки у многих брендов стали заметно легче. Ниже промпт:
Найди на Озоне протеин. Требования к товару:
оценка не менее 4,8 балла;
количество отзывов более 1000 ;
не менее 20 г протеина на порцию;
шоколадный вкус;
вес упаковки — не менее 900 г.
Подбери 3-5 вариантов
Языковая модель думала четыре минуты и выдала таблицу с пятью вариантами, которые подходят под мои требования. В таблице есть название, вес упаковки, содержание белка на порцию, описание, оценка и количество отзывов. Для каждого товара нейросеть указала ссылку. Стоит отметить, что ChatGPT сразу же нашёл на странице фильтры и настроил их под мои требования, чтобы сузить поиск в выдаче.
По описанию меня устроил третий вариант. Интересно, что в таблице не оказалось протеина, который я обычно покупаю. Буду пробовать что-то новое для себя. Выделил понравившийся вариант, попросил заказать его и выбрать вариант оплаты при получении:
ChatGPT думал три минуты. За это время он успел перейти на страницу оформления и выбрать адрес доставки, но завис на способе оплаты. Оказалось, что в интерфейсе пропала кнопка «Оплата при получении». Мне казалось, что она всегда там была. Ещё я забыл указать, что планирую забрать заказ в ПВЗ. Исправил ошибки: указал адрес пункта выдачи и попросил сразу оплатить заказ. У ChatGPT ушло две минуты, чтобы выбрать новые параметры на странице оформления.
Перед оплатой в чате появился точный адрес пункта доставки и сумма заказа. На этом моменте нейросеть попросила ещё раз подтвердить, что я согласен на оплату. Даю добро и получаю письмо на почту о том, что заказ будет ждать меня в ПВЗ завтра.
Агент успешно выполнил задачу, но я так и не понял, почему в OpenAI считают такой способ онлайн-покупок удобнее. Нейросеть потратила около 10 минут на поиск товаров, оформление заказа и оплату. За это время я бы смог справиться сам.
Ощущение, что с агентским режимом OpenAI пытается зайти на сторону личных ассистентов. Услуга довольно дорогая для большинства людей, но нейросети должны частично её заменить собой. Пока за таким ИИ-помощником надо наблюдать, и полностью взять на себя простую задачу по заказу товара в онлайн-магазине он не может.
Выводы
Единственный плюс и отличие Atlas от других нейробраузеров — единый аккаунт с ChatGPT. Благодаря этому не надо оформлять ещё одну подписку. В остальном приложение похоже на аналоги. Несколько месяцев назад я тестировал открытый браузер BrowserOS со встроенным агентом. Он тоже без проблем оформил доставку и оплатил заказ.
Буду дальше пробовать разные сценарии в Atlas, но веской причины переходить с обычного браузера не вижу. Несмотря на то что во многих телеграм-каналах уже успели «похоронить» Chrome.
Ещё один существенный минус нейросетевых браузеров — недоверие языковым моделям. Приходится всё контролировать и каждый раз перепроверять, что агент не запутался в размышлениях.
Забрал картинку у Karri SaarinenИсточник: habr.com