BrowserBC копирует действия человека в браузере и превращает их в навыки для ИИ-агентов

Китайские разработчики из Navers Lab, входящей в структуру компании Einsia AI, создали BrowserBC — систему, которая позволяет обучать ИИ-агентов эффективной работе в браузере, используя реальные действия пользователей в качестве примеров. Проще говоря, она записывает, что делает человек на сайте, а затем превращает эти действия в навыки для ИИ-агентов. По словам авторов проекта, современные ИИ-агенты способны выполнять задачи на сайтах, но делают это не слишком эффективно. Они могут совершать множество лишних действий, ошибаться или теряться в сложных интерфейсах. BrowserBC призван решить эту проблему.

В основе лежит концепция клонирования поведения пользователя (agent behavior clone), то есть обучение ИИ действиям человека в графическом интерфейсе браузера. Система анализирует успешные сценарии взаимодействия пользователя с сайтами, извлекает полезную информацию и превращает в набор повторно используемых навыков. Суть в том, чтобы извлечь гораздо больше информации, чем простая последовательность кликов, включая оптимальные пути выполнения задач, особенности конкретных сайтов и практические решения.

Работает это следующим образом. Пользователь устанавливает браузерное расширение и выполняет какое-либо действие на сайте, например, авторизуется, публикует сообщение, оформляет заказ. Расширение записывает всю последовательность действий, а локальный сервер анализирует эту «траекторию» действий, разбивает её на отдельные этапы, классифицирует их и сохраняет как отдельный навык. Затем эти навыки могут использоваться в Claude Desktop (включая Claude Code), чтобы ИИ автоматически выполнял аналогичные задачи в браузере. BrowserBC формирует базу навыков, к которой в дальнейшем могут обращаться ИИ-агенты во время выполнения новых задач. Инструмент работает локально на компьютере пользователя, а данные не отправляются в облако, кроме запросов к выбранной ИИ-модели. Для работы требуется собственный API-ключ LLM (по умолчанию используется Anthropic Claude).

Результаты тестирования показывают заметный прирост производительности и эффективности. В WebArena-Hard успешность выполнения задач выросла с 60,5% до 81,4%, а в ClawBench — с 32,9% до 68,4%. Кроме того, существенно сократить количество необходимых действий к инструментам WebArena-Hard. Разработчики также отмечают, что полученные навыки могут переноситься между различными ИИ-моделями. Например, знания, извлечённые при помощи Claude Sonnet, позволили повысить успешность работы модели Qwen с 53% до 77%.

Проект опубликован на GitHub, а реальные примеры работы BrowserBC можно посмотреть на официальном сайте.

Источник: trashbox.ru

0 0 голоса
Рейтинг новости
1
0
Подписаться
Уведомить о
0 комментариев