Google показала ИИ-модель, которая пользуется браузером как человек

Google представила новую модель искусственного интеллекта Gemini 2.5 Computer Use, которая умеет работать в браузере почти как живой человек. Она может кликать мышкой, прокручивать страницы и печатать текст, чтобы выполнять задачи, которые раньше требовали прямого доступа к API.

Модель использует визуальное распознавание и логический анализ: она смотрит на запрос пользователя, оценивает ситуацию и выполняет действие — например, заполняет и отправляет форму на сайте. Это особенно полезно для тестирования интерфейсов или работы с сервисами, у которых нет прямого программного подключения.

Варианты этой технологии уже использовались в экспериментальных проектах Google — например, в Project Mariner, где ИИ-агент самостоятельно добавлял продукты в корзину интернет-магазина на основе списка ингредиентов из рецепта.

Google утверждает, что её модель превосходит конкурентов в тестах веб- и мобильных интерфейсов. В отличие от ChatGPT Agent от OpenAI или похожей функции Claude от Anthropic, Gemini 2.5 Computer Use работает только в браузере. Сейчас модель поддерживает 13 действий — открытие браузера, набор текста, перетаскивание элементов и другие базовые команды. Управление десктопной средой пока не оптимизировано.

Анонс Google состоялся на следующий день после презентации OpenAI, где показали новые мини-приложения для ChatGPT. Anthropic представила свою версию технологии «компьютерного управления» для Claude ещё в прошлом году.

Разработчики уже могут опробовать Gemini 2.5 Computer Use через Google AI Studio и Vertex AI. Есть и публичная демоверсия на Browserbase, где можно посмотреть, как модель справляется с разными заданиями в реальном времени.

Источник: lifehacker.ru

0 0 голоса

Рейтинг новости

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”