В Gemini 3,5 Flash внедрен инструмент для управления компьютером

Google добавила инструмент под названием Computer Use непосредственно в архитектуру модели Gemini 3,5 Flash. Ранее эта опция присутствовала исключительно в виде отдельной специализированной модификации Gemini 2,5. Текущая интеграция позволяет ИИ-агентам выполнять комплексные задачи, взаимодействуя с интерфейсом операционных систем на различных платформах. Модель способна анализировать происходящее на экране, выстраивать логические цепочки и совершать целевые действия в браузерах, мобильных операционных системах, а также в десктопных средах.

Внедрение функции расширяет возможности автоматизации сложных рутинных процессов. Сюда относится непрерывное тестирование программного обеспечения, а также выполнение структурированной работы с информацией внутри корпоративных приложений. Инструмент призван помочь разработчикам в создании кастомных цифровых помощников для бизнеса. Доступ к управлению компьютером предоставляется через стандартный интерфейс Gemini API и специализированную платформу Gemini Enterprise Agent Platform.

Для минимизации рисков несанкционированного вмешательства и уязвимостей создатели провели целенаправленное состязательное обучение модели. Дополнительно предлагаются два защитных механизма для корпоративного сегмента. Первый запрашивает обязательное подтверждение от пользователя при выполнении критических или необратимых действий, второй автоматически останавливает текущую сессию в случае обнаружения признаков сторонней инъекции в текстовых подсказках. Начать тестирование новой функциональности можно в демонстрационной среде на площадке Browserbase.

Источник: mobile-review.com

0 0 голоса
Рейтинг новости
1
0
Подписаться
Уведомить о
0 комментариев