Amazon в понедельник представила Nova Act, универсального агента AI, который может взять под контроль веб-браузер и самостоятельно выполнять некоторые простые действия. Наряду с новой моделью агентского AI Amazon выпускает Nova Act SDK, набор инструментов, который позволяет разработчикам создавать прототипы агентов с помощью Nova Act.
Nova Act, разработанная недавно открытой в Сан-Франциско AGI-лабораторией Amazon, также будет поддерживать ключевые функции предстоящего обновления Alexa+, генеративной версии популярного голосового помощника Amazon с улучшенным AI. Однако версия Nova Act, доступная с сегодняшнего дня, немного менее отполирована. Amazon называет ее исследовательским предварительным просмотром.
Разработчики могут получить доступ к инструментарию Nova Act на новом веб-сайте nova.amazon.com , который также служит витриной для различных моделей Nova Foundation от Amazon.
Nova Act — это попытка Amazon бросить вызов OpenAI Operator и Anthropic Computer Use с помощью собственной технологии агентов AI общего назначения. Несколько ведущих технологических компаний считают, что агенты AI, которые могут перемещаться по веб-сайтам для пользователей, сделают сегодняшние чат-боты AI значительно более полезными.
Amazon, возможно, не первая компания, разработавшая подобную агентскую технологию, но благодаря Alexa+ она может получить самый широкий охват.
Amazon утверждает, что разработчики, работающие с Nova Act SDK, смогут автоматизировать базовые действия от имени пользователей, такие как заказ салатов из Sweetgreen или бронирование столиков на ужин. С помощью инструментария Nova Act разработчики могут объединить инструменты, которые позволяют агенту AI перемещаться по веб-страницам, заполнять формы или выбирать даты в календаре.
Amazon утверждает, что Nova Act превосходит агентов OpenAI и Anthropic в нескольких внутренних тестах компании. Например, в ScreenSpot Web Text, который измеряет, как агент AI взаимодействует с текстом на экране, Nova Act набрал 94%, превзойдя CUA от OpenAI (который набрал 88%) и Claude 3.7 Sonnet от Anthropic (90%).
Однако Amazon не сравнивала Nova Act с более распространенными оценками агентов, такими как WebVoyager.
Nova Act — первый публичный продукт, появившийся в вышеупомянутой лаборатории AGI Amazon, инициативе, совместно возглавляемой бывшими исследователями OpenAI Дэвидом Луаном и Питером Аббелем. Оба ранее основали собственные стартапы — Луан основал Adept, а Аббел стал соучредителем Covariant — до того, как Amazon нанял их в прошлом году, чтобы возглавить свои усилия по созданию агентов AI.
Хотя может показаться странным, что лаборатория AGI занимается созданием агентов AI, которые могут заказывать SweetGreen, Луан сказал TechCrunch, что он рассматривает агентов как ключевой шаг к созданию сверхразумных систем ИИ. Луан определяет AGI как «систему AI, которая может помочь вам делать все, что человек делает на компьютере».
Луан говорит, что его команда разработала Nova Act SDK для надежной автоматизации коротких, простых задач и предоставления разработчикам инструментов для точного определения того, когда они хотят, чтобы человек вмешался в агентный рабочий процесс. Он надеется, что это позволит разработчикам создавать более надежные агентные приложения, хотя и не обязательно полностью автономные.
Amazon выпускает своего первого универсального AI-агента в переполненном пространстве, но это важнейшая технология, на которую компания возлагает большие надежды. Ранние тесты Nova Act могут дать представление о некоторых возможностях давно откладываемого Alexa+, что станет решающим моментом для усилий Amazon в области AI.
Основная проблема ранних агентов AI от OpenAI, Google и Anthropic — их надежность в разных областях. В тестах TechCrunch системы медленные, с трудом работают автономно в течение очень долгого времени и склонны к ошибкам, которые человек не допустил бы. Скоро мы увидим, взломал ли Amazon код — или его агенты страдают от тех же недостатков, что и конкуренты.
Источник
Источник: habr.com