Китайский стартап Monica представляет AI-агента Manus для решения сложных задач

Новый агент AI под названием Manus, разработанный китайским стартапом Monica, демонстрирует возможности решения сложных задач от планирования путешествий до финансового анализа без вмешательства человека. Хотя ранние демонстрации привлекли внимание, система остается в ограниченном выпуске, а ключевые технические детали не разглашаются.

Веб -сайт Manus демонстрирует, как агент обрабатывает реальные задачи, показывая примеры его рабочего процесса от первоначального запроса до конечного результата. Примеры включают задачи, варьирующиеся от создания маршрута путешествия до построения панели управления.

Система работает с помощью текстовых подсказок — пользователи описывают, чего они хотят достичь, а Manus преобразует эти инструкции на естественном языке в выполненные задачи. Например, когда дается подсказка об анализе акций Tesla, система автоматически создает и публикует интерактивную панель мониторинга на общедоступном URL-адресе.

На веб-сайте Manus представлены подробные примеры того, как агент обрабатывает первоначальные подсказки и выполняет задания, хотя публичный доступ остается ограниченным.

Соучредитель и главный научный сотрудник Monica Ичао Пик Цзи объясняет в видеопрезентации, как Manus выходит за рамки традиционных чат-ботов и систем рабочих процессов. В отличие от инструментов, которые только предлагают предложения, Manus может выполнять действия напрямую через веб-интерфейсы. Название происходит от «Mens et Manus» (лат. «разум и рука»), что отражает его двойную способность планировать и выполнять веб-задачи — аналогично Operator от OpenAI и Claude Computer Use от Anthropic.

По словам Моники, Manus превосходит функцию глубоких исследований OpenAI на бенчмарке GAIA, который оценивает агентов AI на практических задачах. Однако компания мало что рассказала о своей базовой технологии, что затрудняет независимую проверку этих заявлений о производительности.

Manus утверждает, что установил рекорды производительности на всех уровнях сложности GAIA. График начинает ось x с 30% вместо 0%, что делает лидерство Manus в производительности более драматичным

Первоначальное тестирование показывает, что Manus работает как в стандартном, так и в высокопроизводительном режиме. Это говорит о том, что он использует модель рассуждений, похожую на Operator от OpenAI, которая улучшает качество вывода за счет дополнительного времени обработки. Operator достигает этого с помощью модели o3, которая была настроена с помощью обучения с подкреплением специально для веб-задач.

Пользователи поделились примерами на X, демонстрирующими такие возможности, как автоматизированное редактирование подкастов. Реакция была в основном положительной , некоторые ранние тестировщики сравнивали его с Deepseek — еще одним китайским стартапом, который удивил отрасль, сравнившись с западными возможностями AI.

Перед разработкой Manus основатель Сяо Хун основал Monica в 2022 году, создав расширение браузера, которое интегрировало несколько языковых моделей для международных рынков. Стартап получил поддержку от известных китайских инвесторов ZhenFund и Tencent, а соучредитель Цзи Ичао поделился опытом, полученным в ходе его работы по созданию Peak Labs и разработке поисковой системы Magi.

Хун, известный как «Рэд», получил степень инженера-программиста в Университете науки и технологий Хуачжун (Huazhong University of Science and Technology, HUST). В его послужном списке — основание Nightingale Technology, где он разработал двух помощников с искусственным интеллектом — «Yi Ban» и «Wei Ban», — которые привлекли более двух миллионов корпоративных пользователей.

South China Morning Post сообщает, что неожиданный спрос привел к ранним ограничениям, поставив под сомнение возможности системы. Партнер по продукту Чжан Тао признает, что их инфраструктура была разработана только для демонстраций, описывая текущую версию как «все еще находящуюся в зачаточном состоянии, далекую от того, что мы стремимся предоставить в нашем конечном продукте».

Остаются вопросы о технологии, на которой работает Manus. Хотя система, скорее всего, основана на существующих больших языковых моделях (LLM), команда не уточнила, на каких именно. Похожие вопросы возникают и вокруг Deepseek, еще одной китайской компании ИИ, которая, как сообщается, использовала данные, сгенерированные OpenAI, для обучения.

В настоящее время система функционирует в режиме веб-превью, доступ к которому возможен только по приглашению, а в этом году планируется открыть исходный код некоторых частей технологии, что подтверждает ее принадлежность к разработкам с открытым исходным кодом.

Гонка за разработку автономных агентов AI продолжается, с переменным прогрессом в отрасли. OpenAI запустила свою систему Operator и новую многоагентную структуру под названием «Swarm», хотя раннее тестирование Operator выявило значительные проблемы с надежностью.

Агент браузера Google Mariner использует аналогичный подход, включая расширенные возможности планирования и несколько типов памяти. Лидеры отрасли сохраняют оптимизм — и Хассабис из Google DeepMind, и Хуан из Nvidia ожидают появления функциональных систем агентов в течение двух лет.

Однако исследователи безопасности подчеркивают осторожность. Недавние исследования показывают, что агентами ИИ можно манипулировать , создавая особые риски, когда эти системы имеют доступ к персональным веб-сервисам и аккаунтам пользователей.

Источник

Источник: habr.com

0 0 голоса

Рейтинг новости

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”