Запущен агентский режим для ChatGPT – в нем ИИ сам выполняет сложные задачи

OpenAI только что провела презентацию ChatGPT Agent — нового агентского режима, который сочетает в себе уже существующие наработки по Operator и DeepResearch с совершенно новыми технологиями. По словам президента компании Сэма Альтмана, запуск режима означает переход от этапа “ИИ обсуждает” к этапу “ИИ делает”.

Agent доступен из интерфейса ChatGPT (веб-версия или мобильное приложение), где ему можно дать сложное задание. Показали планирование поездки на свадьбу друзей, в ходе которого агент должен был подобрать несколько вариантов одежды, подходящей под стиль свадьбы, выбрать отель на нужные даты и забронировать его. Получив задание и уточнив его, агент запускает виртуальный компьютер, в котором ему доступны разные инструменты: веб-браузер, консоль, доступ к Google Drive, OneDrive и так далее.

В процессе работы агент может задавать дополнительные вопросы, а затем возвращается с отчетом о проделанном — в примере это расписание поездки, рекомендации по нарядам и отелям. Сделав выбор, можно попросить агента сразу же заказать нужную одежду и забронировать отели.

В другом показанном примере агенту было дано задание найти на Google Drive результаты своих бенчмарков и превратить их в презентацию. Важным элементом этой демонстрации стало то, что модель обладает “зрением”: создав первую версию, агент изучил, как она выглядит, а затем внес правки в финальный дизайн. Любопытный факт: агентский режим показал лучшие результаты в бенчмарках, чем языковые модели OpenAI — например, в Humanity’s Last Exam он набрал 42%, что ставит его на один уровень с Grok 4 и намного впереди ChatGPT o3.

Агентский режим станет доступен сегодня-завтра пользователям всех платных подписок ChatGPT, при этом Plus-пользователи получат возможность выполнять 40 заданий в месяц.

P.S. Поддержать меня можно подпиской на канал “сбежавшая нейросеть”, где я рассказываю про ИИ с творческой стороны.

Источник: habr.com

0 0 голоса

Рейтинг новости

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”