OpenAI только что провела презентацию ChatGPT Agent — нового агентского режима, который сочетает в себе уже существующие наработки по Operator и DeepResearch с совершенно новыми технологиями. По словам президента компании Сэма Альтмана, запуск режима означает переход от этапа “ИИ обсуждает” к этапу “ИИ делает”.
Agent доступен из интерфейса ChatGPT (веб-версия или мобильное приложение), где ему можно дать сложное задание. Показали планирование поездки на свадьбу друзей, в ходе которого агент должен был подобрать несколько вариантов одежды, подходящей под стиль свадьбы, выбрать отель на нужные даты и забронировать его. Получив задание и уточнив его, агент запускает виртуальный компьютер, в котором ему доступны разные инструменты: веб-браузер, консоль, доступ к Google Drive, OneDrive и так далее.
В процессе работы агент может задавать дополнительные вопросы, а затем возвращается с отчетом о проделанном — в примере это расписание поездки, рекомендации по нарядам и отелям. Сделав выбор, можно попросить агента сразу же заказать нужную одежду и забронировать отели.
В другом показанном примере агенту было дано задание найти на Google Drive результаты своих бенчмарков и превратить их в презентацию. Важным элементом этой демонстрации стало то, что модель обладает “зрением”: создав первую версию, агент изучил, как она выглядит, а затем внес правки в финальный дизайн. Любопытный факт: агентский режим показал лучшие результаты в бенчмарках, чем языковые модели OpenAI — например, в Humanity’s Last Exam он набрал 42%, что ставит его на один уровень с Grok 4 и намного впереди ChatGPT o3.
Агентский режим станет доступен сегодня-завтра пользователям всех платных подписок ChatGPT, при этом Plus-пользователи получат возможность выполнять 40 заданий в месяц.
P.S. Поддержать меня можно подпиской на канал “сбежавшая нейросеть”, где я рассказываю про ИИ с творческой стороны.
Источник: habr.com