Запущен агентский режим для ChatGPT – в нем ИИ сам выполняет сложные задачи

OpenAI только что провела презентацию ChatGPT Agent — нового агентского режима, который сочетает в себе уже существующие наработки по Operator и DeepResearch с совершенно новыми технологиями. По словам президента компании Сэма Альтмана, запуск режима означает переход от этапа “ИИ обсуждает” к этапу “ИИ делает”.

Agent доступен из интерфейса ChatGPT (веб-версия или мобильное приложение), где ему можно дать сложное задание. Показали планирование поездки на свадьбу друзей, в ходе которого агент должен был подобрать несколько вариантов одежды, подходящей под стиль свадьбы, выбрать отель на нужные даты и забронировать его. Получив задание и уточнив его, агент запускает виртуальный компьютер, в котором ему доступны разные инструменты: веб-браузер, консоль, доступ к Google Drive, OneDrive и так далее. 

В процессе работы агент может задавать дополнительные вопросы, а затем возвращается с отчетом о проделанном — в примере это расписание поездки, рекомендации по нарядам и отелям. Сделав выбор, можно попросить агента сразу же заказать нужную одежду и забронировать отели.

В другом показанном примере агенту было дано задание найти на Google Drive результаты своих бенчмарков и превратить их в презентацию. Важным элементом этой демонстрации стало то, что модель обладает “зрением”: создав первую версию, агент изучил, как она выглядит, а затем внес правки в финальный дизайн. Любопытный факт: агентский режим показал лучшие результаты в бенчмарках, чем языковые модели OpenAI — например, в Humanity’s Last Exam он набрал 42%, что ставит его на один уровень с Grok 4 и намного впереди ChatGPT o3.

Агентский режим станет доступен сегодня-завтра пользователям всех платных подписок ChatGPT, при этом Plus-пользователи получат возможность выполнять 40 заданий в месяц.

P.S. Поддержать меня можно подпиской на канал “сбежавшая нейросеть”, где я рассказываю про ИИ с творческой стороны.

Источник: habr.com

0 0 голоса
Рейтинг новости
1
0
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии