Компания OpenAI официально представила новую флагманскую ИИ-модель — GPT-5.4. Она призвана заменить сразу две модели: кодерскую GPT-5.3-Codex и универсальную GPT-5.2. Отмечается, что GPT-5.4 является самой токеноэффективной моделью, так как тратит минимум токенов (единица обработки данных для моделей ИИ) для решения тех же задач, что и предшественники.
Ключевой особенностью новой модели стал встроенный computer use. GPT-5.4 научился взаимодействовать с приложениями через интерфейс — он без проблем заполнит любую форму, нажмёт на кнопку или переключатель, а также проверит результат таких действий. До этого момента подобный функционал был доступен исключительно в экспериментальных версиях.
Ещё одно нововведение — tool search. ИИ-модель теперь подгружает определения инструментов по запросу, а не передаёт все сразу. На практике это означает использование меньшего числа токенов, а также возможность выбора более точного инструмента в агентских задачах.
И именно в агентских задачах GPT-5.4 показал рост по результатам тестирования в бенчмарках. Так, например, в OSWorld-Verified его результат составил 75% против 47,3% у GPT-5.2. В BrowseComp — 82,7% против 65,8%, а в GDPval — 83% против 70,9%.
Разработчики решили не ограничивать новую ИИ-модель в возможностях мышления, и установили уровень xhigh — это режим экстремального мышления, когда искусственный интеллекта тратит значительно больше ресурсов на решение сложных задач. Сообщается, что доля ложных утверждения сократилась на 33%, а доля ответов с ошибками снизилась на 18%.
GPT-5.4 получила поддержку компакции, то есть в ходе выполнения многошаговых задач ИИ-модель выполняет сжатие контекста, чтобы не терять ключевую информацию. Также надо отметить, что GPT-5.4 Thinking перед выполнением сложного запроса показывает план работы пользователю, чтобы тот смог скорректировать его по своему усмотрению.
GPT-5.4 стала дефолтной моделью и в API, и в Codex. Отмечается рост цены в API — 2,50 доллара США за миллион входных токенов и 15 долларов США за миллион выходных.
Источник: trashbox.ru