OpenAI представила GPT-5.1-Codex-Max — версию GPT-5.1 Thinking, специально заточенную под задачи программирования внутри кодинг-агента Codex. Модель раскатывается во всех версиях Codex для планов ChatGPT Plus, Pro, Edu и Enterprise. Выход в API ожидается позднее.
Этим релизом компания ответила на запуск Google Gemini 3 Pro — и по собственным оценкам вернула первое место в нескольких бенчмарках по программированию. В SWE-Bench Verified, который считается одним из главных бенчмарков по программированию, модель обходит Gemini 3 Pro (76,2%) и Claude Sonnet 4.5 (77,2%). Также виден рост по другим бенчмаркам.
На настройках low, medium и high модель показывает лучшие результаты, чем GPT-5.1-Codex, при этом тратит меньше токенов — то есть, работает дешевле и быстрее. Для максимального результата добавлена настройка xhigh. В OpenAI отмечают, что во внутренних тестах модель работала над задачей до 24 часов без вмешательства.
Также это первая модель, нативно обученная работать через несколько контекстных окон с помощью механизма compaction — то есть она сама «уплотняет» историю, вытаскивая главное и продолжая работу дальше. Это позволяет обрабатывать миллионы токенов в рамках одной задачи.
P.S. Поддержать меня можно подпиской на канал «сбежавшая нейросеть», где я рассказываю про ИИ с творческой стороны.
Источник: habr.com