OpenAI представила модель GPT-5.3-Codex: она помогала в разработке самой себя

Вчера, 5 февраля, компания OpenAI официально представила свою новую большую языковую модель GPT-5.3-Codex, которая, по словам представителей ИИ-гиганта, является самой мощной на сегодняшний день агентской ИИ-моделью в вопросах программирования. В компании рассказали, что LLM объединила передовые возможности в области написания кода модели GPT-5.2-Codex с возможностями GPT-5.2 в области рассуждений и профессиональных знаний. И, что довольно примечательно, в результате новинка может выполнять те же задачи, что и вышеперечисленные модели, только на 25% быстрее. Подписывайтесь на Telegram-канал про технологии

Но куда интереснее, что GPT-5.3-Codex является первой моделью в арсенале OpenAI, которая сыграла решающую роль в своей же разработке. В официальном блоге представители бренда заявили, что команда Codex использовала ранние версии этой модели для отладки процессов обучения, управления развёртыванием LLM и диагностики результатов тестирования. «С GPT-5.3-Codex платформа Codex превращается из агента, способного писать и проверять код, в агента, который может делать практически всё, что и разработчики на своём компьютере», — говорится в официальном пресс-релизе компании OpenAI.

И, естественно, новая модель демонстрирует впечатляющие результаты в области написания кода. Например, в бенчмарке SWE-Bench Pro, в котором проверяются возможности ИИ в разрезе реальных задач разработки программного обеспечения, GPT-5.3-Codex демонстрирует наилучшие результаты среди моделей OpenAI. Примечательно, что Anthropic, например, на релизе Claude Opus 4.6 выпустила графики, показав в том числе сравнение с моделями Google и OpenAI, тогда как сама OpenAI сравнивать GPT-5.3-Codex с конкурентами не стала. Изображение: OpenAI

Аналогичная ситуация наблюдается в бенчмарке Terminal-Bench 2.0 — новая модель работает с терминалом лучше и тратить меньше токенов, но сравнения с конкурентами нет. Изображение: OpenAI

Кроме того, представители компании заявили, что GPT-5.3-Codex лучше понимает запросы пользователей в процессе создания сайтов по сравнению с GPT-5.2-Codex. «Простые или недостаточно детализированные запросы теперь по умолчанию приводят к генерации сайтов с большим набором функций и настроек», — говорится в блоге компании.

Также новая модель может создавать игры, писать документацию, редактировать текстовый контент, собирать и анализировать различные метрики и многое другое. Но, судя по всему, это скорее минорный апдейт модели, нежели какой-то прорыв.

Источник: trashbox.ru

0 0 голоса

Рейтинг новости