OpenAI представила обновление Codex-CLI до версии 0.36, сделав разработку с помощью ИИ ещё ближе к реальности. Главным героем релиза стал новый GPT-5-Codex, который научился гибко распределять ресурсы: простые задачи решаются почти мгновенно, а сложные проекты система может обрабатывать часами. В некоторых случаях модель работает непрерывно до 7 часов подряд, выполняя рефакторинг, исправляя ошибки и доводя решение до финала.
SWE-bench Verified: Ранее, включая момент запуска GPT-5, мы сообщали о результатах по 477 задачам SWE-bench Verified, потому что некоторые задачи не могли быть выполнены в нашей инфраструктуре. С тех пор мы исправили это и теперь сообщаем обо всех 500 задачах.
Задачи рефакторинга кода: Наша оценка рефакторинга кода содержит задачи в стиле рефакторинга из больших, устоявшихся репозиториев и включает задачи на Python, Go и даже OCaml. Примером задачи является следующий pull request из Gitea, который изменяет 232 файла и 3541 строку, чтобы пронизать переменную ctx через логику приложения.
Одним из ключевых нововведений стала функция codex resume, которая позволяет возобновлять старые сессии. Теперь не нужно начинать всё с нуля — модель возвращается к незавершённому проекту и продолжает работу в том же контексте, как если бы это был живой разработчик, который на время отошёл от компьютера.
Помимо этого, OpenAI обновила интерфейс. Появилось анимированное руководство для новых пользователей, улучшено отображение статусов выполнения задач и добавлена более надёжная система обработки прерываний. Также внедрена новая схема авторизации, которая поддерживает кастомных провайдеров и улучшенную работу с API-ключами. Но самое интересное — это результаты на бенчмарках. GPT-5-Codex показывает впечатляющий рост: на SWE-bench модель набирает 74,5%, обгоняя даже GPT-5 high.
Внутренние тесты по рефакторингу кода тоже демонстрируют прогресс — показатель вырос с 34% до 51%, что указывает на значительный скачок качества в работе с крупными кодовыми базами. Для разработчиков это может означать новый уровень автоматизации, где Codex-CLI теперь не просто инструмент для генерации кода, а полноценный помощник, который способен поддерживать проекты на длинной дистанции.
Делегируйте часть рутинных задач вместе с BotHub! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!
Источник
Источник: habr.com