OpenAI тестирует новую модель o3 Alpha для программирования на WebArena

OpenAI незаметно запустила тестирование новой модели под кодовым названием «o3-alpha-responses-2025-07-17» на платформе WebArena — открытой арене для сравнения ИИ-моделей через предпочтения пользователей.

По данным издания BleepingComputer, которое провело собственное тестирование, o3-alpha демонстрирует значительно лучшие результаты в задачах, связанных с программированием, особенно при создании веб-страниц. Причём она справляется даже с довольно простыми и расплывчатыми запросами. Некоторые пользователи также отметили, что o3-alpha отлично генерирует простые веб-игры, что делает её особенно полезной для тех, кто работает с фронтенд-разработкой, дизайном или изучает программирование.

На платформе WebArena модель отображается как «Anonymous-Chatbot-0717», а в коде платформы можно увидеть: modelApiId: «o3-alpha-responses-2025-07-17».

Несмотря на то, что эта модель активно тестируется, она не является открытым решением и не совпадает с той open-source моделью, которую OpenAI обещала выпустить в ближайшем будущем. Также важно понимать, что это не новая модель под названием o4 — такой модели пока вообще не существует. По информации от OpenAI, следующим крупным шагом станет GPT-5, где будет объединено всё: и мощное рассуждение, и мультимодальные функции (то есть работа с изображениями, видео, звуком и т. д.).

С большой долей вероятности, o3-alpha — это внутренняя тестовая версия улучшенной модели o3. Возможно, она уже включает наработки и улучшения, которые в будущем станут частью GPT-5. Хотя OpenAI официально не подтверждает подробности, тесты показывают, что качество генерации кода, дизайна и логических ответов в o3-alpha заметно лучше, чем у её предшественника.

Делегируйте часть рутинных задач вместе с BotHub! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!

Источник: habr.com

0 0 голоса

Рейтинг новости

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”