OpenAI показала gpt-realtime: новая эра голосовых ассистентов

OpenAI анонсировала выход GPT-Realtime — своей самой продвинутой на сегодняшний день модели, работающей по принципу «speech-to-speech». Разработчики позиционируют её как инструмент для голосовых ассистентов и автоматизированных колл-центров, готовый к внедрению в реальном продакшене.

Главный акцент сделан на точности выполнения голосовых инструкций. По результатам тестирования в бенчмарке MultiChallenge (Audio) GPT-Realtime показала 30,5 %, тогда как у предыдущей версии gpt-4o-realtime-preview от июня 2025 года было 26,5 %, а у декабрьской версии — всего 20,6 %. В другом тесте, ComplexFuncBench (Audio), модель также уверенно обошла предшественников: 66,5 % против 58,9 % и 49,7 % соответственно.

Новая система лучше воспринимает речь, допускает меньше ошибок при распознавании и заметно точнее следует сложным инструкциям, произнесённым голосом. По сути, это качественный шаг вперёд для всех сервисов, которые строятся вокруг диалогового взаимодействия — от персональных ассистентов до колл-ботов в службах поддержки. Стоимость использования GPT-Realtime установлена на уровне $32 за миллион аудио-входных токенов (и $0,40 за миллион кэшированных токенов), а генерация аудио-ответов обойдётся в $64 за миллион выходных токенов.

Как отмечают в OpenAI, модель обучалась на тщательно отобранных данных с применением специализированных reward-схем, что позволило повысить качество понимания речи и снизить число ошибок. По сути, GPT-Realtime можно рассматривать как первый по-настоящему готовый к масштабному внедрению голосовой ИИ-движок.

Делегируйте часть рутинных задач вместе с BotHub! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!

Источник: habr.com

0 0 голоса

Рейтинг новости

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”