OpenAI представила новый голосовой ИИ

OpenAI провела презентацию Realtime API — обновленной платформы для создания голосовых приложений. Ключевым апдейтом API стала gpt-realtime — новая speech-to-speech модель, специально обученная понимать речь, не переводя ее в текст. Благодаря такому подходу голосовой ассистент быстрее отвечает и реже перебивает пользователя. Также новинка понимает интонацию пользователя, распознает разные эмоции (смех, грусть) и сама имитирует их. Модель многоязыковая и способна переключаться между языками на ходу.

В ходе демонстрации OpenAI показали несколько сценариев. В одном модель рассказала стих с интонацией, на ходу переключаясь между несколькими языками. В другом — сыграла роль голосового ассистента техподдержки, вежливо отвечая слишком настойчивому клиенту.

Gpt-realtime поддерживает работу с изображениями, может анализировать их и учитывать полученную информацию в диалоге с пользователем. Также добавлена поддержка MCP, с помощью которой пользователи смогут предоставлять модели доступ к нужной информации — например, базам данных или документации. Gpt-realtime обучена поддерживать диалог во время поиска с помощью MCP, чтобы в разговоре не было долгих пауз.

Пока известно только о запуске модели в API по цене в $32 за миллион входящих токенов и $64 — за миллион исходящих (а также $0,40 за миллион кэшированных токенов). О планах обновить голосового ассистента в ChatGPT на данный момент не сообщалось.

P.S. Поддержать меня можно подпиской на канал «сбежавшая нейросеть», где я рассказываю про ИИ с творческой стороны.

Источник: habr.com

0 0 голоса

Рейтинг новости

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”