Расширенный голосовой режим ChatGPT будет доступен всем пользователям Plus в следующий вторник

В мае 2024 года OpenAI провела неожиданное медиа-мероприятие, за день до ключевого выступления Google на конференции I/O 2024. На этом мероприятии Google представила новые возможности AI Gemini в своем портфеле продуктов. В свою очередь, OpenAI удивила мир новыми мультимодальными функциями ChatGPT, включая способность понимать содержание фотографий и видео.

Изображение: OpenAI

Однако особенно впечатляющей стала новая функция Advanced Voice Mode. Она позволила ChatGPT проводить голосовые беседы естественным образом: пользователи могли прерывать чат-бота новой информации, как в обычном разговоре между людьми, и ChatGPT не теряла при этом свою мысль рассуждения. Более того, в процессе разговора можно было заметить эмоции и изменения в тоне ChatGPT, что больше приближало его к человеческому общению.

На следующий день Google продемонстрировала аналогичные функции для AI Gemini, но ни одна из компаний на тот момент не имела готовых решений для широкого использования.

OpenAI выпустила Advanced Voice Mode для ограниченной группы пользователей ChatGPT Plus в конце июля. Компания заявила, что все пользователи Plus получат доступ к Advanced Voice Mode этой осенью, не раскрывая точную дату релиза. Согласно новым утечкам, эта дата приближается. Пользователь Reddit обнаружил утечки информации на X (раннее Twitter, социальная сеть, заблокирована в РФ), указывающие, что голосовая функция ChatGPT может стать доступной для большего числа пользователей уже 24 сентября. Возможен также запуск среди всех пользователей Plus.

Один из пользователей сообщил, что OpenAI планирует расширить доступность Advanced Voice Mode к концу сентября. Сообщается, что компания продолжает работу над улучшением безопасности и плавности работы функции. Первоначально Advanced Voice Mode может стать доступным лишь небольшой группе пользователей для сбора отзывов, а не всем пользователям Plus.

К концу сентября будет выпущена новая версия расширенного голосового режима 4o, разработанная для повышения безопасности и плавности работы.Отдельно пользователь X нашёл код, указывающий на возможное обновление Advanced Voice Mode 24 сентября.

— nic (@nicdunz) September 17, 2024

Кроме того, другой пользователь нашел код, указывающий на то, что расширенный голосовой режим может получить обновление 24 сентября.

pic.twitter.com/Ym4bcknfIY

— Okentar (@Okentar10) September 17, 2024

Эта дата совпадает с ответом Сэма Альтмана на вопрос пользователя на прошлой неделе о расширении Advanced Voice Mode. Ответ Альтмана был неоднозначным и вызвал негативную реакцию среди пользователей ChatGPT Plus, хотя он отметил, что новые функции появятся скоро.

Как насчет того, чтобы пару недель поблагодарить волшебный разум в небе, и тогда у вас скоро появится больше игрушек?

— Sam Altman (@sama) September 12, 2024

Альтман также ответил на вопросы о более широком запуске Advanced Voice Mode в тот же день, когда Google анонсировала доступность Gemini Live для пользователей Android. Gemini Live — это эквивалент Advanced Voice Mode. Google выпустила Gemini Live как бесплатное обновление для мобильного приложения Gemini для Android.

OpenAI не может позволить себе отставать от Google. Несмотря на недавний выпуск более продвинутой модели ChatGPT o1-preview, она всё ещё находится на стадии тестирования. OpenAI должна доказать инвесторам, что может поддерживать темпы Google, поэтому запуск Advanced Voice Mode не за горами. Напомним, что OpenAI ищет новых инвесторов, среди которых ходят слухи об Apple.

Пока остается не ясным, когда пользователи бесплатного плана ChatGPT смогут получить доступ к новым голосовым функциям.

Источник: habr.com

0 0 голоса
Рейтинг новости
9667
0
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии