Hume AI выпустил быструю модель для синтеза речи

Американский стартап Hume AI представил Octave 2 — новую модель генерации речи, которую уже называют самой быстрой на рынке. Заявленная задержка составляет менее 200 миллисекунд, то есть речь формируется практически в реальном времени. Это открывает возможности для чат-ботов, голосовых ассистентов и любых интерактивных систем, где важна естественная пауза между репликами.

Octave 2 свободно работает на 11 языках, среди которых русский, английский, французский, испанский, китайский и другие. Модель умеет клонировать голоса, копируя тембр говорящего с короткого образца, менять голос под нужный пол, возраст и интонации, управлять эмоциями — от спокойного тона до ярко выраженного эмоционального — и даже редактировать фонемы, чтобы добиться точного произношения редких слов, имён или брендов.

По сравнению с первой версией Octave новая модель стала примерно на 40 % быстрее, а стоимость генерации снизилась почти вдвое. Улучшилось и качество звучания — от чёткости дикции до передачи интонаций.

Octave 2 уже доступна для тестирования прямо на сайте Hume AI и через API для разработчиков. В блоге компании выложены примеры аудио и видео, демонстрирующие возможности модели. С запуском Octave 2 Hume AI стремится снять главный барьер в TTS — задержку. Теперь генерация речи происходит настолько быстро, что становится возможным естественный диалог человека и машины без привычных пауз.

Хотите быть в курсе важных новостей из мира ИИ? Подписывайтесь на наш Telegram‑канал BotHub AI News.

Источник

Источник: habr.com

0 0 голоса

Рейтинг новости

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”