Разработчики из России научили ИИ лучше распознавать голос человека на фоне шума

ИТ-специалисты из России разработали и опубликовали подробное описание нейросетевой технологии, которая помогает виртуальным помощникам и умным устройствам распознавать голосовые команды на фоне шума. Данный алгоритм уже активно используется в устройствах «Яндекса», сообщила пресс-служба компании.

«До сих пор не существовало единого подхода к распознаванию голоса в шумной среде, который был бы одинаково надежен в лабораторных тестах и в реальных условиях. Надеемся, что публикация нашего метода ускорит прогресс в области голосовых интерфейсов, поможет избежать типичных ошибок и приведет к появлению большего количества удобных и надежных голосовых устройств», — пояснил руководитель направления голосовой активации «Яндекса» Дмитрий Солодуха, чьи слова приводит пресс-служба компании.

Как отмечают Солодуха и его коллеги, системы распознавания речи в умных устройствах и виртуальных ассистентах используют алгоритмы эхоподавления и шумоподавления для того, чтобы удалить лишние шумы и распознать голос их пользователя на фоне музыки и прочих посторонних звуков. В процессе работы этих алгоритмов часто ухудшается и качество речи, что снижает вероятность успешного распознавания команд.

Для решения этой проблемы специалисты «Яндекса» разработали нейросетевой механизм внимания, который получает на вход сразу два сигнала — с шумоподавлением и эхоподавлением. В каждый момент времени нейросеть выбирает наиболее четкий сигнал, что и позволяет распознавать команды на фоне самых разных звуков как в лабораторной обстановке, так и при использовании в бытовых условиях.

Источник: hi-tech.mail.ru

0 0 голоса
Рейтинг новости
1
0
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии