ИИ и голос — как искусственный интеллект сможет понять пьяного и вернуть речь немому

Да, искусственный интеллект сейчас используется повсеместно, и очередная новость в духе «ИИ внедрят» уже не воспринимается как что-то неожиданное. Однако, следить за новинками всё-таки стоит, ведь они могут оказаться полезны именно вам. Например, синхронные переводы видео с почти любых языков пригодятся почти где угодно: от образования до просмотра сериалов.

Сегодня искусственный интеллект — это удобный и уже довольно привычный инструмент. Нужно быстро создать подходящую картинку — пожалуйста, постебаться над другом и сделать с ним мемный стикер — займёт секунды. Кажется, ИИ прочно вошёл в нашу жизнь: по статистике, каждый второй житель России прибегал к помощи искусственного интеллекта.

Но ИИ подходит не только для генерации мемов и задушевных бесед с нейросетью. Для учёных, врачей и разработчиков это не игрушка, а мощный инструмент: с помощью него можно создавать цифровых пациентов, чтобы изучать болезни, оптимизировать программный код и даже дать голос немым людям.

Pikabu Голос для ИИ — это опасно?

Одно из самых перспективных направлений в работе с ИИ — это эксперименты с голосом и озвучкой. Например, это пригодилось геймерам: теперь можно локализировать компьютерные игры под любой язык. Просто переводят текст (может, с помощью той же нейросети), закидывают в ИИ и вуаля, у вас есть русская озвучка.

Однако, такие эксперименты по генерации голосов, которые максимально приближены к человеческому, могут быть опасны. Мошенников и так полно, а если ещё у них в доступе будет приложение, которое голос меняет на голос вашего близкого, то проблем не оберёшься. Яркий пример того, как ИИ используют во вред: с функцией замены лица наделали немало контента, который доставил проблем знаменитостям.

Так и с голосовыми функциями нейросетей и других платформ, где можно использовать искусственный интеллект. Чтобы избежать потенциальных проблем с новой технологией, в России создают систему для борьбы с голосовым мошенничеством.

В 2024 году специалисты Института искусственного интеллекта AIRI и Московского технического университета связи и информатики разработали ИТ-систему под названием AASIST3, которая с помощью ИИ определяет признаки генерации синтетического голоса, которую используют телефонные мошенники. Искусственный интеллект против искусственного интеллекта, такая вот рекурсия.

Так что, учёные стараются продумать все последствия. К примеру, сейчас работают над созданием переводчика с языка жестов. Или вот другая интересная технология — научить ИИ по голосу и интонации определять, пьян человек или нет.

Freepik / DC Studio Искусственный интеллект на службе у науки ИИ: пьянству бой?

Специалисты Национального исследовательского Нижегородского государственного университета и Томского государственного университета систем управления и радиоэлектроники придумали способ определять, пьян ли человек. Выводы ИИ будет делать с помощью анализа высоты и амплитуды голоса.

Такую технологию можно будет использовать для контроля персонала. Просто поговорить с подозрительно весёлым трудовиком будет достаточно, чтобы выявить возможную причину веселья: прогнали через систему, и всё стало понятно. Метод основан на анализе спектральных характеристик речи.

Спектральные характеристики голоса — это параметры, которые позволяют оценить качество голоса, его высоту, динамический и тональный диапазоны, длительность фонационного выдоха, частоту основного тона и другие характеристики.

Может ИИ смог определить кто пил, потому что бы с ними в баре?Freepik

А ещё эта технология поможет следить за безопасностью, когда нет возможности проверить кровь или воздух на содержание алкоголя. Правда, всё будет зависеть от качества звука и уровня шума.

Чтобы подтвердить, что новинка действительно работает, учёные решили провести эксперимент. Набрали 600 человек, часть из них находилась в средней стадии опьянения с 1,5 промилле в крови. Участники читали скороговорки под диктофон, а затем эти записи расшифровывались через модель искусственного интеллекта. Результат был хороший, хоть и с погрешностями.

Следующая цель российских специалистов — это научить ИИ определять стресс человека по речи. По словам разработчиков, будущая модель поможет протестировать человека на стрессоустойчивость и отслеживать уровень стресса сотрудников.

Pikabu Наконец-то поймём домашних любимцев

Специалисты из Китая решили попробовать разработать ИИ-переводчик с языка животных. Правда, пока загадкой осталось мяуканье. Видимо, кошек можно понять, только когда они сами того захотят, но над проблемой уже работают: будут учитывать язык тела, голос, поведение и другие параметры.

Будущее приложение будет выглядеть, как анализатор эмоционального состояния животного, который поможет понять желания вашего питомца. Все кошатники были в ситуации, когда кот трётся об ноги, мяукает, но чего именно он хочет, неясно. Может, хоть китайский гаджет даст ответ.

В разработке собираются использовать большие базы данных, машинное обучение и анализирующие нейросети. Пока что только подали заявку на патент, дальше же пойдёт куда более активная работа. Проект довольно сложный в реализации: под каждое животное нужно будет собрать очень много информации. Очевидно, что попугаи и собаки ведут себя по-разному, одно и то же не используешь.

Возможно, совсем скоро появится на смартфонах приложение, которое поможет лучше понимать животных. Конечно, похожие приложения, которые якобы позволяют общаться с пушистыми любимцами, уже существуют, но они собирают одну звезду в отзывах и работают, видимо, просто наугад.

Ferra.ru Вернёт голос после травмы

Конечно, есть и другие не менее интересные разработки ИИ, которые связаны с голосом. Учёные задались вопросом — а можно ли вернуть голос человеку, который потерял его из-за травмы или инсульта? Вообще, да. Для этого потребуются специальные устройства или чипы, но теперь такая возможность есть.

Многие слышали про нашумевший Neuralink. Третий пациент с его чипом смог вернуть голос, хотя у пациента — боковой амиотрофический склероз, который практически лишает возможности говорить внятно или вообще делает человека немым. И здесь без ИИ не обошлось: с помощью него чип сканирует мозговую активность и волны, а затем преобразует в речь.

Но и в России есть свои разработки. Компания «НейроЧат» сейчас создаёт интерфейс «мозг-компьютер» для людей с нарушениями речи. Их цель — помочь снова полноценно общаться с родными, друзьями и всем миром людям с такими диагнозами, как ДЦП, инсульт и различными травмами спинного мозга. Сейчас проект уже действует совместно с компанией «Косима», которая уже много лет разрабатывает устройства для стимуляции спинного мозга.

И это только начало: учёные из разных стран работают над возвращением голоса, а заодно и над облегчением жизни тем, кто по какой-то причине его потерял.

Pikabu Чудеса науки

Искусственный интеллект сейчас везде: появляются новые профессии, которые связаны с ним, например, «нейрокопиратер», который пишет промты для нейросетей, или AI-тренер, который обучает нейросети точно и правильно отвечать на запрос.

Мир меняется, и научная сфера вместе с ним. Помимо полезных вещей, например, устройств, которые могут вернуть голос человеку, есть и негативные: например, телефонные мошенники с ИИ на проводе.

Искусственный интеллект помогает учёным в исследованиях, которые раньше были за пределами человеческих возможностей. Можно анализировать огромные объёмы данных, моделировать различные процессы в организме человека, а это поможет вылечить многие заболевания, которые раньше казались неизлечимыми. Это ли не здорово?

Источник: www.ferra.ru

0 0 голоса

Рейтинг новости

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”