Да, искусственный интеллект сейчас используется повсеместно, и очередная новость в духе «ИИ внедрят» уже не воспринимается как что-то неожиданное. Однако, следить за новинками всё-таки стоит, ведь они могут оказаться полезны именно вам. Например, синхронные переводы видео с почти любых языков пригодятся почти где угодно: от образования до просмотра сериалов.
Сегодня искусственный интеллект — это удобный и уже довольно привычный инструмент. Нужно быстро создать подходящую картинку — пожалуйста, постебаться над другом и сделать с ним мемный стикер — займёт секунды. Кажется, ИИ прочно вошёл в нашу жизнь: по статистике, каждый второй житель России прибегал к помощи искусственного интеллекта.
Но ИИ подходит не только для генерации мемов и задушевных бесед с нейросетью. Для учёных, врачей и разработчиков это не игрушка, а мощный инструмент: с помощью него можно создавать цифровых пациентов, чтобы изучать болезни, оптимизировать программный код и даже дать голос немым людям.

Одно из самых перспективных направлений в работе с ИИ — это эксперименты с голосом и озвучкой. Например, это пригодилось геймерам: теперь можно локализировать компьютерные игры под любой язык. Просто переводят текст (может, с помощью той же нейросети), закидывают в ИИ и вуаля, у вас есть русская озвучка.
Однако, такие эксперименты по генерации голосов, которые максимально приближены к человеческому, могут быть опасны. Мошенников и так полно, а если ещё у них в доступе будет приложение, которое голос меняет на голос вашего близкого, то проблем не оберёшься. Яркий пример того, как ИИ используют во вред: с функцией замены лица наделали немало контента, который доставил проблем знаменитостям.
Так и с голосовыми функциями нейросетей и других платформ, где можно использовать искусственный интеллект. Чтобы избежать потенциальных проблем с новой технологией, в России создают систему для борьбы с голосовым мошенничеством.
В 2024 году специалисты Института искусственного интеллекта AIRI и Московского технического университета связи и информатики разработали ИТ-систему под названием AASIST3, которая с помощью ИИ определяет признаки генерации синтетического голоса, которую используют телефонные мошенники. Искусственный интеллект против искусственного интеллекта, такая вот рекурсия.
Так что, учёные стараются продумать все последствия. К примеру, сейчас работают над созданием переводчика с языка жестов. Или вот другая интересная технология — научить ИИ по голосу и интонации определять, пьян человек или нет.

Специалисты Национального исследовательского Нижегородского государственного университета и Томского государственного университета систем управления и радиоэлектроники придумали способ определять, пьян ли человек. Выводы ИИ будет делать с помощью анализа высоты и амплитуды голоса.
Такую технологию можно будет использовать для контроля персонала. Просто поговорить с подозрительно весёлым трудовиком будет достаточно, чтобы выявить возможную причину веселья: прогнали через систему, и всё стало понятно. Метод основан на анализе спектральных характеристик речи.
Спектральные характеристики голоса — это параметры, которые позволяют оценить качество голоса, его высоту, динамический и тональный диапазоны, длительность фонационного выдоха, частоту основного тона и другие характеристики.

А ещё эта технология поможет следить за безопасностью, когда нет возможности проверить кровь или воздух на содержание алкоголя. Правда, всё будет зависеть от качества звука и уровня шума.
Чтобы подтвердить, что новинка действительно работает, учёные решили провести эксперимент. Набрали 600 человек, часть из них находилась в средней стадии опьянения с 1,5 промилле в крови. Участники читали скороговорки под диктофон, а затем эти записи расшифровывались через модель искусственного интеллекта. Результат был хороший, хоть и с погрешностями.
Следующая цель российских специалистов — это научить ИИ определять стресс человека по речи. По словам разработчиков, будущая модель поможет протестировать человека на стрессоустойчивость и отслеживать уровень стресса сотрудников.

Специалисты из Китая решили попробовать разработать ИИ-переводчик с языка животных. Правда, пока загадкой осталось мяуканье. Видимо, кошек можно понять, только когда они сами того захотят, но над проблемой уже работают: будут учитывать язык тела, голос, поведение и другие параметры.
Будущее приложение будет выглядеть, как анализатор эмоционального состояния животного, который поможет понять желания вашего питомца. Все кошатники были в ситуации, когда кот трётся об ноги, мяукает, но чего именно он хочет, неясно. Может, хоть китайский гаджет даст ответ.
В разработке собираются использовать большие базы данных, машинное обучение и анализирующие нейросети. Пока что только подали заявку на патент, дальше же пойдёт куда более активная работа. Проект довольно сложный в реализации: под каждое животное нужно будет собрать очень много информации. Очевидно, что попугаи и собаки ведут себя по-разному, одно и то же не используешь.
Возможно, совсем скоро появится на смартфонах приложение, которое поможет лучше понимать животных. Конечно, похожие приложения, которые якобы позволяют общаться с пушистыми любимцами, уже существуют, но они собирают одну звезду в отзывах и работают, видимо, просто наугад.

Конечно, есть и другие не менее интересные разработки ИИ, которые связаны с голосом. Учёные задались вопросом — а можно ли вернуть голос человеку, который потерял его из-за травмы или инсульта? Вообще, да. Для этого потребуются специальные устройства или чипы, но теперь такая возможность есть.
Многие слышали про нашумевший Neuralink. Третий пациент с его чипом смог вернуть голос, хотя у пациента — боковой амиотрофический склероз, который практически лишает возможности говорить внятно или вообще делает человека немым. И здесь без ИИ не обошлось: с помощью него чип сканирует мозговую активность и волны, а затем преобразует в речь.
Но и в России есть свои разработки. Компания «НейроЧат» сейчас создаёт интерфейс «мозг-компьютер» для людей с нарушениями речи. Их цель — помочь снова полноценно общаться с родными, друзьями и всем миром людям с такими диагнозами, как ДЦП, инсульт и различными травмами спинного мозга. Сейчас проект уже действует совместно с компанией «Косима», которая уже много лет разрабатывает устройства для стимуляции спинного мозга.
И это только начало: учёные из разных стран работают над возвращением голоса, а заодно и над облегчением жизни тем, кто по какой-то причине его потерял.

Искусственный интеллект сейчас везде: появляются новые профессии, которые связаны с ним, например, «нейрокопиратер», который пишет промты для нейросетей, или AI-тренер, который обучает нейросети точно и правильно отвечать на запрос.
Мир меняется, и научная сфера вместе с ним. Помимо полезных вещей, например, устройств, которые могут вернуть голос человеку, есть и негативные: например, телефонные мошенники с ИИ на проводе.
Искусственный интеллект помогает учёным в исследованиях, которые раньше были за пределами человеческих возможностей. Можно анализировать огромные объёмы данных, моделировать различные процессы в организме человека, а это поможет вылечить многие заболевания, которые раньше казались неизлечимыми. Это ли не здорово?
Источник: www.ferra.ru