Baidu запатентует технологию перевода звуков животных на человеческий язык

Китайский гигант искусственного интеллекта Baidu намерен получить патент на технологию искусственного интеллекта, предназначенную для перевода звуков животных на человеческий язык.

Интернет-гигант поиска подал заявку на патент в декабре, но она была опубликована Национальным управлением интеллектуальной собственности Китая только в мае.

Метод перевода работает путём сбора различных типов данных от животного, включая «голос, язык тела, поведенческие изменения и другие биологические признаки». Затем он определяет «эмоцию», анализируя данные перед их преобразованием в язык. Технология использует машинное и глубокое обучение, а также обработку естественного языка.

Если голос не соответствует ни одной ранее выявленной «эмоции», то команда вручную помечает голосовые данные, обновляет образец и корректирует параметры модели.

Baidu отметила, что современные переводчики языков животных в основном используют два подхода: распознавание голосовых отпечатков и изучение выражений лиц. Оба подхода ограничены в понимании эмоций животных, поскольку «чрезмерно полагаются на один источник информации».

Патентную заявку пока лишь опубликовали, но её одобрение может занять ещё некоторое время, возможно, годы.

Baidu не разъяснила свои намерения относительно применения технологии, например, планирует ли она выпустить новое приложение. «В настоящее время решение находится на стадии исследований.Как компания ИИ, мы постоянно стремимся применять новые технологии в различных вариантах использования», — заявили там. 

Учёные и компании по всему миру уже работают над переводом звуков животных. В 2001 году японский производитель игрушек Takara попал в заголовки газет, выпустив Bowlingual — небольшое портативное электронное устройство, которое переводило лай собак. Продукт был назван журналом Time одним из «Лучших изобретений 2002 года». Позднее компания выпустила такой же гаджет Meowlingual для кошек.

В 2014 году небольшая скандинавская исследовательская лаборатория собрала более $22 тысяч на краудфандинговой платформе Indiegogo для устройства под названием No More Woof. Однако три года спустя команда заявила, что «проект стал слишком дорогим для продолжения».

С 2020 года международные исследователи из проекта CETI (Cetacean Translation Initiative) используют статистический анализ и ИИ, чтобы понять, как общаются кашалоты, в то время как проект Earth Species Project пытается использовать технологию для расшифровки общения животных.

Источник: habr.com

0 0 голоса
Рейтинг новости
1
0
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии