DeepL запускает DeepL Voice — переводчик для голосового перевода в реальном времени

DeepL — немецкий стартап, ставший известным благодаря онлайн-переводам текста, которые он позиционирует как более точные, чем у Google. Теперь, на фоне растущего интереса к ИИ-сервисам, DeepL запускает новую функцию: аудиоперевод. Пользователи смогут использовать DeepL Voice для перевода устной речи с одного языка на другой в режиме реального времени.

На данный момент DeepL Voice понимает английский, немецкий, японский, корейский, шведский, нидерландский, французский, турецкий, польский, португальский, русский, испанский и итальянский языки. Для всех 33 языков, поддерживаемых переводчиком DeepL, доступен перевод в виде субтитров.

Особенности DeepL Voice

В отличие от многих других сервисов, DeepL Voice пока не сохраняет результат перевода в виде аудио- или видеофайлов. Сервис предназначен для реального времени, например для живых бесед или видеоконференций, где перевод выводится в текстовом формате. В режиме личной встречи переводы можно настроить на смартфоне, который будет показывать «зеркальные» переводы для каждой из сторон, или в виде расшифровки для совместного просмотра. В режиме видеоконференции переводы появляются в виде субтитров. Основатель и генеральный директор компании Ярек Кутыловски намекнул, что в будущем могут появиться и другие функции для голосового сервиса.

Конкуренция и перспективы

DeepL Voice выходит на рынок, где конкуренция с такими сервисами, как Google Meet, уже предлагающим перевод субтитров, стремительно растёт. Кроме того, появляются стартапы, специализирующиеся на голосовом переводе, такие как Eleven Labs и Panjaya. Некоторые из этих сервисов используют технологии DeepL, как отметил Кутыловски.

Пока у DeepL Voice нет API, а единственная платформа для видеозвонков, поддерживающая его субтитры, — это Microsoft Teams, которая, по словам Кутыловски, охватывает большинство их клиентов. Неясно, когда и будут ли поддержаны Zoom или Google Meet.

Будущие области применения

Помимо видеоконференций, DeepL видит возможности для использования своего сервиса в сфере обслуживания, например в ресторанах, где работники смогут быстро общаться с клиентами на разных языках.

Тем не менее, важным остаётся вопрос конфиденциальности: в условиях, когда пользователи всё больше обеспокоены защитой данных, DeepL стремится гарантировать, что передаваемые на его серверы голоса не сохраняются и не используются для обучения моделей. Компания заверяет, что будет сотрудничать с клиентами для соблюдения норм GDPR и других стандартов по защите данных.

Источник

Источник: habr.com

0 0 голоса

Рейтинг новости

12425

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”