DeepL — немецкий стартап, ставший известным благодаря онлайн-переводам текста, которые он позиционирует как более точные, чем у Google. Теперь, на фоне растущего интереса к ИИ-сервисам, DeepL запускает новую функцию: аудиоперевод. Пользователи смогут использовать DeepL Voice для перевода устной речи с одного языка на другой в режиме реального времени.
На данный момент DeepL Voice понимает английский, немецкий, японский, корейский, шведский, нидерландский, французский, турецкий, польский, португальский, русский, испанский и итальянский языки. Для всех 33 языков, поддерживаемых переводчиком DeepL, доступен перевод в виде субтитров.
Особенности DeepL Voice
В отличие от многих других сервисов, DeepL Voice пока не сохраняет результат перевода в виде аудио- или видеофайлов. Сервис предназначен для реального времени, например для живых бесед или видеоконференций, где перевод выводится в текстовом формате. В режиме личной встречи переводы можно настроить на смартфоне, который будет показывать «зеркальные» переводы для каждой из сторон, или в виде расшифровки для совместного просмотра. В режиме видеоконференции переводы появляются в виде субтитров. Основатель и генеральный директор компании Ярек Кутыловски намекнул, что в будущем могут появиться и другие функции для голосового сервиса.
Конкуренция и перспективы
DeepL Voice выходит на рынок, где конкуренция с такими сервисами, как Google Meet, уже предлагающим перевод субтитров, стремительно растёт. Кроме того, появляются стартапы, специализирующиеся на голосовом переводе, такие как Eleven Labs и Panjaya. Некоторые из этих сервисов используют технологии DeepL, как отметил Кутыловски.
Пока у DeepL Voice нет API, а единственная платформа для видеозвонков, поддерживающая его субтитры, — это Microsoft Teams, которая, по словам Кутыловски, охватывает большинство их клиентов. Неясно, когда и будут ли поддержаны Zoom или Google Meet.
Будущие области применения
Помимо видеоконференций, DeepL видит возможности для использования своего сервиса в сфере обслуживания, например в ресторанах, где работники смогут быстро общаться с клиентами на разных языках.
Тем не менее, важным остаётся вопрос конфиденциальности: в условиях, когда пользователи всё больше обеспокоены защитой данных, DeepL стремится гарантировать, что передаваемые на его серверы голоса не сохраняются и не используются для обучения моделей. Компания заверяет, что будет сотрудничать с клиентами для соблюдения норм GDPR и других стандартов по защите данных.
Источник
Источник: habr.com