Специалисты видеосервиса «VK Видео» в 10 раз увеличили объём видео с субтитрами и повысили точность обработки расшифровки речи на платформе.
В VK пояснили, что благодаря этому улучшению просмотр видео стал ещё удобнее, а речь говорящего оформляется в текстовые субтитры в виде предложений со знаками препинания и заглавными буквами с учётом особенностей разговорной, узкоспециализированной лексики и неологизмов. Причём эта технология работает как в профессиональных роликах, так и в пользовательском контенте. В VK считают, что нововведение будет полезно пользвоателям с нарушениями слуха и в ситуациях, когда, например, включать звук в видео нежелательно.
«В ленте пользователя на главном экране 8 из 10 видео будут с новыми субтитрами. Автоматические субтитры в VK Видео генерируют ML‑модели. Аудиопоток из видео проходит через несколько этапов обработки. Сначала нейросеть убирает посторонние шумы, выделяет речь и преобразует её в слова, а другие модели превращают расшифровку в текст. Финальный AI синхронизирует получившийся текст с аудиодорожкой. AI‑модель допускает на 30% ошибок меньше, чем аналогичные модели генерации субтитров в подобных сервисах», — добавили в VK.
Ранее сервис «VK Видео» представил функцию «Картинка в картинке» в веб‑версии своей платформы, которая позволяет пользователям просматривать ролики в мини-плеере, не отвлекаясь от других задач. В настройках плеера «VK Видео» добавлена кнопка, которая позволяет активировать режим для просмотра видео в отдельном окне. Мини-плеер видеосервиса может отображаться как поверх текущего браузера, так и поверх остальных окон на рабочем столе.
В декабре 2024 года VK запустила обновлённую веб-версию платформы «VK Видео» на отдельном домене vkvideo.ru. В VK пояснили Хабру, что пользователи могут заходить на страницу видеосервиса из адресной строки браузера и быстрее находить фильмы, трансляции, шоу и авторский контент на платформе.
Источник: habr.com