Tencent опубликовала MiraData — большой датасет видеоданных для обучения нейросетей

Китайская компания Tencent опубликовала MiraData — открытый датасет видеоданных для обучения нейросетей. С его помощью разработчики могут создавать модели для генерации длинных роликов.

Авторы датасета отмечают, что анонс нейросети Sora от OpenAI сильно повлиял на область генерации видео. Ролики от Sora отличаются относительно длинным хронометражем и интенсивными движениями в кадре. Имеющиеся открытые наборы данных не позволяют обучать модели такого же уровня, поэтому инженеры Tencent решили исправить это.

Датасет MiraData включает в себя видеоданные общей продолжительностью более 16 тыс. часов, а средний хронометраж каждого ролика составляет 71 секунду. Видео подобран так, чтобы в них присутствовала высокая интенсивность движения в кадре. Каждое видео сопровождается подробной аннотацией из более чем 300 слов.

Архитектура датасета MiraData

Для оценки качества моделей, обученных на MiraData, выпустили бенчмарк MiraBench. Он использует 17 метрик, обращающих внимание на качество видео, согласованность движений, временную согласованность и другие параметры. Авторы проекта подчёркивают, что другие открытые датасеты делают упор на короткие видео, а аннотации часто не превышают 20 слов.

Сравнение MiraData с другими открытыми датасетами

Проект опубликован на GitHub, а данные можно скачать с Google Drive или Hugging Face Dataset. Вместе с этим инженеры опубликовали текст исследования на портале Arxiv.

Источник: habr.com

0 0 голоса

Рейтинг новости

23579

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”