Китайские ученые обучили искусственный интеллект на 10 млн коротких видеороликов. В результате получилась модель, которая генерирует качественные видеоизображения.
Группа ученых из Китая разработала новую модель искусственного интеллекта под названием Pyramid Flow. Ее можно использовать для создания видеоизображений высокого разрешения (768p), сообщает TechXplore.
Создатели Pyramid Flow разработали новый подход к генерации видео с использованием искусственного интеллекта. Их модель создает ролики в несколько этапов с низким разрешением, постепенно повышая качество до конечного результата. Программа может создавать пятисекундные клипы с разрешением 384p всего за 56 секунд.
Этот метод генерации видео требует гораздо меньше вычислительных ресурсов по сравнению с аналогами, что снижает затраты. Кроме того, подход позволяет сократить количество токенов, необходимых для создания видео. Поэтому процесс становится эффективнее.
Разработчики выложили исходный код Pyramid Flow на платформу GitHub под лицензией MIT. Вместе с кодом были опубликованы видеоролики, демонстрирующие качество результатов, которые выдает модель. Также команда предоставила список открытых наборов данных, которые использовались для обучения ИИ. В общей сложности, было задействовано 10 млн коротких видеороликов.
Источник: hi-tech.mail.ru