2024 год ознаменовался всплеском моделей ИИ-синтеза видео, способных создавать видеоролики по текстовым описаниям. Вслед за Sora появились китайские модели Kling и video-01 компании Minimax, которые легли в основу вирусных роликов и вызвали споры. Так, Ars Technica решили узнать, насколько обусловлен «хайп».
Kling может генерировать высококачественные видео 1080p, но на данный момент доступен только пользователям с китайскими телефонными номерами. Video-01 компании Minimax, доступный через платформу Hailuo AI, позволяет любому создавать видеоролики. Ars Technica протестировал video-01, используя запросы, ранее использовавшиеся с Runway Gen-3.
Результаты Minimax были похожи на результаты Gen-3, с некоторыми отличиями. Но в целом всё выглядело очень и очень неплохо. Примеры можно глянуть в источнике.
Эти модели отлично справляются с комбинированием концепций из своих обучающих данных, но испытывают трудности с совершенно новыми сценариями, то есть, если в исходном наборе данных не было видео с древнетюркской маской, то сгенерировать моделям будет сложно.
Несмотря на ограничения, Minimax показывает отличные результаты.
Источник: www.ferra.ru