Alibaba выпустила видео-ИИ Wan 2.2 Animate: анимация по одному фото и замена лица

Компания Alibaba представила Wan 2.2 Animate — открытую видео-модель для анимации персонажа по одному фото и замены лиа в готовом видео. Это часть семейства моделей Wan 2.2, которое включает преобразования текста в видео (T2V), речи в видео (S2V) и другие варианты. Модель доступна на Hugging Face и GitHub под лицензией Apache-2.0, также ее можно попробовать онлайн.

Архитектура Animate-14B основана на смеси экспертов (MoE) с двумя специалистами: один обрабатывает этапы с высоким уровнем шума, другой — с низким. В общей сложности это 27 миллиардов параметров, но на каждом шаге используется только 14 миллиардов, что позволяет экономить вычисления. Прогресса в кинематографической эстетике и обработке сложных движений удалось достичь благодаря расширенному набору данных: на 65,6% больше изображений и на 83,2% больше видео по сравнению с предыдущей версией.

Процесс простой: вы даете референс-фото героя и драйв-видео с нужными движениями. Система извлекает позы и маски. Дальше два режима. В Animation из фото «собирается» новый ролик — модель переносит движения и мимику из драйв-видео на персонажа (получается видео с вашим героем в тех же жестах и ракурсах). В Replacement исходное видео остается тем же (сцена, фон, камера, тайминг), но модель заменяет в нем человека на героя с фото — можно ограничиться лицом или сделать полную замену тела, с сохранением поз и синхронизации губ.

Для локального запуска полная версия Animate-14B требует около 80 ГБ видеопамяти, но запуск возможен и на 24 ГБ (например, RTX 4090) при использовании оффлоад (выгрузки части данных на ОЗУ) или FP8. Упрощенная версия TI2V-5B работает на 4090 и выдает видео в 720p при 24 fps.

P.S. Поддержать меня можно подпиской на канал «сбежавшая нейросеть», где я рассказываю про ИИ с творческой стороны.

Источник: habr.com

0 0 голоса

Рейтинг новости

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”