Google представила нейросеть VLOGGER для генерации анимированных роликов с реалистичной мимикой человека по фотографии

Google разработала нейросеть VLOGGER, которая способна генерировать анимированные ролики говорящего человека по одной статической фотографии и записи голоса.

Нейросеть генерирует движение губ, моргание глаз, жесты руками и наклоны головы. VLOGGER также можно использовать, чтобы отредактировать уже готовое видео (например, синхронизировать движения губ человека с речью на другом языке).

«Наша цель — создать фотореалистичное видео переменной длины, изображающее речь целевого человека, включая его голову и жесты. Наш метод состоит из 1) стохастической модели диффузии движения человека в 3D и 2) новой архитектуры, основанной на диффузии, которая дополняет модели преобразования текста в изображение как временным, так и пространственным контролем», — поясняют исследователи.

VLOGGER не требует обучения для конкретного человека, входные данные включают в себя только одно фото и аудиозапись с речью, которую должен произнести человек на сгенерированном ролике. В отличие от предыдущих моделей, VLOGGER не полагается на распознавание лиц, генерирует полное изображение (а не только лицо или губы) и учитывает положение тела человека на фото.

Исследователи оценили VLOGGER по трём различным критериям и пришли к выводу, что модель превосходит другие аналогичные методы по качеству изображения, сохранению идентичности сгенерированного человека и временной согласованности ролика.

Технологию предлагается использовать в творчестве, онлайн-коммуникациях, образовании и при разработке персонализированных виртуальных помощников.

Источник: habr.com

0 0 голоса

Рейтинг новости

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”