Microsoft разрабатывает технологию, которая снова может перевернуть наше представление о цифровом мире.
VASA-1 – модель, создающая реалистичное видео из одного единственного изображения и аудиозаписи. Система стирает грань между реальностью и подделкой.
Технология не просто синхронизирует аудио с картинкой, но воссоздает мимику, эмоции, движения головы, создавая эффект поразительной достоверности.
При этом новый ИИ работает с высоким разрешением (512 x 512 пикселей) и впечатляющей скоростью – 45 кадров в секунду. Еще круче, что модель генерирует реалистичное говорящее лицо в реальном времени со скоростью 40 кадров в секунду.
Все это открывает заманчивые перспективы: исторические личности для образовательных ресурсов или виртуальные компаньоны для психологической поддержки.
Но потенциал для злоупотребления тоже огромен. VASA-1 может создавать убедительные дипфейки для распространения дезинформации и разрушения доверия.
К счастью, Microsoft не планирует выпускать эту мощную технологию без надежных защитных механизмов.
Источник: www.ferra.ru