На GigaConf «Сбер» представил Kandinsky 4.1 Video

«Сбер» представил новую модель Kandinsky 4.1 Video для генерации видео по тексту. Об этом сообщил старший вице‑президент, руководитель блока «Технологическое развитие» «Сбера» Андрей Белевцев на технологической конференции GigaConf. Информационная служба Хабра присутствовала на конференции.

Первыми доступ к Kandinsky 4.1 Video получили участники GigaConf, а также некоторые художники и дизайнеры. В ближайшее время модель станет доступна всем пользователям.

Kandinsky 4.1 Video создаёт видео продолжительностью до 10 секунд. Поддерживаются разрешения SD (720×576) и HD (1280×720). Генерация возможна как по текстовому описанию, так и по произвольному стартовому кадру. Модель поддерживает любое соотношение сторон.

В основе модели лежит архитектура диффузионного трансформера. Качество генерации улучшилось за счёт дообучения (Supervised Fine‑Tuning, SFT) на специально отобранных данных. Обучение проводилось при участии более 100 экспертов — дизайнеров, фотографов и художников с профильным образованием. Это повысило художественную выразительность, композицию и кинематографичность видеоряда.

Новая архитектура потребовала больше вычислительных ресурсов. Поэтому при разработке применялись методы дистилляции и ускорения. В результате время генерации сократилось более чем в три раза по сравнению с предыдущим вариантом. В ряде сценариев качество при этом сохранилось или улучшилось.

Источник: habr.com

0 0 голоса

Рейтинг новости

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”