Kuaishou Technology представила новую генеративную модель SVG

Kuaishou Technology представила новую генеративную модель SVG, построенную на архитектуре Latent Diffusion, но без классического блока вариационного автоэнкодера. Отказ от VAE стал ключевым шагом, позволившим модели работать значительно быстрее и стабильнее. Вместо привычного кодировщика компания применила самообучающиеся представления, которые напрямую формируют латентное пространство без потерь точности.

Результаты оказались впечатляющими. Обучение модели идёт в 62 раза быстрее, а инференс в 35 раз. При этом качество изображений не только не ухудшилось, но даже улучшилось. Убраны искажения, которые обычно возникают при переходе между латентным и визуальным пространством. Модель генерирует картинки высокого разрешения с более естественными текстурами и плавными переходами.

SVG рассматривают как возможное новое направление развития диффузионных архитектур. Простая, энергоэффективная и быстрая альтернатива решениям с VAE открывает путь к созданию генеративных моделей, способных работать в реальном времени даже на мобильных устройствах.

Делегируйте часть рутинных задач вместе с BotHub! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!

Подробнее

Источник: habr.com

0 0 голоса

Рейтинг новости

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”