Учёные из MIT разработали новый метод генерации изображений: он в 30 раз быстрее существующих

Исследователи из Массачусетского технологического института (MIT) сообщили о создании нового метода генерации изображений по текстовому описанию, который назвали «дистилляция с согласованным распределением» (distribution matching distillation). Утверждается, что он в 30 раз быстрее популярных нынче генеративных ИИ-моделей для создания картинок.

Существующие нейронные сети основаны на технике «диффузия». Принцип её действия очень прост. На начальном этапе создаётся очень размытое изображение, а далее с каждым шагом оно детализируется до максимально возможного качества. Данный метод занимает сравнительно много времени, поэтому учёные MIT поставили перед собой цель — ускорить этот процесс.

Новый метод генерирует изображение в один проход, что намного быстрее, чем 30–50 проходов, которые характерны для современных диффузных нейросетей. Так, например, ИИ-модель Stable Diffusion создаёт изображение по запросу пользователя в среднем за 1,5 секунды. У метода DMD на это уходит 0,05 секунды.

Результаты своей работы исследовали MIT продемонстрировали на видео:

На данном этапе DMD — это разработка, которая не добралась до коммерческого продукта. Вероятнее всего, на это потребуется ещё какое-то время.

Источник: trashbox.ru

0 0 голоса
Рейтинг новости
0
0
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии