Исследователи из NVIDIA и Стэнфордского университета представили новую ИИ-модель под названием Test-Time Training (TTT).
Разработчики провели обучение модели на 50 часах мультфильмов "Том и Джерри", в результате чего модель научилась по текстовому запросу генерировать новые серии мультсериала длиною до 1 минуты. Разработчики показали несколько примеров запросов и тех видео, которые сгенерировала модель.
Текстовый запрос:
Текстовый запрос:
Один из разработчиков модели Каран Далал отметил, что видео не подвергались обработке: в них еще присутствуют артефакты, но для создания видео использовалась модель лишь на 5 миллиардов параметров — когда у разработчиков появится железо для более сложной модели, то она сможет генерировать более длинные и последовательные видео.
Источник: www.playground.ru