ИИ-стартап Genmo запускает открытую модель для генерации видео Mochi 1, которая может стать конкурентом Runway

Компания Genmo, специализирующаяся на генеративных видео-технологиях с использованием ИИ, анонсировала выпуск исследовательской версии модели Mochi 1 — открытого программного решения для создания высококачественных видео на основе текстовых запросов. Genmo заявляет, что Mochi 1 по производительности может конкурировать с ведущими моделями, такими как Runway’s Gen-3 Alpha, Luma AI’s Dream Machine, Kuaishou’s Kling, и другими.Основные особенности Mochi 1

Скриншот из сгенерированного моделью видео.Основные особенности Mochi 1

Mochi 1 — это первая в своем роде модель с открытым исходным кодом для видео-генерации, доступная под лицензией Apache 2.0, которая предлагает бесплатный доступ к мощным возможностям генерации видео. В то время как конкурирующие решения предлагают платные тарифы, такие как Hailuo Unlimited за $94,99 в месяц, Mochi 1 предоставляет бесплатную альтернативу.

На момент запуска пользователи могут работать с моделью, поддерживающей разрешение 480p, а версия с высоким разрешением, Mochi 1 HD, ожидается позже в этом году. В начальных тестах модель продемонстрировала реалистичные движения и точное следование текстовым инструкциям, особенно при генерации видео с участием людей.

Посмотреть примеры можно в этой статье.

Прорыв в генерации видео

Mochi 1 существенно продвинула технологии генерации видео, предлагая высокую точность передачи движений и четкое соответствие пользовательским запросам. Модель использует новаторскую архитектуру Asymmetric Diffusion Transformer (AsymmDiT) и состоит из 10 миллиардов параметров, что делает её крупнейшей открытой моделью для генерации видео.

В Mochi 1 используются компрессионные алгоритмы, такие как Variational Autoencoder (VAE), что позволяет значительно уменьшить объём видео-данных и облегчить использование модели на пользовательских устройствах. Это делает её доступной для разработчиков, которые могут скачать вес модели с HuggingFace или интегрировать её через API.

Миссия Genmo: доступность ИИ-технологий

Соучредитель и генеральный директор Genmo, Парас Джайн, подчеркнул важность демократизации технологии генерации видео: «Мы считаем, что крайне важно передать эту технологию в руки как можно большего числа людей, именно поэтому мы делаем её с открытым исходным кодом». В будущем компания планирует использовать генерацию видео для создания симуляторов, которые могут быть применены в робототехнике и автономных системах.

Финансирование и будущее разработки

Одновременно с выпуском Mochi 1, Genmo объявила о привлечении финансирования в размере $28,4 миллиона в рамках серии A. Эти средства помогут компании продолжать исследования и разработки в области видео-генерации и расширить команду.

На сегодняшний день Mochi 1 поддерживает только разрешение 480p, и есть небольшие искажения в сложных движениях. Но модель демонстрирует значительные успехи в фотореалистичных стилях и станет более мощной с выходом версии HD.

Применение и перспективы

Открытие технологии Mochi 1 открывает новые возможности для различных отраслей — от развлечений и рекламы до образования и разработки роботизированных систем. В долгосрочной перспективе компания видит будущее, где ИИ поможет создавать лучшие симуляторы для автономных систем и роботов.

Возможность протестировать Mochi 1 уже доступна на площадке Genmo, а также компания активно ищет таланты для расширения команды исследователей и инженеров, чтобы продолжать работу над развитием технологий генерации видео.

Источник: habr.com

0 0 голоса
Рейтинг новости
4878
0
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии