Компания Genmo, специализирующаяся на генеративных видео-технологиях с использованием ИИ, анонсировала выпуск исследовательской версии модели Mochi 1 — открытого программного решения для создания высококачественных видео на основе текстовых запросов. Genmo заявляет, что Mochi 1 по производительности может конкурировать с ведущими моделями, такими как Runway’s Gen-3 Alpha, Luma AI’s Dream Machine, Kuaishou’s Kling, и другими.Основные особенности Mochi 1
Скриншот из сгенерированного моделью видео.Основные особенности Mochi 1
Mochi 1 — это первая в своем роде модель с открытым исходным кодом для видео-генерации, доступная под лицензией Apache 2.0, которая предлагает бесплатный доступ к мощным возможностям генерации видео. В то время как конкурирующие решения предлагают платные тарифы, такие как Hailuo Unlimited за $94,99 в месяц, Mochi 1 предоставляет бесплатную альтернативу.
На момент запуска пользователи могут работать с моделью, поддерживающей разрешение 480p, а версия с высоким разрешением, Mochi 1 HD, ожидается позже в этом году. В начальных тестах модель продемонстрировала реалистичные движения и точное следование текстовым инструкциям, особенно при генерации видео с участием людей.
Посмотреть примеры можно в этой статье.
Прорыв в генерации видео
Mochi 1 существенно продвинула технологии генерации видео, предлагая высокую точность передачи движений и четкое соответствие пользовательским запросам. Модель использует новаторскую архитектуру Asymmetric Diffusion Transformer (AsymmDiT) и состоит из 10 миллиардов параметров, что делает её крупнейшей открытой моделью для генерации видео.
В Mochi 1 используются компрессионные алгоритмы, такие как Variational Autoencoder (VAE), что позволяет значительно уменьшить объём видео-данных и облегчить использование модели на пользовательских устройствах. Это делает её доступной для разработчиков, которые могут скачать вес модели с HuggingFace или интегрировать её через API.
Миссия Genmo: доступность ИИ-технологий
Соучредитель и генеральный директор Genmo, Парас Джайн, подчеркнул важность демократизации технологии генерации видео: «Мы считаем, что крайне важно передать эту технологию в руки как можно большего числа людей, именно поэтому мы делаем её с открытым исходным кодом». В будущем компания планирует использовать генерацию видео для создания симуляторов, которые могут быть применены в робототехнике и автономных системах.
Финансирование и будущее разработки
Одновременно с выпуском Mochi 1, Genmo объявила о привлечении финансирования в размере $28,4 миллиона в рамках серии A. Эти средства помогут компании продолжать исследования и разработки в области видео-генерации и расширить команду.
На сегодняшний день Mochi 1 поддерживает только разрешение 480p, и есть небольшие искажения в сложных движениях. Но модель демонстрирует значительные успехи в фотореалистичных стилях и станет более мощной с выходом версии HD.
Применение и перспективы
Открытие технологии Mochi 1 открывает новые возможности для различных отраслей — от развлечений и рекламы до образования и разработки роботизированных систем. В долгосрочной перспективе компания видит будущее, где ИИ поможет создавать лучшие симуляторы для автономных систем и роботов.
Возможность протестировать Mochi 1 уже доступна на площадке Genmo, а также компания активно ищет таланты для расширения команды исследователей и инженеров, чтобы продолжать работу над развитием технологий генерации видео.
Источник: habr.com