Tencent выпустила HunyuanVideo 1.5, новую открытую модель для генерации видео, которая сейчас считается одним из самых сильных open-source решений в отрасли. Модель построена на архитектуре DiT и содержит 8,3 миллиарда параметров, что позволяет запускать её даже на потребительских видеокартах с примерно 14 ГБ видеопамяти. Другими словами, качественная генерация видео перестаёт быть прерогативой дата-центров.
Модель генерирует 5–10 секунд видео в 480p и 720p, а затем позволяет повышать разрешение до 1080p через встроенный суперрезолюшн. В итоге пользователи получают почти кинематографическую детализацию при крайне умеренных требованиях к железу. По уровню качества HunyuanVideo 1.5 уже сравнивают с закрытыми коммерческими моделями, но при этом она доступна свободно, без лицензий и платных API.
Проект открыт и уже доступен для загрузки и интеграции. Исходники лежат на GitHub.
А веса модели и пайплайны можно получить через Hugging Face.
Появление HunyuanVideo 1.5 заметно поднимает планку для open-source генераторов видео. Теперь полноценную работу с ИИ-видео можно строить без доступа к облаку и арендованных GPU, что делает модель особенно интересной для инди-разработчиков, художников, исследователей и стартапов, тестирующих идеи на локалке.
Делегируйте часть рутинных задач вместе с BotHub! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!
Источник: habr.com