Сбербанк продолжает активно развивать open source-инициативы и выкладывает сразу две новые модели, которые могут изменить работу с данными и контентом.
Первая модель — Giga-Embeddings. Это крупная embedding-система, которая превращает текстовые запросы и документы в семантические векторы. Такой формат незаменим для построения современных RAG-систем, интеллектуального поиска и кластеризации данных. У разработчиков теперь появляется возможность бесплатно подключать инструмент, который ранее был доступен только внутри крупных компаний. Сбер утверждает, что Giga-Embeddings отличается высокой скоростью, точностью и адаптивностью — её можно дообучать под свои домены и улучшать релевантность.
Вторая новинка — Kandinsky 5.0 Video Lite, облегчённая версия Kandinsky для генерации видео по тексту. Модель весит всего 2 млрд параметров, но, по словам разработчиков, выдаёт ролики уровня Wan 2.2 A14B, которая в 13 раз больше. Это означает, что создавать короткие видеосцены или целые сюжеты по текстовому описанию теперь можно на куда более скромном железе. Kandinsky 5.0 Video Lite особенно интересна небольшим студиям, разработчикам приложений и стартапам, которым нужны доступные инструменты генерации медиа.
Обе модели выложены в открытый доступ на Hugging Face — Giga-Embeddings здесь, а Kandinsky 5.0 Video Lite здесь. По сути, Сбер формирует собственную экосистему open source-инструментов, способных конкурировать с западными разработками. Для бизнеса это возможность построить свои рекомендательные системы, поисковые движки и сервисы генерации контента без лицензий и больших затрат.
Делегируйте часть рутинных задач вместе с BotHub! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!
Источник: habr.com