Модели, доступные для загрузки с платформы Hugging Face, принадлежат к новому семейству, названному JanusPro. Они имеют размер от 1 до 7 миллиардов параметров, причём модели с большим количеством параметров, демонстрируют высокую производительность.
JanusPro распространяется по лицензии MIT, что позволяет использовать модель в коммерческих целях без ограничений. Компания описывает JanusPro как «новую авторегрессионную структуру», способную как анализировать, так и создавать новые изображения. Самая большая модель в семействе, JanusPro7B, превосходит DALLE 3, а также такие решения, как PixArtalpha, Emu3Gen и Stable Diffusion XL от Stability AI, в двух оценочных тестах — GenEval и DPGBench.
Хотя большинство моделей JanusPro могут анализировать только изображения с разрешением до 384 x 384, их производительность впечатляет, учитывая компактные размеры. Это делает JanusPro сильным кандидатом на звание одной из самых универсальных мультимодальных моделей. DeepSeek подчёркивает, что простота, высокая гибкость и эффективность новой модели соответствуют или превосходят производительность специализированных моделей.
JanusPro7B является усовершенствованной версией предыдущей модели Janus. Улучшения включают:
Обновлённые процессы обучения: модель обучена на 72 миллионах высококачественных синтетических изображений, сбалансированных с реальными данными.
Повышенное качество данных: новые подходы к обработке и увеличению объёма данных способствуют более детализированным результатам.
Увеличенный размер модели: это обеспечивает стабильность и высокий уровень генерации изображений.
Новое поколение моделей DeepSeek может применяться в дизайне, рекламе, медиа и сфере развлечений, а возможность создавать высококачественные изображения на основе текстовых запросов делает JanusPro незаменимым инструментом для профессионалов.
С выпуском JanusPro7B компания бросает вызов таким гигантам, как OpenAI и Stability AI, а успех DeepSeek в разработке языковых и визуальных моделей искусственного интеллекта вызывает сомнения о лидерстве США.
Около года назад Google приостанавливал работу Gemini, считая, что она выдает крайне сомнительные результаты в исторических фотографиях. Для подтверждения такой позиции было достаточно лишь взглянуть на изображения американских сенаторов позапрошлого века. Читайте также ВКС 2024: Рейтинг систем видеоконференцсвязи IT-World провел опрос ИТ-директоров, экспертов клуба «ИТ-Диалог», о качестве наиболее популярных систем ВКС по нескольким критериям. Такой подход кардинально отличается от субъективного взгляда других редакций и основан исключительно на практическом опыте управленцев, которые используют данные системы в своей ежедневной работе.
Источник: Hugging Face
Источник: www.it-world.ru