Сегодня, 27 апреля, компания «Сбер» официально представила Kandinsky 6.0 Image — новую генеративную модель, которая способна создавать контент весьма высокого качества. Представители компании заявили, что новинка уже доступна в рамках ИИ-помощника «ГигаЧат» — в веб-версии, мобильном приложении и мессенджерах. Более того, инструмент абсолютно бесплатный и, что довольно важно, у него нет ограничений по количеству генераций, так что у пользователей будет достаточно пространства для экспериментов. При этом свежая флагманская модель работает примерно в два раза быстрее, гораздо лучше понимает сложные промпты и может похвастаться повышенной детализацией генерации. Подписывайтесь на Telegram-канал про технологии
Кроме того, разработчики системы заметно «прокачали» возможности генеративной модели не только в разрезе генерации контента — Kandinsky 6.0 Image лучше справляется и с редактированием предоставленных изображений. Например, ИИ прекрасно справляется с реставрацией старых и/или повреждённых фотографий — алгоритмы умело обрабатывают контент, нивелируя царапины, потёртости и иные физические повреждения. Более того, эти снимки можно сделать цветными — финальный результат выглядит весьма привлекательно. Изображение: пресс-служба компании «Сбер»
Также модель нового поколения поддерживает стилизацию контента — можно изменить оформление фотографии, применив стиль аниме, комиксов или мультфильмов. А режим «Нейрофотосессии» предоставляет пользователю прекрасную возможность сгенерировать целую серию фотографий на основе одного базового кадра. При этом система поменяет фон, одежду и даже локацию, чтобы снимки выглядели более разнообразными. В «Сбере» сообщили, что в определённых сценариях новая модель способна конкурировать с ведущими решениями на рынке — Nano-Banana, Flux и Qwen.
Ещё в «Сбере» заявили, что новая версия модели лучше работает со сложными многосоставными инструкциями и гораздо аккуратнее вносит небольшие правки. Например, если попросить ИИ добавить очки человеку на фото, то система выполнит поставленную задачу, но не затронет остальные элементы кадра, что крайне удобно — позволяет быстро добиться желаемого результата. Изображение: пресс-служба компании «Сбер» «Вырос уровень детализации в сложных сценах — интерьерах, сервировке стола, изображениях с большим числом людей. Ошибок и „галлюцинаций” стало меньше, текст на изображениях генерируется корректнее», — цитата из официального пресс-релиза компании.
Важный момент — в основе Kandinsky 6.0 Image лежит новая архитектура Mixture of Experts, которая в наши дни является основным стандартом для больших языковых моделей. Вместо того, чтобы задействовать всю LLM для каждого запроса, модель выбирает лишь нужного «эксперта» и экономит ресурсы.
Источник: trashbox.ru