Сбер улучшил генератор картинок Kandinsky: что изменилось

Команда из почти сотни профессиональных художников и дизайнеров вручную отбирала лучшие изображения для обучения обновленной нейросети — такой подход к созданию ИИ-генераторов картинок применили впервые.

Российская компания Сбер запустила принципиально новую версию своего искусственного интеллекта для создания изображений Kandinsky 4.1 Image. Разработчики полностью переписали внутреннюю архитектуру системы и внедрили уникальную методологию обучения с участием живых экспертов.

Инженеры отказались от традиционной U-Net структуры в пользу диффузионного трансформера. Эта замена кардинально изменила принципы работы системы — теперь нейросеть может эффективно масштабироваться и показывать лучшие результаты при увеличении вычислительных мощностей.

Новый подход позволил достичь четырехкратного ускорения генерации без потери качества. Более того, в некоторых категориях изображений система стала работать даже лучше предыдущих версий.

Самым необычным решением стало привлечение команды профессиональных творцов для отбора обучающих материалов. Почти 100 художников, дизайнеров и фотографов прошли специальный экзамен на понимание композиции, освещения и цветовых сочетаний.

Процесс отбора данных проходил в два этапа. Сначала обычные специалисты убирали изображения с техническими дефектами — артефактами, неправильным кадрированием, засветами. Затем эксперты-художники оценивали сложные аспекты: гармонию композиции, баланс кадра, сочетание оттенков.

Источник: hi-tech.mail.ru

0 0 голоса
Рейтинг новости
1
0
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии