Microsoft представила новую модель для генерации изображений

Microsoft представила MAI-Image-1 — собственную модель для генерации изображений, которая теперь доступна в Bing Image Creator и мобильных приложениях Bing. Это первая крупная text-to-image система, полностью созданная внутри Microsoft, без участия OpenAI или сторонних лабораторий.

MAI-Image-1 уже вошла в десятку лучших моделей на LMArena, платформе для сравнительного тестирования генераторов изображений. Модель демонстрирует стабильное качество и точную передачу текстовых описаний, особенно в сценах с несколькими персонажами или сложными композициями, где многие другие ИИ дают сбой.

Главное отличие в оптимизации под голосовые и визуальные ассистенты Microsoft. MAI-Image-1 интегрирована в Copilot Audio Expressions, где она визуализирует истории, описанные голосом пользователя. Таким образом, Copilot теперь может не только рассказать, но и показать рассказ.

Модель построена на усовершенствованной архитектуре Diffusion XL, обучалась на мультиязычном корпусе данных, и поддерживает текстовые запросы на десятках языков. По заявлению Microsoft, MAI-Image-1 станет ядром для всей линейки мультимодальных продуктов компании.

В настоящее время модель доступна во всех регионах, где работают Bing Image Creator и Copilot Labs, кроме стран Европейского союза, там компания ждёт окончательного одобрения регуляторов.

Делегируйте часть рутинных задач вместе с BotHub! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!

Источник

Источник: habr.com

0 0 голоса

Рейтинг новости

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”