Google представила новый ИИ для создания картинок. Он обходит GPT Image в 6 из 7 бенчмарков

Google запустила Gemini 2.5 Flash Image — свою новую модель для создания графики, которая ранее тестировалась на LMArena под кодовым названием nano banana. На сервисе модель заняла первые места в 6 категориях: общая производительность, персонажи, креативность, инфографика, объекты и окружение и реконтекстуализация продукта (смена стиля при сохранении узнаваемости). Модель уступила GPT Image и Qwen Image Edit только в стилизации.

Отмечу, что на LMArena nano banana тестировалась около 10 дней. Пользователи отмечают хорошую работу модели со шрифтами, а также комбинированием нескольких изображений в одно — например, ИИ может взять картинку со стопкой книг, повернуть их и разместить на комоде, сохранив шрифты и исправив положение книг относительно друг друга. При этом модель справляется даже со сложными сценариями вроде комбинирования четырех изображений.

Модель уже можно бесплатно попробовать в приложении Gemini и на площадке Google AI Studio. В API стоимость создания изображения составляет $0,039 — столько же, сколько у предыдущей версии создания картинок.

P.S. Поддержать меня можно подпиской на канал «сбежавшая нейросеть», где я рассказываю про ИИ с творческой стороны.

Источник: habr.com

0 0 голоса
Рейтинг новости
1
0
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии