Google запустила Gemini 2.5 Flash Image — свою новую модель для создания графики, которая ранее тестировалась на LMArena под кодовым названием nano banana. На сервисе модель заняла первые места в 6 категориях: общая производительность, персонажи, креативность, инфографика, объекты и окружение и реконтекстуализация продукта (смена стиля при сохранении узнаваемости). Модель уступила GPT Image и Qwen Image Edit только в стилизации.
Отмечу, что на LMArena nano banana тестировалась около 10 дней. Пользователи отмечают хорошую работу модели со шрифтами, а также комбинированием нескольких изображений в одно — например, ИИ может взять картинку со стопкой книг, повернуть их и разместить на комоде, сохранив шрифты и исправив положение книг относительно друг друга. При этом модель справляется даже со сложными сценариями вроде комбинирования четырех изображений.
Модель уже можно бесплатно попробовать в приложении Gemini и на площадке Google AI Studio. В API стоимость создания изображения составляет $0,039 — столько же, сколько у предыдущей версии создания картинок.
P.S. Поддержать меня можно подпиской на канал «сбежавшая нейросеть», где я рассказываю про ИИ с творческой стороны.
Источник: habr.com