Google обновила линейку генеративных моделей, сделав ставку на скорость и снижение порога входа для массового использования. В ночь на 1 июля компания открыла доступ к Nano Banana 2 Lite — самой быстрой и дешёвой нейросети для создания изображений в своём арсенале. Параллельно разработчикам стал доступен Gemini Omni Flash для генерации и редактирования видео в режиме диалога.
Новинка приходит на смену первой версии Nano Banana, которую в Google теперь прямо называют устаревшей. Внутренние замеры показывают, что Nano Banana 2 Lite выдаёт картинку в среднем за 4 секунды, что в пять раз быстрее оригинальной Nano Banana 2 (20 секунд) и чуть шустрее, чем Grok Imagine Image от xAI (6,4 секунды), при этом качество, по заверениям Google DeepMind, почти не уступает полноразмерной Nano Banana 2.
Сравнение разных версий генератора картинок
Генерация тысячи изображений в Nano Banana 2 Lite обойдётся в 0,034 доллара (примерно 2,6 рубля). Для сравнения: у базовой Nano Banana 2 тот же объём стоит вдвое дороже — 0,067 доллара. Снижение стоимости достигается не за счёт урезания функциональности, а за счёт оптимизации архитектуры под быстрые итерации. Модель сохраняет приличное следование текстовым подсказкам, удерживает стилистическую консистентность персонажей и научилась неплохо вписывать читаемый текст прямо в изображения. В Google AI Studio и Gemini API новая модель спрятана под техническим названием gemini-3.1-flash-lite-image, а для обычных пользователей она активируется при выборе режима Flash-Lite в интерфейсе Gemini. Помимо студии, модель уже внедряют в AI Mode поиска Google, приложение Gemini, NotebookLM, Google Photos, Stitch, Google Flow и рекламный кабинет Google Ads. Такой разброс намекает, что «лайт»-генератор картинок должен стать рабочей лошадкой для любых задач, где нужен быстрый визуальный черновик.
Вместе с Nano Banana 2 Lite компания выкатила в публичное превью Gemini Omni Flash — модель, заточенную на видео. Она принимает комбинацию текста, картинок и коротких видео, чтобы генерировать 10-секундные ролики с привязкой к реальным знаниям Gemini (история, биология, нарративная логика) и даёт редактировать результат голосом или текстом как в чате. Цена — 0,10 доллара за секунду сгенерированного видео, столько же, сколько у Veo 3.1 Fast. Пока есть ограничения: загрузка аудиодорожек и расширение сцен не поддерживаются, а видео длиннее трёх секунд на входе хоть и принимается API, но обрабатывается некорректно. В Google обещают поправить это в ближайших обновлениях и увеличить длительность генерации.

Обе модели поставляются с SynthID-водяными знаками, которые можно проверить через поиск, Gemini в Chrome или приложение Gemini. Безопасность и маркировка синтетического контента остаются стандартным пунктом любого релиза Google, и здесь исключений нет. Вся эта история явно нацелена на тех, кто строит пайплайны с высокой пропускной способностью: от лент соцсетей до каталогов маркетплейсов. Снижение времени ответа до четырёх секунд и ценник в два раза ниже предыдущего флагмана делают эксперименты с генеративным артом по-настоящему дешёвыми, а для части бизнесов — впервые рентабельными.
А вы уже пробовали новые режимы в Gemini или Google AI Studio? Делитесь в комментариях.
Тест по теме Тест: картина художника или арт от нейросети — слабо отличить работу человека от творения ИИ? 10 вопросов

Ermolaev Alexey 27 ноября 2022

В последнее время нейросети всё чаще используются в индустрии развлечений. Порой результат их работы неотличим от артов или скриншотов из игр. А сможете ли вы отличить их друг от друга? Такова основная задача в нашем новом тесте!
А ещё для разнообразия мы добавили несколько вопросов, в которых нужно угадать не авторство нейросети или человека, а запрос, который был сделан нейросети, чтобы создать рисунок.
Думается, что правила ясны, давайте начинать! Удачи. Начать Или пройдите в Telegram НовостиЖелезо и технологииGoogleнейросети
Источник: vgtimes.ru