Создатели ChatGPT обновили генератор картинок так, что Midjourney и Nano Banana внезапно устарели

Предыстория: OpenAI случайно засветила GPT Image 2: новая нейросеть рисует интерфейсы YouTube лучше, чем реальный YouTube

OpenAI без развернула новую модель генерации изображений под названием GPT Image 2. Она уже доступна внутри ChatGPT для платных подписчиков и, судя по первым тестам, заметно опережает не только предыдущую версию, но и большинство специализированных нейросетей вроде Nano Banana Pro и Flux.

Модель появилась на фоне запланированного на 12 мая 2026 года отключения API для DALL‑E 2 и DALL‑E 3 и по сути, это окончательный переход OpenAI на линейку GPT Image, интегрированную напрямую в чат‑интерфейс. Предыдущая версия, вышедшая в декабре 2025‑го, уже умела генерировать изображения быстрее DALL‑E и поддерживала редактирование в контексте диалога, но у неё оставались заметные ограничения: тёплый желтоватый оттенок на многих результатах, проблемы с длинным текстом внутри картинки и слабая точность при описании сложных сцен.

Примеры работ GPT Image 2

В GPT Image 2 разработчики сделали упор на несколько вещей, которые раньше считались почти нерешаемыми для генеративных моделей. Во‑первых, рендеринг текста, теперь нейросеть теперь отображает надписи на изображениях с точностью выше 99 процентов, включая поддержку кириллицы и иероглифов. Для дизайнеров и маркетологов это означает возможность получать макеты с читаемыми заголовками и кнопками без доработки в фотошопе. Во‑вторых, устранён постоянный жёлтый каст, который преследовал предыдущие версии и цветопередача стала нейтральной. В‑третьих, модель научилась удерживать внешность персонажа при нескольких генерациях подряд.

Разрешение тоже подтянули и максимальный размер теперь достигает 2048×2048 пикселей, чего достаточно для небольших печатных материалов и уверенного масштабирования под веб. Одним из самых неожиданных применений GPT Image 2 стала генерация правдоподобных экранов приложений и игровых сцен. Модель без проблем создаёт интерфейсы в стиле Steam, Twitch или фитнес‑приложений с корректным расположением элементов. Также встроенный апскейл позволяет улучшать качество существующих картинок — убирать шум, повышать резкость и восстанавливать детали.

Примеры работ с текстом от GPT Image 2

Официально GPT Image 2 доступна в веб‑версии и приложениях ChatGPT для пользователей с платной подпиской. Генерация происходит прямо в диалоге, без переключения на отдельный сервис. Бесплатные пользователи могут создать до 5 картинок в день. Стоит отметить, что на площадке LM Arena в начале апреля засветились анонимные модели с кодовыми именами вроде «duct‑tape», которые позже оказались тестовыми сборками GPT Image 2. Тогда же в ChatGPT началось A/B‑тестирование: некоторые пользователи замечали резкое улучшение качества при тех же запросах.

Очевидно, что конкуренты не будут сидеть сложа руки и та же Nano Banana Pro уже получила несколько обновлений, а Midjourney продолжает развивать редактор и контроль композиции.

А вы уже пробовали новую модель или пока пользуетесь альтернативами? Какие сценарии генерации для вас самые востребованные — реалистичные фото, интерфейсы или что‑то ещё? Делитесь в комментариях.

НовостиЖелезо и технологииискусственный интеллектOpenAIChatGPT

Источник: vgtimes.ru

0 0 голоса

Рейтинг новости