Вчера, 16 декабря, компания OpenAI официально представила новую версию своей флагманской генеративной модели ChatGPT Images, отвечающей за создание изображений по текстовым инструкциям пользователя. Разработчики модели рассказали, что ключевая особенность новинки в том, что теперь, когда пользователь запрашивает редактирование загруженного изображения, LLM точнее выполняет инструкции, вплоть до мельчайших деталей, следуя замыслу пользователя. И, что немаловажно, система будет изменять в изображении только то, что попросил пользователь, сохраняя при этом согласованность освещения, внешнего вида людей и общей композиции кадра. Изображения: OpenAI
Благодаря данному нововведению ChatGPT Images нового поколения, по словам OpenAI, будет лучше справляться с задачами по «примерке» одежды на пользователя, применению фильтров и концептуальному преображению изображения. Видео: OpenAI «В совокупности эти улучшения означают, что ChatGPT сможет выступать в качестве креативной студии в вашем кармане, способной как к практичному редактированию, так и к выразительному переосмыслению», — говорится в официальном блоге компании.
Кроме того, новая модель демонстрирует более креативный подход в процессе преобразования изображений, в рамках которых система добавляет различного рода элементы вроде текстовых надписей или шаблонов. Данные преобразования применимы как для простых сценариев, так и для сложных концепций, а предустановленные стили и идеи для генераций можно опробовать в отдельном разделе (в этом случае писать текстовую инструкцию не придётся). Генерация одного и того же промпта старой и новой версией ChatGPT Images | Изображения: OpenAI
Более того, и это одно из важнейших нововведений модели, новая версия ChatGPT Images гораздо лучше рендерит текстовый контент, обрабатывая в том числе мелкий шрифт и плотно написанный текст. Ранее многие пользователи жаловались именно на то, что искусственный интеллект очень плохо справляется с генерацией текста, тогда как конкуренты в этом направлении продвинулись далеко вперёд. Видимо, не зря Сэм Альтман, глава OpenAI, недавно объявил в компании «красный код» на фоне растущей конкуренции со стороны Google и прочих крупных игроков рынка ИИ-технологий. Изображения: OpenAI
Также в компании рассказали, что новая модель лучше обрабатывает дополнительные параметры, гораздо точнее справляется с рендерингом мелких деталей, а финальное изображение выглядит более естественным. И, что немаловажно, новая модель генерирует изображения в четыре раза быстрее предыдущей версии.
Источник: trashbox.ru