OpenAI крупно обновила генератор изображений: лучше следует промптам и в 4 раза быстрее

Вчера, 16 декабря, компания OpenAI официально представила новую версию своей флагманской генеративной модели ChatGPT Images, отвечающей за создание изображений по текстовым инструкциям пользователя. Разработчики модели рассказали, что ключевая особенность новинки в том, что теперь, когда пользователь запрашивает редактирование загруженного изображения, LLM точнее выполняет инструкции, вплоть до мельчайших деталей, следуя замыслу пользователя. И, что немаловажно, система будет изменять в изображении только то, что попросил пользователь, сохраняя при этом согласованность освещения, внешнего вида людей и общей композиции кадра. Изображения: OpenAI

Благодаря данному нововведению ChatGPT Images нового поколения, по словам OpenAI, будет лучше справляться с задачами по «примерке» одежды на пользователя, применению фильтров и концептуальному преображению изображения. Видео: OpenAI «В совокупности эти улучшения означают, что ChatGPT сможет выступать в качестве креативной студии в вашем кармане, способной как к практичному редактированию, так и к выразительному переосмыслению», — говорится в официальном блоге компании.

Кроме того, новая модель демонстрирует более креативный подход в процессе преобразования изображений, в рамках которых система добавляет различного рода элементы вроде текстовых надписей или шаблонов. Данные преобразования применимы как для простых сценариев, так и для сложных концепций, а предустановленные стили и идеи для генераций можно опробовать в отдельном разделе (в этом случае писать текстовую инструкцию не придётся). Генерация одного и того же промпта старой и новой версией ChatGPT Images | Изображения: OpenAI

Более того, и это одно из важнейших нововведений модели, новая версия ChatGPT Images гораздо лучше рендерит текстовый контент, обрабатывая в том числе мелкий шрифт и плотно написанный текст. Ранее многие пользователи жаловались именно на то, что искусственный интеллект очень плохо справляется с генерацией текста, тогда как конкуренты в этом направлении продвинулись далеко вперёд. Видимо, не зря Сэм Альтман, глава OpenAI, недавно объявил в компании «красный код» на фоне растущей конкуренции со стороны Google и прочих крупных игроков рынка ИИ-технологий. Изображения: OpenAI

Также в компании рассказали, что новая модель лучше обрабатывает дополнительные параметры, гораздо точнее справляется с рендерингом мелких деталей, а финальное изображение выглядит более естественным. И, что немаловажно, новая модель генерирует изображения в четыре раза быстрее предыдущей версии.

Источник: trashbox.ru

0 0 голоса
Рейтинг новости
1
0
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии