OpenAI крупно обновила генератор изображений: лучше следует промптам и в 4 раза быстрее

Вчера, 16 декабря, компания OpenAI официально представила новую версию своей флагманской генеративной модели ChatGPT Images, отвечающей за создание изображений по текстовым инструкциям пользователя. Разработчики модели рассказали, что ключевая особенность новинки в том, что теперь, когда пользователь запрашивает редактирование загруженного изображения, LLM точнее выполняет инструкции, вплоть до мельчайших деталей, следуя замыслу пользователя. И, что немаловажно, система будет изменять в изображении только то, что попросил пользователь, сохраняя при этом согласованность освещения, внешнего вида людей и общей композиции кадра. Изображения: OpenAI

Благодаря данному нововведению ChatGPT Images нового поколения, по словам OpenAI, будет лучше справляться с задачами по «примерке» одежды на пользователя, применению фильтров и концептуальному преображению изображения. Видео: OpenAI «В совокупности эти улучшения означают, что ChatGPT сможет выступать в качестве креативной студии в вашем кармане, способной как к практичному редактированию, так и к выразительному переосмыслению», — говорится в официальном блоге компании.

Кроме того, новая модель демонстрирует более креативный подход в процессе преобразования изображений, в рамках которых система добавляет различного рода элементы вроде текстовых надписей или шаблонов. Данные преобразования применимы как для простых сценариев, так и для сложных концепций, а предустановленные стили и идеи для генераций можно опробовать в отдельном разделе (в этом случае писать текстовую инструкцию не придётся). Генерация одного и того же промпта старой и новой версией ChatGPT Images | Изображения: OpenAI

Более того, и это одно из важнейших нововведений модели, новая версия ChatGPT Images гораздо лучше рендерит текстовый контент, обрабатывая в том числе мелкий шрифт и плотно написанный текст. Ранее многие пользователи жаловались именно на то, что искусственный интеллект очень плохо справляется с генерацией текста, тогда как конкуренты в этом направлении продвинулись далеко вперёд. Видимо, не зря Сэм Альтман, глава OpenAI, недавно объявил в компании «красный код» на фоне растущей конкуренции со стороны Google и прочих крупных игроков рынка ИИ-технологий. Изображения: OpenAI

Также в компании рассказали, что новая модель лучше обрабатывает дополнительные параметры, гораздо точнее справляется с рендерингом мелких деталей, а финальное изображение выглядит более естественным. И, что немаловажно, новая модель генерирует изображения в четыре раза быстрее предыдущей версии.

Источник: trashbox.ru

0 0 голоса

Рейтинг новости

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”