Компания OpenAI, создатель ChatGPT, представила нейросеть SORA, генерирующую реалистичные видео на основе текстового описания или изображений. В сравнении с уже доступными аналогами это настоящая революция в мире ИИ.
Промпт: стильная женщина идёт по улице Токио, наполненной теплым светящимся неоном и анимированными вывесками города. На ней чёрная кожаная куртка, длинное красное платье и черные ботинки.
SORA может генерировать сложные ролики с высоким уровнем детализации, множеством динамичных объектов и пониманием физических свойств объектов. Продолжительность видео — до минуты.
Промпт: трейлер фильма, рассказывающий о приключениях 30-летнего космонавта в красном шерстяном вязаном мотоциклетном шлеме, голубое небо, соляная пустыня, кинематографический стиль, снятый на 35-мм плёнку, яркие цвета.
Разработчики отметили, что существующая модель может неточно моделировать физику сложной сцены и неправильно интерпретировать некоторые причинно-следственные связи. Ниже яркий пример.
Промпт: археологи обнаруживают в пустыне обычный пластиковый стул, тщательно раскапывая и вытирая его.
После анонса Сэм Альтман, глава OpenAI, в соцсетях демонстрировал работу SORA, генерируя ролики по запросам в комментариях. Вот один из них.
Промпт: два золотистых ретривера ведут подкаст на вершине горы.
Доступ к нейросети пока открыт только ряду специалистов-тестировщиков, а также некоторым иллюстраторам, дизайнерам и кинематографистам, которые должны будут изучить возможности применения SORA.
Сроки открытого тестирования компания пока не называет. Оставить заявку на участие в испытаниях можно на официальном сайте.
На официальном сайте проекта представлено больше примеров, часть из которых сложно отличить от реальной съёмки на камеру.
Источник: lifehacker.ru