OpenAI представила Sora 2 — новое поколение своей флагманской модели для генерации видео и аудио. Если оригинальная Sora, выпущенная в феврале 2024 года, была «GPT-1» для видео, то Sora 2 — это уже «GPT-3.5», обеспечивающая значительный скачок в симуляции мира и физической точности.
Разработчики сосредоточились на продвинутых возможностях симуляции, которые, по их мнению, критически важны для глубокого понимания ИИ физического мира. Sora 2 может генерировать видео, которые были невозможны для предыдущих моделей: например, тройной аксель фигуриста или сальто на доске для серфинга, точно моделирующее законы физики. В отличие от «чрезмерно оптимистичных» старых систем, Sora 2 способна моделировать не только успех, но и неудачу.
Модель также значительно улучшилась в управляемости, следует сложным инструкциям на протяжении нескольких кадров, работает с реалистичными, кинематографическими и аниме-стилями, а также генерирует синхронизированные диалоги и реалистичные звуковые ландшафты.
Ключевая новая функция — «камео»: пользователи могут вставлять себя, друзей, животных или любые объекты в сгенерированные сцены с точным воспроизведением внешности и голоса.
Для использования этой функции OpenAI выпустила новое социальное iOS-приложение под названием «Sora». Приложение, которое сначала запускается в США и Канаде, ориентировано на создание, а не потребление, и использует пригласительную систему для формирования сообщества. Компания подчеркивает свое внимание к безопасности, предлагая пользователям инструменты контроля ленты, родительский контроль и защиту личных данных. Модель Sora 2 доступна бесплатно, для пользователей подписки ChatGPT Pro будет доступна экспериментальная модель более высокого качества — Sora 2 Pro.
Источник: mobile-review.com