Ажиотаж в Китае вокруг ИИ-видеосервисов — тревожный сигнал для всего мира

Изображение создано нейросетью

Китайские технологические компании бешеными темпами совершенствуют инструменты искусственного интеллекта, которые могут превращать текст в короткие видеоролики. «Выпуск нескольких сервисов по созданию видео на основе ИИ от крупных компаний и стартапов направлен на то, чтобы показать, как страна сокращает разрыв с США в области технологий. Но одновременно они открывают ящик Пандоры…», полагает эксперт.

Кэтрин Торбек попробовала работать с несколькими сервисами: «Они не позволили мне создать видео с брейк-дансом Си Цзиньпина, но один из них создал клип по моему портрету, на котором я сняла куртку и рубашку… Мне … стало жаль поколение молодых людей, которые растут с этой легкодоступной технологией».

Журналистка отмечает, что большинство созданных видео были очень «странными», над сервисами необходимо еще работать и работать:

«Моим любимым творением стала реалистичная серо-полосатая кошка, поедающая миску рамена в открытом космосе от Kling (запрос: «Можете ли вы сделать реалистичное видео серо-полосатой кошки, поедающей рамен в открытом космосе?»), но ИИ добавил жуткую человеческую руку, чтобы помочь котенку есть лапшу палочками. Vidu дал мне невероятно реалистичный кадр пары влюбленных в стиле легендарного режиссера Вонга Кар-Вая, но зачем-то удалил одежду (выше плеч) на моем собственном снимке. Когда я попросила Kling убрать мою куртку и рубашку с фотографии, он ничего не сделал».

За последние недели интернет-гигант Kuaishou Technology выпустил свой инструмент для создания видео на основе ИИ Kling; стартап Zhipu AI запустил Ying; материнская компания TikTok ByteDance Ltd. представила Jimeng; а стартап Shengshu AI при поддержке Университета Цинхуа запустил Vidu. Сообщается, что Alibaba Group Holding Ltd. также работает над собственным приложением для создания видео на основе ИИ.

Kuaishou заявили, что планируют использовать Kling для создания короткометражного фильма в жанре фэнтези, но сомнительно, что это будет что-то качественное, инструмент очень несовершенен. «Созданный мною клип с девушкой, танцующей брейк, был кошмарным. Анимационное видео, которое я сгенерировала, имело красивый фон, но там была летающая непонятная фигура. Мне также потребовалось около пяти минут, чтобы сгенерировать пятисекундный клип, так что представьте, сколько часов ушло бы на создание более длинного видео, не считая кропотливого пост-обработки и монтажа», считает эксперт.

Желание поскорее предложить эти сервисы китайской публике резко контрастирует со стратегией американских компаний. OpenAI анонсировала Sora в феврале, но пока не выпустила его. Veo от Google в настоящее время доступен только тестировщикам.

«..сдержанность американских технологических гигантов в запуске этих инструментов мудра (и экономит им массу вычислительных ресурсов). Но это также затрудняет оценку того, насколько их продукты на самом деле превосходят китайские аналоги. Согласно анонсам, которые мы видели от OpenAI и Google, они кажутся гораздо более способными создавать реалистичный видеоконтент».

Обучение видеомоделей ИИ требует огромных объемов визуальных данных и вычислительной мощности. Опубликованное исследование OpenAI по Sora показало, что качество видео «заметно улучшается» по мере увеличения вычислительных ресурсов для обучения.

Пекину в настоящее время ограничен доступ к первоклассному оборудованию от Nvidia Corp. и других компаний. Но китайские технологические компании находят способы получать эти продукты через сложные серые рыночные маршруты, а также занимаются производством ИИ-чипов ИИ самостоятельно. Интересно, насколько более мощными станут их видеосервисы и разработки ИИ через пять-десять лет?

Одни утверждают, что видеогенераторы ИИ демократизируют творчество, давая любому человеку возможность снимать собственные фильмы. Но непрозрачные данные обучения поднимают вопросы о правах интеллектуальной собственности и о том, как это может повлиять на заработки профессиональных создателей. Существуют также вполне обоснованные опасения, что обязательно найдутся мошенники, которые будут злоупотреблять ИИ-видеосервисами, создавая дезинформацию и даже фейковую порнографию.

«Между тем, настроения по всему миру ухудшаются в отношении контента, созданного ИИ. Некоторые из первоначальных «вау-факторов», испытанных после выпуска ChatGPT почти два года назад, превратились в усталость, и теперь возникают вопросы о том, как эта технология трансформируется во что-то, что сделает нашу жизнь лучше.

Возможно, уже слишком поздно загонять джинна обратно в бутылку, но поколение, которому приходится взрослеть под постоянной угрозой быть обманутым, заслуживает лучшего».

Источник: www.bloomberg.com

Источник: www.it-world.ru

0 0 голоса

Рейтинг новости

23566

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”