YouTube активно использует разработки Google DeepMind в области генерации видео, а также другие ИИ-инструменты, чтобы привлечь авторов и не уступить конкурентам.
Во вторник платформа представила целый набор продуктов на базе генеративного искусственного интеллекта, рассчитанных на широкую аудиторию. Этот шаг призван продемонстрировать, что многомиллиардные инвестиции YouTube в ИИ начинают приносить ощутимые результаты.
Новые функции выходят далеко за рамки привычных инструментов редактирования, которые в последние годы предлагали YouTube и другие соцсети. Многие из них созданы специально для авторов и формата коротких видео YouTube Shorts — показатель того, что платформа усиливает конкуренцию с TikTok от ByteDance и Instagram, принадлежащим Meta*.
Часть новых возможностей основана на модели Veo 3 Fast от Google DeepMind, которая способна за считаные секунды сгенерировать реалистичное видео и аудио — от диалогов до звуковых эффектов — всего по текстовому запросу со смартфона.
«Двадцать лет назад YouTube появился с идеей, что каждый должен иметь возможность творить и заявить о себе на мировой сцене, — написала во вторник в блоге к мероприятию Made on YouTube в Нью-Йорке директор по продуктам YouTube Джоанна Вулич. — С тех пор мы видим, как создатели формируют культуру и индустрию развлечений способами, которые ранее казались невозможными». Она добавила, что за последние четыре года YouTube выплатил авторам более 100 миллиардов долларов.
Скоро создатели смогут использовать Veo 3 Fast для добавления фонов, реквизита и спецэффектов в Shorts. С начала следующего года подкастеры получат возможность легко генерировать видеоролики на основе своих аудиозаписей. А авторы видеоподкастов — которые сегодня смотрят в общей сложности по 100 миллионов часов ежедневно, что уже значительно опережает традиционное ТВ, — в ближайшие месяцы смогут с помощью ИИ создавать подборки лучших моментов и делиться ими в соцсетях.
Кроме Veo, YouTube внедряет инструмент Ask Studio — диалогового ИИ-ассистента, который вскоре начнет предоставлять американским авторам аналитику и обратную связь по их контенту. По словам Амджада Ханифа, вице-президента YouTube по управлению продуктами для создателей, этот инструмент станет их «главным креативным партнером» и «первым помощником, к которому авторы будут обращаться».
YouTube также тестирует новые подходы к улучшению технологии дубляжа: по данным компании, она уже помогла перевести более 60 миллионов роликов на 20 языков, расширяя охват аудитории. Вскоре появится функция «speech-to-song», основанная на музыкальной модели Lyria 2 от DeepMind: она позволит превращать слова и фразы из видео в музыкальное сопровождение.
От внедрения генеративного ИИ выиграют и бренды. В панели Google Ads скоро появятся рекомендации по подбору авторов для рекламных кампаний, а в YouTube Shopping — инструменты для упрощенной отметки товаров в видео.
При этом Alphabet, материнская компания YouTube, не единственная, кто активно интегрирует генеративный ИИ в социальные платформы. Meta* недавно провела масштабный набор специалистов для своего нового исследовательского центра супер-ИИ и делает ставку на рекламные продукты с использованием искусственного интеллекта в Instagram и Facebook. А Илон Маск, объединивший свою соцсеть X со стартапом xAI, намерен использовать ИИ для перестройки рекламной системы X и проверки достоверности публикаций.
Однако гонка за лидерство в ИИ порождает и новые вызовы для пользователей соцсетей — от неконтролируемого распространения дезинформации до взрывного роста видео и аудио с чужими лицами и голосами без разрешения. В качестве одной из мер защиты YouTube расширяет доступ авторов к инструменту, который будет искать на платформе ролики, созданные ИИ с нарушением прав на изображение, и упрощать их удаление.
«Наша цель — создавать технологии искусственного интеллекта, которые развивают человеческое творчество ответственно. И это включает защиту авторов и их бизнеса», — отметил Ханиф в блоге компании.
Источник: Bloomberg
*На территории России запрещена деятельность компании Meta и принадлежащих ей Facebook и Instagram.
Чтобы не пропустить анонс новых материалов подпишитесь на «Голос Технократии» — мы регулярно рассказываем о новостях про AI, LLM и RAG, а также делимся полезными мастридами и актуальными событиями.
Источник: habr.com