Google на конференции Google I/O 2026 вместе с радикально переработанным «Поиском» представила новую мультимодальную линейку ИИ-моделей Gemini Omni. По словам главы DeepMind и технического директора Google Демиса Хассабиса, она должна стать ещё одним шагом к созданию AGI — искусственного интеллекта общего назначения.
Первая модель серии называется Gemini Omni Flash. Её главная особенность — генерация видео со звуком из самых разных исходных данных: картинок, текста, схем, роликов и голосовых записей. Google утверждает, что модель сочетает знания Gemini о реальном мире с улучшенным пониманием физики, поэтому сцены выглядят более правдоподобно, чем раньше, а объекты ведут себя естественнее.
В компании отдельно подчёркивают, что Omni Flash умеет учитывать гравитацию, кинетическую энергию и поведение жидкостей. В примерах Google показала генерацию сложных сцен с движущимися объектами, а также анимированные научные объяснения вроде ролика о сворачивании белков в стиле пластилиновой анимации.
Одной из ключевых функций стала возможность редактировать видео через диалог с нейросетью. Пользователь может менять детали сцены текстовыми командами, а модель будет сохранять персонажей, окружение и логику происходящего между правками.
Например, Omni Flash позволяет превратить скульптуру в конструкцию из пузырей, изменить действия героев в уже снятом видео или добавить спецэффекты. Также можно менять стиль, угол камеры, окружение и отдельные объекты без повторного создания ролика.
Компания также тестирует функцию Avatars — создание цифрового аватара по фотографиям и записи голоса пользователя. После первоначальной загрузки материалов можно будет генерировать новые ролики только по текстовому описанию.
Gemini Omni объединяет способность Gemini рассуждать со способностью создавать.
Google отдельно отмечает, что все видео, созданные через Omni, автоматически получают скрытую цифровую метку SynthID. Проверить происхождение ролика можно через Gemini, поиск Google и браузер Chrome.
Gemini Omni Flash уже начала появляться у пользователей приложения Gemini, сервиса Flow и YouTube Shorts. Доступ к модели получили подписчики Google AI Plus, Pro и Ultra, а для авторов в YouTube Shorts и приложении YouTube Create её открыли бесплатно. В ближайшие недели Google пообещала добавить Omni Flash в API и инструменты для разработчиков.
Источник: lifehacker.ru