На конференции I/O Google показала сразу две новые разработки в области ИИ. Одна сделала акцент на скорости работы, другая на работу с медиаконтентом.
Gemini 3.5 Flash — это обновлённая ИИ-модель, что используется в чат-боте компании. Она уже доступна всем желающим не только в приложении Gemini, но и в ИИ-режиме Поиска Google. Работает очень быстро, но при этом «почти не уступает по уму самым мощным версиям Gemini». Модель «особенно хороша» в написании кода и в «способности выполнять сложные задачи по инструкциям». Также она отлично понимает текст, изображения и звук.
Gemini Omni — уже модель нового типа. Она умеет создавать видео на основе чего угодно: картинок, аудио, обычного видео или текста. При этом видео получаются «качественными и реалистичными», хвалится компания. Модель, мол, понимает законы физики: силу тяжести, движение жидкостей, энергию. После создания видео его можно легко изменить. Все сгенерированные видео имеют цифровую метку SynthID.
Первая модель в семействе Omni — Gemini Omni Flash стала доступна подписчикам планов Google AI Plus, Pro и Ultra по всему миру в приложении Gemini и в сервисе Google Flow.
Источник: www.ferra.ru