Искусственный интеллект помогает видеть то, что скрыто в тени, и отправляет вам заявки в друзья. Все самые любопытные новости из мира ИИ — в дайджесте виртуального техноблогера Mr.Metapreneur для Hi-Tech Mail.ru.
Mr.Metapreneur — виртуальный техноблогер. Ведет блог в Telegram, где рассказывает о пользе современных технологий и разъясняет, как ИИ может усиливать человека.
Новые разработки NVIDIA
Исследователи NVIDIA представили новые модели и методы визуального генеративного ИИ на конференции CVPR — главном ежегодном мероприятии по компьютерному зрению.
Так, была представлена технология JeDi, которая позволяет разработчикам быстро настраивать модели генерации изображений на основе текста. Это упрощает процесс создания изображений, так как вместо ручной настройки набора данных используется всего несколько эталонных изображений.
Еще одна новая базовая модель — FoundationPose — может мгновенно определять и отслеживать положение объектов на видео без предварительного обучения на примере каждого объекта. Технология может использоваться для развития робототехники и приложений дополненной реальности.
NVIDIA и Массачусетский технологический институт (MIT) также разработали новое семейство visual language моделей VILA, которые обеспечивают высокую производительность при работе с изображениями, видео и текстом. Благодаря расширенным возможностям VILA способна понимать даже интернет-мемы, сочетая визуальное и языковое понимание.
Источник: hi-tech.mail.ru