Xiaomi представила ИИ-модель для роботов

«Топ за свои деньги»-компания объявила о запуске Xiaomi-Robotics-0. Это открытая VLA-модель с 4,7 миллиарда параметров. Она объединяет визуальное восприятие (Vision), понимание языка (Language) и генерацию физических действий (Action) для управления роботами. По словам компании, модель уже отлично себя показывает как в симуляциях, так и в реальных тестах.

Robotics-0 строится на двух ключевых компонентах:

Первый — Visual Language Model (VLM), «мозг» системы, который интерпретирует команды человека и распознаёт объекты, учитывая «пространственные отношения».

Второй — Action Expert на базе Diffusion Transformer (DiT), что генерирует последовательности движений, обеспечивая «точность» и «плавность» выполнения задач.

Модель обучалась так, чтобы «сохранять способность к рассуждению и пониманию мира», даже осваивая физические действия.

В тестах на нескольких симуляторах Xiaomi-Robotics-0 превзошла около 30 других моделей. На реальной двурукой платформе робот, мол, показал «высокую координацию движений» и «умение работать с жёсткими и гибкими объектами».

Источник: www.ferra.ru

0 0 голоса
Рейтинг новости
1
0
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии