Boston Dynamics интегрировала ИИ Gemini в робота Spot

Boston Dynamics интегрировала ИИ Gemini в робота Spot

Робот читает рукописную записку, идет к обуви, раскладывает ее по местам, подбирает банки, складывает одежду в корзину. В финале берет поводок и выводит на прогулку собаку. Это не очередная фантазия разработчика — именно так Boston Dynamics показала результат интеграции языковой модели Gemini Robotics-ER 1.6 от Google DeepMind в своего четвероногого робота.

До этого момента Spot работал по скриптам. Инженеры заранее прописывали каждое действие: куда идти, что взять, как повернуть манипулятор. Стоило среде измениться, и робот терялся. Теперь схема другая: Spot видит обстановку камерами, языковая модель интерпретирует картинку и текстовую задачу, а затем самостоятельно выстраивает план действий.

Технически это называют VLA-архитектурой — vision-language-action. Проще говоря, три слоя: зрение, понимание языка и физическое действие. Модель не просто распознает объекты — она соображает, что с ними делать в конкретном контексте. Написано «убери обувь» — Spot сам решает, где она стоит, как к ней подойти и куда переложить.

Главная цель апгрейда — не домашние задачи, а промышленность. Spot уже работает на заводах, нефтехимических объектах и в дата-центрах. Там робот патрулирует территорию, считывает показания манометров, замечает лужи на полу, тепловые аномалии и открытые двери. С новой моделью он делает это без участия человека-оператора: сам фиксирует проблему, сам ее классифицирует, сам передает сигнал.

Для индустриальных заказчиков это принципиально. Раньше за каждый новый тип задачи приходилось перепрограммировать робота. Теперь достаточно поставить задачу текстом, и Spot сразу адаптируется. Это резко сокращает стоимость внедрения и расширяет список сценариев без дополнительных затрат на разработку.

Технологии есть куда стремиться, на той же демонстрации Spot схватил банку боком — неловко, как человек с онемевшей рукой. Мелкая ошибка, но показательная: модель пока не чувствует физику предметов так, как ее чувствуем мы. У людей это понимание складывается годами через тактильный опыт. У Spot есть только камеры и данные — осязания нет.

Именно поэтому Boston Dynamics не торопится с массовым выпуском. Компания запускает технологию поэтапно, собирает обратную связь от клиентов и выстраивает пороговые показатели надежности. Главный критерий — минимум ложных срабатываний. Если робот будет часто ошибаться, доверие к нему быстро упадет, и никакой ИИ это не компенсирует.

Партнерство Boston Dynamics и Google DeepMind началось в начале 2025 года. Gemini Robotics-ER 1.6 — первый публичный результат совместной работы. Следующим шагом, по заявлению обеих компаний, необходимо улучшить понимание физического мира через новые обучающие сценарии и более строгие поведенческие бенчмарки.

Также недавно писали, что теперь на маркетплейсе можно будет купить гуманоидного робота Unitree. Подробности в статье.

Источник: hi-tech.mail.ru

0 0 голоса
Рейтинг новости
1
0
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии