Google DeepMind создала две модели искусственного интеллекта: Gemini Robotics и Gemini Robotics-ER. Они помогают роботам лучше понимать окружающий мир и взаимодействовать с ним. Это важный шаг к созданию роботов-ассистентов, которые смогут работать в реальной жизни, а не только в лабораториях.
До сих пор робототехника сталкивалась с серьезной проблемой: даже если роботы были физически совершенны, им не хватало умного программного управления. Новые модели Google базируются на системе Gemini 2.0 — мощной языковой модели, которая теперь может не только понимать команды, но и правильно их выполнять. Gemini Robotics может видеть предметы, понимать человеческие команды и двигаться в ответ на них, а Gemini Robotics-ER лучше воспринимает пространство и умеет соединяться с разными системами управления.
Например, если попросить робота «положить банан в корзину», он не просто выполнит команду по шаблону, а действительно увидит банан, поймет, где находится корзина, и аккуратно положит фрукт туда. Или, скажем, если сказать «сложи оригами в форме лисы», робот не просто скомкает бумагу, а сложит ее так, как это делает человек.
Еще в 2023 году Google выпустила модель RT-2, которая позволяла роботам понимать команды и адаптироваться к новым задачам. Но тогда они могли только использовать заранее изученные движения. Теперь же Gemini Robotics выводит роботов на новый уровень — они учатся делать сложные вещи самостоятельно.
Одна из главных особенностей новой системы — это ее способность к обучению. Если раньше робота нужно было специально тренировать под каждую задачу, то теперь он может осваивать новые действия на лету. Это делает возможным создание роботов, которые смогут работать в непредсказуемых условиях, например, в домах, больницах или на складах.
Google также заключила партнерство с компанией Apptronik, планируя развивать новые поколения гуманоидных роботов. Хотя сейчас система тренируется на роботах с двумя манипуляторами (руками), в будущем она сможет работать и с более сложными механизмами, например, с гуманоидными роботами.
Безопасность остается важным вопросом, и Google подходит к нему серьезно. Компания разработала специальные меры защиты, включая систему предотвращения столкновений и ограничение силы движений. Более того, они создали «Конституцию робота», основанную на «Трех законах робототехники» Айзека Азимова, а также выпустили датасет ASIMOV, который поможет тестировать безопасность действий роботов.
Пока что Gemini Robotics — это исследовательский проект, и неясно, когда он появится в коммерческом использовании. Видео с демонстрацией возможностей впечатляют, но пока неизвестно, как система покажет себя в реальной жизни. Ясно одно: Google делает большие шаги к тому, чтобы роботы стали умнее, аккуратнее и действительно полезными в повседневных задачах.
На фоне подобных новостей, еще интереснее выглядит информация о том, что искусственный интеллект не только совершенствуется в логических рассуждениях, но и осваивает куда более спорные навыки — например, умение хитрить и обходить правила. Читайте также Как не превратить 1С в конструктор желаний? Можно ли одновременно сохранить гибкость и стабильность системы? Как организовать поддержку так, чтобы пользователи не превращали ИТ-отдел в бюро «скоропомощников», а бизнес не страдал от бесконечных «доработок на коленке»?
Источник: Arstechnica
Источник: www.it-world.ru