Исследователи из Google DeepMind представили метод обучения, который позволил им обучить робота выполнять такие действия, как завязывание шнурков, подвешивание рубашек и даже починку других роботов.
Исследователи применили обучающую платформу ALOHA Unleashed и собственную программу моделирования DemoStart, которая позволяет роботам обучаться в процессе наблюдения за людьми.
Исследование команды DeepMind в первую очередь демонстрирует, как роботы учатся выполнять сложные задачи на визуальных демонстрациях. ALOHA Unleashed помогает им учиться выполнять сложные и новые задачи по манипуляции двумя руками; DemoStart же использует моделирование для улучшения реальных характеристик роботизированной руки с несколькими пальцами.
До сих пор большинство передовых роботов с искусственным интеллектом способны лишь поднимать и размещать предметы и делать это только с помощью одной руки.
Метод ALOHA Unleashed основан на платформе ALOHA 2, которая представляет собой доработку недорогой аппаратной системе с открытым исходным кодом для двуручного телеуправления, разработанной в Стэнфордском университете.
Сначала исследователи собрали демонстрационные данные, удалённо управляя поведением робота при выполнении сложных задач. Затем они применили метод диффузии, предсказывая действия робота по случайному шуму, аналогично тому, как модель Imagen генерирует изображения.
DemoStart использует алгоритм обучения с подкреплением, чтобы помочь роботам в симуляциях. Сначала модель учится на простых действиях, а со временем начинает осваивать более сложные. Ей требуется в 100 раз меньше смоделированных демонстраций, чтобы научиться решать задачу в симуляции.
Робот достиг показателя успешности более 98% в ряде различных задач, включая переориентацию кубиков с определённым цветом, затягивание гайки и болта, а также уборку инструментов. В реальной ситуации он достиг показателя успешности 97% при переориентации и подъеме кубика и 64% при задаче вставки вилки в гнездо, которая требовала высокой координации пальцев и точности.
Как отмечают исследователи, роботизированное обучение в симуляции может сократить затраты и время, необходимые для проведения реальных физических экспериментов. Но такие симуляции сложно проектировать, и, кроме того, они не всегда успешно реализуются уже в реальности. Объединяя обучение с подкреплением и демонстрации, DemoStart автоматически генерирует учебную программу, которая преодолевает разрыв между симуляцией и реальностью, упрощая перенос знаний и сокращая затраты и время.
Метод протестировали на трёхпалой роботизированной руке DEX-EE, которая была разработана в сотрудничестве с Shadow Robot.
В 2023 году DeepMind создала робота под названием RoboCat с искусственным интеллектом. Команда разработчиков заявила, что добилась у RoboCat прорыва в освоении новых задач, а также улучшения производительности за счёт построения роботом собственных данных о ней. Чем больше новых задач робот усваивает, тем лучше он осваивает дополнительные задачи.
Источник: habr.com