Boston Dynamics вместо кодирования Atlas просто показывает роботу, что делать

Работа с гуманоидом Atlas от Boston Dynamics открывает совершенно иной подход к обучению сложным задачам: теперь он учится, глядя на человека.

Запрограммировать машину так, чтобы она справлялась с бесконечным множеством человеческих ситуаций — от бережного обращения с хрупкими предметами до лавирования в тесных захламлённых пространствах, — всегда было делом почти непосильным. Но теперь на помощь приходят крупные поведенческие модели (large behavior models, LBM), которые обещают ускорить обучение роботов и сделать его куда более естественным.

Atlas — ученик в мире машин

В совместной демонстрации Boston Dynamics и Toyota Research Institute всего одна модель искусственного интеллекта ведёт Atlas через длинный цикл заданий под названием «Spot workshop». Робот задействует всё своё тело: берёт детали с тележки, складывает их и аккуратно помещает на полку. Затем он выдвигает низкий контейнер, чтобы уложить туда другие элементы, и под занавес выгружает остаток в огромный грузовик.

Но настоящее чудо начинается тогда, когда что‑то идёт не по плану. Первые версии ИИ пасовали перед неожиданностями. Решением оказалось вовсе не написание сложных новых алгоритмов: инженеры просто дали человеку‑оператору показать роботу, как выходить из неловких ситуаций — например, если деталь упала на пол или крышка контейнера вдруг захлопнулась. После переобучения на этих примерах Atlas научился самостоятельно реагировать и находить выход из затруднений.

Этот навык рождается из способности модели оценивать происходящее на основе сенсоров и действовать, опираясь на опыт, полученный в обучении. Теперь для того, чтобы задать новое поведение, уже не нужны годы инженерных усилий: достаточно пары новых примеров — и возможности Atlas начинают быстро расти.

Человек внутри машины

Как же научить робота? Всё начинается с того, что оператор надевает VR‑гарнитуру и полностью погружается в пространство робота, видя мир его глазами — через стереокамеры на «голове». Датчики на руках и ногах передают движения напрямую: Atlas двигается точно так же, как человек, — плавно, естественно, интуитивно.

Именно эта телесистема позволяет собирать данные высочайшего качества. Когда робот приседает за упавшей вещью или осторожно делает шаг, чтобы занять новое положение, за каждым его жестом стоит человек, чьи движения превращаются в исходный материал для обучения.

Эти данные поступают в «мозг» Atlas — архитектуру diffusion transformer с 450 млн параметров. Модель учитывает всё: изображения, собственное «ощущение тела» (проприоцепцию), а также текстовый запрос, описывающий задачу. На выходе рождаются точные команды, управляющие всем телом с его 50 степенями свободы.

Весь процесс идёт по непрерывному циклу: сбор данных → обучение модели → проверка результатов → решение, что собирать дальше.

Обучение сложному и непредсказуемому

Учёные убедились: чем больше и разнообразнее задания, тем лучше робот справляется и с обобщением, и с исправлением ошибок. Он осваивает то, что почти невозможно было бы закодировать вручную из‑за сложности и непредсказуемости.

Всего одна языковая модель позволила Atlas научиться завязывать верёвку, расправлять скатерть и даже управляться с автомобильной шиной весом 10 кг.

Исследователи выяснили, что для LBM неважно, складывает ли робот твёрдые кубики или сворачивает футболку: если человек способен показать действие — Atlas способен его освоить. Более того, в процессе испытаний оказалось, что робот может выполнять задания в полтора‑два раза быстрее, чем человеческая демонстрация, — и без потери качества.

Следующие шаги — расширять этот «маховик данных», увеличивая и разнообразие, и сложность задач, параллельно исследуя новые алгоритмы ИИ и источники информации. Это лишь начало долгого пути к будущему, где гуманоиды вроде Atlas будут работать рядом с нами и для нас — уже в реальном мире.

Делегируйте рутинные задачи вместе с BotHub! По ссылке вы можете получить 100 000 бесплатных капсов и приступить к работе с нейросетями прямо сейчас.

Источник: habr.com

0 0 голоса
Рейтинг новости
1
0
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии