PyTorch представил фреймворк, который превращает тысячи GPU в один логический компьютер

PyTorch снова делает шаг вперёд в инфраструктуре AI. Команда анонсировала Monarch, систему распределённых вычислений, которая позволяет управлять тысячами графических процессоров из одного простого Python-скрипта.

До сих пор разработчики пользовались SPMD-подходом, где каждый узел в кластере выполняет одинаковый код независимо, но Monarch ломает этот принцип. Теперь можно писать одну управляющую программу, а фреймворк сам распределяет вычисления и синхронизацию между узлами.

Monarch вводит концепцию многомерных вычислительных сеток (meshes) — структур, в которых процессы и акторы могут напрямую взаимодействовать между собой, передавая данные GPU без участия CPU, через RDMA. Это сильно сокращает накладные расходы и ускоряет задачи вроде обучения RL, fine-tuning или многомодального анализа.

Бонус — полная совместимость с привычным Python. Можно использовать Jupyter Notebook и дебажить всё в реальном времени. Система поддерживает динамическое масштабирование, отказоустойчивость и понятную отладку ошибок.

Фреймворк уже встроен в TorchForge, VERL и Lightning AI, что делает его потенциальным стандартом для новой волны распределённого обучения. Фактически, Monarch превращает кластер в единый мозг, управляемый из одного окна. Следим за новостями дальше!

Делегируйте часть рутинных задач вместе с BotHub! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!

Источник

Источник: habr.com

0 0 голоса

Рейтинг новости

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”