AMD представила Instinct MI350X: новый AI-процессор на CDNA 4 для конкуренции с NVIDIA Blackwell

AMD официально представила свой новый графический процессор для искусственного интеллекта – Instinct MI350X, основанный на передовой вычислительной архитектуре CDNA 4. Этот мощный чип разработан для прямой конкуренции с серией NVIDIA B200 «Blackwell», причём AMD уже сравнивает свою топовую модель Instinct MI355X с B200 в своих презентациях.

MI350X не только дебютирует с архитектурой CDNA 4, но и является частью новейшего программного стека ROCm 7 и аппаратной экосистемы. Эта экосистема базируется на стандартной отраслевой спецификации Open Compute Project и включает процессоры AMD EPYC Zen 5, графические процессоры Instinct серии MI350, масштабируемые сетевые карты AMD-Pensando Pollara с поддержкой Ultra-Ethernet, а также стандартные стойки и узлы, доступные как в форм-факторах с воздушным, так и с жидкостным охлаждением.

MI350 – это гигантский чиплетный графический процессор для искусственного интеллекта, состоящий из многослойного кремния. Он имеет две базовые плитки, так называемые кристаллы ввода/вывода (IOD), каждая из которых изготовлена по 6-нм техпроцессу TSMC N6. Эти IOD плитки содержат микроскопическую проводку для подключения к четырём плиткам ускоряющих вычислительных кристаллов (XCD), расположенных сверху. Кроме того, на IOD расположены 128-канальные контроллеры памяти HBM3E, 256 МБ кэш-памяти Infinity, интерфейсы Infinity Fabric и корневой комплекс PCI-Express 5.0 x16.

Сами же XCD плитки производятся по 3-нм техпроцессу TSMC N3P. Каждая XCD содержит 4 МБ кэша L2 и четыре шейдерных движка, каждый из которых имеет 9 вычислительных блоков (CU). Таким образом, каждый XCD имеет 36 CU, а каждый IOD – 144 CU. Два IOD соединены двунаправленным соединением со скоростью 5,5 ТБ/с, что обеспечивает полную когерентность кэша между ними. В целом, весь корпус содержит 288 CU. Каждый IOD управляет четырьмя стеками HBM3E, предоставляя 144 ГБ памяти, что в сумме даёт 288 ГБ памяти для всего корпуса. Хотя MI350 с его 288 CU и 288 ГБ памяти может функционировать как один графический процессор, AMD предложила инновационные способы его разделения и управления физической памятью, как по IOD, так и по XCD.

На уровне платформы, каждый блейд-сервер поддерживает до восьми графических процессоров серии MI350. Пулы памяти этих процессоров соединены сетью «точка-точка» с пропускной способностью 153,6 Гбит/с, обеспечивая связь между каждым пакетом на узле. Кроме того, каждый пакет имеет подключение PCI-Express 5.0 x16 к одному из двух процессоров EPYC «Turin» узла, которые отвечают за последовательную обработку.

Павлик Александр

Источник: ru.gecid.com

0 0 голоса
Рейтинг новости
1
0
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии