Чипы AMD MI350 обеспечивают большой объём памяти, но уступают Nvidia в сетевых технологиях

AMD стремится бросить вызов доминированию Nvidia на рынке чипов для искусственного интеллекта с помощью своих новых ускорителей серии Instinct MI350. Компания надеется, что эти чипы обеспечат преимущества при определённых рабочих нагрузках и снизят общие затраты, но программное обеспечение остаётся камнем преткновения.

Недавно компания AMD представила два новых чипа для искусственного интеллекта — Instinct MI350X и MI355X, основанные на новейшей архитектуре CDNA 4 и изготовленные по 3-нанометровому техпроцессу TSMC. Каждый чип содержит до 185 миллиардов транзисторов и поддерживает новые форматы данных, такие как FP4 и FP6. Обе модели оснащены 288 гигабайтами памяти HBM3E, что крайне важно для приложений ИИ.

MI350X с воздушным охлаждением потребляет 1000 Вт, в то время как MI355X потребляет 1400 Вт и может охлаждаться воздухом или жидкостью. На бумаге MI355X имеет лишь немного более высокий рейтинг TFLOPS, чем MI350X, но SemiAnalysis ожидает, что его реальная производительность будет более чем на 10% выше.

Как новые чипы AMD конкурируют с чипами Nvidia?

По данным SemiAnalysis, MI355X может конкурировать с HGX B200 от Nvidia с точки зрения производительности на единицу совокупной стоимости владения (TCO) для определённых задач ИИ, особенно при работе с языковыми моделями малого и среднего размера. TCO учитывает не только цену покупки, но и энергопотребление и обслуживание, и AMD заявляет о 33% преимуществе для автономных систем. AMD утверждает, что MI355X предлагает в 1,6 раза больше памяти и в 2,2 раза более высокую производительность FP6, чем B200 от Nvidia. Однако, по данным SemiAnalysis, при вычислениях FP4 B300 от Nvidia в 1,3 раза быстрее, чем MI355X.

Таким образом, MI350 выглядит как настоящий конкурент. Но по сравнению с системой Nvidia высшего уровня GB200 NVL72, MI355X отстаёт в работе с очень большими моделями или при обучении новых моделей, согласно SemiAnalysis. Одна из причин заключается в меньшем «размере мира» — только 8 чипов MI355X могут работать на полной скорости, в то время как Nvidia GB200 NVL72 позволяет это делать 72 чипам. В результате сложные рабочие нагрузки, требующие частой связи между множеством процессоров, могут выполняться на оборудовании AMD как минимум в 18 раз медленнее, пишет SemiAnalysis.

Они также критикуют маркетинговый ход AMD, заключающийся в представлении «стойки с 128 графическими процессорами» MI355X. На самом деле она состоит из 16 отдельных серверов с 8 графическими процессорами на каждом, а не из единой интегрированной системы для стоек.

AMD увеличила скорость обмена данными в кластере из 8 графических процессоров (масштабирование) по сравнению с подключением XGMI до 76,8 гигабайта в секунду, но сопоставимые системы Nvidia всё равно в 1,6 раза быстрее.

Программное обеспечение, партнёрские отношения и планы на будущее

Программное обеспечение — важнейшая составляющая продвижения AMD в области ИИ. С выходом 7-й версии ROCm компания AMD улучшила производительность приложений ИИ, заявив, что она в среднем в 3,5 раза выше, чем в предыдущей версии. Поддержка Triton, инструмента программирования для ИИ, также стала лучше. Тем не менее, библиотека коллективной коммуникации ROCm (RCCL), ключевая для многочиповой совместной работы, остаётся слабым местом и, по сути, является копией программного обеспечения NCCL от Nvidia.

По данным SemiAnalysis, AMD работает над расширением своей экосистемы поставщиков «неооблачных» сервисов, которые арендуют вычислительные мощности AMD. Сама AMD арендует мощности у таких компаний, как AWS и Oracle. Компания также предлагает собственное «облако для разработчиков AMD» с графическими процессорами MI300X, которые можно арендовать всего за 1,99 доллара в час, чтобы стимулировать конкуренцию. В то же время AMD работает над тем, чтобы зарплаты её инженеров по искусственному интеллекту соответствовали рынку в целом.

Серия MI400 ожидается во второй половине 2026 года и представляет собой настоящее стоечное решение, способное конкурировать с системой Nvidia VR200 NVL144. В ней будет использоваться «UALink over Ethernet» — разработанный AMD метод высокоскоростного подключения по стандартному Ethernet, аналогичный NVLink от Nvidia. SemiAnalysis сомневается, что это решение будет соответствовать производительности специализированного решения. Заглядывая в будущее, можно сказать, что выпуск MI500 UAL256 с 256 чипами запланирован на конец 2027 года. Серия MI350 уже доступна для заказа, а в третьем квартале 2025 года она станет более распространённой.

Пользуясь случаем, хочу порекомендовать BotHub — платформу, где можно протестировать все популярные модели без ограничений. Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 100 000 бесплатных токенов для первых задач и уже сейчас начать работать!

Источник

Источник: habr.com

0 0 голоса
Рейтинг новости
1
0
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии