AMD официально представила ROCm 7.0, обновление своей открытой вычислительной платформы Radeon, вместе с новыми графическими процессорами серии Instinct MI350. Этот программный стек, который сейчас доступен в формате предварительного просмотра, призван обеспечить значительные улучшения производительности для рабочих нагрузок с искусственным интеллектом.
ROCm 7.0 сосредоточен на поддержке новейших ускорителей MI350 и MI355X, добавляя новые алгоритмы, модели и расширенные корпоративные функции. AMD заявляет об увеличении производительности до 3,5 раз по сравнению с ROCm 6 в популярных моделях ИИ. Например, компания утверждает о 3,2-кратном увеличении производительности Llama 3.1 70B, 3,4-кратном увеличении Qwen2-72B и 3,8-кратном увеличении производительности DeepSeek R1.
Особенно стоит отметить, что ROCm 7 достигает на 30 процентов более высокой пропускной способности в DeepSeek R1 на графическом процессоре MI355X по сравнению с платформой NVIDIA Blackwell B200 под управлением CUDA. Однако, стоит учитывать, что сравнения AMD с ROCm 6 базируются на дате первичной поддержки конкретных моделей, а не на последней стабильной версии, что несколько усложняет прямую интерпретацию этих результатов.
Помимо чистой производительности, ROCm 7.0 представляет несколько новых технических возможностей. Стек теперь поддерживает расширенные типы данных, такие как FP8, FP6, FP4 и смешанная точность, которые критически важны для современных задач искусственного интеллекта. Программное обеспечение также предлагает новые ядра и алгоритмы, включая автонастройку GEMM, MoE, механизмы внимания и систему создания ядра на основе Python.
AMD подтвердила свою цель сделать ROCm универсальной платформой, планируя расширить поддержку на клиентские графические процессоры Radeon и ноутбуки на базе Ryzen позднее в этом году. Официальный выпуск ROCm 7.0 ожидается позднее в 2025 году, а пока AMD призывает разработчиков начать тестирование предварительной версии.
videocardz.com
Павлик Александр
Источник: ru.gecid.com