Intel с партнёрами разработает эталонный дизайн стоек с чипами Xeon для ODM и OEM-производителей

Intel совместно с SambaNova и Foxconn объявила о намерении создать референс-дизайн стоечной ИИ-инфраструктуры на базе процессоров Intel Xeon для ЦОД, гиперскейлеров и центров интеллектуального управления.

Как сообщает The Register, подход основан на ранее разработанной Intel совместно с SambaNova концепции дезагрегированного ИИ. Архитектура распределяет ресурсоёмкие операции предварительного заполнения между GPU NVIDIA, используя ИИ-ускорители SambaNova для ресурсоёмких операций декодирования, что позволяет увеличить выход токенов для каждого пользователя в 2–3 раза.

Генеральный директор Intel Лип-Бу Тан (Lip-Bu Tan) представил два примера таких проектов. Один предназначен для агентных нагрузок, чувствительных к задержкам, а другой — для обеспечения максимальной плотности вычислений.

Источник изображения: Intel

Обе конфигурации поддерживают до 128 процессоров Intel: либо 128-ядерных Intel Granite Rapids Xeon 6, либо 288-ядерных Intel Clearwater Forest Xeon 6+, что в сумме составляет от 16 384 P-ядер до 36 864 E-ядер, а также до 384 Тбайт оперативной памяти DDR5 при энергопотреблении 100 кВт. Тан сообщил, что системы на основе этого референс-дизайна будут широко доступны у ODM- и OEM-партнёров компании.

В рамках сотрудничества Foxconn предоставит возможности системной интеграции для новой стоечной ИИ-инфраструктуры. Компания также планирует выпускать вариант стоечной инфраструктуры с высокой плотностью процессоров для рабочих нагрузок, не требующих дополнительного ускорения, включая оптимизированные по стоимости задачи инференса, обработку данных и гибридный ИИ.

Intel объявила, что облачный провайдер Vector Core Compute, созданный Vista Equity Partners и Cambium Capital, станет одним из первых, кто развернёт эту платформу, а Together.AI — её первым коммерческим клиентом.

Также на выставке Computex 2026 компании Intel, SambaNova, Vista Equity Partners и Cambium Capital представили первую реальную демонстрацию дезагрегированной системы инференса, использующей процессоры Intel Xeon 6 для оркестрации и выполнения, блоки RDU SambaNova SN40 для декодирования и GPU NVIDIA Blackwell для предварительного заполнения, работающую из ЦОД Vector Core Compute в Лос-Анджелесе, (Los Angeles, Калифорния, США).

Напомним, что ранее NVIDIA объявила о запуске аналогичной стоечной платформы, включающей 256 88-ядерных процессоров Vera, ускорители Rubin и LPU Groq 3.

Arm также работает над парой референс-дизайнов стоечных систем для агентных рабочих нагрузок на основе своих новых процессоров Arm AGI: 36-киловаттной системой с воздушным охлаждением и 8160 ядрами, а также 200-киловаттной системой с жидкостным охлаждением и 45 696 ядрами.

Источник: servernews.ru

0 0 голоса

Рейтинг новости