У NVIDIA проблемы? Аналитики предупреждают, что инженеры ИИ смотрят в сторону специализированных ASIC из-за цен на чипы и охлаждение

Инвестиционный банк Evercore ISI опубликовал отчет, в котором предупреждает об изменении настроений среди инженеров и архитекторов ИИ-систем. Несмотря на то, что ускорители NVIDIA традиционно считаются эталоном производительности, непомерно высокая стоимость самих чипов, расходы на их энергоснабжение и жидкостное охлаждение заставляют гиперскейлеров все активнее смотреть в сторону кастомных ASIC-решений (например, Google TPU или Amazon Trainium) и более доступных альтернатив.

Индустрия ИИ стремительно переходит от стадии обучения моделей к стадии их массового использования (инференса). Согласно оценкам экспертов из Nebius, на задачи инференса сейчас приходится до 95% всех корпоративных нагрузок. В этой реальности пиковая пропускная способность уходит на второй план, а главными метриками эффективности становятся стоимость генерации миллиона токенов, коэффициент полезного использования, энергопотребление и общая стоимость владения.

Громкие заявления NVIDIA о «35-кратном превосходстве» новых архитектур не находят должного отклика у рядовых ИИ-инженеров на фоне понимания того, что валовая маржа NVIDIA на уровне 70% является избыточной накруткой. Разработчики все чаще соглашаются на чипы категории «достаточно хорошие», если они позволяют существенно улучшить экономику проекта.

Стоимость постройки дата-центра на базе новейших стоек NVIDIA (например, Blackwell или грядущей Vera Rubin) обходится примерно в два раза дороже, чем развертывание аналогичного по мощности ЦОД на специализированных ASIC. И хотя аналитики из Morgan Stanley парируют это тем, что Blackwell предлагает превосходство в энергоэффективности на ватт в 2–8 раз, инженеров пугает совокупная цена сопутствующей обвязки — систем питания, сложнейших контуров охлаждения и запредельно дорогой памяти HBM4/LPDDR5X, которая теперь занимает до 26% стоимости всей серверной стойки.

В Evercore заключают, что хотя позиции NVIDIA в сегменте максимальной производительности все еще непоколебимы, прагматичный подход инженеров к оптимизации бюджетов создает идеальные условия для ускоренного внедрения домашних чипов от Google, Amazon и Meta, а также альтернативных ускорителей от конкурентов.

Источник: www.goha.ru

0 0 голоса
Рейтинг новости
1
0
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии