Meta✴ вынуждена продлить срок эксплуатации некоторых из своих серверов общего назначения из-за дефицита DRAM с шести до семи лет, сообщает The Wall Street Journal со ссылкой на внутреннюю документацию техногиганта, где говорится о том, что компания не ожидала существенного дефицита поставок оборудования, в основном именно из-за нехватки оперативной памяти, а также жёстких дисков. Предполагается, что дефицит продлится минимум до 2027 года.
Ежегодно компания инвестирует огромные средства в инфраструктуру ЦОД и является одним из крупнейших заказчиков серверного оборудования в мире. Однако даже увеличение капзатрат до $125–$145 млрд в этом году не позволяет обновлять серверы прежними темпами. Внутренне моделирование Meta✴ показало, что увеличение срока эксплуатации серверов компании увеличит ожидаемую годовую интенсивность отказов (AFR) с 4,8 % до 7,4 % ежегодно. Такой риск считается приемлемым, хотя до восьми лет срок службы оборудования решили не продлевать.
95 % мирового выпуска DRAM приходится на Samsung Electronics, SK hynix и Micron Technology, которые в последние полтора года делают ставку на увеличение выпуска HBM для ИИ-ускорителей, поскольку такая память значительно маржинальнее обычной серверной DRAM. По оценкам IDC, речь может идти уже не о временном, «циклическом» дефиците, а о стратегическом перераспределении производственных ресурсов. Согласно прогнозам, на HBM в 2026 году придётся порядка 25 % выпуска всех пластин DRAM, спрос на неё растёт приблизительно на 70 % ежегодно.
Источник изображений: Meta✴
В результате цена DDR5 и других модулей резко выросла. Впрочем, с другими компонентами ситуация не лучше. Western Digital уже распродала даже не выпущенные HDD, у Seagate дела тоже идут отлично (для неё самой), а время поставок некоторых моделей серверных процессоров выросло до полугода. Таким образом, один из ключевых мировых покупателей серверного оборудования, в отличие от многих экспертов, не полагается на падение цен на память и другие компоненты к концу 2026 года, а предпочитает увеличить срок эксплуатации уже развёрнутого оборудования.
Для более мелких покупателей это может служить сигналом всё более серьёзных проблем с закупками в обозримой перспективе. Если получить достаточно памяти по приемлемой цене не рассчитывает гиперскейлер, прочие могут столкнуться с более длительными сроками поставок, частичным выполнением заказов и значительным ростом цен. Вполне может оказаться, что продление сроков службы оборудования — оптимальный сценарий не только для Meta✴, что, помимо прочего, приведёт к переносу капитальных затрат и замедлению внедрения более энергоэффективных и высокопроизводительных платформ.
Более того, дефициту HDD и SSD уделяется намного меньше внимания, чем нехватке DRAM, что, по-видимому, является ошибкой при планировании закупок. Массовая скупка HDD и рост цен на NAND оставляют всё меньше места для манёвра при формировании инфраструктуры для хранения данных. По мнению экспертов, новые производственные мощности для модулей памяти заработают ещё нескоро, и дефицит может постепенно снизиться в 2027–2028 гг., когда свои плоды начнут приносить инвестиции 2024–2025 гг.
В качестве временной меры возможно повышение эффективности использования имеющегося оборудования программными средствами. Например, NVIDIA анонсировала новое ПО для мониторинга и продления жизни ИИ-ускорителей в ЦОД. С другой стороны, индустрия не в первый раз прибегает к увеличению сроков службы оборудования. Так поступали Microsoft, Google, CloudFlare, Scaleway и др.
Источник: servernews.ru