Российские компании, развивающие искусственный интеллект (ИИ), продолжают закупать необходимое для этого оборудование. В первую очередь это видеокарты Nvidia для объединения в высокопроизводительные кластеры. Перспективы участники рынка видят в системном развитии инфраструктуры, в том числе с использованием климатических особенностей страны. Например, строительство ИИ‑дата‑центров на севере России.
Российские компании все активнее развивают направление машинного обучения в последние годы. Так, «Яндекс» и Сбербанк не только интегрировали большие языковые модели (LLM) YandexGPT и GigaChat в свои ассистенты, но и позволили компаниям обращаться к ним за обработкой или генерацией контента. Продукты и функции на базе генеративного ИИ, использующие собственные LLM, также представили VK и МТС.
Для разработки LLM необходимы значительные вычислительные мощности и чем больше у модели параметров — тем выше ее способности и число операций, предпринимаемых для ее тренировки. Само по себе обращение к нейросетям, прошедшим тренировку, также расходует ресурсы. Стоимость ответов на основе YandexGPT, например, в пересчете на пользователя в семь раз выше, чем при использовании классических технологий.
Одна из главных деталей в работе с ИИ — графические ускорители (видеокарты). Изначально они использовались только для компьютерной графики: видеоигр, 3D‑моделирования и рендеринга. В 2006 году американский производитель Nvidia дал разработчикам возможность применять видеокарты для вычислений общего характера, например алгебраических вычислений. По итогам 2023 года на серверные графические ускорители Nvidia приходится 97% всей выручки, которую приносит сегмент во всем мире, следует из исследования Dell»Oro Group.
По информации «Коммерсанта», российские игроки покупают и более новые, производительные ускорители на архитектурах Ada и Hopper. Популярностью пользуются модели видеокарт Nvidia RTX A6000 (для рабочих станций) и Tesla H100 (для серверов).
При этом Nvidia с 2022 года в РФ формально не работает — продукцию не поставляет и не поддерживает ее. Санкции усложняют закупки и поставки серверов «с адекватными конфигурациями и ценами» и приводят к разрыву в доступности мощностей между странами. Это, подчеркивает источник «Ъ» среди производителей электроники, сдерживает рост рынка ЦОДов: «В России есть компании, готовые много инвестировать в ИИ‑дата‑центры, но нет тех, кто способен поставить оборудование в нужном объеме».
В мировом масштабе гонка за мощностями для ИИ привела к тому, что компоненты начали устанавливать и в потребительскую электронику. В технику внедряют нейронные процессоры (NPU): производительность у них меньше, чем у видеокарт, но и электроэнергии они потребляют меньше. NPU, например, есть в умной колонке «Яндекс Станция Миди», там он отвечает за распознавание команд без интернета.
Нейропроцессоры есть и в компьютерах. Например, от Apple, начиная с моделей на M1 от 2020 года. Компьютеры, оснащенные NPU, называются AI PC (ПК для искусственного интеллекта), в 2024 году выйдут новые чипы Intel, AMD и Qualcomm со встроенными нейронными блоками как раздля этой категории «железа». В 2023 году, по данным Gartner, рынок персональных компьютеров сократился на 14,8%, но появление ИИ‑ПК призвано способствовать его росту на 3,5%. Nvidia к ИИ‑ПК относят и компьютеры без NPU, оснащенные ее видеокартами, поэтому в январе компания заявила о «более 100 млн» уже существующих ПК такого класса.
Российский бизнес пока «не видит смысла переплачивать за процессоры с NPU», сообщает «Коммерсантъ» со ссылкой на свои источники. Причины в том, что не всегда очевидно, как технические преимущества такого оборудования трансформируются в измеримые бизнес‑результаты и не очевидны сценарии, при которых ИИ‑ПК были бы экономически выгоднее серверного подхода.
Развитие ИИ приводит к росту спроса на накопители и диски, а это потребует строительства высокоплотных энергонагруженных ЦОДов, уверены собеседники издания.
«Потребители уже стали запрашивать достаточно высокие мощности, вплоть до 15–20 кВт в расчете на стойку, на перспективу внедрения вбоевую ИИ, даже если эти характеристики избыточны для них в моменте», — рассказал IT‑директор облачного провайдера OXYGEN Александр Будкин.
Он добавил, что это требует «переосмысления ЦОДа как конечного коммерческого продукта» для ИТ рынка: «ИИ требует значительно больше электричества и приводит к большему тепловыделению, но при этом не нужны каналы с высокой пропускной способностью».
«Если тенденция сохранится на четыре‑пять лет, можно будет говорить о проектах ЦОДов, рассчитанных именно под ИИ. Они могут быть размещены в регионах с холодным климатом, работать от электричества с электростанций на попутном газе. Такие идеи высказывались и раньше, но считались нецелесообразными из‑за относительной неразвитости каналов связи, но ИИ более толерантен к задержкам», — уверен Александр Будкин.
А как вы считаете, какое направление будет развиваться активнее — NPU или ИИ‑ЦОД? Что будет с поставками видеокарт Nvidia и других производителей? Что вообще будет с ИИ в России в ближайшие годы? Поделитесь мнением в комментариях!
И подписывайтесь на наш канал в Telegram, там мы не только постим новости про IT, но и рассказываем про облака, дата-центры и кибербез!
Источник: habr.com