Китайские ИИ-компании могут отказаться от open-source-подхода к большим языковым моделям, предупреждают аналитики. Для российских разработчиков это грозит ростом затрат, замедлением развития и необходимостью масштабных инвестиций в создание суверенного ИИ.
По данным исследования Совкомбанка, в ближайшие годы китайские технологические компании могут изменить подход к распространению LLM и постепенно отказаться от практики открытого доступа к ним. Сегодня ряд ведущих китайских разработчиков, включая DeepSeek и Qwen от Alibaba Cloud, придерживаются стратегии open-source. По их мнению, такой подход способствует усилению ценовой конкуренции с продвинутыми американскими ИИ-моделями, однако одновременно ограничивает возможности китайских компаний по монетизации собственных разработок и не создает достаточного конкурентного давления на американских игроков рынка. Если китайские разработчики начнут сокращать объемы публикации моделей с открытым исходным кодом, это может создать дополнительные сложности для российских компаний. В настоящее время многие отечественные разработчики используют передовые открытые модели, в том числе китайского происхождения, как основу для последующей адаптации и дообучения под собственные задачи.
В исследовании говорится, что по мере ограничения доступа к новым китайским моделям будут сокращаться возможности загружать модельные веса и их развертывания на локальной инфраструктуре. Получение доступа к следующим поколениям решений будет требовать значительных расходов на лицензирование или использование API. В результате российским компаниям придется увеличивать затраты для сохранения нынешних темпов развития собственных больших языковых моделей.
Авторы исследования также подчеркивают, что на сегодняшний день разработка LLM не обеспечивает положительного денежного потока ни одной компании в мире. В качестве примера приводятся российские лидеры рынка — «Сбер» и «Яндекс». Расходы «Яндекса» на развитие ИИ в 2026 году составляют порядка 150–200 млрд рублей, вложения «Сбера» оцениваются в диапазоне 300–400 млрд рублей.
Аналитики выделяют три возможных сценария для российских участников рынка в случае заметного сокращения публикаций моделей в формате open-source со стороны зарубежных разработчиков. Первый вариант предполагает увеличение расходов из-за необходимости приобретать коммерческий доступ к иностранным LLM. Это может оказать дополнительное давление на свободный денежный поток российских компаний. Второй сценарий связан с риском замедления развития отечественных решений. Если различия в возможностях российских и зарубежных моделей станут заметны конечным пользователям, часть аудитории может переключиться на глобальные сервисы. Третий сценарий предусматривает масштабный пересмотр стратегии развития отрасли и запуск долгосрочных программ по формированию собственной инфраструктуры для обучения моделей. Такой подход потребует кратного увеличения инвестиций в дата-центры, вычислительные мощности и подготовку специалистов. Этот путь является самым капиталоемким, однако именно он способен обеспечить полную технологическую независимость и в перспективе может стать источником конкурентных преимуществ.
Создание суверенного ИИ в России возможно, однако вопрос заключается в объеме необходимых ресурсов и сроках реализации. Наиболее реалистичным вариантом в среднесрочной перспективе аналитики считают гибридную модель развития, при которой российские компании продолжают развивать собственные компетенции в области эксплуатации, адаптации и дообучения моделей, используя при этом зарубежные технологии на этапе их первоначального обучения. Для достижения полной независимости потребуется многократное увеличение инвестиций в вычислительную инфраструктуру и длительный период реализации таких проектов. Авторы исследования считают, что существующих ресурсов в стране пока недостаточно для создания суверенного ИИ мирового уровня. По их оценке, совокупная мощность российских ЦОДов не позволяет в полном объеме обучать LLM с нуля в масштабах, сопоставимых с мировыми лидерами. Такой вывод был сделан на основании анализа расходов ключевых российских разработчиков LLM и ситуации на рынке серверного оборудования.
Согласно прогнозу Совкомбанка, к 2030 году затраты на серверное оборудование для дата-центров могут достигнуть 7,8 трлн рублей. Из этой суммы около 3,4 трлн рублей придется непосредственно на серверы, предназначенные для работы с большими языковыми моделями.
Для обучения суверенной языковой модели уровня DeepSeek V4 потребуется специализированный ИИ-центр обработки данных мощностью не менее 300 МВт. Такой объект должен обеспечивать как обучение модели с нуля, так и ее последующую работу с учетом потенциального числа пользователей в России. Капитальные затраты на строительство подобного центра составят около 1,2 трлн рубле. Совокупные ежегодные расходы «Сбера» и «Яндекса» на закупку серверов и строительство дата-центров достигают примерно 500 млрд рублей. Однако приобретаемое оборудование преимущественно используется для инференса уже существующих моделей. Эти модели либо основаны на других open-source-решениях, либо уступают по качеству DeepSeek V4. Ни один из российских игроков пока не располагает специализированным ИИ-ЦОДом мощностью не менее 300 МВт, необходимым для полноценного обучения модели такого уровня с нуля.
Тема суверенных и национальных моделей искусственного интеллекта также отражена в законопроекте, подготовленном правительством в марте. Источник в IT-отрасли сообщил Forbes, что включение моделей в категорию суверенных предполагается сделать добровольным. Компании, претендующие на такой статус, должны будут подтвердить отсутствие использования иностранных кодов или данных при создании своих решений.
В «Сбере» считают, что в России уже есть необходимые ресурсы и компетенции для создания суверенных ИИ-моделей мирового уровня, и подчеркивает, что «ГигаЧат» является полностью собственной разработкой. «Яндекс» сообщил, что сохраняет полный цикл разработки своих моделей, сочетая собственные технологии с открытыми решениями для ускорения развития. В MWS AI полагают, что оптимальной остается стратегия сочетания открытых технологий и развития собственных моделей, поскольку создание конкурентоспособного ИИ требует огромных инвестиций и инфраструктуры.
Эксперты отмечают, что полный технологический суверенитет в области ИИ пока затруднен из-за ограниченности вычислительных мощностей и ресурсов. Наиболее реалистичным сценарием они считают развитие собственных технологий с одновременной адаптацией и дообучением открытых моделей. Цифровые двойники в промышленности. Как виртуальные модели создают конкурентное преимущество ИИ сделал ненужными 12 тыс. программ в вузах КНР Кредитка для дипфейка
Источник: www.it-world.ru