ИИ-ускорители Huawei Ascend стали причиной задержки выхода DeepSeek R2, сообщают источники издания Financial Times. В издании напоминают, что DeepSeek R1 обучали на ускорителях NVIDIA, но после успеха этого ИИ в январе, китайские чиновники связались с разработчиками и попросили попробовать обучить новую модель на чипах Ascend.
В процессе работы над ИИ оказалось, что китайские ускорители на данный момент уступают NVIDIA не только в производительности — наблюдаются проблемы в программном обеспечении и параллельной работе большого количества ускорителей. В итоге попытка обучения модели на ускорителях Ascend провалилась — не помогло даже то, что Huawei отправил в офис DeepSeek команду инженеров для помощи с настройкой чипов.
Как результат, разработчикам пришлось разделить ресурсы. Для обучения DeepSeek R2 они вернулись к привычным ускорителям NVIDIA, а чипы Huawei Ascend планируется использовать в инференсе — эксплуатации уже готовой модели конечными пользователями.
Еще один источник добавляет, что для новой модели разработчики слишком долго размечали данные для обучения. По слухам, изначально выход DeepSeek R2 был запланирован на май, но из-за недовольства руководства качеством модели, релиз пришлось перенести. Сейчас называются разные даты — от конца августа до осени.
P.S. Поддержать меня можно подпиской на канал «сбежавшая нейросеть», где я рассказываю про ИИ с творческой стороны.
Источник: habr.com