DeepSeek R2 задерживается из-за отсталости китайских чипов

ИИ-ускорители Huawei Ascend стали причиной задержки выхода DeepSeek R2, сообщают источники издания Financial Times. В издании напоминают, что DeepSeek R1 обучали на ускорителях NVIDIA, но после успеха этого ИИ в январе, китайские чиновники связались с разработчиками и попросили попробовать обучить новую модель на чипах Ascend.

В процессе работы над ИИ оказалось, что китайские ускорители на данный момент уступают NVIDIA не только в производительности — наблюдаются проблемы в программном обеспечении и параллельной работе большого количества ускорителей. В итоге попытка обучения модели на ускорителях Ascend провалилась — не помогло даже то, что Huawei отправил в офис DeepSeek команду инженеров для помощи с настройкой чипов.

Как результат, разработчикам пришлось разделить ресурсы. Для обучения DeepSeek R2 они вернулись к привычным ускорителям NVIDIA, а чипы Huawei Ascend планируется использовать в инференсе — эксплуатации уже готовой модели конечными пользователями.

Еще один источник добавляет, что для новой модели разработчики слишком долго размечали данные для обучения. По слухам, изначально выход DeepSeek R2 был запланирован на май, но из-за недовольства руководства качеством модели, релиз пришлось перенести. Сейчас называются разные даты — от конца августа до осени.

P.S. Поддержать меня можно подпиской на канал «сбежавшая нейросеть», где я рассказываю про ИИ с творческой стороны.

Источник: habr.com

0 0 голоса

Рейтинг новости

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”