Китайская компания DeepSeek раскрыла стоимость обучения своей модели искусственного интеллекта (ИИ) R1. По данным исследования, опубликованного в журнале Nature, процесс обошёлся в 294 тысячи долларов. Это значительно меньше, чем суммы, которые называют американские разработчики ИИ.
Для обучения R1 компания использовала кластер из 512 графических процессоров Nvidia H800, предназначенных специально для китайского рынка. Подготовительный этап, по словам исследователей, проходил на GPU A100. На основном этапе обучение заняло около 80 часов.
Оценка затрат на обучение языковых моделей важна, поскольку они требуют огромных вычислительных мощностей и недельной или месячной работы процессоров. Руководитель OpenAI Сэм Альтман ранее говорил, что разработка базовых моделей обходится «намного дороже» 100 миллионов долларов, но конкретных цифр компания не раскрывала.
Источник: www.ferra.ru