Китайская DeepSeek заявила о низкой стоимости обучения модели R1

Китайская компания DeepSeek раскрыла стоимость обучения своей модели искусственного интеллекта (ИИ) R1. По данным исследования, опубликованного в журнале Nature, процесс обошёлся в 294 тысячи долларов. Это значительно меньше, чем суммы, которые называют американские разработчики ИИ.

Для обучения R1 компания использовала кластер из 512 графических процессоров Nvidia H800, предназначенных специально для китайского рынка. Подготовительный этап, по словам исследователей, проходил на GPU A100. На основном этапе обучение заняло около 80 часов.

Оценка затрат на обучение языковых моделей важна, поскольку они требуют огромных вычислительных мощностей и недельной или месячной работы процессоров. Руководитель OpenAI Сэм Альтман ранее говорил, что разработка базовых моделей обходится «намного дороже» 100 миллионов долларов, но конкретных цифр компания не раскрывала.

Источник: www.ferra.ru

0 0 голоса

Рейтинг новости

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”