Финальное обучение Kimi K2-Thinking стоило всего $4,6 млн — в разы меньше западных моделей

По данным CNBC, финальный этап обучения модели Kimi K2-Thinking обошелся примерно в 4,6 миллиона долларов. Издание ссылается на анонимный источник и уточняет, что не смогло независимо подтвердить эту цифру. Компания Moonshot AI официально стоимость обучения не раскрывала, поэтому речь идет о предварительной оценке.

Kimi K2-Thinking — крупная нейросеть архитектуры Mixture of Experts с общим числом параметров порядка триллиона, из которых во время работы активна лишь малая часть. Модель создана для решения сложных задач рассуждения и взаимодействия с инструментами. Для подобных систем обычно требуются крайне дорогостоящие вычисления, поэтому сумма в несколько миллионов долларов выглядит неожиданно низкой.

Схожая ситуация уже наблюдалась у китайской DeepSeek. В конце 2024 года обучение базовой модели DeepSeek-V3 стоило примерно 5,5–5,6 миллиона долларов, а рассуждающая надстройка R1 обошлась в 294 тысячи долларов. Kimi K2-Thinking также построена на базовой K2, поэтому можно ожидать похожей пропорции. Также стоит отметить, что подобные оценки не включают экспериментальные прогоны, финальное тестирование и другие расходы — от аренды офиса до зарплат персоналу.

Но в любом случае цена крайне низкая, особенно учитывая тот факт, что в большинстве бенчмарков K2-Thinking держится на уровне лидирующих западных моделей вроде GPT-5 Pro и Grok 4. Для сравнения, финальный этап обучения GPT-4, по оценке SemiAnalysis, стоил около 63 миллионов долларов, а в отчете AI Index фигурирует еще большая сумма в 78 миллионов. Полное обучение Grok 4 аналитики Epoch AI оценили в астрономические 490 миллионов долларов.

P.S. Поддержать меня можно подпиской на канал «сбежавшая нейросеть», где я рассказываю про ИИ с творческой стороны.

Источник: habr.com

0 0 голоса
Рейтинг новости
1
0
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии