Финальное обучение Kimi K2-Thinking стоило всего $4,6 млн — в разы меньше западных моделей

По данным CNBC, финальный этап обучения модели Kimi K2-Thinking обошелся примерно в 4,6 миллиона долларов. Издание ссылается на анонимный источник и уточняет, что не смогло независимо подтвердить эту цифру. Компания Moonshot AI официально стоимость обучения не раскрывала, поэтому речь идет о предварительной оценке.

Kimi K2-Thinking — крупная нейросеть архитектуры Mixture of Experts с общим числом параметров порядка триллиона, из которых во время работы активна лишь малая часть. Модель создана для решения сложных задач рассуждения и взаимодействия с инструментами. Для подобных систем обычно требуются крайне дорогостоящие вычисления, поэтому сумма в несколько миллионов долларов выглядит неожиданно низкой.

Схожая ситуация уже наблюдалась у китайской DeepSeek. В конце 2024 года обучение базовой модели DeepSeek-V3 стоило примерно 5,5–5,6 миллиона долларов, а рассуждающая надстройка R1 обошлась в 294 тысячи долларов. Kimi K2-Thinking также построена на базовой K2, поэтому можно ожидать похожей пропорции. Также стоит отметить, что подобные оценки не включают экспериментальные прогоны, финальное тестирование и другие расходы — от аренды офиса до зарплат персоналу.

Но в любом случае цена крайне низкая, особенно учитывая тот факт, что в большинстве бенчмарков K2-Thinking держится на уровне лидирующих западных моделей вроде GPT-5 Pro и Grok 4. Для сравнения, финальный этап обучения GPT-4, по оценке SemiAnalysis, стоил около 63 миллионов долларов, а в отчете AI Index фигурирует еще большая сумма в 78 миллионов. Полное обучение Grok 4 аналитики Epoch AI оценили в астрономические 490 миллионов долларов.

P.S. Поддержать меня можно подпиской на канал «сбежавшая нейросеть», где я рассказываю про ИИ с творческой стороны.

Источник: habr.com

0 0 голоса

Рейтинг новости

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”