Аналитический центр red_mad_robot рассказывает и комментирует главные новости индустрии за неделю с 27 апреля по 3 мая.
Как AI-агенты тратят деньги?
Microsoft, Google DeepMind, MIT и другие организации провели исследование о том, как AI-агенты расходуют токены при выполнении задач для кодинга. Анализировалось восемь моделей на бенчмарке SWE-bench Verified. Результаты выявили несколько закономерностей:
Агентные задачи по кодингу требуют в тысячу раз больше токенов, чем обычный чат — основная доля затрат приходится на входные токены, а не на генерацию ответа.Потребление токенов крайне нестабильно: даже при одинаковых задачах разные запуски могут отличаться по расходу в 30 раз.Больше токенов — не значит лучше: точность выходит на плато при средних расходах и может даже снижаться при дальнейшем росте затрат.
Между моделями — существенная разница. Kimi-K2 и Claude-Sonnet-4.5 в среднем расходуют более чем на 1,5 млн токенов больше, чем GPT-5 на тех же задачах, и это даже в простых сценариях. Отдельная проблема: модели плохо предсказывают собственное потребление токенов до выполнения задачи — их оценки лишь слабо коррелируют с реальностью и особенно часто занижают расход входных токенов.
Почему это важно: бизнес может не знать итоговую стоимость задачи заранее и платить даже за неудачные запуски. Понимание того, как расходуются токены, помогает выбирать эффективные модели, оценивать затраты заранее и вводить бюджетные ограничения.
Источник: hi-tech.mail.ru