
Гендиректор Coinbase Брайан Армстронг перевёл свою компанию на китайские ИИ-модели, такие как GLM 5.2 и Kimi 2.7. По его словам, работники компании тратят больше токенов, чем когда‑либо, но обходится это вдвое дешевле, чем раньше.
Coinbase также внедрила автоматическую систему маршрутизации запросов, которая выбирает оптимальную модель для каждой задачи с учётом цены, качества и потенциала кэширования. Только за счёт улучшенного кэширования доля попаданий в кэш выросла с 5 до 60%, что существенно снизило расходы на вызовы моделей. Разработчикам рекомендуют держать контекст коротким и запускать новые сессии для новых задач, чтобы дополнительно экономить токены.
Компания также сделала использование токенов каждым разработчиком полностью прозрачным, что позволяет точнее контролировать бюджет и поведение приложений.
Сообщается, что IT-компании всё чаще обращают внимание на китайские модели. Генеральный директор стартапа Lindy недавно сообщил о переходе компании на Deepseek v4; стартап Snowflake также тестирует китайские модели в качестве бюджетной альтернативы OpenAI и Anthropic.
Источник: habr.com