Разработчики крупных технологических компаний нашли необычный способ сократить расходы на искусственный интеллект. Вместо перехода на более дешевые и менее точные языковые модели программисты из Nvidia, GitHub и других гигантов начали использовать открытый плагин caveman. Утилита, созданная программистом Юлиусом Брюсси, заставляет популярные ИИ-инструменты вроде Claude Code и Codex избавляться от вежливых развернутых формулировок и выдавать информацию максимально кратко, в стиле пещерного человека.
Главная задача плагина — экономия токенов. Инструмент полностью сохраняет в ответах строчки кода, команды, ссылки и цифры, но сжимает сопутствующий текст. Тесты показали, что такое принудительное косноязычие сокращает объем исходящих токенов примерно на 65–75 %. В одном из зафиксированных сеансов работы с Claude Code разработчикам удалось сэкономить сразу 5800 токенов, превратив вежливого чат-бота в лаконичный инструмент. К развитию проекта уже подключился директор по инженерии OpenAI Шейн Суини, который помог адаптировать плагин для работы с Codex.
Подобная микрооптимизация стала вынужденной мерой из-за резкого роста расходов компаний на искусственный интеллект. Например, GitHub недавно перешел на тарификацию за каждый отдельный токен, а Uber умудрился полностью израсходовать свой годовой ИИ-бюджет всего за четыре месяца. Руководство крупных корпораций, включая Walmart и тот же Uber, уже начало вводить жесткие лимиты на использование нейросетей, а французская компания Legrand в официальной внутренней записке призвала сотрудников использовать caveman для контроля бюджетов.
Пока неясно, как на такую тактику урезания трафика отреагируют сами создатели нейросетей из Anthropic, OpenAI и Google, чьи стандартные настройки генерации теперь намеренно блокируются пользователями. Вполне вероятно, что разработчики моделей со временем изменят тарифные сетки или добавят официальный встроенный лаконичный режим, чтобы вернуть упущенную финансовую выгоду.
Источник: gameguru.ru