Microsoft выпустила два новых инструмента для вайбкодеров

Microsoft выпустила два новых инструмента для вайбкодеров

Корпорация Microsoft выпустила сразу два проекта с открытым кодом — SkillOpt и AI Engineer Coach. Оба бесплатны и решают реальную боль: агенты на базе языковых моделей работают хуже, чем могли бы, а разработчики часто не понимают, где именно теряется качество.

SkillOpt: агент, который учится сам

Классический подход к улучшению модели — дообучение на новых данных. Это долго, дорого и требует доступа к весам. SkillOpt предлагает другой путь: не трогать модель вообще, а менять текстовый файл с инструкциями — skill.md. Именно он описывает агенту, как себя вести, какие инструменты применять и в каком порядке.

Цикл работает так, что сначала агент получает задачи с текущей версией инструкций и выполняет их — система фиксирует, что пошло не так и что сработало. Затем отдельная, как правило более сильная, модель-оптимизатор анализирует эти результаты и предлагает точечные правки: добавить правило, удалить устаревшую инструкцию, уточнить формулировку. Правка принимается только если на контрольной выборке результат стал лучше. Если нет — изменение отклоняют, но запоминают, чтобы не повторять похожую ошибку.

Важная деталь — «текстовая скорость обучения». Разработчики намеренно ограничивают объем изменений за один шаг: нельзя переписать весь файл целиком. Это защищает рабочие части инструкции от случайного удаления ради попытки исправить один узкий сбой.

На шести разных стендах — поиск по документам, работа с таблицами, математические задачи, навигация в текстовых играх — SkillOpt показал лучший или равный лучшему результат во всех 52 тестовых комбинациях. Для GPT-5.5 средний прирост составил 23,5% пункта относительно запуска без инструкций. Особенно заметен эффект на сложных задачах: в работе с электронными таблицами тот же GPT-5.5 прибавил почти 39 пунктов.

Финальный файл best_skill.md — это обычный текстовый документ. Его можно передать другой модели или запустить в ином окружении: в тестах инструкция, обученная через Codex, без дополнительной настройки дала прирост в 31,8 пункта при переносе на Claude Code.

AI Engineer Coach: зеркало для разработчика

Этот инструмент смотрит не на агента, а на человека. Плагин для VS Code читает локальные логи сессий с ИИ-ассистентами — Copilot, Claude Code и другими — и строит из них аналитическую панель.

Система выявляет 45 антипаттернов: слишком короткие промпты без контекста, повторные запросы на одно и то же, запуск дорогих моделей для тривиальных задач, отсутствие проверки кода перед принятием. Для каждого нарушения есть конкретное действие: что изменить и как.

Кроме разбора ошибок, Coach показывает объем сгенерированного кода по языкам и моделям, помогает найти повторяющиеся запросы и превратить их в переиспользуемые инструкции, а также оценивает, насколько проект вообще готов к агентному режиму работы. Вся обработка происходит локально — данные за пределы машины не уходят.

Оба проекта уже доступны на GitHub и не требуют подписок или API-ключей для базового использования.

Также недавно поделились подборкой лучших бесплатных нейросетей для творчества в 2026 году. Подробности в статье.

Источник: hi-tech.mail.ru

0 0 голоса
Рейтинг новости
1
0
Подписаться
Уведомить о
0 комментариев