Moonshot AI представила Kimi K2 — новую reasoning-модель с открытым кодом, которая показывает выдающиеся способности к рассуждению и агентному поведению. Главное отличие K2 в том, что она может не просто отвечать на вопросы, а планировать действия и выполнять их цепочкой ш��гов без вмешательства человека.
Версия Kimi K2 Thinking решает задачи с помощью 200–300 последовательных инструментальных вызовов, анализируя каждый этап и корректируя стратегию на лету. Благодаря расширенному контексту в 256 тысяч токенов модель может удерживать и осмыслять большие фрагменты информации, что особенно важно для агентных сценариев и многоходовых вычислений.
В бенчмарках, измеряющих способность моделей действовать как рассуждающие агенты, Kimi K2 установила новые рекорды. Она показала лучший результат в Humanity’s Last Exam — тесте, считающемся одним из самых трудных испытаний для современных ИИ, где нужно проявить не только логику, но и способность к обобщению и планированию.
Moonshot AI отмечает, что Kimi K2 станет основой для создания полностью автономных ИИ-систем, способных самостоятельно исследовать задачи, выстраивать гипотезы и использовать внешние инструменты. Модель уже доступна на сайте и через API, а полноценный агентный режим разработчики обещают включить в ближайшее время.
Хотите быть в курсе важных новостей из мира ИИ? Подписывайтесь на наш Telegram‑канал BotHub AI News.
Источник
Источник: habr.com