xAI раскрыли лучшие результаты Grok 4.1 Fast и подробнее рассказали про Agent Tools API

После недавнего релиза Grok 4.1 Fast команда xAI поделилась, по всей видимости, самыми впечатляющими результатами бенчмарков, на которых новая модель уверенно обходит конкурентов. Помимо этого, разработчики подробнее рассказали об инфраструктуре Agent Tools API — ключевом элементе для построения продвинутых автономных агентов.

Grok 4.1 Fast на лидирующих позициях

xAI раскрыли обновлённые данные по бенчмаркам, где Grok 4.1 Fast показывает особенно сильные результаты.

τ²-bench Telecom: 100% — максимальный результат среди агентных моделей, ориентированных на использование инструментов. Модель существенно опережает Grok 4, GPT-5.1 и Claude Sonnet 4.5.

Berkeley Function Calling v4: 72% точности при низкой стоимости, что выводит Grok 4.1 Fast в лидеры по качеству обычного и рассуждающего tool calling.

Длинный контекст: благодаря RL-обучению на долгих цепочках модель сохраняет стабильное качество вплоть до полного 2-миллионного контекстного окна. Для сравнения: в режиме с несколькими шагами «длинный контекст» Grok 4.1 Fast достигает 67% против 22% у Grok 4.

Судя по представленным данным, xAI сделали ставку на демонстрацию именно тех метрик, которые подчёркивают сильные стороны Grok 4.1 Fast как агентной платформы: стабильность, масштабируемость и точность при планировании сложных действий.

Agent Tools API — серверные инструменты для автономных агентов

Разработчики также раскрыли дополнительные подробности об Agent Tools API — наборе серверных инструментов, которые дают Grok доступ к реальным данным и внешним операциям.

API позволяет агенту:

выполнять веб-поиск и искать информацию в X в реальном времени,

запускать Python-код в безопасной среде,

обращаться к загруженным документам с интеллектуальным поиском,

подключаться к внешним MCP-серверам (например, кастомным корпоративным инструментам),

автоматически комбинировать несколько инструментов в цепочке действий.

Ключевая особенность — инструменты работают полностью на инфраструктуре xAI. Разработчикам не нужно управлять ключами, лимитами или окружениями: Grok сам решает, какой инструмент вызвать и как спланировать последовательность шагов, вплоть до параллельных вызовов.

Доступность

Сейчас xAI предлагают два варианта модели:

grok-4-1-fast-reasoning — для задач, требующих глубоких рассуждений,

grok-4-1-fast-non-reasoning — для мгновенных ответов.

До 3 декабря модель доступна бесплатно на OpenRouter, а инструменты Agent Tools API — бесплатно для всех пользователей xAI.

Русскоязычное сообщество про AI в разработке

Друзья! Эту новость подготовила команда ТГК «AI for Devs» — канала, где мы рассказываем про AI-ассистентов, плагины для IDE, делимся практическими кейсами и свежими новостями из мира ИИ. Подписывайтесь, чтобы быть в курсе и ничего не упустить!

Источник: habr.com

0 0 голоса
Рейтинг новости
1
0
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии