xAI раскрыли лучшие результаты Grok 4.1 Fast и подробнее рассказали про Agent Tools API

После недавнего релиза Grok 4.1 Fast команда xAI поделилась, по всей видимости, самыми впечатляющими результатами бенчмарков, на которых новая модель уверенно обходит конкурентов. Помимо этого, разработчики подробнее рассказали об инфраструктуре Agent Tools API — ключевом элементе для построения продвинутых автономных агентов.

Grok 4.1 Fast на лидирующих позициях

xAI раскрыли обновлённые данные по бенчмаркам, где Grok 4.1 Fast показывает особенно сильные результаты.

τ²-bench Telecom: 100% — максимальный результат среди агентных моделей, ориентированных на использование инструментов. Модель существенно опережает Grok 4, GPT-5.1 и Claude Sonnet 4.5.

Berkeley Function Calling v4: 72% точности при низкой стоимости, что выводит Grok 4.1 Fast в лидеры по качеству обычного и рассуждающего tool calling.

Длинный контекст: благодаря RL-обучению на долгих цепочках модель сохраняет стабильное качество вплоть до полного 2-миллионного контекстного окна. Для сравнения: в режиме с несколькими шагами «длинный контекст» Grok 4.1 Fast достигает 67% против 22% у Grok 4.

Судя по представленным данным, xAI сделали ставку на демонстрацию именно тех метрик, которые подчёркивают сильные стороны Grok 4.1 Fast как агентной платформы: стабильность, масштабируемость и точность при планировании сложных действий.

Agent Tools API — серверные инструменты для автономных агентов

Разработчики также раскрыли дополнительные подробности об Agent Tools API — наборе серверных инструментов, которые дают Grok доступ к реальным данным и внешним операциям.

API позволяет агенту:

выполнять веб-поиск и искать информацию в X в реальном времени,

запускать Python-код в безопасной среде,

обращаться к загруженным документам с интеллектуальным поиском,

подключаться к внешним MCP-серверам (например, кастомным корпоративным инструментам),

автоматически комбинировать несколько инструментов в цепочке действий.

Ключевая особенность — инструменты работают полностью на инфраструктуре xAI. Разработчикам не нужно управлять ключами, лимитами или окружениями: Grok сам решает, какой инструмент вызвать и как спланировать последовательность шагов, вплоть до параллельных вызовов.

Доступность

Сейчас xAI предлагают два варианта модели:

grok-4-1-fast-reasoning — для задач, требующих глубоких рассуждений,

grok-4-1-fast-non-reasoning — для мгновенных ответов.

До 3 декабря модель доступна бесплатно на OpenRouter, а инструменты Agent Tools API — бесплатно для всех пользователей xAI.

Русскоязычное сообщество про AI в разработке

Друзья! Эту новость подготовила команда ТГК «AI for Devs» — канала, где мы рассказываем про AI-ассистентов, плагины для IDE, делимся практическими кейсами и свежими новостями из мира ИИ. Подписывайтесь, чтобы быть в курсе и ничего не упустить!

Источник: habr.com

0 0 голоса

Рейтинг новости

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”