Компания Anthropic опубликовала технические подробности своего нового исследовательского агента Claude, который использует многоагентный подход для ускорения и улучшения сложных поисковых запросов.
Система опирается на ведущего агента, который анализирует запросы пользователей, разрабатывает стратегию, а затем запускает несколько специализированных вспомогательных агентов для параллельного поиска информации. Такая настройка позволяет агенту обрабатывать более сложные запросы быстрее и тщательнее, чем мог бы один агент.
Агент Claude Research использует ведущий оркестратор для координации специализированных поисковых и цитирующих субагентов. Результаты объединяются с помощью модуля памяти для создания подробных отчетов по запросам пользователей
Во время внутренних тестов Anthropic многоагентная система превзошла автономный агент Claude Opus 4 на 90,2%. Архитектура использует Claude Opus 4 в качестве основного координатора и Claude Sonnet 4 в качестве вспомогательных агентов.
Anthropic оценивает результаты с помощью LLM в качестве судьи, оценивая фактическую точность, качество источника и использование инструментов. По их словам, этот метод более надёжен и эффективен, чем традиционные методы оценки. Такой подход позволяет использовать LLM в качестве метаинструментов для управления другими системами ИИ.
Одним из ключевых факторов производительности является расход токенов: в многоагентных запусках используется примерно в 15 раз больше токенов, чем в стандартных чатах. При внутреннем тестировании количество используемых токенов объясняло около 80% различий в производительности, а дополнительное улучшение достигалось за счёт количества используемых инструментов и выбора модели.
Например, переход на Claude Sonnet 4 привёл к более значительному повышению производительности, чем простое удвоение количества токенов в Claude Sonnet 3.7. Это говорит о том, что, хотя использование токенов имеет значение, выбор модели и конфигурации инструмента также критически важны для производительности.
Кроме того, Anthropic утверждает, что в определённых сценариях Claude 4 может распознавать собственные ошибки и корректировать описания инструментов для повышения производительности с течением времени. По сути, он действует как собственный инженер-консультант.
Асинхронное выполнение: следующий шаг для агентного ИИ
Anthropic считает, что его текущая многоагентная архитектура лучше всего подходит для запросов, требующих больших объёмов информации и допускающих параллельную обработку.
Заглядывая в будущее, Anthropic стремится перейти к асинхронному выполнению задач, при котором агенты могут создавать новые субагенты и работать параллельно, не дожидаясь завершения работы всех субагентов.
Такой переход обеспечит большую гибкость и скорость, но сопряжён с трудностями в области координации, управления состоянием и обработки ошибок — проблемами, которые, по словам Anthropic, ещё предстоит полностью решить.
Пользуясь случаем, хочу порекомендовать BotHub — платформу, где можно протестировать все популярные модели без ограничений. Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 100 000 бесплатных токенов для первых задач и уже сейчас начать работать!
Источник
Источник: habr.com