Аналитический центр red_mad_robot рассказывает и комментирует главные новости индустрии за неделю с 9 по 15 февраля.
Новый фреймворк AgentArk
Amazon, CMU, University of British Columbia и другие исследовательские команды представили AgentArk: фреймворк, который позволяет перенести рассуждения многоагентных систем в одну модель. Вместо затратного инференса с несколькими агентами коллективное обсуждение проводится заранее, а его структура и логика дистиллируются в модель на этапе обучения.
В основе AgentArk — три режима дистилляции:
Reasoning-Enhanced SFT (RSFT) — дообучение с учителем на корректных траекториях рассуждений.Data Augmentation (DA) — расширение обучающих данных за счет отбора и добавления разнообразных путей рассуждения.Process-Aware Distillation (PAD) — процессно-ориентированная дистилляция с сохранением структуры коллективного обсуждения, включая проверку промежуточных шагов и выявление ошибок.
По результатам более ста экспериментов PAD обеспечил средний прирост 4,8% по сравнению с одноагентными базовыми моделями. В задачах внутри домена улучшение достигало 30%.
Дистиллированные модели также продемонстрировали перенос знаний: при обучении на математических задачах они улучшили результаты на TruthfulQA — показатель ROUGE-L вырос с 0,613 до 0,657.
Почему это важно: мультиагентные системы дают прирост качества, но их инференс остается дорогим и сложным в эксплуатации. AgentArk переносит вычислительную нагрузку на этап обучения, позволяя одной модели воспроизводить глубину коллективных рассуждений без постоянного запуска команды агентов.
Источник: hi-tech.mail.ru