Коллективный интеллект без коллектива. Нейроновости недели

Аналитический центр red_mad_robot рассказывает и комментирует главные новости индустрии за неделю с 9 по 15 февраля.

Новый фреймворк AgentArk

Amazon, CMU, University of British Columbia и другие исследовательские команды представили AgentArk: фреймворк, который позволяет перенести рассуждения многоагентных систем в одну модель. Вместо затратного инференса с несколькими агентами коллективное обсуждение проводится заранее, а его структура и логика дистиллируются в модель на этапе обучения.

В основе AgentArk — три режима дистилляции:

Reasoning-Enhanced SFT (RSFT) — дообучение с учителем на корректных траекториях рассуждений.Data Augmentation (DA) — расширение обучающих данных за счет отбора и добавления разнообразных путей рассуждения.Process-Aware Distillation (PAD) — процессно-ориентированная дистилляция с сохранением структуры коллективного обсуждения, включая проверку промежуточных шагов и выявление ошибок.

По результатам более ста экспериментов PAD обеспечил средний прирост 4,8% по сравнению с одноагентными базовыми моделями. В задачах внутри домена улучшение достигало 30%.

Дистиллированные модели также продемонстрировали перенос знаний: при обучении на математических задачах они улучшили результаты на TruthfulQA — показатель ROUGE-L вырос с 0,613 до 0,657.

Почему это важно: мультиагентные системы дают прирост качества, но их инференс остается дорогим и сложным в эксплуатации. AgentArk переносит вычислительную нагрузку на этап обучения, позволяя одной модели воспроизводить глубину коллективных рассуждений без постоянного запуска команды агентов.

Источник: hi-tech.mail.ru

0 0 голоса

Рейтинг новости