Новые инструменты контроля над ИИ. Нейроновости недели

Новые инструменты контроля над ИИ. Нейроновости недели

Новая архитектура

Новая архитектура от Amazon

Amazon Web Services разработала FineRouter: двухэтапную архитектуру маршрутизации запросов между языковыми моделями. Существующие решения плохо справляются с двумя проблемами: сложно вручную задавать таксономии задач, а монолитные маршрутизаторы не улавливают тонкие различия между моделями. FineRouter решает обе.

На первом этапе система с помощью графовой кластеризации находит скрытые категории запросов и обучает классификатор, который определяет тип нового запроса. На втором этапе используется архитектура смеси экспертов (MoE) — для каждого типа задач есть специализированные модули, которые оценивают, какая модель даст лучший результат. В реальном времени система объединяет результаты обоих этапов: это дает устойчивость за счет понимания типа задачи и гибкость за счет учета особенностей конкретного запроса.

В экспериментах на 10 бенчмарках с участием 11 современных моделей FineRouter превзошел существующие подходы и даже самую сильную отдельную модель — при этом потребовал менее половины вычислений на инференс.

Почему это важно: с ростом числа моделей и сокращением разрыва в их качестве правильно распределять запросы становится критично. Простые запросы можно направлять к дешевым моделям, сложные — к дорогим. Это делает ИИ-системы доступнее и эффективнее.

Концепция естественного описания

Концепция естественного описания

Университет Цинхуа предложил концепцию Natural-Language Agent Harnesses (NLAHs): структурированное описание на естественном языке, которое выносит логику «обвязки» агента в отдельный переносимый артефакт.

Обычно эта логика разбросана по всей системе: часть зашита в коде, часть — в настройках фреймворков, часть — в адаптерах инструментов. Менять, переносить или анализировать ее трудно. NLAHs собирают все в одном месте: описываются роли компонентов, правила их взаимодействия, этапы выполнения, состояния системы и возможные ошибки — понятно и человеку, и модели.

Чтобы такие описания можно было реально использовать, вводится специальная среда — Intelligent Harness Runtime (IHR). В ней модель читает описание на естественном языке, интерпретирует его и действует в соответствии с ним.

Почему это важно: эффективность агента все сильнее зависит от его обвязки, которая обычно скрыта в коде и плохо поддается анализу. NLAHs делают этот слой видимым: обвязку можно описывать, сравнивать и переносить. Это упрощает создание надежных агентов, помогает понять, почему они работают, и воспроизводить удачные решения в разных моделях и средах.

Также на неделе:

  • NVIDIA показала алгоритм обучения с подкреплением для дообучения LLM в сложных агентных задачах с длинным горизонтом планирования
  • IBM представила обзор методов проектирования и оптимизации рабочих процессов агентов на базе LLM — с систематизацией подходов по структуре, оптимизации и сигналам оценки
  • Samsung, KAIST AI и Yonsei University показали итеративный алгоритм поиска для многозадачных смесей данных с учетом переобучения
  • Sakana AI анонсировала Marlin — систему для глубоких исследований
  • H Company выпустила семейство мультимодальных MoE-моделей Holo3 для управления графическими интерфейсами
  • Google выпустила семейство открытых моделей Gemma 4
  • Alibaba выпустила омнимодальную модель Qwen 3.5-Omni

Новости представлены аналитическим центром red_mad_robot.

Источник: hi-tech.mail.ru

0 0 голоса
Рейтинг новости
1
0
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии