Обучение ИИ без человека и симуляций. Нейроновости недели

Развитие без участия

Развитие без участия человека

ByteDance представила Agent-World: система, в которой ИИ-агенты обучаются и адаптируются к сложным условиям реального мира. Архитектура состоит из двух взаимосвязанных модулей:

Первый создает условия для обучения: система анализирует источники из интернета, собирает тематические базы и исполняемые инструменты, генерирует задачи разной сложности. На выходе — экосистема из 1978 сред и 19 822 инструментов.
Второй обеспечивает развитие агента через обучение с подкреплением. Система анализирует ошибки, выявляет пробелы в навыках и создает новые, более сложные задачи, которые целенаправленно закрывают слабые места.

Эксперименты на 23 бенчмарках показали, что модели Agent-World превосходят существующие аналоги и мощные закрытые модели в задачах планирования и работы с инструментами.

Почему это важно: работа решает проблему нехватки качественных данных для обучения ИИ-агентов в реальных условиях. Вместо ограниченных симуляций предлагается использовать веб как масштабируемую обучающую среду. Это позволяет создавать системы, которые развиваются без участия человека.

AC/DC от Sakana AI

Sakana AI представила AC/DC (Assessment Coevolving with Diverse Capabilities): подход, где вместо одной крупной модели развивается группа небольших специализированных. Они эволюционируют вместе с автоматически генерируемыми синтетическими задачами, которые постепенно усложняются и требуют разных навыков.

Система отбирает модели по точности и разнообразию решений — сохраняет те, которые справляются с разными типами задач. В итоге несколько небольших моделей дают более широкие возможности, чем одна большая, при значительно меньших вычислительных затратах.

Почему это важно: эффективность растет не только за счет увеличения размера модели, но и за счет разделения на специализированные роли. В перспективе это может привести к появлению коллективного ИИ, где множество агентов взаимодействуют и действуют в открытой среде.

Также на неделе:

Google DeepMind показала архитектуру обучения ИИ, которая позволяет эффективно использовать чипы, распределенные по разным дата-центрам
Princeton University разработал фреймворк для долгих многошаговых задач: он объединяет результаты нескольких параллельных вариантов решения и динамически взаимодействует с ними
KAIST и New York University описали Memory Transfer Learning для агентов-программистов: общая память собирает знания из разных типов задач и помогает переносить опыт между ними
Tencent предлагает оценивать самообученные знания агента по конечному результату — после обучения внешние подсказки отключаются, и система работает автономно
DeepSeek представила новые модели V4-Flash и V4-Pro, которые превосходят Gemini, Claude и ChatGPT по ряду бенчмарков
Google запустила Gemini Enterprise Agent Platform — корпоративную платформу для создания и управления ИИ-агентами
OpenAI анонсировала GPT-5.5 с акцентом на агентность, безопасность и оптимизацию токенов в задачах программирования
OpenAI открыла доступ к Workspace Agents — инструменту создания облачных ИИ-агентов

Новости представлены аналитическим центром red_mad_robot.

Источник: hi-tech.mail.ru

0 0 голоса

Рейтинг новости