
Развитие без участия
Развитие без участия человека
ByteDance представила Agent-World: система, в которой ИИ-агенты обучаются и адаптируются к сложным условиям реального мира. Архитектура состоит из двух взаимосвязанных модулей:
- Первый создает условия для обучения: система анализирует источники из интернета, собирает тематические базы и исполняемые инструменты, генерирует задачи разной сложности. На выходе — экосистема из 1978 сред и 19 822 инструментов.
- Второй обеспечивает развитие агента через обучение с подкреплением. Система анализирует ошибки, выявляет пробелы в навыках и создает новые, более сложные задачи, которые целенаправленно закрывают слабые места.
Эксперименты на 23 бенчмарках показали, что модели Agent-World превосходят существующие аналоги и мощные закрытые модели в задачах планирования и работы с инструментами.
Почему это важно: работа решает проблему нехватки качественных данных для обучения ИИ-агентов в реальных условиях. Вместо ограниченных симуляций предлагается использовать веб как масштабируемую обучающую среду. Это позволяет создавать системы, которые развиваются без участия человека.
AC/DC от Sakana AI
AC/DC от Sakana AI
Sakana AI представила AC/DC (Assessment Coevolving with Diverse Capabilities): подход, где вместо одной крупной модели развивается группа небольших специализированных. Они эволюционируют вместе с автоматически генерируемыми синтетическими задачами, которые постепенно усложняются и требуют разных навыков.
Система отбирает модели по точности и разнообразию решений — сохраняет те, которые справляются с разными типами задач. В итоге несколько небольших моделей дают более широкие возможности, чем одна большая, при значительно меньших вычислительных затратах.
Почему это важно: эффективность растет не только за счет увеличения размера модели, но и за счет разделения на специализированные роли. В перспективе это может привести к появлению коллективного ИИ, где множество агентов взаимодействуют и действуют в открытой среде.
Также на неделе:
- Google DeepMind показала архитектуру обучения ИИ, которая позволяет эффективно использовать чипы, распределенные по разным дата-центрам
- Princeton University разработал фреймворк для долгих многошаговых задач: он объединяет результаты нескольких параллельных вариантов решения и динамически взаимодействует с ними
- KAIST и New York University описали Memory Transfer Learning для агентов-программистов: общая память собирает знания из разных типов задач и помогает переносить опыт между ними
- Tencent предлагает оценивать самообученные знания агента по конечному результату — после обучения внешние подсказки отключаются, и система работает автономно
- DeepSeek представила новые модели V4-Flash и V4-Pro, которые превосходят Gemini, Claude и ChatGPT по ряду бенчмарков
- Google запустила Gemini Enterprise Agent Platform — корпоративную платформу для создания и управления ИИ-агентами
- OpenAI анонсировала GPT-5.5 с акцентом на агентность, безопасность и оптимизацию токенов в задачах программирования
- OpenAI открыла доступ к Workspace Agents — инструменту создания облачных ИИ-агентов
Новости представлены аналитическим центром red_mad_robot.
Источник: hi-tech.mail.ru