Обучение ИИ без человека и симуляций. Нейроновости недели

Обучение ИИ без человека и симуляций. Нейроновости недели

Развитие без участия

Развитие без участия человека

ByteDance представила Agent-World: система, в которой ИИ-агенты обучаются и адаптируются к сложным условиям реального мира. Архитектура состоит из двух взаимосвязанных модулей:

  • Первый создает условия для обучения: система анализирует источники из интернета, собирает тематические базы и исполняемые инструменты, генерирует задачи разной сложности. На выходе — экосистема из 1978 сред и 19 822 инструментов.
  • Второй обеспечивает развитие агента через обучение с подкреплением. Система анализирует ошибки, выявляет пробелы в навыках и создает новые, более сложные задачи, которые целенаправленно закрывают слабые места.

Эксперименты на 23 бенчмарках показали, что модели Agent-World превосходят существующие аналоги и мощные закрытые модели в задачах планирования и работы с инструментами.

Почему это важно: работа решает проблему нехватки качественных данных для обучения ИИ-агентов в реальных условиях. Вместо ограниченных симуляций предлагается использовать веб как масштабируемую обучающую среду. Это позволяет создавать системы, которые развиваются без участия человека.

AC/DC от Sakana AI

AC/DC от Sakana AI

Sakana AI представила AC/DC (Assessment Coevolving with Diverse Capabilities): подход, где вместо одной крупной модели развивается группа небольших специализированных. Они эволюционируют вместе с автоматически генерируемыми синтетическими задачами, которые постепенно усложняются и требуют разных навыков.

Система отбирает модели по точности и разнообразию решений — сохраняет те, которые справляются с разными типами задач. В итоге несколько небольших моделей дают более широкие возможности, чем одна большая, при значительно меньших вычислительных затратах.

Почему это важно: эффективность растет не только за счет увеличения размера модели, но и за счет разделения на специализированные роли. В перспективе это может привести к появлению коллективного ИИ, где множество агентов взаимодействуют и действуют в открытой среде.

Также на неделе:

  • Google DeepMind показала архитектуру обучения ИИ, которая позволяет эффективно использовать чипы, распределенные по разным дата-центрам
  • Princeton University разработал фреймворк для долгих многошаговых задач: он объединяет результаты нескольких параллельных вариантов решения и динамически взаимодействует с ними
  • KAIST и New York University описали Memory Transfer Learning для агентов-программистов: общая память собирает знания из разных типов задач и помогает переносить опыт между ними
  • Tencent предлагает оценивать самообученные знания агента по конечному результату — после обучения внешние подсказки отключаются, и система работает автономно
  • DeepSeek представила новые модели V4-Flash и V4-Pro, которые превосходят Gemini, Claude и ChatGPT по ряду бенчмарков
  • Google запустила Gemini Enterprise Agent Platform — корпоративную платформу для создания и управления ИИ-агентами
  • OpenAI анонсировала GPT-5.5 с акцентом на агентность, безопасность и оптимизацию токенов в задачах программирования
  • OpenAI открыла доступ к Workspace Agents — инструменту создания облачных ИИ-агентов

Новости представлены аналитическим центром red_mad_robot.

Источник: hi-tech.mail.ru

0 0 голоса
Рейтинг новости
1
0
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии