
Синтетические компьютеры
Система из синтетических компьютеров
Microsoft Research создала Synthetic Computers at Scale: систему из тысячи синтетических компьютеров с реалистичными файловыми структурами, документами и рабочими артефактами. На них запускаются длительные симуляции пользовательской активности, и в каждой работают два агента: один ставит задачи, другой их выполняет.
Один прогон длится восемь часов и включает более двух тысяч шагов взаимодействия — по масштабу эквивалентно месяцу человеческой работы, сжатому в один сценарий. Полученные данные используются для обучения агентов и улучшают их работу как на знакомых, так и на новых задачах.
Почему это важно: главным ограничением для агентов, работающих с компьютером, стала не мощность моделей, а нехватка данных для долгих сценариев. Синтетические среды позволяют масштабировать обучение без сбора реальной пользовательской телеметрии и становятся важной основой для будущих систем.
Агентные системы
Агентные системы в математике
Google DeepMind представила систему AI co-mathematician: интерактивную среду для математических исследований на основе иерархии AI-агентов. В основе — координирующий агент и набор специализированных помощников, которые запускаются после диалога с исследователем.
Система формирует параллельные потоки работы и создает «живые» математические документы в LaTeX с комментариями и ссылками на источники — человек может контролировать процесс на любом этапе. На бенчмарке FrontierMath система достигла 48% на сложном уровне за счет многоэтапной проверки и внутреннего рецензирования. Среди рисков — зацикливание и накопление ошибок.
Почему это важно: агентные системы в математике, как и в программировании, позволяют AI выходить на новый уровень. При этом ключевая роль остается за человеком — AI усиливает работу исследователей и ускоряет открытия, а не заменяет их.
Рост AI-агентов
Рост AI-агентов в науке
Исследователи из Shanghai Jiao Tong University представили ARIS: систему для автоматизации научных исследований на основе состязательного взаимодействия агентов. Один агент выступает исполнителем, второй — обязательно из другого семейства моделей — становится критиком.
Архитектура состоит из трех уровней:
- Уровень исполнения: библиотека из 65 навыков и исследовательская вики с историей экспериментов
- Уровень оркестрации: управляет всем циклом от генерации идеи до написания статьи
- Уровень достоверности: многоуровневая проверка данных
Почему это важно: система решает проблему ненадежности AI в науке через взаимный контроль разных моделей. Это снижает риск галлюцинаций и необоснованных выводов и делает результаты более достоверными.
Также на неделе
Также на неделе:
- Thinking Machines показала новый класс моделей для непрерывного взаимодействия
- Anthropic выпустила AI-инструменты для юристов и добавила дашборд Agent View в Claude Code для управления агентами
- Sakana AI и NVIDIA представили подход для снижения стоимости масштабирования языковых моделей без изменения архитектуры
- Google и Meta (запрещена в РФ) рассказали о фреймворке для автоматического поиска стратегий масштабирования моделей во время инференса
- Google анонсировала Gemini Intelligence — мультимодального агента для автоматизации рутинных задач
- Baidu выпустила Ernie 5.1 с улучшенными агентными функциями и AI-агента DuMate для управления приложениями и работы с файлами
Новости представлены аналитическим центром red_mad_robot.
Источник: hi-tech.mail.ru