AI берется за исследования и симуляции. Нейроновости недели

Синтетические компьютеры

Система из синтетических компьютеров

Microsoft Research создала Synthetic Computers at Scale: систему из тысячи синтетических компьютеров с реалистичными файловыми структурами, документами и рабочими артефактами. На них запускаются длительные симуляции пользовательской активности, и в каждой работают два агента: один ставит задачи, другой их выполняет.

Один прогон длится восемь часов и включает более двух тысяч шагов взаимодействия — по масштабу эквивалентно месяцу человеческой работы, сжатому в один сценарий. Полученные данные используются для обучения агентов и улучшают их работу как на знакомых, так и на новых задачах.

Почему это важно: главным ограничением для агентов, работающих с компьютером, стала не мощность моделей, а нехватка данных для долгих сценариев. Синтетические среды позволяют масштабировать обучение без сбора реальной пользовательской телеметрии и становятся важной основой для будущих систем.

Агентные системы

Агентные системы в математике

Google DeepMind представила систему AI co-mathematician: интерактивную среду для математических исследований на основе иерархии AI-агентов. В основе — координирующий агент и набор специализированных помощников, которые запускаются после диалога с исследователем.

Система формирует параллельные потоки работы и создает «живые» математические документы в LaTeX с комментариями и ссылками на источники — человек может контролировать процесс на любом этапе. На бенчмарке FrontierMath система достигла 48% на сложном уровне за счет многоэтапной проверки и внутреннего рецензирования. Среди рисков — зацикливание и накопление ошибок.

Почему это важно: агентные системы в математике, как и в программировании, позволяют AI выходить на новый уровень. При этом ключевая роль остается за человеком — AI усиливает работу исследователей и ускоряет открытия, а не заменяет их.

Рост AI-агентов

Рост AI-агентов в науке

Исследователи из Shanghai Jiao Tong University представили ARIS: систему для автоматизации научных исследований на основе состязательного взаимодействия агентов. Один агент выступает исполнителем, второй — обязательно из другого семейства моделей — становится критиком.

Архитектура состоит из трех уровней:

Уровень исполнения: библиотека из 65 навыков и исследовательская вики с историей экспериментов
Уровень оркестрации: управляет всем циклом от генерации идеи до написания статьи
Уровень достоверности: многоуровневая проверка данных

Почему это важно: система решает проблему ненадежности AI в науке через взаимный контроль разных моделей. Это снижает риск галлюцинаций и необоснованных выводов и делает результаты более достоверными.

Также на неделе

Также на неделе:

Thinking Machines показала новый класс моделей для непрерывного взаимодействия
Anthropic выпустила AI-инструменты для юристов и добавила дашборд Agent View в Claude Code для управления агентами
Sakana AI и NVIDIA представили подход для снижения стоимости масштабирования языковых моделей без изменения архитектуры
Google и Meta (запрещена в РФ) рассказали о фреймворке для автоматического поиска стратегий масштабирования моделей во время инференса
Google анонсировала Gemini Intelligence — мультимодального агента для автоматизации рутинных задач
Baidu выпустила Ernie 5.1 с улучшенными агентными функциями и AI-агента DuMate для управления приложениями и работы с файлами

Новости представлены аналитическим центром red_mad_robot.

Источник: hi-tech.mail.ru

0 0 голоса

Рейтинг новости