Google опубликовала 150-страничный отчёт о проекте Health AI Agents, включающий более 7 000 аннотаций и свыше 1 100 часов экспертов. Однако главное в документе — не цифры и метрики, а новая философия дизайна медицинских AI-систем. Вместо создания монолитного «Doctor-GPT» компания предлагает концепцию Personal Health Agent (PHA) — модульную систему из трёх специализированных агентов, каждый из которых выполняет свою роль.
Обзор персонального здравоохранительного агента.(a) Мы описываем анатомию личных потребностей в здоровье через процесс проектирования, ориентированный на пользователя.(b) Далее разрабатываем многоагентную систему на базе передовых больших языковых моделей, включающую специализированных агентов: Data Science (DS), отраслевого эксперта по здравоохранению (Domain Expert, DE) и Health Coach (HC), чтобы закрывать широкий спектр пользовательских задач. Под базовой моделью подразумевается семейство Gemini 2.0.(c) Наша работа представляет собой наиболее комплексную на сегодня оценку медицинского агента (>7000 аннотаций и 1100 часов работы на 10 бенчмарках).
Первый агент, Data Science Agent, отвечает за анализ данных с носимых устройств и лабораторных исследований. Второй, Domain Expert Agent, проверяет медицинские факты и актуальные знания. Третий, Health Coach Agent, ведёт диалог с пользователем, ставит цели, добавляет элементы эмпатии и поддержки. Все три агента связаны оркестратором с памятью, который хранит цели, барьеры и инсайты пользователя, обеспечивая согласованность и персонализацию взаимодействия.
Исследование WEAR-ME включает пользователей Fitbit, которые дали согласие на участие. После согласия и регистрации участникам предложили посетить один из центров Quest для сдачи крови и сбора биохимических данных. Для каждого участника доступны мультимодальные данные: показания Fitbit, результаты анализов крови и анкеты. (b) Для гуманитарной оценки мы выбрали подмножество данных WEAR-ME на основе наиболее распространённых у участников состояний здоровья. Выделили 10 типовых профилей и случайным образом отобрали по пять человек из каждого.
Результаты тестирования показывают эффективность нового подхода. PHA превзошёл базовые модели на десяти бенчмарках. Пользователи предпочли взаимодействие с PHA по сравнению с обычными LLM: в тесте участвовали 20 участников и 50 персон. Эксперты отметили, что в сложных медицинских запросах ответы PHA оказались лучше на 5,7–39 % по сравнению с конкурентами.
Дизайн-принципы системы включают учёт всех потребностей пользователя, адаптивное комбинирование агентов, отказ от запроса данных, которые можно вывести из имеющейся информации, а также минимизацию задержки и сложности взаимодействия. Протестированные сценарии охватывают общие вопросы о здоровье, интерпретацию данных носимых устройств и биомаркеров, рекомендации по сну, питанию и активности, а также оценку симптомов (без постановки диагноза).
Тем не менее, система пока не лишена ограничений. Она работает медленнее одиночных агентов (244 секунды против 36), требует аудита предвзятости, защиты данных и соблюдения регуляторных требований. Следующим шагом Google планирует внедрить адаптивный стиль общения, который будет балансировать между эмпатией и ответственностью.
Делегируйте часть рутинных задач вместе с BotHub! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!
Источник
Источник: habr.com