Исследователи из Microsoft опубликовали результаты, показывающие, что их экспериментальная система диагностики на основе искусственного интеллекта MAI-DxO значительно превосходит врачей-людей в решении сложных медицинских задач, а также позволяет сократить предполагаемые расходы на тестирование.
Исследование сосредоточено на диагностическом оркестраторе искусственного интеллекта Microsoft (MAI-DxO), который подходит к медицинской диагностике иначе, чем существующие системы искусственного интеллекта. Вместо того чтобы анализировать всю информацию о пациенте сразу, MAI-DxO использует последовательный процесс: начиная с ограниченной информации о пациенте, он задаёт конкретные вопросы, назначает определённые анализы и постепенно выстраивает диагноз.
Команда протестировала свою систему на 304 сложных с точки зрения диагностики случаях из серии Case Record журнала New England Journal of Medicine, в которой представлены многоуровневые медицинские сценарии, часто ставящие в тупик даже опытных врачей. Эти случаи представляют собой одни из самых тяжелых диагностических задач в клинической медицине.
«Мы делаем большой шаг к созданию медицинского суперинтеллекта», — отметил Мустафа Сулейман в LinkedIn. «Модели искусственного интеллекта отлично справляются с медицинскими тестами с несколькими вариантами ответов, но у реальных пациентов нет вариантов ответов».
Этот подход отличается от других систем медицинского ИИ, таких как AMIE от Google, которые в основном ориентированы на диалоговые функции или статическую диагностику на основе полной информации. MAI-DxO имитирует совместную работу медицинской комиссии с помощью пяти отдельных ИИ-персонажей: один занимается дифференциальной диагностикой, другой выбирает тесты, третий оспаривает предположения, чтобы избежать предвзятости, четвёртый обеспечивает экономию средств, а пятый контролирует качество.
Система продемонстрировала стратегическое мышление в вопросах сбора информации. В одном из примеров, связанном с алкогольной абстиненцией и употреблением дезинфицирующего средства для рук, базовая модель GPT-4 назначила обширное обследование, включающее МРТ головного мозга и ЭЭГ, что привело к предполагаемым затратам в размере 3431 доллара и неправильному диагнозу.
MAI-DxO на раннем этапе определила необходимость учитывать внутрибольничное воздействие токсинов, задала вопрос об употреблении дезинфицирующего средства для рук и подтвердила диагноз с помощью целевого тестирования стоимостью 795 долларов.
Исследование направлено на решение растущих проблем в сфере здравоохранения, где расходы продолжают расти, а диагностические ошибки остаются серьёзной проблемой. Современные инструменты ИИ для диагностики продемонстрировали свою эффективность в анализе медицинских изображений и структурированных данных, но внедрение этих достижений в реальные клинические процессы по-прежнему сопряжено с трудностями.
Исследование показало, что MAI-DxO повышает эффективность различных базовых моделей ИИ, независимо от лежащей в их основе технологии. Применительно к моделям OpenAI, Anthropic, Google и других компаний, комплексный подход стабильно повышал точность диагностики в среднем на 11 процентных пунктов при одновременном снижении предполагаемых затрат.
Это исследование было проведено в то время, когда несколько технологических компаний разрабатывали приложения на основе ИИ для сферы здравоохранения. Система AMIE от Google продемонстрировала свои возможности в области диагностического общения и недавно получила способность интерпретировать медицинские изображения. Однако, в то время как AMIE делает упор на качество общения и эмпатию в контролируемых условиях, подход Microsoft сосредоточен на стратегическом мышлении и аспектах управления ресурсами в медицинской диагностике.
Исследования в области ИИ-диагностики потенциально могут решить глобальные проблемы, связанные с доступом к медицинским услугам. Системы здравоохранения во всем мире сталкиваются с нехваткой врачей и увеличением количества пациентов, особенно в регионах с ограниченным доступом к специализированным медицинским услугам.
Исследование имеет ряд важных ограничений, на которые стоит обратить внимание. Тестирование проводилось на сложных, редких случаях, которые не являются типичными для медицинской практики. В ходе исследования не удалось оценить, насколько хорошо MAI-DxO справляется с распространёнными заболеваниями и может ли он упустить очевидные диагнозы при выявлении редких заболеваний. Кроме того, в условиях контролируемого тестирования не учитывались типичные клинические ограничения, такие как электронные медицинские карты, одобрение страховкой, предпочтения пациентов или нехватка времени, с которой сталкиваются врачи на практике.
Кроме того, врачи, несмотря на свой опыт, работали без доступа к коллегам, учебникам или цифровым инструментам, которые они обычно используют в клинической практике. Это может привести к занижению показателей эффективности человека в типичных условиях.
На данный момент MAI-DxO — это исследовательский проект. Исследователи Microsoft подчёркивают, что это исследование находится на ранней стадии и требует тщательной проверки перед применением в клинической практике. Команда сотрудничает с медицинскими организациями для проведения исследований в реальных условиях, начиная с совместной работы с медицинским центром Beth Israel Deaconess.
Хотите быть в курсе важных новостей из мира ИИ? Подписывайтесь на наш Telegram‑канал BotHub AI News.
Источник
Источник: habr.com