На 16% меньше ошибочных диагнозов. OpenAI испытала ИИ-ассистента врача

С 30 января по 18 апреля 2025 года сеть клиник Penda Health в Найроби, Кения, испытывала систему AI Consult — ИИ-помощника врача. В тестировании участвовали 106 специалистов первичной помощи (близки к терапевтам) — они сталкиваются с огромным количеством заболеваний, что повышает риск ошибки. Врачей поделили на две группы: одна использовала AI Consult, а вторая была контрольной.

Особенность AI Consult в том, что эта система не принимает решение за врача, а работает параллельно с ним: изучает историю болезни, результаты осмотра и анализов, а затем выдает один из трех цветов: зеленый (проблем нет), желтый (мелкие недочеты) и красный (критические проблемы). Среди примеров выявленных проблем — назначение лекарств, которые не сочетаются друг с другом, отсутствие части необходимых анализов, пропущенные диагнозы и так далее.

Всего врачи обработали около 40 тысяч визитов, из которых случайным образом отобрали более 5 тысяч приемов и отдали на проверку группе из 108 независимых специалистов. В итоге в группе с ИИ-ассистентом оказалось на 16 % меньше диагностических ошибок и на 13 % меньше ошибок в назначении лечения. Если же брать только «красные» ошибки, то результат становится еще выше: на 31 % меньше ошибок в диагностике и на 18 % меньше ошибок в лечении. Со временем количество «красных» сигналов снижалось — врачи учились на своих ошибках.

В исследовании AI Consult работал на ChatGPT 4o от августа 2024 года. По сегодняшним меркам это устаревшая модель, которая в два раза уступает той же ChatGPT o3 в бенчмарке Healthbench — а значит, результат будущих версий может стать еще лучше.

P.S. Поддержать меня можно подпиской на канал «сбежавшая нейросеть», где я рассказываю про ИИ с творческой стороны.

Источник: habr.com

0 0 голоса

Рейтинг новости

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”