Google DeepMind анонсировала новую исследовательскую инициативу под названием AI co-clinician. Цель проекта — создание искусственного интеллекта, который будет работать не вместо врача, а вместе с ним, формируя так называемую триадическую модель помощи (врач, пациент и ИИ). Это важный шаг в развитии медицинских технологий, переносящий фокус с простой генерации текста на комплексное взаимодействие в реальном времени.
Системы здравоохранения по всему миру сталкиваются с серьезными вызовами. По прогнозам Всемирной организации здравоохранения, к 2030 году глобальный дефицит медицинских работников превысит 10 миллионов человек. Ранее ИИ рассматривался как потенциальное решение этой проблемы, однако существующие инструменты не могли полностью удовлетворить потребности клинической практики. Эволюция медицинского ИИ в Google DeepMind началась с успешной сдачи экзаменов моделью MedPaLM и продолжилась системой AMIE, которая имитировала текстовые консультации. Теперь исследователи пошли дальше.
Advancements in research into medical AI so that they might be more trustworthy and helpful for clinicians in assisting patients.
Медицина не ограничивается текстом — она требует визуального и аудиального анализа. Поэтому новый AI co-clinician построен на базе мультимодальных технологий (включая наработки Gemini и Project Astra). В ходе слепых тестирований на 98 реалистичных запросах первичной медико-санитарной помощи система не допустила ни одной критической ошибки в 97 случаях, превзойдя широко используемые врачами инструменты синтеза данных.
Особое внимание уделялось работе с медикаментами. На сложной базе данных OpenFDA (бенчмарк RxQA) модель показала значительный прогресс в ответах на открытые вопросы, которые наиболее точно отражают реальную клиническую практику. Однако настоящим прорывом стали тесты в телемедицинском формате.
В сотрудничестве с врачами из Гарварда и Стэнфорда исследователи провели симуляцию 120 телемедицинских сеансов. ИИ анализировал видео и аудио в реальном времени, например, успешно корректируя технику использования ингалятора пациентом или направляя его движения для диагностики травмы вращательной манжеты плеча.
The study used a blind comparison of 98 realistic primary care queries, which were curated from a diverse range of sources and subsequently refined by a panel of attending physicians. This multi-step iterative process involved comprehensive background research and the development of query-specific answer metrics to enable a rigorous professional assessment of clinical accuracy and compliance with best practice guidance. By leveraging this expert-led refinement phase, the methodology allowed for a precise characterization of consensus scenario-specific errors of omission and commission, ensuring that the evaluation reflected the complexities of real-world clinical decision-making.
Результаты исследования показывают реальную картину возможностей технологии. По итогам оценки 140 аспектов консультации живые эксперты в целом превзошли ИИ, особенно в выявлении критических симптомов (red flags) и проведении сложных физикальных осмотров. При этом ИИ-ассистент показал результаты на уровне или выше врачей первичного звена в 68 из 140 оцениваемых областей.
Для обеспечения безопасности в системе используется двухагентная архитектура. Специальный модуль-планировщик (Planner) непрерывно отслеживает ход беседы, гарантируя точность и соответствие медицинским протоколам.
Эти данные подтверждают, что на текущем этапе ИИ не готов заменить клиническое суждение человека. Его роль — быть надежным ассистентом, который берет на себя рутинный синтез данных, помогает не упустить важные детали и расширяет возможности телемедицины. Внедрение таких систем потребует времени и бескомпромиссных мер безопасности, но направление развития индустрии уже определено.