ONC планирует провести конкурс алгоритмов по поиску наилучшего соответствия пациента

ONC планирует провести конкурс алгоритмов по поиску наилучшего соответствия пациента

ONC (Office of the National Coordinator for Health Information Technology) - подразделение министерства здравоохранения и социальных служб США. Миссией ONC является создание совместимой, надежной и безопасной общенациональной информационной системы здравоохранения и поддержка широкомасштабного и осмысленного использования информационных технологий здравоохранения. Целью конкурса с 6-ю номинациями и призовым фондом 75000$ является изучение  существующих алгоритмов, стимулирование выбора метрик производительности, изучение вопросов дедупликации данных о пациенте и их связывании с другой клинической информацией. 

Что такое поиск соответствия пациента?

В США в настоящее время отсутствует идентификация пациента на уровне государства. Поскольку такой идентификатор отсутствует, организации здравоохранения и разработчики вынуждены использовать собственные алгоритмы сопоставления данных или записей о пациенте, а также самостоятельно разрабатывать и поддерживать базы данных с информацией о пациентах.

Предыстория

Организация IHE разработала два профиля для использования для запроса данных пациента. Это Patient Identifier Cross Referencing (PIX)/Patient Demographics Query (PDQ) и Cross-Community Patient Discovery (XCPD). Эти профили определяют механизм передачи демографической информации пациента и запрос соответствия данных пациента в целевой организации, а также ответ на этот запрос. Тем не менее, в настоящее время не существует стандартного набора идентификационных или демографических данных, которые должны использоваться для определения личности пациента в организации или для сопоставления записей внутри информационных систем и между ними. Для обеспечения корректности данных, организации полагаются на внутренние политики доступа к данным пациента и принципы управления данными. Риски и частота отказов существующих алгоритмов совпадения пациентов недооцениваются. При коэффициенте ошибок менее 8%, который считается промышленным стандартом, современные алгоритмы сопоставления пациентов значительно отстают от значения 0,1%, рекомендованного комитетом стандартов HIT

Специалисты по управлению информацией в области здравоохранения и безопасности пациентов уже давно признали важность надежной методологии идентификации пациентов. Благодаря программе Meaningful Use ONC, необходимость устранения пробелов в идентификации и сопоставлении пациентов получила дополнительное внимание специалистов.

Многие в индустрии медицинских ИТ выступают за разработку национального идентификатора пациента (PHIN) как панацею от обозначенных проблем. В 1996 году Закон о переносимости и подотчетности в здравоохранении (HIPAA) обязал министерство здравоохранения и социальных услуги разработать такой идентификатор. Финансирование этой работы было остановлено Конгрессом в 1998 году в связи с деятельностью защитников прав неприкосновенности частной жизни и либертарианцами, обеспокоенными неправомерным вмешательством в жизнь граждан США и угрозой несанкционированного доступа и хищения личных данных.

В контексте этой проблемы, организации, связанные с передачей медицинских данных разработали собственные алгоритмы (проприетарные и открытые) для решения задачи сопоставления пациентов. И хотя сопоставление пациентов является краеугольным камнем совместимости современных систем и стратегий совместного использования данных, относительно мало людей понимают, насколько сложным и подверженным ошибкам является в действительности этот процесс. Более того, недостаточное управление или стандартизация вокруг данных, используемых этими алгоритмами. 

Основы

Алгоритмы сопоставления записей часто встроены в ядро медицинских систем и считаются достаточно точными, но ровно до того момента, как приходится обмениваться данными с другими системами. По мере того, как региональные организации выходят на национальный уровень, и по мере роста клиентской базы, объемы пациентов и записей, которые необходимо сопоставлять, растут в геометрической прогрессии. И этот рост становится проблемой для алгоритмов, которые до сих пор функционировали хорошо в рамках локальной системы. Одна организация сообщила о 90% совпадении для своей ЭМК, но когда было выполнено сопоставление по 17 различным организациям, использующим ту же самую ЭМК, точность совпадения пациентов снизилась до 50-60%. К примеру, в статье, написанной в 2015 году, автор сообщает, что в базе данных округа Харрис, Техасский больничный округ, содержатся ЭМК почти для 2500 человек по имени Мария Гарсия, и 231 из них имеют одинаковую дату рождения. 

Как точность алгоритмов сопоставления пациентов влияет на ключевые приоритеты реформы здравоохранения США?

Безопасность и качество

Алгоритмы соответствия пациента обеспечивают целостность и достоверность данных, содержащейся в  медицинской карте. По мере того, как увеличивается обмен данными, последствия несоответствия записей и отсутствующих данных ставят под угрозу рост качества обслуживания пациетов и может стать причиной серьезных ошибок в лечении. Ложноположительные соответствия приводят к объединению записей разных пациентов. Ложноотрицательные соответствия приводят к отсутствию важной информации в ЭМК пациента.

Конфиденциальность

Несоответствие записей может приводить к раскрытию информации не тому лицу или наоборот, отказу лицу, имеющему право получить доступ к собственной медицинской информации.

Расходы

Устранение неточного соответствия записей пациентов дорого обходится медицинским организациям и посредникам. Большинство организаций используют сотрудников для обработки ошибок при подозрительных несоответствиях. Процесс устранения дублирования записей и ошибочного слияния трудоемкий и дорогостоящий. Ошибки сопоставления в одной организации могут экспоненциально реплицироваться, когда те же несоответствующие записи передаются через HIE потребителям данных. Организации сообщают, что устранение одного несоответствия обходится в сумму от 60 до 90 долларов США. Хуже того, многие ЭМК поддерживают объединение записей, но не их разъединение, что делает исправления особенно дорогостоящими.

Типы алгоритмов

Базовые (детерменированные):

  • Алгоритм посимвольно сравнивает выбранные элементы в указанных полях 
  • Могут включать фонетические соответствия и маски

Алгоритмы средней сложности:

  • Включает нечеткую логику.
  • Задает систему оценок для различных элементов соответствия.
  • Назначает вес для различных элементов, например для номеру социального страхования присваивается гораздо больший вес, чем имени и фамилии.
  • Назначает вес для редко и часто встречающихся значений. Например частым фамилиям присваивается меньший вес, а редким - больший.
  • Рассчитывает на наличие прозвищ.
  • Делает допущения о возможности существования опечаток.

Продвинутые алгоритмы:

  • Используют вероятностные и математические модели для определения вероятности совпадения
  • Используют машинное обучение и искусственный интеллект
  •  Алгоритм эволюционирует для оптимизации соответствия в зависимости от региональных различий в именах

 

Атрибуты данных  Риски
Все данные Хотя существуют стандарты HL 7 для транзакций сообщений, нет стандарта для форматирования данных в каждом из сегменов сообщения HL 7.
Имя пациента - 1-е и последнее
  • Изменение имен новорожденных при последующих поступлениях
  • Дефисы и апострофы создают проблемы и не имеют стандартов форматирования
  • Обработка поля среднего имени: как часть фамилии или как отдельное поле.
Дата рождения Пациенты могут изменить свою дату рождения, чтобы казаться моложе или старше.
Пол Может измениться.
Номер социального страхования
  • Новорожденные и иностранные граждане не имеют SSN
  • Пациенты часто не желают сообщать SSN
  • SSN может быть украдены
Телефонные номера Могут меняться
Адреса Могут меняться
Девичья фамилия матери или имя отца Улучшает точность, но многие информационные системы не обрабатывают этот тип элемента данных.

 

Теги: