ONC планирует провести конкурс алгоритмов по поиску наилучшего соответствия пациента
- Блог пользователя eleven
- Войдите или зарегистрируйтесь, чтобы отправлять комментарии
ONC (Office of the National Coordinator for Health Information Technology) - подразделение министерства здравоохранения и социальных служб США. Миссией ONC является создание совместимой, надежной и безопасной общенациональной информационной системы здравоохранения и поддержка широкомасштабного и осмысленного использования информационных технологий здравоохранения. Целью конкурса с 6-ю номинациями и призовым фондом 75000$ является изучение существующих алгоритмов, стимулирование выбора метрик производительности, изучение вопросов дедупликации данных о пациенте и их связывании с другой клинической информацией.
Что такое поиск соответствия пациента?
В США в настоящее время отсутствует идентификация пациента на уровне государства. Поскольку такой идентификатор отсутствует, организации здравоохранения и разработчики вынуждены использовать собственные алгоритмы сопоставления данных или записей о пациенте, а также самостоятельно разрабатывать и поддерживать базы данных с информацией о пациентах.
Предыстория
Организация IHE разработала два профиля для использования для запроса данных пациента. Это Patient Identifier Cross Referencing (PIX)/Patient Demographics Query (PDQ) и Cross-Community Patient Discovery (XCPD). Эти профили определяют механизм передачи демографической информации пациента и запрос соответствия данных пациента в целевой организации, а также ответ на этот запрос. Тем не менее, в настоящее время не существует стандартного набора идентификационных или демографических данных, которые должны использоваться для определения личности пациента в организации или для сопоставления записей внутри информационных систем и между ними. Для обеспечения корректности данных, организации полагаются на внутренние политики доступа к данным пациента и принципы управления данными. Риски и частота отказов существующих алгоритмов совпадения пациентов недооцениваются. При коэффициенте ошибок менее 8%, который считается промышленным стандартом, современные алгоритмы сопоставления пациентов значительно отстают от значения 0,1%, рекомендованного комитетом стандартов HIT.
Специалисты по управлению информацией в области здравоохранения и безопасности пациентов уже давно признали важность надежной методологии идентификации пациентов. Благодаря программе Meaningful Use ONC, необходимость устранения пробелов в идентификации и сопоставлении пациентов получила дополнительное внимание специалистов.
Многие в индустрии медицинских ИТ выступают за разработку национального идентификатора пациента (PHIN) как панацею от обозначенных проблем. В 1996 году Закон о переносимости и подотчетности в здравоохранении (HIPAA) обязал министерство здравоохранения и социальных услуги разработать такой идентификатор. Финансирование этой работы было остановлено Конгрессом в 1998 году в связи с деятельностью защитников прав неприкосновенности частной жизни и либертарианцами, обеспокоенными неправомерным вмешательством в жизнь граждан США и угрозой несанкционированного доступа и хищения личных данных.
В контексте этой проблемы, организации, связанные с передачей медицинских данных разработали собственные алгоритмы (проприетарные и открытые) для решения задачи сопоставления пациентов. И хотя сопоставление пациентов является краеугольным камнем совместимости современных систем и стратегий совместного использования данных, относительно мало людей понимают, насколько сложным и подверженным ошибкам является в действительности этот процесс. Более того, недостаточное управление или стандартизация вокруг данных, используемых этими алгоритмами.
Основы
Алгоритмы сопоставления записей часто встроены в ядро медицинских систем и считаются достаточно точными, но ровно до того момента, как приходится обмениваться данными с другими системами. По мере того, как региональные организации выходят на национальный уровень, и по мере роста клиентской базы, объемы пациентов и записей, которые необходимо сопоставлять, растут в геометрической прогрессии. И этот рост становится проблемой для алгоритмов, которые до сих пор функционировали хорошо в рамках локальной системы. Одна организация сообщила о 90% совпадении для своей ЭМК, но когда было выполнено сопоставление по 17 различным организациям, использующим ту же самую ЭМК, точность совпадения пациентов снизилась до 50-60%. К примеру, в статье, написанной в 2015 году, автор сообщает, что в базе данных округа Харрис, Техасский больничный округ, содержатся ЭМК почти для 2500 человек по имени Мария Гарсия, и 231 из них имеют одинаковую дату рождения.
Как точность алгоритмов сопоставления пациентов влияет на ключевые приоритеты реформы здравоохранения США?
Безопасность и качество
Алгоритмы соответствия пациента обеспечивают целостность и достоверность данных, содержащейся в медицинской карте. По мере того, как увеличивается обмен данными, последствия несоответствия записей и отсутствующих данных ставят под угрозу рост качества обслуживания пациетов и может стать причиной серьезных ошибок в лечении. Ложноположительные соответствия приводят к объединению записей разных пациентов. Ложноотрицательные соответствия приводят к отсутствию важной информации в ЭМК пациента.
Конфиденциальность
Несоответствие записей может приводить к раскрытию информации не тому лицу или наоборот, отказу лицу, имеющему право получить доступ к собственной медицинской информации.
Расходы
Устранение неточного соответствия записей пациентов дорого обходится медицинским организациям и посредникам. Большинство организаций используют сотрудников для обработки ошибок при подозрительных несоответствиях. Процесс устранения дублирования записей и ошибочного слияния трудоемкий и дорогостоящий. Ошибки сопоставления в одной организации могут экспоненциально реплицироваться, когда те же несоответствующие записи передаются через HIE потребителям данных. Организации сообщают, что устранение одного несоответствия обходится в сумму от 60 до 90 долларов США. Хуже того, многие ЭМК поддерживают объединение записей, но не их разъединение, что делает исправления особенно дорогостоящими.
Типы алгоритмов
Базовые (детерменированные):
- Алгоритм посимвольно сравнивает выбранные элементы в указанных полях
- Могут включать фонетические соответствия и маски
Алгоритмы средней сложности:
- Включает нечеткую логику.
- Задает систему оценок для различных элементов соответствия.
- Назначает вес для различных элементов, например для номеру социального страхования присваивается гораздо больший вес, чем имени и фамилии.
- Назначает вес для редко и часто встречающихся значений. Например частым фамилиям присваивается меньший вес, а редким - больший.
- Рассчитывает на наличие прозвищ.
- Делает допущения о возможности существования опечаток.
Продвинутые алгоритмы:
- Используют вероятностные и математические модели для определения вероятности совпадения
- Используют машинное обучение и искусственный интеллект
- Алгоритм эволюционирует для оптимизации соответствия в зависимости от региональных различий в именах
Атрибуты данных | Риски |
---|---|
Все данные | Хотя существуют стандарты HL 7 для транзакций сообщений, нет стандарта для форматирования данных в каждом из сегменов сообщения HL 7. |
Имя пациента - 1-е и последнее |
|
Дата рождения | Пациенты могут изменить свою дату рождения, чтобы казаться моложе или старше. |
Пол | Может измениться. |
Номер социального страхования |
|
Телефонные номера | Могут меняться |
Адреса | Могут меняться |
Девичья фамилия матери или имя отца | Улучшает точность, но многие информационные системы не обрабатывают этот тип элемента данных. |