Normalización de datos clínicos

Download Report

Transcript Normalización de datos clínicos

Normalización de datos
clínicos
José Alberto Maldonado
Grupo de Informática Biomédica, Instituto ITACA, UPV
VeraTech for Health
[email protected]
Interoperabilidad semántica
“Dos sistemas serán semánticamente interoperables
si la información circula entre ellos sin que el
significado original se vea alterado y cada uno de
ellos entiende por sí mismo lo que el otro le envía y
puede actuar en consecuencia de manera
automática”
“Manual práctico de interoperabilidad semántica para entornos sanitarios basada en arquetipos”
El Proceso de integración de la
información
• La interoperabilidad es un cualidad. La
tecnología que la soporta es la integración de
información.
• Las cuatro fases del proceso de integración:
– Comprensión
– Estandarización
– Especificación
– Ejecución
(Beauty and the Beast: The theory and practice of information integration, Laura Haas).
Estandarización
• Determinar la mejor forma de representar la
información integrada.
• En el caso de la estandarización de la HCE contamos
con tres pilares básicos para esta representación:
– Vocabulario
– Modelos de referencia
– Arquetipos (o modelos clínicos detallados, plantillas, etc.).
• Nuestro resultado en esta área: LinkEHR un editor de
arquetipos con soporte a múltiples modelos de
referencia. Enlazado con servidores de terminología,
concretamente ITServer de la empresa Indizen.
Especificación
• Conozco mis datos y también sé como quiero
representarlos.
• Por tanto tengo que transformar mis datos de un
formato origen a otro destino. Distintos escenarios:
– De datos no normalizados a datos normalizados.
– Entre diversas representaciones en un mismo estándar.
– O incluso transformar de un estándar a otro.
• Nos enfrentamos a un problema conocido en
la literatura como “Data exchange”
(transformación de datos).
Esquemas destino: Estándares de HCE
• Los estándares de comunicación de historia
clínica son complejos. Como consecuencia:
– la transformación de datos en salud requiere la
definición y gestión de programas de
transformación muy complejos y difíciles de
mantener.
– Son necesarias herramientas para ayudar en la
definición de estos programas de transformación.
LinkEHR como herramienta de
transformación de datos
• Nuestro
trabajo
en
transformación
(normalización) de HCE se ha plasmado en un
nuevo modulo de LinkEHR.
• Por tanto, permite normalizar a diversos
estándares: ISO13606, HL7 CDA, openEHR o
cualquier formato local.
• Nos hemos basado en la amplia base teórica
desarrollada en los últimos años en el área de
transformación de datos.
Publicaciones recientes
• Jesualdo T. Fernández-Breis, José Alberto Maldonado, Mar Marcos, María
del Carmen Legaz-García, David Moner, Joaquín Torres-Sospedra, Angel
Esteban-Gil, Begoña Martínez-Salvador, Montserrat Robles. Leveraging
electronic healthcare record standards and Semantic Web technologies for
the identification of patient cohorts. Journal of the American Medical
Informatics Association 20(E2), pp. e288-e296, 2013.
• Mar Marcos, José Alberto Maldonado, Begoña Martínez-Salvador, Diego
Boscá, Montserrat Robles. Interoperability of clinical decision-support
systems and electronic health records using archetypes: A case study in
clinical trial eligibility. Journal of Biomedical Informatics , 46(4), pp. 676689, 2013.
• Jose Alberto Maldonado, Catalina Martínez Costa, David Moner Cano,
Marcos Menárguez Tortosa, Diego Boscá Tomás, José Antonio Miñarro
Giménez, Jesualdo Tomás Fernández Breis, Montserrat Robles Viejo. Using
the ResearchEHR platform to facilitate the practical applications of EHR
standards. Journal of Biomedical Informatics 45(4), pp. 746-762, 2012.
Transformación de datos (data
exchange)
• Data exchange es el problema de crear a
partir de una instancia de un esquema origen
una instancia de un esquema destino, de tal
forma que la instancia destino es una
representación precisa de los datos origen.
• La relación entre ambos esquemas (origen y
destino) debe ser descrita adecuadamente, un
mapeo es una especificación de esta relación.
Mapeos: Especificar y generar
• Los mapeos de esquema son aserciones de
alto nivel declarativas que especifican la
relación entre dos esquemas.
• Los mapeos permiten separar la especificación
de las relaciones entre los esquemas de la
implementación. Se pueden compilar
automáticamente en programas ejecutables
como XSLT, SQL o XQuery.
Esquema general del problema
•Quiere normalizar datos de S
Esquema
origen S
“es conforme a ”
datos
Mapeo
(alto nivel)
Compilación
Programa de
Trasformación de datos
Esquema
Destino T
“es conforme a”
datos
Mapeo declarativo: correspondencia
de valores
• Correspondencias de valores: dictan como
calcular un valor en el destino a partir de un
conjunto de valores del origen.
– Están compuestas de una Función y un Filtro.
– Las funciones más simples son la asignación de
una constante o la función identidad (copia del
valor).
– LinkEHR viene con un conjunto muy amplio de
funciones, por ejemplo para normalizar fechas y
horas.
Ejemplos
• /dept[at0001]/empl[at0003]/name(true, /source/proj/empl/ename)
• /report[at0001]/status(true,”aborted”)
• /dept[at0001]/empl[at0003]/salary(true,/source/proj/empl/salary * 1.28)
• /dept[at0001]/empl[at0003]/sex
Ejemplo
∀𝒆 ∈ 𝑠𝑜𝑢𝑟𝑐𝑒. 𝑑𝑒𝑝𝑡. 𝑟𝑒𝑔𝐸𝑚𝑝. 𝑒𝑛𝑎𝑚𝑒 | 𝑠𝑜𝑢𝑟𝑐𝑒. 𝑑𝑒𝑝𝑡. 𝑟𝑒𝑔𝐸𝑚𝑝. 𝑠𝑎𝑙. 𝑣𝑎𝑙𝑢𝑒 > 1000 →
∃𝑒 ′ ∈ 𝑡𝑎𝑟𝑔𝑒𝑡. 𝑑𝑒𝑝𝑎𝑟𝑡𝑚𝑒𝑛𝑡. 𝑒𝑚𝑝𝑙𝑜𝑦𝑒𝑒|𝑒 ′ . @𝑛𝑎𝑚𝑒 = 𝑒. 𝑣𝑎𝑙𝑢𝑒
Mapeo de arquetipos
• Hay que tener en cuenta el modelo de
referencia completo.
• Los arquetipos definen restricciones que hay
que tener también en cuenta: existencia,
ocurrencia, cardinalidad, sobre los valores de
los atributos, etc.
Arquetipo en vista de mapeo
Vista en definición
Vista en mapeo
Semántica
• Las correspondencias de valores son a priori faciles de
especificar, pero al final tenemos que tratar con múltiples
correspondencias que se definen de manera independiente.
• ¿Cómo tenemos que combinarlas para construir una mapeo
completo?
• ¿Cómo tenemos en cuenta las restricciones impuestas por los
arquetipos?
• ¿Cuántas instancias tenemos que generar de cada tipo?
• ¿Qué ocurre cuando existen múltiples instancias destino que
satisfacen el mapeo?
• ¿Qué ocurre cuando no existen instancias destino que
satisfagan el mapeo?
Semántica
• En la literatura existe una base teórica
desarrollada en los últimos 15 años.
• Existe una semántica recomendada bien
definida.
• Nos hemos basada en ella en nuestra
herramienta de transformación de datos de
HCE. Es nuestra semántica por defecto.
Ajustar el mapeo
• Debido a la complejidad de las estructuras de
datos definidas por los modelos de referencia
y arquetipos a veces la semántica por defecto
no es adecuada.
• Hemos desarrollado mecanismos para que los
usuarios puedan modificar la semántica de la
transformación. Para lo cual hemos ampliado
el lenguaje de especificación de mapeos.
Ejemplo
Solo con correspondencias de valores.
Generamos un único departamento en el
destino.
Ampliación
del
lenguaje
de
especificación. Podemos indicar cuando
generar una instancia de “department”
Soporte a Snomed
• Hemos incorporado funciones sobre Snomed CT
a nuestro lenguaje de mapeo que operan sobre
las jerarquías de esta terminología. Estas
funciones permiten:
– Hacer abstracciones sobre la jerárquica de conceptos,
por ejemplo “administración de medicamento” es una
abstracción de “administración de antibiótico”.
– Construir conceptos más complejos a partir de otros
más simples. Por ejemplo “tumor sólido metastático”.
Funciones de Snomed CT
Ejemplo de mapeo con abstracción
Mapeo para el concepto “Presencia de un tumor metastático”
FUNCION FILTRO
TRUE
(
@count ($context/resumida/prob_OMI/problema_OMI,
@in($context/resumida/prob_OMI/problema_OMI/codigo,
@descendents ("128462008")))
+
@count ($context/resumida/prob_SELENE/problema_SELENE,
@in($context/resumida/prob_SELENE/problema_SELENE/codigo,
@descendents ("128462008")))
)>0
FALSE
TRUE
128462008 = Secondary malignant neoplastic disease
Arquetipos como esquema origen
• En LinkEHR un arquetipo puede ser el
esquema origen de un escenario de
transformación.
• Esto permite por ejemplo la transformación
entre estándares o dentro de un mismo
estándar.
Soporte a mapeos entre arquetipos
Ultimo paso: Compilación de la
especificación
• LinkEHR analiza la especificación del mapeo
(correspondencias de valores + extensiones) y
genera un programa XQuery que realiza la
transformación.
• Este programa tiene como entrada una instancia
de nuestro esquema origen y genera una
instancia del arquetipo destino.
• Por tanto si el arquetipo destino está basado en
algún estándar, las instancias generadas son
conformes al estándar.
Resumen
• Los estándares de HCE son complejos y requieren
herramientas de transformación de datos
adaptadas.
• Los escenarios de aplicación son múltiples:
normalización
de
datos
ya
existentes,
transformación entre estándares, reuso en
investigación clínica.
• Los lenguajes de especificación de mapeo deben
ser potentes y con un buen fundamento teórico.
Conclusión
• Interoperabilidad: el elefante y los seis sabios
ciegos
• La Interoperabilidad sigue
siendo un reto básico.
• La normalización solo cubre
algunos aspectos de la
interoperabilidad.
• Teoría y práctica deben
retroalimentarse.