Vortragstitel

Download Report

Transcript Vortragstitel

Stefan Schulz
Medical Informatics
Research Group
University
Medical Center
Freiburg, Germany
Introducción a Ontologías
Propósito
 Aclarar la diferencias entre
 Terminologías / tesauros
 Ontologías
 Precisar las bases semánticas de
representaciones OWL / lógica descriptiva
 Promover práctica buenas de ingeniería ontológica
mediante ejercicios prácticos usando Protégé en el
contexto de biomedicina
Systematized Nomenclature of Medicine
Clinical Terms (SNOMED CT)
 SNOMED Términos Clínicos®
• Sistema de codificación para todo la historia clínica
• Estándar terminológico global
• Manutención / desarrollo : IHTSDO (International Health Terminology
Standards Development Organisation):
Miembros: US, UK, AU, NZ, CA, DK, SE, NL, LV, ES
SNOMED CT como vocabulario controlado
311 000
conceptos
~750 000
términos ingleses,
~400 000
castellanos
Términos clínicos (inclusive sinónimos e
traducciones) conectados con conceptos
(portadores de significado)
SNOMED CT como ontología
teoría la cual ofrece
formulaciones
precisas y
matemáticas de las
propiedades y
relaciones de ciertas
entidades
taxonomías de clases:
C1 isa C2
significa
x: instanceOf(x, C1) 
instanceOf(x, C2)
SNOMED CT : Jerarquías taxonómicas
SNOMED CT como ontología
Relaciones (Atributos):
Restricciones: lógica descriptiva.
C1 – Rel – C2 significa:
x: instanceOf(x, C1) 
y: instanceOf(C2)  Rel(x,y)
C1 ⊑  Rel.C2
Associated morphology
Finding site
(50 tipos)
SNOMED CT como ontología
definierte vs.
primitive
conceptos
definidos

Konzepte
conceptos
primitivos ⊑
Lo que terminología y ontologias biomédica
tienen en común
etiquetas / termos
legibles pare usuarios
Nodos, enlaces, jerarquias
Definiciones formales o
informales
domain or region of DNA [GENIA]:
• Benign neoplasm of heart
• Benign tumor of heart
• Benign tumour of heart
• Benign cardiac neoplasm
• Gutartiger Herzumor
• Gutartige Neubildung am
Herzen
• Gutartige Neubildung:
Herz
• Gutartige Neoplasie des
Herzens
• Tumeur bénigne cardiaque
• Tumeur bénigne du cœur
• Neoplasia cardíaca
benigna
• Neoplasia benigna do
coração
• Neoplasia benigna del
corazón
• Tumor benigno do corazón
clases,
conceptos,
descriptores,
categorias…
A substructure of DNA molecule which is
supposed to have a particular function, such
as a gene, e.g., c-jun gene, promoter region,
Sp1 site, CA repeat. This class also includes a
base sequence that has a particular function.
Peptides [MeSH]:
Members of the class of compounds composed
of AMINO ACIDS joined together by peptide
bonds between adjacent amino acids into
linear, branched or cyclical structures.
OLIGOPEPTIDES are composed of
approximately 2-12 amino acids. Polypeptides
are composed of approximately 13 or more
amino acids. PROTEINS are linear polypeptides
that are normally synthesized on RIBOSOMES.
19429009|chronic ulcer of skin|
116680003|is a|=64572001|disease|
{116676008|associated morphology|=
405719001|chronic ulcer|
363698007|finding site|=
39937001|skin structure|}
bla bla bla
Terminologías
Conjunto de términos
que representan el
sistema de conceptos de
un domino particular
(ISO 1087)
Ontologías
La ontología es el estudio de lo
que hay. Una ontología es una
teoría la cual ofrece
formulaciones precisas y
matemáticas de las
propiedades y relaciones de
ciertas entidades
(Stanford Encyclopedia of
Philosophy)
Terminologías tratan de conceptos y lenguaje
humano
bla bla bla
Terminologías
Conjunto de términos
que representan el
sistema de conceptos de
un domino particular
(ISO 1087)
Ontologías
La ontología es el estudio de lo
que hay. Una ontología es una
teoría la cual ofrece
formulaciones precisas y
matemáticas de las
propiedades y relaciones de
ciertas entidades
(Stanford Encyclopedia of
Philosophy)
entidades de
lenguaje
(términos)
„benign neoplasm of heart“
„gutartige Neubildung des Herzmuskels”
“neoplasia cardíaca benigna”
Conceptos)
Ejemplo: UMLS (mrconso table)
Shared
Term
Meanings
términos
C0153957|ENG|P|L0180790|PF|S1084242|Y|A1141630||||MTH|PN|U001287|benign neoplasm of heart|0|N||
C0153957|ENG|P|L0180790|VC|S0245316|N|A0270815||||ICD9CM|PT| 212.7|Benign neoplasm of heart|0|N||
C0153957|ENG|P|L0180790|VC|S0245316|N|A0270817||||RCD|SY|B727.| Benign neoplasm of heart|3|N||
C0153957|ENG|P|L0180790|VO|S1446737|Y|A1406658||||SNMI|PT|
D3-F0100|Benign neoplasm of heart, NOS|3|N||
C0153957|ENG|S|L0524277|PF|S0599118|N|A0654589||||RCDAE|PT|B727.|Benign tumor of heart|3|N||
C0153957|ENG|S|L0524277|VO|S0599510|N|A0654975||||RCD|PT|B727.| Benign tumour of heart|3|N||
C0153957|ENG|S|L0018787|PF|S0047194|Y|A0066366||||ICD10|PS|D15.1|Heart|3|Y||
C0153957|ENG|S|L0018787|VO|S0900815|Y|A0957792||||MTH|MM|U003158|Heart <3>|0|Y||
C0153957|ENG|S|L1371329|PF|S1624801|N|A1583056|||10004245|MDR|LT|10004245|Benign cardiac neoplasm|3|N||
C0153957|GER|P|L1258174|PF|S1500120|Y|A1450314||||DMDICD10|PT| D15.1|Gutartige Neubildung: Herz|1|N||
C0153957|SPA|P|L2354284|PF|S2790139|N|A2809706||||MDRSPA|LT| 10004245|Neoplasia cardiaca benigna|3|N||
Unified Medical Language System, Bethesda, MD: National Library of Medicine: http://umlsinfo.nlm.nih.gov/
Ejemplo : UMLS
Shared
Term
Meanings
Shared
Term
Meanings
C0153957|A0066366|AUI|PAR|C0348423|A0876682|AUI |
|R06101405||ICD10|ICD10|||N||
C0153957|A0066366|AUI|RQ |C0153957|A0270815|AUI |default_mapped_ from|R03575929||NCISEER|NCISEER|||N||
C0153957|A0066366|AUI|SY |C0153957|A0270815|AUI |uniquely_mapped_ to |R03581228||NCISEER|NCISEER|||N||
C0153957|A0270815|AUI|RQ |C0810249|A1739601|AUI |classifies
| R00860638||CCS|CCS|||N||
C0153957|A0270815|AUI|SIB|C0347243|A0654158|AUI |
|R06390094
|| ICD9CM|ICD9CM||N|N||
C0153957|A0270815|CODE|RN|C0685118|A3807697|SCUI |mapped_to
| R15864842||SNOMEDCT|SNOMEDCT||Y|N||
C0153957|A1406658|AUI|RL |C0153957|A0270815|AUI |mapped_from
| R04145423||SNMI|SNMI|||N||
C0153957|A1406658|AUI|RO |C0018787|A0357988|AUI |location_of
| R04309461||SNMI|SNMI|||N||
C0153957|A2891769|SCUI|CHD|C0151241|A2890143|SCUI|isa
|R19841220|47189027|SNOMEDCT|SNOMEDCT|0|Y|N||
Relaciones
Semanticas
Example: UMLS
Shared
Term
Meanings
Shared
Term
Meanings
C0153957|A0066366|AUI|PAR|C0348423|A0876682|AUI |
|R06101405||ICD10|ICD10|||N||
C0153957|A0066366|AUI|RQ |C0153957|A0270815|AUI |default_mapped_ from|R03575929||NCISEER|NCISEER|||N||
C0153957|A0066366|AUI|SY |C0153957|A0270815|AUI |uniquely_mapped_ to |R03581228||NCISEER|NCISEER|||N||
C0153957|A0270815|AUI|RQ |C0810249|A1739601|AUI |classifies
| R00860638||CCS|CCS|||N||
C0153957|A0270815|AUI|SIB|C0347243|A0654158|AUI |
|R06390094
|| ICD9CM|ICD9CM||N|N||
C0153957|A0270815|CODE|RN|C0685118|A3807697|SCUI |mapped_to
| R15864842||SNOMEDCT|SNOMEDCT||Y|N||
C0153957|A1406658|AUI|RL |C0153957|A0270815|AUI |mapped_from
| R04145423||SNMI|SNMI|||N||
C0153957|A1406658|AUI|RO |C0018787|A0357988|AUI |location_of
| R04309461||SNMI|SNMI|||N||
C0153957|A2891769|SCUI|CHD|C0151241|A2890143|SCUI|isa
|R19841220|47189027|SNOMEDCT|SNOMEDCT|0|Y|N||
Relaciones
Semanticas
Relaciones semánticas en terminologías /
tesauros
 Son informales
el dedo es parte del mano
El mano tiene parte pulgar
aspirina trata dolor de cabeza
Murcia está localizada en España
Obama es presidente
Donald es un pato
“Higado” traducción de “liver”
España puede ser Campeón 2010
el gorila es un prímate
el trigo es un alimento
el trigo es una planta
polen causa alergias
Lmo-2 interactúa con elf-2
Neumonía tiene síntoma fiebre
 Significado depende del contexto y está
relacionado con lenguaje humano
Ontologías formales tratan de lo que existe
en el mundo
bla bla bla
Terminology
Ontología
Set of terms
representing the system
of concepts of a
particular subject field.
(ISO 1087)
La ontología es el estudio de lo
que hay. Una ontología es una
teoría la cual ofrece
formulaciones precisas y
matemáticas de las
propiedades y relaciones de
ciertas entidades
(Stanford Encyclopedia of
Philosophy)
Instanciación
Tipos de
Entidades
El tipo neoplasia
benigno del
corazón
instance-of
neoplasia benigno
del corazón del
paciente 12345
Entidades
Relaciones e definiciones
 Taxonomías: relaciona tipos and subtipos:
 Tumor of Heart subClassOf Tumor equivalente con:
 Todas las instancias de Tumor of Heart son instancias de Tumor
(sin excepciones)
 Relaciones:
 instance_of relaciona individuales con tipos, todas las otras relacionan
individuales (e.g. part_of) o son derivados de ellos (e.g. is_a)
 Definiciones: describen lo que es siempre verdadero para
todos los individuales que instancian un tipo
 Tumor of Heart subClassOf has_location some Heart :
Todas las instancias de Tumor of Heart están localizadas en algun
Heart
Jerarquías, Tipos,
Clases, Individuales
Dominio
Jerarquías, Tipos,
Clases, Individuales
Dominio
Jerarquías, Tipos,
Clases, Individuales
Ontology
Dominio
Type 1
Jerarquías, Tipos,
Clases, Individuales
Ontology
Type 1
Is_a
Subtype
1.1
Dominio
Is_a
Subtype
1.2
Is_a
Subtype
1.3
Jerarquías, Tipos,
Clases, Individuales
Ontology
Inflammatory
Disease
Dominio
Jerarquías, Tipos,
Clases, Individuales
Ontology
Inflammatory
Disease
Is_a
Gastritis
Dominio
Is_a
Hepatitis
Is_a
Pancreatitis
Jerarquías, Tipos,
Clases, Individuales
Ontology
Inflammatory
Disease
Is_a
Gastritis
Dominio
Is_a
Hepatitis
Is_a
Pancreatitis
Jerarquías, Tipos,
Clases, Individuales
Ontology
Inflammatory
Disease
Is_a
Gastritis
Dominio
Is_a
Hepatitis
Is_a
Pancreatitis
Relaciones y Definiciones
Ontology
Inflammatory
Disease
Is_a
Hepatitis
Hepatitis
Dominio
has
Location
Liver
Relaciones y Definiciones
Ontology
Inflammatory
Disease
Is_a
Hepatitis
Hepatitis
Dominio
has
Location
Liver
Relaciones y Definiciones
Ontology
Inflammatory
Disease
Is_a
Hepatitis
Dominio
has
Location
Liver
Relaciones y Definiciones
Ontology
Inflammatory
Disease
Is_a
Population
Is_a
Population of Virus
Dominio
caused
by
Hepatitis
Viral Hepatitis
has
Location
Liver
Compromiso ontológico
 Cuales son los objetos que pertenecen al
dominio representado?
 Cuales dominios deben estar excluidos ?
Dominio
Compromiso ontológico
Mouse
Ficcion?
 Otros ejemplos ?
Realidad?
Lenguajes para ontologías formales
 Lenguaje natural:
“Every hepatitis is an inflammatory disease that is located in some liver”
“Every inflammatory disease that is located in some liver is an hepatitis”
 Lógica de primer orden:
x: instanceOf(x, Hepatitis)  instanceOf(x, Inflammation) 
y: instanceOf(y, Liver)  hasLocation(x,y)
 Lógica descriptiva:
Hepatitis equivalentTo Inflammation and hasLocation some Liver
OWL – Ontology Web Language e
Protégé
Clases
Relaciones
Individuos
Ejercicio 1
 modeliza en Protege como clases e instancias e
incluyendo enlaces jerárquicos :
Body part
Organ
Liver
Respiratory Tract
Lung
Cell
Living Being
Animal
Human
Country
Spain
South Africa
Durban
Spanish Team
Xavi
Casillas
…
Relaciones
 Importante: relaciones
(object properties) en
OWL solamente entre
individuos
 Dominio y rango
especifican restricciones
 Características
algébricas: transitividad,
reflexividad
Ejercicio 2
 Añade las relaciones part of y has part (relación
inversa)
 Expresa que Durban es una parte de Sudáfrica
 Es posible, expresar de la misma manera que el
pulmón es parte del aparejo respiratorio ?
Restricciones
 part-of (Durban, Sudáfrica) es una expresión
correcta, pero no:
part-of (Pulmón, Aparejo respiratorio)
 Cuantificación:
cada instancia de Pulmón es parte de una
instancia de Aparejo respiratorio:
FOL:
x: instanceOf(x, Pulmon)  y: instanceOf(y, AparejoResp)  part-of (x,y)
DL (Manchester Syntax)
Pulmon
subClassOf
part-of some AparejoResp
Restricciones
Ejercicio 3
 Completa las clases en la mini-ontologia con
restricciones
Ejercicio 3
 Completa las clases en la mini-ontologia con
restricciones
Constructores de la lógica descriptiva
Constructor DL
⊓
and
E⊓F
E and F

some
r.G
r some G
⊑
subClassOf
A⊑B
A subClassOf B

equivalentTo

not
CD
C equivalentTo D
A
not A

only
r.G
r only G
⊔
or
A ⊔B
A or B
Significado
Ejemplo
Intersección
entre E y F
Acid ⊓
Organic Molecule
Restricción
existencial de la
relación r por G
B subsume A
part-of.Liver
Liver ⊑ Organ
C y D son
equivalentes
Negación de A
Restricción de
valor de la
relación r por G
Unión de A con
B
Organic Acid  Acid
⊓ Organic Molecule
Base ⊑  Acid
Hand ⊑
has-Laterality.
(Left ⊔ Right)
Dialectos de la lógica descriptiva
 Diferentes conjuntos de operadores y
propiedades. Ej:
EL: {SubClassOf, equivalent To, and, some}
(dialecto de SNOMED CT)
 Diferentes grados de complejidad computacional
 Padrones OWL:
 OWL EL
 OWL QL
 OWL RL
 Razonadores, e.g. HermiT, Pellet, Fact++:
OWL QL
Ejercicio 4a: ontología para neumonía
Modeliza el siguiente dominio:
 La neumonía es una enfermedad infecciosa que afecta el tejido del
pulmón.
 Los pulmones son órganos localizados en el tórax.
 Hay un pulmón derecho y un pulmón izquierdo
 El pulmón derecho tiene tres lobos: lobo superior, medio, inferior. E
pulmón izquierdo apenas dos, superior y inferior
 Otros órganos son corazón, riñón, y hígado.
 La neumonía puede ser adquirida en el hogar o en el hospital
 La neumonía viral es una neumonía causada por virus
 La neumonía bacteriana es una neumonía causada por bacterias
 Hay tambien otras causas de la neumonia.
 Las neumonias pueden ser agudas o cronicas.
¿Qué relaciones y clases de nivel superior son necesarias?
Ejercicio 4b: ontología para neumonía
Define clases e confiere su consistencia
 neumonía viral crónica
 neumonía bacteriana adquirida en el hospital
 neumonía bacteriana aguda en el lobo inferior derecho
 neumonía bacteriana aguda en el pulmón derecho
 * neumonía bacteriana aguda e crónica
 * neumonía bacteriana en el hígado
 *neumonía aguda en el lobo medio del pulmón izquierdo
Examina los siguientes queries
 Todas las estructuras anatómicas que tienen tejido pulmonar
 Todas las estructuras anatómicas que no tienen tejido pulmonar
 Todo lo que está localizado en el tórax
¿ Cuales son las modificaciones necesarias para impedir la definición de
clases inconsistentes
¿ Cuales son las modificaciones necesarias para evitar resultados falsos ?
Ejercicio 4c : ontología para neumonía
Intenta expresar lo siguiente conocimiento
 neumonías bacterianas son tratados con antibióticos
 hay neumonías bacterianas resistentes a penicilina
 neumonías lobares normalmente son bacterianas
 la embolia pulmonar predispone para neumonía bacteriana
 la neumonía viral es una enfermedad frecuente
 la neumonía viral unilateral es una enfermedad rara
 la neumonía típica tiene como síntomas fiebre y dolor
Ejercicio 4d : ontología para neumonía
Inspecciona las clases e relaciones de la ontología de nivel superior
BioTop (purl.org/biotop/biotop.owl) .
Reconstruye tu ontología utilizando clases y relaciones del BioTop
(importando la ontología externa)
OWL – What can sensibly be expressed
 Only suitable to represent shared, uncontroversial
meaning of a domain vocabulary
 Supports universal statements about instances of
a type:
 All Xs are Ys
 For all Xs there is some Y
 Properties of types are properties of all entities that
instantiate these types (strict inheritance)
OWL – What cannot be expressed
 Context dependent knowledge
 „Allergic Rhinitis is a common disorder (in Europe)“
 Probabilistic knowledge
 „95% of people infected with viral hepatitis recover “
 “Smoking is a cardiovascular risk factor”
 Default / canonic knowledge
 „Adult humans have 32 teeth“
 Meta-classes (instances of instances), e.g.
 Clyde subClassOf Elephant subClassOf Species
(“punning” not expressible in description logics)
 Non quantified relations between classes
 Treats(Aspirin, Headache)
Ontology  Knowledge Representation
Continuum of knowledge
Universally accepted
assertions
Consolidated but contextdependent facts
Hypotheses, beliefs,
statistical associations
Domain Knowledge
Ontology !
Universally accepted
assertions
Consolidated but contextdependent facts
Hypotheses, beliefs,
statistical associations
Domain Knowledge