Οντολογία (1/2)

Download Report

Transcript Οντολογία (1/2)

Semantic Web & Medicine
Φλουρή Καλλιρρόη
Μουστάκας Ιωάννης
Χατζόπουλος Κώστας
Εισαγωγή (1/4)
Η ανάπτυξη των πληροφοριακών και τηλεπικοινωνιακών συστημάτων
έφεραν στο προσκήνιο όρους όπως:
ιατρική πληροφορική
ηλεκτρονικός φάκελος υγείας
τηλεϊατρική
ιατρικές βάσεις δεδομένων
θησαυροί ιατρικών ορολογιών
Εισαγωγή (2/4)
Στον χώρο της ιατρικής τα τελευταία χρόνια έχει γίνει σημαντική
ερευνητική προσπάθεια με στόχο:
συγχώνευση και συγκέντρωση της ιατρικής πληροφορίας σε
μεγάλες διασυνδεδεμένες βάσεις δεδομένων
ομογεννοποίηση της ιατρικής ορολογίας σε θησαυρούς
αποθήκευση ιατρικών δεδομένων των ασθενών, με την μορφή
του ατομικού, ηλεκτρονικού και κατανεμημένου φακέλου
υγείας
απομακρυσμένη παρακολούθηση της πορείας της υγείας των
ασθενών μέσω του διαδικτύου
ανάκτηση ιατρικών εικόνων με βάση το περιεχόμενό τους
Εισαγωγή (3/4)
Στις περισσότερες από τις σύγχρονες ιατρικές εφαρμογές ο ρόλος
που διαδραματίζει η αποτελεσματική εύκολη και γρήγορη διακίνηση
και ανάκτηση πληροφορίας, είναι πολύ βασικός.
Για τον λόγο αυτό η πληροφορία θα πρέπει να είναι οργανωμένη
και ιεραρχημένη με τρόπο που να καθιστά εύκολη την κατανόησή
της από τον άνθρωπο και γρήγορη την επεξεργασία της από τον
υπολογιστή.
Σημασιολογικός ιστός
Εισαγωγή (4/4)
Προβλήματα του WWW
Σημασιολογικός Ιστός
Οι αναζητήσεις στο WWW εξετάζουν
μόνο το 20% των σχετικών
ιστοσελίδων και επιστρέφουν μεγάλη
ποσότητα άσχετης πληροφορίας
Διπλασιάζεται
σε μέγεθος
κάθε 6 μήνες
Η πληροφορίες στο www δεν
μπορούν εύκολα να επεξεργαστούν
από software agents
Η πληροφορία στο διαδίκτυο είναι
καθορισμένη και συνδεδεμένη έτσι ώστε
να μπορεί να χρησιμοποιηθεί από τους
υπολογιστές για την αυτοματοποίηση, την
ενσωμάτωση και την επαναχρησιμοποίηση
δεδομένων σε πολλές εφαρμογές
Σημασιολογικός ιστός και ιατρική
National Library of Medicine (NLM)





MeSH: οντολογία ιατρικών όρων
MEDLINE: βιβλιογραφική βάση δεδομένων
PubMed: μηχανή αναζήτησης
UMLS: Unified Medical Language System
The Visible Human Project
MELISA: MEdical Literature Search Agent
Οπτικοποίηση ιατρικών πληροφοριών με χρήση σημασιολογικών
μεταδεδομένων
Οντολογία ιατρικών σφαλμάτων
Οντολογία ασθενούς στον ιατρικό φάκελο
Άλλες προσπάθειες
Η National Library of Medicine (NLM) είναι η μεγαλύτερη
παγκοσμίως ιατρική βιβλιοθήκη και εδρεύει στο National
Institutes of Health στην Bethesda του Maryland.
http://www.nlm.nih.gov
Η NLM παρέχει
Πληροφορίες υγείας
MEDLINE/PubMed, MEDLINEplus, NLM Gateway
Υπηρεσίες βιβλιοθήκης
Κατάλογοι, Βάσεις Δεδομένων, MeSH, Ιστορικές
πληροφορίες, Δημοσιεύσεις
Ερευνητικά προγράμματα
Computational Molecular Biology, UMLS, Medical
Informatics, Visible Human Project
Η MEDLINE είναι η πρώτη και πιο γνωστή βιβλιογραφική βάση
ιατρικών δεδομένων.
Παρέχει πληροφόρηση σε θέματα ιατρικής, νοσηλευτικής,
οδοντιατρικής, κτηνιατρικής και για το σύστημα περίθαλψης και υγείας.
Περιέχει βιβλιογραφικές εγγραφές και περιλήψεις από περίπου
3.900 τρέχοντα βιοϊατρικά περιοδικά που εκδίδονται στις Ηνωμένες
Πολιτείες της Αμερικής και σε 70 άλλες χώρες.
Χρησιμοποιεί την ιατρική οντολογία MeSH
Είναι μια συλλογή μεταδεδομένων βιοιατρικής πληροφορίας


έγγραφα
περιγραφικά και σημασιολογικά μεταδεδομένα
PMID: Pubmed Identifier
PT: Publication Type
UID: Unique Identifier
DA: Date of Acceptance
TI: TItle
DP: Date of Publication
AU: Author
AB: ABstract
LA: LAnguage
SO: Source of Publication
MH: MeSH term related (σημασιολογικά μεταδεδομένα)
Η πρόσβαση στη MEDLINE γίνεται μέσω της
μηχανής αναζήτησης PubMed.
http://www.ncbi.nlm.nih.gov/entrez/query.fcgi
Το σύστημα αναζήτησης PubMed αναπτύχθηκε από το National
Center for Biotechnology Information (NCBI) σε συνεργασία με
εκδότες βιοϊατρικής βιβλιογραφίας.
Είναι ένα εργαλείο αναζήτησης βιβλιογραφικών παραπομπών και
επιπλέον χρησιμοποιείται ως σύνδεσμος για τίτλους περιοδικών
των εκδοτών που συμμετέχουν.
Οι εκδότες προμηθεύουν στην NLM βιβλιογραφικές εγγραφές, η
οποία μετά τις προσθέτει στο σύστημα αναζήτησης PubMed.
To PubMed επιτρέπει διαφορετικούς τύπους αναζήτησης για ένα
Keyword χρησιμοποιώντας περιορισμούς που ονομάζονται
Search modifiers
MAJR: Mesh term as major topic
MH:NOEXP: Mesh term without searching the descendants
MH: Like previous expanding the search through descendants
TI: The term in the Title
TW: The same, plus looking the term in the Abstract
PT: This term as Publication Type
Το MeSH (Medical Subject Headings) είναι ο θησαυρός ορολογιών
που έχει αναπτύξει η NLM.
Οι ορολογίες του MeSH είναι αποθηκευμένες σε αλφαβητική σειρά αλλά
και σε προκαθορισμένη ιεραρχική δομή.
Στο πιο γενικό επίπεδο της ιεραρχικής δομής υπάρχουν έννοιες όπως
«Ανατομία» ή «Ψυχικές Διαταραχές», ενώ σε ειδικότερα επίπεδα
υπάρχουν έννοιες όπως «Αστράγαλος», «Βιταμίνη C».
Υπάρχουν 21.973 όροι στo MeSH.
Ο θησαυρός MeSH χρησιμοποιείται από την NLM για indexing
άρθρων.
Τα άρθρα αυτά προέρχονται από τα 4.600 κορυφαία βιοιατρικά περιοδικά
και χρησιμοποιούνται στη βάση MEDLINE.
Επιπλέον το MeSH χρησιμοποιείται σε πολλές βάσεις της NLM που
περιέχουν καταλόγους βιβλίων και αρχείων.
Ο ίδιος όρος εμφανίζεται σε πολλαπλά κλαδιά του ιεραρχικού
πολυδένδρου
Κάθε όρος περιγράφεται από τις παρακάτω ιδιότητες
Name: Name of the term
Definition: Medical Definition
Related Terms: Other related terms
Subheadings: Allowed Subheadings to modify and
complement the meaning of this term
Position on the polytree: Fathers and sons on all
locations of the term
Unified Medical Language System:
Διευκολύνει την ανάκτηση πλήρους πληροφορίας η οποία
προέρχεται από κατανεμημένες πηγές όπως βιοιατρική
βιβλιογραφία, ιατρικούς φακέλους υγείας, βάσεις γνώσης και
καταλόγους για ιατρικούς οργανισμούς.
Αρχιτεκτονική: Τρεις πηγές γνώσης
The Metathesaurus : Περιέχει σημασιολογική πληροφορία για
βιοιατρικές έννοιες, ονόματα και συσχετίσεις μεταξύ τους.
The Semantic Network : Αποτελεί ένα δίκτυο γενικών
κατηγοριών και σημασιολογικών τύπων για όλους τους όρους
του Metathesaurus.
The Specialist Lexicon : Περιέχει συντακτική πληροφορία για
βιοιατρικούς όρους.
Entity
Conceptual Entity
Physical Object
Organism
Substance
Anatomical Structure
Idea or Concept
Manufactured Object
Finding
Language
Organization
Group
Organism attribute Intellectual Product Occupation or Discipline Group - attribute
Event
Activity
Behavior
Machine Activity
Daily or Recreational Activity
Occupational Activity
Phenomenon or Process
Natural phenomenon or process
Injury or Poisoning
Human-caused phenomenon or process
Entity
Physical Object
UI
T110
STY
Steroid
Substance
Chemical
Chemical Viewed Structurally
Definition
Organic Chemical
Lipid
Steroid
Examples
One of a group of polycyclic, 17-carbonatom, fused-ring compounds occurring both
in natural and synthetic forms. Included
here are naturally occurring and synthetic
steroids, bufanolides, cardanolides,
homosteroids, norsteroids, and
secosteroids.
Bufanolides, Ketosteroids, Norandrostanes,
Prednisone
Με την ανάπτυξη σύγχρονων μεθόδων τρισδιάστατης
οπτικοποίησης είναι δυνατή η 3D αναπαράσταση των ανατομικών
δομών του ανθρωπίνου σώματος.
Οποιοδήποτε υποσύνολο από τα 3D αντικείμενα μπορεί να
αναπαρασταθεί είτε μόνο του είτε ως μέλος μιας μεγαλύτερης
ομάδας.
Δημιουργείται η ανάγκη για ένα εργαλείο που να διευκολύνει
την πρόσβαση στα 3D αντικείμενα.
Δημιουργήθηκε ένα σύστημα πλοήγησης σε 3D εικόνες
ανατομίας. Αυτές συσχετίζονται με έννοιες ανατομίας τις
οποίες συνδέει μια σημασιολογική οντολογία.
Ανάλογα με το μέρος του σώματος που απεικονίζει η 3D εικόνα,
παρουσιάζεται το αντίστοιχο τμήμα της οντολογίας
η λεκάνη και όλες οι υπόλοιπες
κατηγορίες οστών είναι IsA της
γενικότερης κλάσης BONES
τα οστά COCCYX, OS COXAE,
SACRUM είναι IsA της κλάσης BONES
[PELVIS]
Medical Literature Search Agent (1/3)
(MELISA)
Πράκτορας ανάκτησης ιατρικών πληροφοριών βασισμένος στην
ιατρική οντολογία
Input Interface
Query Generation
Query Evaluation
Filter & Combination
Output Interface
Medical Literature Search Agent (2/3)
(MELISA)
Χρησιμοποιεί την ιατρική οντολογία της MeSH
EVIDENCE
QUALITY
MEDICAL
CLASS
GOOD EVIDENCE QUALITY
MEDIUM EVIDENCE QUALITY
POOR EVIDENCE QUALITY
CLINICAL
CATEGORIES
DIAGNOSIS
THERAPY
PROGNOSIS
ADVERSE EFFECTS
RISK FACTORS
ANALYSIS
DECISSION TREES
POLICY MAKING
COST ANALYSIS
EVIDENCE
INTEGRATION
GUIDLINES
NURSING
EVIDENCE BASED MEDICINE
REVIEW
Medical Literature Search Agent (3/3)
(MELISA)
Οπτικοποίηση ιατρικών πληροφοριών
χρήση της ιεραρχίας του πολυδένδρου της Μesh
χρήση των σημασιολογικών μεταδεδομένων της Mesh
Εμφάνιση του πλήθους των σχετικών με κάθε όρο
άρθρων
Θα μπορούσε να οπτικοποιηθεί με χρήση 3D δένδρο;
SIMS 247 Project, Berkley
Οπτικοποίηση ιατρικών πληροφοριών
Οπτικοποίηση ιατρικών πληροφοριών
Οντολογία ιατρικών σφαλμάτων (1/2)
Ιατρικά σφάλματα:
συχνά
επιβλαβή
μπορούν να αποφευχθούν
Συνήθως οφείλονται σε:
έλλειψη πληροφορίας
προβλήματα στην επικοινωνία
Δημιουργείται η ανάγκη μιας οντολογίας που να συσχετίζει τα
ιατρικά λάθη, την έλλειψη πληροφορίας και την επικοινωνία
Οντολογία ιατρικών σφαλμάτων (2/2)
Οντολογία ασθενούς στον EHR (1/2)
Μοντελοποίηση της εγγραφής στον EHR από μία
ιατρική επίσκεψη
Οντολογία ασθενούς στον EHR (2/2)
(DAML+OIL)
Άλλες σημαντικές προσπάθειες
Domain Specific Markup Languages
Βιοϊατρικές οντολογίες (GO,MGED)
ΟΝ9 για την ομογενοποίηση ιατρικών όρων
HYGEIA NET
ΟΝ9 (ομογενοποίηση ιατρικών όρων)
Xρήση της μεθοδολογίας ONIONS (Οntologic Integration
on Naïve Sources) για την ανάλυση και ομογενοποίηση
οντολογιών συγκεκριμένου πεδίου
Δεδομένα απο 5 (ετερογενή) συστήματα ιατρικής
ορολογίας





UMLS-SN (MeSH, ICD9-CM, SNOMED II…)
ICD 10
GMN
SNOMED III
CORE (GALEN project)
HYGEIA net (1/3)
Integrated Health Telematics Network of Crete
HYGEIA net (2/3)
HYGEIA net (3/3)
Κατηγορίες παρεχόμενων υπηρεσιών
δεδομένα ασθενών
διαθεσιμότητα και κατανομή πόρων
συνεργασία
στήριξη αποφάσεων
εκπαίδευση
υπηρεσίες προστιθέμενης αξίας
Domain Specific Markup Languages
Language
Full Name
Developer
Description
BSML
Bioinformatic
Sequence Markup
Language
BIOML
BIOpolymer
Markup Language
ProteoMetrics
XML language that is used to describe experimental
information about proteins, genes, and other biopolymers
PSDML
Protein Sequence
Database Markup
Language
National
Biomedical
Research
Foundation
open-standard markup language used to store protein
information in the Protein Information Resource (PIR)
database.
MSAML
Multiple Sequence
Alignment Markup
Language
Paul Gordon
was developed to make manipulation and extraction of multiple
sequence alignment information easier by logically defining the
parts of an alignment for use in an XML-based application.
MGED
Group/OMG
The Microarray Gene Expression Database (MGED) group is a
grass-root movement to promote the adoption of standards in
microarray experiments and data. More specific goals are to
facilitate the establishment of gene expression databases,
comparability of microarray data from different sources,
interoperability of different functional genomics databases and
data analysis software. Subsumes GeneXML, GEML and MAML.
MGEDML
Microarray Gene
Expression
Database Markup
Language
LabBook
open-standard protocol for the encoding and display of graphic
genomic displays of DNA, RNA, and protein sequence
information.
Βιοϊατρικές Οντολογίες
(RDF/RDFS/DAML+OIL)
Language
Full Name
GO
Gene Ontology
MGED
Ontology
Microarray Gene
Expression
Database Ontology
Developer
Gene Ontology
Consortium
MGED Group
Description
The objective of GO is to provide controlled vocabularies for
the description of the molecular function, biological process
and cellular component of gene products. These terms are to
be used as attributes of gene products by collaborating
databases, facilitating uniform queries across them. The
controlled vocabularies of terms are structured to allow both
attribution and querying to be at different levels of granularity.
The MGED project is charged with developing an ontology for
describing samples used in microarray experiments.
Τέλος