Transcript 3. Lekcija

Semantiskais tīmeklis
–––––––––––––––––
Semantic Web
Andrejs Lesovskis
Lekcijas plāns
Ontoloģijas
Taksonomijas
Tēzauri
OWL valoda
Semantiskā tīmekļa slāni
Ontoloģija un ontoloģijas (1)
Ontoloģija definē terminus, kas tiek izmantoti, lai aprakstītu un
attēlotu zināšanu nozari
Ontoloģija arī ir modelis (konceptu kopa), kas satur šo
terminu jēdzienus
Tādejādi, ontoloģija definē vārdnīcu un vārdnīcas jēdzienu.
Cilvēki, datu bāzes un programmas izmanto ontoloģijas, lai
apmainītos ar informāciju no noteiktiem domēniem
Domēns: konkrētā zināšanu nozare (piemēram, medicīna,
nekustams īpašums, finansu pārvaldība, utt).
Ontoloģijas iekļauj domēna konceptu definīcijas un relācijas
starp šiem konceptiem, kuras var izmantot datori
Tās iekodē domēna zināšanas (modular)
Zināšanas, kas aptver domēnus (composable)
Zināšanas var tikt atkārtoti izmantotas (reusable)
Ontoloģija un ontoloģijas (2)
"Ontoloģijas definē pamatkonceptus un
attiecības, kas veido konkrētas nozares
tematisku vārdnīcu, un noteikumus
konceptu un attiecību apvienošanai, lai
nodefinētu vārdnīcas paplašinājumus."
"Ontoloģija
ir
koplietojamas
specifikācija."
formāla,
skaidra
konceptualizācijas
Ontoloģiju pielietošana (1)
Bioinformātikā
Open Biomedical Ontologies Consortium (GO, MGED)
Gene Ontology Project
Sequence Ontology Project
Ontoloģiju pielietošana (2)
Medicīnā
Terminoloģiju izveidošana un uzturēšana.
Piemēram, Snomed, NCI un Galen.
Central Sulcus
Parietal Lobe
Frontal Lobe
Occipital
Lobe
Temporal Lobe
Lateral Sulcus
Ontoloģiju pielietošana (3)
Sarežģītas
un
daļēji
strukturētas
informācijas organizēšana:
UN-FAO, NASA, Ordnance Survey, General
Motors, Lockheed Martin, …
"Big O" Ontoloģija un "small o" ontoloģija
"Big O" Ontoloģija ir filozofijas
disciplīna.
"Little o" ontoloģija ir informācijas
tehnoloģiju disciplīna.
Ontoloģija un ontoloģijas (2)
Terminu ontoloģija izmanto, lai aprakstītu
modeļus ar atšķirīgām detalizācijas
(struktūrizācijas) pakāpēm:
Mazāka d. p.: taksonomijas (Semio/Convero,
Yahoo hierarchy, UNSPSC), datu bāzes
shēmas un metadatu shēmas (ICML, ebXML,
WSDL).
Lielāka d. p.: tēzauri (WordNet, CALL, DTIC),
konceptuālie modeli (OO models, UML).
Vēl lielāka d. p.: loģiskās teorijas (Ontolingua,
TOVE, CYC, Semantic Web).
Ontoloģiju spektrs (1)
Modal Logic Stiprā semantika
First Order Logic
Loģiskā teorija
Is Disjoint Subclass of
Description Logic
with transitivity
DAML+OIL, OWL
property
UML
Konceptuāls modelis
Is subclass of
RDF/S
XTM
Extended ER
Tēzaurs
ER
Has narrower meaning than
DB Schemas, XML Schema
Taksonomija
Relational
Model, XML
Vājā semantika
Semantic Interoperability
Structural Interoperability
Is sublassification of
Syntactic Interoperability
Ontoloģiju spektrs (2)
Modal Logic Stiprā semantika
First Order Logic
Problēma: ļoti vispārēja
Loģiskā
teorija
Is Disjoint
Subclass of
Semantiskā ekspresivitāte:
ļoti augsta
Description Logic
with transitivity
DAML+OIL, OWL
property
UML
vispārēja
Konceptuāls Problēma:
modelis
Is subclass
Semantiskā ekspresivitāte:
augsta of
RDF/S
XTM
Extended ER
Semantic Interoperability
Problēma: vispārēja
Tēzaurs
Semantiskā ekspresivitāte:
vidējameaning than
Has narrower
ER
DB Schemas, XML Schema
Structural Interoperability
Problēma: lokāla
Taksonomija
Is sublassification of
Semantiskā ekspresivitāte: vāja
Relational
Model, XML
Vājā semantika
Syntactic Interoperability
Jēgas (signifikācijas) trīsstūris
<John_Smith >
Koncepts
Semantika:Jēdziens
Apraksts
Norāde/
Apzīmējums
Termins
“John” + “Smith”
Reālās pasaules
referents
Sintakse:Simboli
Pragmatika:Pielietošana
Paplašinājums
Termins un koncepts
Termins (terminoloģija):
Dabiskās valodas vārdi
Koncepts Transportlīdzeklis
Termins
vai frāzes, kas norāda “Transportlīdzeklis”
jēdzienu.
Sintakse, kura aizstāj
Koncepts Autotransports
vai indicē semantiku
Koncepts Automobilis
(jēdzienu).
Koncepts:
Semantiskā vienība
(jēdziens), mezgls
(entītija) vai saite
(attiecība) zināšanu
attēlošanas modeļos
Termins “Automobilis”
Termins “Automašīna”
Terminu attiecības
Šaurāks nekā
Sinonīms
Konceptu attiecības
Ir apakšklase
Taksonomija
"Taksonomija (vispār.) – zinātniskās
klasificēšanas pamatprincipu pētīšana;
sistemātiskā klasificēšana; piemērām:
sakārtotā augu un dzīvnieku klasificēšana,
kas atbilst to dabiskām attiecībām."
" Taksonomija (inf. tehn.) – informācijas
entītiju klasificēšana hierarhijas formā, lai
tā atbilstu attiecīgajām reālās pasaules
entītiju attiecībām."
Vājās taksonomijas
Piemērs: direktoriju struktūra
• Nav nav stingri noteiktas
semantikas vecāksbērns attiecībām:
nenoteiktas
apakšklasificēšanas
attiecības.
• Nav vispārināšanas /
specializācijas
taksonomija.
Piemērs: UNSPSC
Segment
Family
Class
Commodity
Title
10
00
00
00
Live Plant and Animal Material
and Accessories and Supplies
10
10
00
00
Live animals
10
10
15
00
Livestock
10
10
15
01
Cats
10
10
15
02
Dogs
Stipras taksonomijas
Saskanīgā
semantika
vēcāks-bērns
attiecībām: Narrower than (terminiem)
vai Subclass (konceptiem) attiecības.
Vispārināšanas/specializācijas
taksonomija.
Stipru taksonomiju piemēri
objekts
aģents
persona
organizācija
menedžeris
darbinieks
Tēzaurs
"Tēzaurs – ir pārvaldāma vārdnīca, kas ir
sakārtota noteiktā secībā un strukturētā
tā, lai varētu attēlot un identificēt ar
standartiem
attiecību
indikatoriem
ekvivalentas, homogrāfiskas, hierarhiskas
un
asociatīvas
attiecības
starp
terminiem.“
ANSI/NISO Monolingual Thesaurus Standard
Tēzauru terminu attiecības
Semantiskās
attiecības
Sinonīms
Vienāds ar,
Ekvivalents
Homonīms
Raksta vienādi,
Homogrāfisks
Plašāks nekā
(Hierarhijā:
vecāks)
Šaurāks nekā
(Hierarhijā:
bērns)
Asociācija
Saistītie
Ir relācija
Definīcija
Piemērs
Terminiem X un Y ir
līdzīga nozīme.
“Automašīna” ir sinonīms
vārdam “automobilis”
Terminus X un Y
raksta vienādi, bet
tiem ir atšķirīgas
nozīmes.
Terminam X ir
plašākā nozīme nekā
terminam Y.
Terminam X ir
šaurākā nozīme nekā
terminam Y.
Termins X ir saistīts
ar terminu Y.
“Rota” var apzīmēt rotas
lietas vai bruņotu spēku
apakšvienību.
“Tranportlīdzeklis” ir
plašāks nekā
“automobilis”.
“Automobilis” ir šaurāks
nekā “transportlīzeklis”.
“Šasija” ir saistīta ar
“līdmašīnu”.
Tēzaura piemērs no CALL
imagery
aerial imagery
infrared imagery
radar imagery
moving target indicators
radar photography
combat support
equipment
intelligence and electronic
warfare equipment
Narrower than
imaging systems
Related to
imaging radar
infrared imaging systems
Tēzaurs un ontoloģija
Pārvaldāmā vārdnīca
•Termini
•Relācijas
Koncepts
Tēzaurs
Termins
‘Semantiskās attiecības:

Terminu
Semantika
(vāja)
Ontoloģija

Equivalent =
Used For (Synonym)
UF

Broader Term/BT

Narrower Term/NT

Related Term/RT
Loģiskā-konceptuāla
Semantika
(stipra)
Reālās pasaules
referenti
Logical Concepts
•Entītijas
•Relācijas
•Īpašības
•Aksiomas
Semantiskās
attiecības:

Subclass Of

Part Of

Arbitrary Relations

Meta-Properties on
Relations
WordNet
 Princeton WordNet (PWN) tiek definēts
kā leksikalizētu jēdzienu semantisks tīkls.
Tika izstrādāts Prinstonas universitātē
psiholoģijas profesora Dž. Millera vadībā.
 PWN ir nekomerciāls, atvērts projekts.
WordNet
Konceptuālais modelis (UML piemērs)
Ontoloģiju attēlošanas līmeni
Meta-Level to
Object-Level
Meta-Level to
Object-Level
Līmeni
Piemēri
Class,
Relation,
Instance,
Knowledge
Representation (KR) Function, Attribute,
Property, Constraint, Axiom, Rule
Language (Ontology
Language) līmenis:
Valoda
ir meta līmenis Ontology
Concept līmenim
Ontology
Concept Person, Location, Event, Parent,
Hammer,
River,
(OC) līmenis:
FinancialTransaction,
ir objektu līmenis KR
BuyingAHouse,
Automobile,
Language līmenim un ir
TravelPlanning.
meta līmenis Instance
līmenim
Ontology Instance (OI) Harry X. Landsford III, Ralph
Waldo Emerson, Person560234,
līmenis:
ir
objektu
līmenis PurchaseOrderTransactionEvent6
Ontology
Concept 117090, 1995-96 V-6 Ford
Taurus
244/4.0
Aerostar
līmenim
Automatic with Block Casting #
95TM-AB and Head Casting
95TM
Ontoloģijas
(Vispārējās)
Zināšanu bāze
(Konkrētās zin.)
26
Web Ontology Language (OWL)
Ir DAML+OIL valodas revīzija.
Ir W3C rekomendācija.
Eksistē 3 valodas versijas:
OWL Lite
OWL DL
OWL Full
OWL’am izvirzītie mērķi
Labi definēta sintakse
Efektīvas spriešanas atbalsts
Formālās semantikas
Pietiekami izteiksmīga valoda
RDFS trūkumi
Nav eksistences/kardinalitātēs
ierobežojumu
Nav transitīvu, inversīvu un simetrisku
īpašību;
Speciālas īpašību iezīmības;
Sarežģītāk atbalstīt spriešanu.
OWL entītijas un to attiecības
rdfs:Class
rdfs:Datatype
rdfs:subClassOf
owl:DataRange
owl:equivalentClass
owl:Class
owl:disjointWith
rdf:domain
rdf:Property
rdf:range
x
owl:equivalentProperty
owl:inverseOf
owl:Object
Property
rdfs:subPropertyOf
owl:Datatype
Property
rdf:subPropertyOf
owl:Functional
Property
owl:equivalentProperty
owl:Inverse
Functional
Property
owl:Symmetric
Property
owl:Transitive
Property
OWL klases
<owl:Class rdf:ID="Continent">
<owl:oneOf rdf:parseType="Collection">
<owl:Thing rdf:ID="#Eurasia"/>
<owl:Thing rdf:ID="#Africa"/>
…
</owl:oneOf>
</owl:Class>
<owl:Class rdf:ID="Opera">
<rdfs:subClassOf
rdf:resource="#MusicalWork" />
</owl:Class>
OWL piemērs
<owl:Class rdf:ID="mathCourse">
<rdfs:subClassOf>
<owl:Restriction>
<owl:onProperty
rdf:resource= "#isTaughtBy"/>
<owl:hasValue
rdf:resource= "#949352"/>
</owl:Restriction>
</rdfs:subClassOf>
</owl:Class>
OWL piemērs (2)
<owl:Class rdf:ID="carnivore">
<rdfs:comment>Carnivores are exactly those
animals that eat animals.</rdfs:comment>
<owl:intersectionOf
rdf:parsetype="Collection">
<owl:Class rdf:about="#animal"/>
<owl:Restriction>
<owl:onProperty rdf:resource="#eats"/>
<owl:someValuesFrom
rdf:resource="#animal"/>
</owl:Restriction>
</owl:intersectionOf>
</owl:Class>
OWL piemērs (3)
@prefix ex: <http://example.org>.
ex:Canine rdf:type owl:Class.
ex:Human rdf:type owl:Class.
ex:Spike rdf:type ex:Canine.
ex:Ryan rdf:type ex:Human.
OWL redaktori
Protégé (Maryland Information and Network Dynamics
Lab),
Swoop (Stanford University),
Emacs.
Rīki un infrastruktūra (1)
Redaktori/vide:
Oiled, Protégé, Swoop, Construct, Ontotrack,
…
Rīki un infrastruktūra (2)
Spriešanas sistēmas
Cerebra, FaCT++, Kaon2, Pellet, Racer, …
Pellet
Paldies
par uzmanību!