Transcript 3. Lekcija
Semantiskais tīmeklis ––––––––––––––––– Semantic Web Andrejs Lesovskis Lekcijas plāns Ontoloģijas Taksonomijas Tēzauri OWL valoda Semantiskā tīmekļa slāni Ontoloģija un ontoloģijas (1) Ontoloģija definē terminus, kas tiek izmantoti, lai aprakstītu un attēlotu zināšanu nozari Ontoloģija arī ir modelis (konceptu kopa), kas satur šo terminu jēdzienus Tādejādi, ontoloģija definē vārdnīcu un vārdnīcas jēdzienu. Cilvēki, datu bāzes un programmas izmanto ontoloģijas, lai apmainītos ar informāciju no noteiktiem domēniem Domēns: konkrētā zināšanu nozare (piemēram, medicīna, nekustams īpašums, finansu pārvaldība, utt). Ontoloģijas iekļauj domēna konceptu definīcijas un relācijas starp šiem konceptiem, kuras var izmantot datori Tās iekodē domēna zināšanas (modular) Zināšanas, kas aptver domēnus (composable) Zināšanas var tikt atkārtoti izmantotas (reusable) Ontoloģija un ontoloģijas (2) "Ontoloģijas definē pamatkonceptus un attiecības, kas veido konkrētas nozares tematisku vārdnīcu, un noteikumus konceptu un attiecību apvienošanai, lai nodefinētu vārdnīcas paplašinājumus." "Ontoloģija ir koplietojamas specifikācija." formāla, skaidra konceptualizācijas Ontoloģiju pielietošana (1) Bioinformātikā Open Biomedical Ontologies Consortium (GO, MGED) Gene Ontology Project Sequence Ontology Project Ontoloģiju pielietošana (2) Medicīnā Terminoloģiju izveidošana un uzturēšana. Piemēram, Snomed, NCI un Galen. Central Sulcus Parietal Lobe Frontal Lobe Occipital Lobe Temporal Lobe Lateral Sulcus Ontoloģiju pielietošana (3) Sarežģītas un daļēji strukturētas informācijas organizēšana: UN-FAO, NASA, Ordnance Survey, General Motors, Lockheed Martin, … "Big O" Ontoloģija un "small o" ontoloģija "Big O" Ontoloģija ir filozofijas disciplīna. "Little o" ontoloģija ir informācijas tehnoloģiju disciplīna. Ontoloģija un ontoloģijas (2) Terminu ontoloģija izmanto, lai aprakstītu modeļus ar atšķirīgām detalizācijas (struktūrizācijas) pakāpēm: Mazāka d. p.: taksonomijas (Semio/Convero, Yahoo hierarchy, UNSPSC), datu bāzes shēmas un metadatu shēmas (ICML, ebXML, WSDL). Lielāka d. p.: tēzauri (WordNet, CALL, DTIC), konceptuālie modeli (OO models, UML). Vēl lielāka d. p.: loģiskās teorijas (Ontolingua, TOVE, CYC, Semantic Web). Ontoloģiju spektrs (1) Modal Logic Stiprā semantika First Order Logic Loģiskā teorija Is Disjoint Subclass of Description Logic with transitivity DAML+OIL, OWL property UML Konceptuāls modelis Is subclass of RDF/S XTM Extended ER Tēzaurs ER Has narrower meaning than DB Schemas, XML Schema Taksonomija Relational Model, XML Vājā semantika Semantic Interoperability Structural Interoperability Is sublassification of Syntactic Interoperability Ontoloģiju spektrs (2) Modal Logic Stiprā semantika First Order Logic Problēma: ļoti vispārēja Loģiskā teorija Is Disjoint Subclass of Semantiskā ekspresivitāte: ļoti augsta Description Logic with transitivity DAML+OIL, OWL property UML vispārēja Konceptuāls Problēma: modelis Is subclass Semantiskā ekspresivitāte: augsta of RDF/S XTM Extended ER Semantic Interoperability Problēma: vispārēja Tēzaurs Semantiskā ekspresivitāte: vidējameaning than Has narrower ER DB Schemas, XML Schema Structural Interoperability Problēma: lokāla Taksonomija Is sublassification of Semantiskā ekspresivitāte: vāja Relational Model, XML Vājā semantika Syntactic Interoperability Jēgas (signifikācijas) trīsstūris <John_Smith > Koncepts Semantika:Jēdziens Apraksts Norāde/ Apzīmējums Termins “John” + “Smith” Reālās pasaules referents Sintakse:Simboli Pragmatika:Pielietošana Paplašinājums Termins un koncepts Termins (terminoloģija): Dabiskās valodas vārdi Koncepts Transportlīdzeklis Termins vai frāzes, kas norāda “Transportlīdzeklis” jēdzienu. Sintakse, kura aizstāj Koncepts Autotransports vai indicē semantiku Koncepts Automobilis (jēdzienu). Koncepts: Semantiskā vienība (jēdziens), mezgls (entītija) vai saite (attiecība) zināšanu attēlošanas modeļos Termins “Automobilis” Termins “Automašīna” Terminu attiecības Šaurāks nekā Sinonīms Konceptu attiecības Ir apakšklase Taksonomija "Taksonomija (vispār.) – zinātniskās klasificēšanas pamatprincipu pētīšana; sistemātiskā klasificēšana; piemērām: sakārtotā augu un dzīvnieku klasificēšana, kas atbilst to dabiskām attiecībām." " Taksonomija (inf. tehn.) – informācijas entītiju klasificēšana hierarhijas formā, lai tā atbilstu attiecīgajām reālās pasaules entītiju attiecībām." Vājās taksonomijas Piemērs: direktoriju struktūra • Nav nav stingri noteiktas semantikas vecāksbērns attiecībām: nenoteiktas apakšklasificēšanas attiecības. • Nav vispārināšanas / specializācijas taksonomija. Piemērs: UNSPSC Segment Family Class Commodity Title 10 00 00 00 Live Plant and Animal Material and Accessories and Supplies 10 10 00 00 Live animals 10 10 15 00 Livestock 10 10 15 01 Cats 10 10 15 02 Dogs Stipras taksonomijas Saskanīgā semantika vēcāks-bērns attiecībām: Narrower than (terminiem) vai Subclass (konceptiem) attiecības. Vispārināšanas/specializācijas taksonomija. Stipru taksonomiju piemēri objekts aģents persona organizācija menedžeris darbinieks Tēzaurs "Tēzaurs – ir pārvaldāma vārdnīca, kas ir sakārtota noteiktā secībā un strukturētā tā, lai varētu attēlot un identificēt ar standartiem attiecību indikatoriem ekvivalentas, homogrāfiskas, hierarhiskas un asociatīvas attiecības starp terminiem.“ ANSI/NISO Monolingual Thesaurus Standard Tēzauru terminu attiecības Semantiskās attiecības Sinonīms Vienāds ar, Ekvivalents Homonīms Raksta vienādi, Homogrāfisks Plašāks nekā (Hierarhijā: vecāks) Šaurāks nekā (Hierarhijā: bērns) Asociācija Saistītie Ir relācija Definīcija Piemērs Terminiem X un Y ir līdzīga nozīme. “Automašīna” ir sinonīms vārdam “automobilis” Terminus X un Y raksta vienādi, bet tiem ir atšķirīgas nozīmes. Terminam X ir plašākā nozīme nekā terminam Y. Terminam X ir šaurākā nozīme nekā terminam Y. Termins X ir saistīts ar terminu Y. “Rota” var apzīmēt rotas lietas vai bruņotu spēku apakšvienību. “Tranportlīdzeklis” ir plašāks nekā “automobilis”. “Automobilis” ir šaurāks nekā “transportlīzeklis”. “Šasija” ir saistīta ar “līdmašīnu”. Tēzaura piemērs no CALL imagery aerial imagery infrared imagery radar imagery moving target indicators radar photography combat support equipment intelligence and electronic warfare equipment Narrower than imaging systems Related to imaging radar infrared imaging systems Tēzaurs un ontoloģija Pārvaldāmā vārdnīca •Termini •Relācijas Koncepts Tēzaurs Termins ‘Semantiskās attiecības: Terminu Semantika (vāja) Ontoloģija Equivalent = Used For (Synonym) UF Broader Term/BT Narrower Term/NT Related Term/RT Loģiskā-konceptuāla Semantika (stipra) Reālās pasaules referenti Logical Concepts •Entītijas •Relācijas •Īpašības •Aksiomas Semantiskās attiecības: Subclass Of Part Of Arbitrary Relations Meta-Properties on Relations WordNet Princeton WordNet (PWN) tiek definēts kā leksikalizētu jēdzienu semantisks tīkls. Tika izstrādāts Prinstonas universitātē psiholoģijas profesora Dž. Millera vadībā. PWN ir nekomerciāls, atvērts projekts. WordNet Konceptuālais modelis (UML piemērs) Ontoloģiju attēlošanas līmeni Meta-Level to Object-Level Meta-Level to Object-Level Līmeni Piemēri Class, Relation, Instance, Knowledge Representation (KR) Function, Attribute, Property, Constraint, Axiom, Rule Language (Ontology Language) līmenis: Valoda ir meta līmenis Ontology Concept līmenim Ontology Concept Person, Location, Event, Parent, Hammer, River, (OC) līmenis: FinancialTransaction, ir objektu līmenis KR BuyingAHouse, Automobile, Language līmenim un ir TravelPlanning. meta līmenis Instance līmenim Ontology Instance (OI) Harry X. Landsford III, Ralph Waldo Emerson, Person560234, līmenis: ir objektu līmenis PurchaseOrderTransactionEvent6 Ontology Concept 117090, 1995-96 V-6 Ford Taurus 244/4.0 Aerostar līmenim Automatic with Block Casting # 95TM-AB and Head Casting 95TM Ontoloģijas (Vispārējās) Zināšanu bāze (Konkrētās zin.) 26 Web Ontology Language (OWL) Ir DAML+OIL valodas revīzija. Ir W3C rekomendācija. Eksistē 3 valodas versijas: OWL Lite OWL DL OWL Full OWL’am izvirzītie mērķi Labi definēta sintakse Efektīvas spriešanas atbalsts Formālās semantikas Pietiekami izteiksmīga valoda RDFS trūkumi Nav eksistences/kardinalitātēs ierobežojumu Nav transitīvu, inversīvu un simetrisku īpašību; Speciālas īpašību iezīmības; Sarežģītāk atbalstīt spriešanu. OWL entītijas un to attiecības rdfs:Class rdfs:Datatype rdfs:subClassOf owl:DataRange owl:equivalentClass owl:Class owl:disjointWith rdf:domain rdf:Property rdf:range x owl:equivalentProperty owl:inverseOf owl:Object Property rdfs:subPropertyOf owl:Datatype Property rdf:subPropertyOf owl:Functional Property owl:equivalentProperty owl:Inverse Functional Property owl:Symmetric Property owl:Transitive Property OWL klases <owl:Class rdf:ID="Continent"> <owl:oneOf rdf:parseType="Collection"> <owl:Thing rdf:ID="#Eurasia"/> <owl:Thing rdf:ID="#Africa"/> … </owl:oneOf> </owl:Class> <owl:Class rdf:ID="Opera"> <rdfs:subClassOf rdf:resource="#MusicalWork" /> </owl:Class> OWL piemērs <owl:Class rdf:ID="mathCourse"> <rdfs:subClassOf> <owl:Restriction> <owl:onProperty rdf:resource= "#isTaughtBy"/> <owl:hasValue rdf:resource= "#949352"/> </owl:Restriction> </rdfs:subClassOf> </owl:Class> OWL piemērs (2) <owl:Class rdf:ID="carnivore"> <rdfs:comment>Carnivores are exactly those animals that eat animals.</rdfs:comment> <owl:intersectionOf rdf:parsetype="Collection"> <owl:Class rdf:about="#animal"/> <owl:Restriction> <owl:onProperty rdf:resource="#eats"/> <owl:someValuesFrom rdf:resource="#animal"/> </owl:Restriction> </owl:intersectionOf> </owl:Class> OWL piemērs (3) @prefix ex: <http://example.org>. ex:Canine rdf:type owl:Class. ex:Human rdf:type owl:Class. ex:Spike rdf:type ex:Canine. ex:Ryan rdf:type ex:Human. OWL redaktori Protégé (Maryland Information and Network Dynamics Lab), Swoop (Stanford University), Emacs. Rīki un infrastruktūra (1) Redaktori/vide: Oiled, Protégé, Swoop, Construct, Ontotrack, … Rīki un infrastruktūra (2) Spriešanas sistēmas Cerebra, FaCT++, Kaon2, Pellet, Racer, … Pellet Paldies par uzmanību!