Präsentation Boteram 22.11.2007

Download Report

Transcript Präsentation Boteram 22.11.2007

XML, RDF, RDFS, OWL
Auszeichnungs- und Modellierungssprachen
im Kontext semantischer Technologien
Felix Boteram
Übersicht
1. Einleitung
2. Sprachen
2.1 HTML
2.2 XML
2.3. XMLSchema
3. Spezifikationen und Sprachen
3.1 RDF
3.2 RDFSchema
3.3 OWL
Semantisches Netz Standards HTML
XML XHTML RDF RDFS OWL
Übersicht
1. Einleitung
2. Standards
3. Sprachen
3.1 SGML
3.2 HTML
3.3 XML
3.4 XML Schema
3.5 XHTML
4. Spezifikationen und Sprachen
4.1 RDF
4.2 RDFS
4.3 OWL
Semantisches Netz Standards HTML
XML XHTML RDF RDFS OWL
Vor -und Nachteile HTML
Vorteile

Leicht erlernbar
Nachteile
 Trennung nur von Inhalt
und Darstellung
 Bedeutung der Elemente
nicht ausgezeichnet
 Bedeutung nicht
maschinell lesbar oder
interpretierbar
 Begrenzte Menge an
Tags
XML Extensible Markup Language (W3C 1996)





Auszeichnungssprache auf Basis
von SGML
Trennung von Inhalt, Struktur und Layout Ausgabe /
Darstellung plattformunabhängig
Tags frei wählbar
Definition des Vokabulars mittels DTD oder XMLSchema
Dient unter anderem der Serialisierung von
Beschreibungsmodellen.
XML Extensible Markup Language (W3C 1996)
Codierungsbeispiel in XML:
<book>
<title>
Nonmonotonic Reasoning
</title>
<author>V.Marek</author>
<author>M. Truszczynski </author>
<publisher> Springer</publisher>
<year> 1993</year>
<isbn> 0387976892</isbn>
</book>
XML

Bedeutung der Tags muß definiert werden:

Eindeutigkeit der Sprache muß durch Definition in
Namensräumen und die Referenzierung durch URIs
gewährleistet sein.

Standard-Namensräume verfasst und abrufbar von:
W3C oder Dublin Core

Zugelassene Standardsprachen:
XML Schema, SMIL, SVG etc.
Verwendung semantischer Tags
Vor- und Nachteile XML
Vorteile
 Freie Wahl an Tags

Nachteile

Hierarchische Struktur

Bedeutung nicht
maschinell interpretierbar
Flexible Strukturierung und
Darstellung der
Informationen

Bedeutung explizierbar
(semantische Tags)

Darstellung
plattformunabhängig
RDF Ressource Description Framework (W3C 1999)
RDF ist ein Standard, auf Basis von XML, zur
Beschreibung von Metadaten, und somit essentieller
Baustein der Semantic Web-Architektur.
Er bietet die Möglichkeit, Ressourcen und deren
Eigenschaften, maschinell lesbar zu beschreiben.
Resource Description Framework (RDF)
Fakultät für Informations-und Kommunikationswissenschaften
Fachhochschule Köln
Semantic Web
RDF (Resource Description Framework), eine offizielle W3C
Recommendation, ist ein XML-basierter Standard zur Beschreibung von
Ressourcen im Internet, Intranet und Extranet. RDF baut auf bestehenden
XML- und URI (Uniform Resource Identifier)-Technologien auf, wobei URIs
zum Identifizieren der einzelnen Ressourcen und zur Angabe von
Statements über Ressourcen dienen. RDF Statements beschreiben eine
Ressource (die durch eine URI identifiziert wird), die Eigenschaften einer
Ressource und die Werte dieser Eigenschaften. RDF Statements werden oft
als "Triples" bezeichnet. Diese Triples bestehen aus Subjekt, Prädikat und
Objekt. Dies entspricht einer Ressource (Subjekt), einer Eigenschaft
(Prädikat) und einem Eigenschaftswert (Objekt):
[Ressource]
The secret agent
[Subjekt]
[Eigenschaft]
[Wert]
is named
Niki Devgood
[Prädikat]
[Objekt]
RDF-Triples können mit XML-Tags bezeichnet werden und werden oft
grafisch folgendermaßen dargestellt:
W. Gödert
RDF Ressource Description Framework (W3C 1999)
Dabei werden einfache Aussagen in Form von Triplets
definiert:
Hund
Hund
jagt
jagt
jagt
jagt
Konstituenten:
 Subjekt  Ressource
 Prädikat  Eigenschaft
 Objekt Ressource oder Wert
Katze
Katze
hatName
wiegt
„Moggy“
4,5 kg
RDF Ressource Description Framework
„Soap1.0“
hat Titel
Buch
behandelt
verfasst
Soap
Manfred
Hein
Informatiker
hat Name
RDF Ressource Description Framework
Hat Titel
„Soap1.0“
Buch
http://dublincore.org/2006/08/28/dces.rdf#coverage
Soap
Manfred
Hein
verfasst
Informatiker
Hat Name
1<?xml version=„1.0“?>
2 <rdf:RDF
RDF
3 4.1
xmlns:rdf=„www.w3c.org/1999/02/22-rdf-syntax-ns“
4 xmlns:dc=„www.dublincore.org/elements/1.1“>
5 xmlns:fbi=„www.fbi.fh-koeln.de/projekt/vocabulary>
6<rdf:Description rdf: about:“Informatiker“>
7 <fbi: verfasst rdf: resource=„Buch“>
8 <fbi: hatName rdf:>Manfred Hein</hatName>
9</rdf:Description>
10<rdf:Deskription rdf: about:=„Buch“>
11<fbi: hatTitel>Soap 1.0</fbi:hatTitel>
12 <dc: coverage rdf:resource=„Soap“>
13</rdf:Description>
14<rdf:Description rdf: about: „Soap“>
15 <fbi: ….>
16 <fbi: …>
17</rdf:Description>
4.1 RDF
Durch Erstellung von Triples mit
Subjekt,
Prädikat
und
Objekt
können in RDF einfache Zusammenhänge dargestellt
werden. Anhand der enthaltenen Informationen können
Maschinen logische Annahmen auf Basis der
Assoziationen zwischen Subjekt und Objekt machen.
4.1 Vor- und Nachteile RDF
Vorteile
 Möglichkeit logischer
Annahmen über
Beziehungen zwischen
Subjekt und Objekt
Nachteile
 Nur einfache
Beziehungen darstellbar


Bedeutung maschinell
interpretierbar
Keine Möglichkeit der
Strukturierung durch
Hierarchien oder
Klassenbildung
Fakultät für Informations-und Kommunikationswissenschaften
Fachhochschule Köln
Semantic Web
W. Gödert
Nachdem Triples grafisch definiert wurden, können Sie entweder
in RDF/XML oder n-Triples-Formaten kodiert werden, um von
Programmen aufgerufen werden zu können.
Durch Erstellung von Triples mit Subjekt, Prädikat und Objekt in
RDF können Maschinen logische Annahmen auf Basis der
Assoziationen zwischen Subjekt und Objekt machen. Da RDF URIs
zum Identifizieren der Ressourcen verwendet, ist jede Ressource
mit einer eindeutigen Definition verknüpft, die im Internet zur
Verfügung steht. RDF bietet zwar ein Model und eine Syntax (die
Regeln, mit denen die Elemente eines Satzes definiert werden)
zum Beschreiben der Ressourcen, gibt aber keinen Aufschluss
über die Semantik (die Bedeutung) der Ressourcen.
Zur Definition der Semantik benötigen wir RDFS und OWL
RDFS – Schemata
RDF – Schemata sind einfache Modelle anhand derer
Das Inventar aller gebrauchten Ressourcen definiert wird.
d.h.
alle Klassen
alle Eigenschaften
Autor
unterrichtet
Sowie deren mögliche Kombinationen dargestellt werden.
Dazu steht ein begrenztes „Set“ an Relationstypen zur
Verfügung.
RDF Schema (RDFS)
Fakultät für Informations-und Kommunikationswissenschaften
Fachhochschule Köln
Semantic Web
W. Gödert
RDFS dient zum Erstellen von Vokabularen, die Gruppen
verwandter RDF-Ressoucen und die Beziehungen zwischen diesen
Ressourcen beschreiben. Ein RDFS-Vokabular definiert, welche
Eigenschaften den RDF-Ressoucen in einer bestimmten Domain
zugewiesen werden können. Mit RDFS können Sie außerdem
Ressourcenklassen erstellen, die gemeinsame Eigenschaften
haben.
Aufbauend auf demselben Triples-Modell wie bei RDF, bestehen
RDFS-Triples aus Klassen, Klasseneigenschaften und Werten, die
die Klassen und Beziehungen zwischen den Ressourcen in einer
bestimmten Domain definieren.
In einem RDFS-Vokabular sind Ressourcen als Instanzen von
Klassen definiert. Eine Klasse ist auch eine Ressouce und jede
Klasse kann eine Unterklasse einer anderen sein. Dank dieser
hierarchisch aufgebauten semantischen Informationen können
Maschinen auf Basis der Eigenschaften und Klassen von
Ressourcen deren Bedeutung ermitteln.
RDF - Schemata
 Schema um alle benötigten Typen von RDF-Elementen
(Klassen und Eigenschaften)
in Namensräumen zu definieren.
ex:Publication

rdfs:Class
Ermöglicht die Definition von Subklassen
ex:Article

rdf:type
rdfs:subClassOf
ex:Publication
Erlaubt den Aufbau einfacher hierarchischer Strukturen.
range
literal
hasId
produces
domain
range
hasPrice
Product
range
domain
subPropertyof
subClassOf
writes
range
range
Publication
domain
domain
domain
Author
subClassOf
Review
Quelle:. frei nach: Antoniou et al. A Semantic Web Primer, 2005 S.84
subClassOf
subClassOf
Article
Essay
range
literal
hasId
involves
domain
range
range
phone
Staff
Member
domain
subPropertyof
subClassOf
isTaughtBy
Academic
Staff
range
range
domain
domain
domain
Course
Quelle:. Antoniou et al. A Semantic Web Primer, 2005 S.84
subClassOf
Professor
subClassOf
subClassOf
Lecturer
Assistant
range
literal
range
id
phone
1. <rdf:RDF involves
2.
xmlns:rdf=„http://www.w3.org/1999/02/22-rdf-syntax-ns#“
Staff
3.
xmlns:rdfs=„http://www.w3.org/1999/02/22-rdf-schema#“>
domain
domain
Member
range
4. <rdfs:ClasssubPropertyof
rdf:ID=„lecturer“>
5.
<rdfs:subClassOf rdf: resource = „#academicStaffMember“/>
subClassOf
6. </rdfs:Class>
7. <rdfs:Class rdf:ID="staffMember">
range
isTaughtby
8. </rdfs:Class>
Academic
Staff
domain
9. <rdfs:Class rdf:ID="academicStaffMember">
10.
<rdfs:subClassOf rdf: resource = „#staffMember“/>
domain
11. </rdfs:Class>
subClassOf
subClassOf
12. <rdfs:Class rdf:ID="course">
13. </rdfs:Class>
Course
Quelle:. A Semantic Web Primer, 2005 S.84
Professor
Lecturer
subClassOf
Assistant
1. <rdfs:Property rdf:ID="involves">
range
2.
<rdfs:domain rdf: resource = "#course">
3.
<rdfs:range rdf: resource = "#lecturer">
involves
id
4. </rdfs:Property>
literal
range
phone
Staff
5. <rdfs:Property rdf:ID="isTaughtby">
domain
domain
Member
6.
<rdfs:comment>
range
subPropertyof
7.
Inherits
its domain ("course")and range("lecturer")from
8.
its superproperty "involves"
subClassOf
9.
</rdfs:comment>
10.
<rdfs:subPropertyOf rdf: resource = "#involves">
11. </rdfs:Property>
range
Academic
isTaughtby
domain
12. <rdfs:Property rdf:ID="phone">
13.
<rdfs:comment>
14.
it is a property of staff members
domain
15.
and
takes literals as values
subClassOf
16.
</rdfs:comment>
subClassOf
Staff
subClassOf
17.
<rdfs:domain rdf: resource = "#staffMember">
Course
18.
<rdfs:range rdf: resource = "&rdf
; Literal"> Lecturer
Professor
19. </rdfs:Property>
20.
</rdf:
RDF>
Quelle:.
A Semantic
Web Primer, 2005 S.84
subClassOf
Assistant
range
literal
id
involves
domain
range
range
phone
Staff
Member
domain
subPropertyof
subClassOf
isTaughtby
Academic
Staff
range
domain
domain
Course
Quelle:. Antoniou et al. A Semantic Web Primer, 2005 S.84
subClassOf
Professor
subClassOf
subClassOf
Lecturer
Assistant
von RDFS zu OWL
Da die Gestaltung eines solchen Schemas wesentlich für
die


Ausdrucksstärke
Leistungsfähigkeit
und somit
der mit ihrer Hilfe abgebildeten „Welten“ ist,
wird versucht, diese Schemata als möglichst differenzierte
Ontologien zu gestalten.
RDFS – Vor und Nachteile
Vorteile

Klassenbildung

Definition in
Namensräumen

flexibel gestaltbares
Vokabular für RDF
Nachteile

Es können nur
hierarchische
Beziehungen dargestellt
werden

Eingeschränkte
Klassenbildung
Web Ontology Language (OWL)
Fakultät für Informations-und Kommunikationswissenschaften
Fachhochschule Köln
Semantic Web
Grob gesprochen ist RDFS eine einfache Vokabularsprache zur
Beschreibung der Beziehungen zwischen Ressourcen. OWL baut
auf RDFS auf und ist ein viel umfangreicheres Vokabular zur
Definition von Semantic Web Ontologien.
OWL ist die dritte W3C-Spezifikation zur Erstellung von Semantic
Web Applikationen. Aufbauend auf RDF und RDFS definiert OWL
die Arten von Beziehungen, die in RDF mittels eines XMLVokabulars ausgedrückt werden können, um die Hierarchien und
Beziehungen zwischen verschiedenen Ressourcen zu
veranschaulichen. Und genau das ist die Definition von
"Ontologie" im Zusammenhang mit dem Semantic Web: Ein
Schema, das die Hierarchien und Beziehungen zwischen
verschiedenen Ressourcen ausdrücklich definiert. Semantic WebOntologien bestehen aus einer Taxonomie und einer Reihe von
Inferenzregeln, anhand derer Maschinen logische Schlüsse ziehen
können.
Zur Definition der Semantik benötigen wir RDFS und OWL
W. Gödert
OWL
OWL - Web Ontology Language

Weiterentwicklung von RDF – RDFS
 Nutzt
 Bietet
zahlreiche Funktionalitäten von RDFS
erweiterte Möglichkeiten zum Aufbau
differenzierter Ontologien
OWL:
OWL

OWL erweitert das Vokabular um
wichtige Funktionalitäten:
 Bildung
von Subklassen
 Definition
logischer Charakteristiken von
Eigenschaften
 Äquivalenzbeziehungen
 Erweitertes,
von Begriffen und Klassen
leistungsstarkes Reasoning
OWL Eigenschaften
Bildung neuer Klassen durch mengenlogische
Operationen
 Schnittmengen
 Vereinigungsmengen
 Komplementäroperationen
 (Kardinalitäten)
OWL
OWL
OWL
Charakterisierung von Eigenschaften
als Relationen:
 transitiv
 funktional
 symmetrisch
 invers
 invers

…
funktional
OWL
Transitive Beziehung
A
A
beinhaltet
beinhaltet
B
C
B
B
A
beinhaltet
beinhaltet
beinhaltet
C
C
OWL
OWL
Charakterisierung von Eigenschaften
als Relationen:
 transitiv
 funktional
 symmetrisch
 invers
 invers

…
funktional
Inverse Beziehung
OWL
unterrichtet
A
B
WirdUnterrichtet
Symmetrische Beziehung
IstVerheiratetMit
A
C
Aussagekräftigere Ontologien ermöglichen ein
leistungsstärkeres Reasoning.
OWL



OWL
OWL Lite
OWL DL
OWL Full

Diese Varianten zeichnen sich durch unterschiedliche
Grade an Gestaltbarkeit und Entscheidbarkeit aus.

Die Entscheidung für eine Variante stellt immer einen
Kompromiss dar.

OWL
OWL Lite
 Zahlreiche
Operatoren sind nicht erlaubt.
 Kardinalitäten
 Bildung
 Alle
eingeschränkt nutzbar
von Äquivalenzklassen eingeschränkt
Anfragen sind entscheidbar
 Leistungsstarker
„Reasoning Support“

OWL
OWL Full
 Keine
Einschränkungen
 Maximale
Gestaltbarkeit
aber:
 Entscheidbarkeit
 Kein
kann nicht garantiert werden.
„Reasoning Support“

OWL DL (Description Logic)
 Zahlreiche
Operatoren sind nicht erlaubt.
 Kardinalitäten
eingeschränkt nutzbar
 Eingeschränkter
 Maximale
OWL
„Reasoning Support“
Gestaltbarkeit bei gleichzeitiger garantierter
Entscheidbarkeit
Quellen
Altova: http://www.altova.com/
Antoniou, Grigoris; Frank van Harmeln, A Semantic Web Primer;
Cambidge: The MIT Press 2006,
Birkenbihl, K.: „Standards für das Semantic Web.“ In: Semantic Web:
Wege zur vernetzten Wissensgesellschaft. Hrsg.: Pellegrini T; A.
Blumauer: Berlin: Springer 2006. S.73-88.
Lacy, Lee W. OWL: Representing information using the Web Ontology
Language. Victoria/Canada: Trafford Publishing, 2005
Quellen
Jackenkroll, Melanie. Cross Publishing mittels XML
Die Enzyklopädie als Beispiel; Kölner Arbeitspapiere zur Bibliotheksund
Informationswissenschaft, Band 35. Köln: 2003
Reimer, Ulrich. Einführung in die Wissensrepräsentation. Stuttgart:
Teubner 1991
Semantic Web: Wege zur vernetzten Wissensgesellschaft. Hrsg.:
Pellegrini T; A. Blumauer. Berlin: Springer 2006
Semantic Web School: http://www.semantic-web.at/main.php
W3C: www.w3c.org