Transcript HIER DEN TITEL IN GROSSBUCHSTABEN EINGEBEN
Informatik-Seminar im Sommersemester 2007 Agenten im Semantic Web
Ontologien im Semantic Web Am Beispiel der KArsruhe ONtology and Semantic Web Infrastructure (KAON)
Niko Kwekkeboom
Gliederung
1.
2.
3.
4.
5.
6.
7.
Einleitung
Semantic Web Grundlagen Ontologien KAON KAON2 Zusammenfassung Fragen und Diskussion Seminar im Sommersemester 2007: Agenten im Semantic Web
2
Beispiel: Die
Suchbeispiel: „Golf“
-Suche
~390.000.000 Treffer (20.06.2007) Umfassen Golfsport, VW Golf, Golf von Mexico etc.
1.
Einleitung
3
Beispiel: Die -Suche
Suchmaschinen indizieren Webseiten Schlüsselwörter, Häufigkeiten, Verlinkung Ranking-Kriterien geheim Suchmaschine abhängig von guten Nutzereingaben für qualitative Ergebnisse Bedeutung der Suchbegriffe kann nicht interpretiert werden Unzulänglichkeiten in den vorhandenen Suchmöglichkeiten 1.
Einleitung
4
Semantic Web – Status quo
„The Semantic Web is not a separate Web but an extension to the current one, in which information is given well defined meaning, better enabling computers and people to work in cooperation.”
bestehenden Webs gedacht Suchergebnisse bzw. Rechnerunterstützung im allgemeinen unbefriedigend 1.
Einleitung
5
Semantic Web – Ziel
Sprachentwicklung zur Darstellung von Informationen in maschinenverstehbarer Form Ziel: Daten maschinenverstehbarer gestalten und somit die Mensch Maschine- und die Maschine-Maschine-Kommunikation verbessern Der Computer weiß, ob bei der Eingabe Golf als Auto, Sport oder Ort gemeint ist 1.
Einleitung
6
Semantic Web – Anmerkung
Semantic Web immer noch eher Idee als Technologie Umsetzung steckt noch in den Ansätzen Konzepte und Technologien noch in den „Kinderschuhen“ Vor allem Standardisierung dringend nötig 1.
Einleitung
7
Gliederung
Seminar im Sommersemester 2007: Agenten im Semantic Web 1.
2.
3.
4.
5.
6.
7.
Einleitung
Semantic Web Grundlagen
Ontologien KAON KAON2 Zusammenfassung Fragen und Diskussion
8
Semantic Web – Architektur
Schichtenmodell des Semantic Web: Self desc.
doc.
Data Rules Data Logic Ontology vocabulary RDF + RDFS Proof Trust Unicode XML + NS + xmlschema URI 2.
Semantic Web Grundlagen
9
Semantic Web – Architektur
XML + NS + xmlschema Unicode URI Grundlage Unicode: Plattformunabhängige, eindeutiger Standard zur Zuordnung von Zeichen zu Zahlen URI (Unified Resource Identifier): Identifizierung einer abstrakten oder physikalischen Ressource Erweiterung XML (eXtensible Markup Language): Technologie zur Formatierung von Dokumenten mit flexibler Struktur (Gegensatz zu HTML) xmlschema: Grammatik für XML-Dokumente, Regeln für syntaktischen Aufbau Selbst XML-Dokument 2.
Namensräume (NS) zur Verhinderung von Konflikten eingeführt Semantic Web Grundlagen
10
Semantic Web – Architektur
RDF + RDFS RDF (Resource Description Framework) Setzt auf XML auf Modell zur Repräsentation vom Metadaten Konstruktion aus Statements, bestehend aus: Ressourcen, Eigenschaften, Aussagen RDFS (Resource Description Framework Schema): Beschreibt die Semantik eines RDF-Dokumentes, Aufbaukriterien festgelegt Ermöglicht Klassenbildung und somit Hierarchien und Ableitungen 2.
Semantic Web Grundlagen
11
Semantic Web – Ontologien
Ontology vocabulary Ontology: Formale Beschreibung von Gegenständen und deren Beziehungen zueinander Basierend auf RDF(S) und Erweiterung (RDF: Programmiersprache; Ontologie: Programm) Meist lediglich kontrollierte Vokabularien Komplexe Relationen über Relationen eher selten gebraucht Zentraler Bestandteil der Vision des Semantic Web Ziel: Schaffung einer gemeinsamen Sprache Je nach Nutzen kategorisier- und einteilbar Nicht „die eine“ Ontologie; OWL als Empfehlung des W3C 2.
Semantic Web Grundlagen
12
Semantic Web – Architektur
Trust Proof Logic Keine technologischen Erweiterungen, sondern Regelung darunter liegender Schichten Logic: Daten in maschinenverarbeitbarer Form, ermöglicht Anfragen mit boolschen Operatoren, Quantoren und Kardinalitätsbeschränkungen Proof: Agenten befähigen angebotene Beweise selbstständig nachzuvollziehen Datenquellen für Nutzer ersichtlich Trust: Korrekte Informationen nötig, in offener Architektur schwierig sicherzustellen „trusted rating services“ zur Bewertung von Quellen Rechtevergabe: „Wo darf ein Agent was?“ 2.
Digital Signature: Zur Missbrauchsverhinderung des Semantic Webs verlässliche digitale Signatur erforderlich
13
Gliederung
1.
2.
3.
4.
5.
6.
7.
Einleitung Semantic Web Grundlagen
Ontologien
KAON KAON2 Zusammenfassung Fragen und Diskussion Seminar im Sommersemester 2007: Agenten im Semantic Web
14
Kommunikation
Zur Kommunikation ist eine gemeinsame Sprache nötig, d.h.: 1.
2.
3.
4.
5.
Übereinkunft über gemeinsame Symbole und Begriffe (Index), deren Bedeutung (Glossar), Klassifikation von Begriffen (Taxonomie), Assoziation bzw. Vernetzung von Begriffen (Thesaurus/Topic Map) Regeln und Wissen (Erfahrungen) darüber, welche Vernetzungen zulässig und sinnvoll sind (Ontologie).
Trifft in besonderem Maße auf die Kommunikation mit Maschinen zu 3.
Ontologien
15
Ontologien – Definition
Wortursprung im Griechischen: „ontos“=„sein“, „logos“=„Wort“ Ursprüngliche Bedeutung in der Philosophie: Lehre des Seins und Seienden (Abgrenzung von der Lehre der verschiedenen Lebewesen in den Naturwissenschaften) Untersuchung und Beschreibung der Realitäten und der Existenz von Dingen Dinge sind als Grundlage klar definiert und akzeptiert Verwand mit der Erkenntnistheorie 3.
Ontologien
16
Ontologien – Definition: Informatik
In der Informatik umfasst der Begriff Ontologien Techniken zur formalen Modellierung von Begriffssystemen Konstruktion daher stark kontextabhängig (Komplexität/Einsatzzweck) Formalisiertes Modell der Welt (Domäne) oder ein Teil der Welt (Sudomäne) Keine einheitlichen, allgemeinen, vollständigen Regeln zur Konstruktion Hoher intellektueller und logistischer Aufwand 3.
Ontologien
17
Ontologien – Aufbau
Dreigeteilter Aufbau:
Konzepte
Begriffe „Terminologische Kontrolle“ „Homonyme“, „Polyseme“ „Synonyme“ Trennung und Gruppierung: Objekt, Begriff, Benennung
Relationen
Verknüpfung zwischen Begriffen (Sind selbst Begriffe) Hierarchische Relation Ordnungsrelation Koordinative Beziehungen Symmetrie, Transitivität
Regeln
Logische Aussagen Relationen) über Begriffe (und Teilweise relationsimplizit Einhaltung von Wertebereichen Komplexere Zusammenhänge, z.B. Schlüsse aus Relationen 3.
Ontologien
18
Ontologien – Elemente
Konzepte Instanzen Erläuterung
Abstrakte Ausdrücke, in Taxonomien organisiert, stellen Elemente einer Ontologie dar Konkrete Ausprägungen von abstrakten Konzepten
Beispiel
Autor, Buch, Angestellte, etc.
(Taxonomie hier: Verlag) Carla Muster IST EINE Angestellte
Attribute Axiome
Relationen unterschiedlichen Typs (String, Integers, Boolean etc.) von vordefinierten Datentypen, charakterisieren Konzepte Regeln, die in modellierter Beweis immer gültig sind.
Domäne ohne Name des Angestellten, Buchpreis, ISBN Nummer, etc.
Relationen
Stellen Beziehungen zwischen zwei oder mehr nicht hierarchischen Konzepten dar Mario Muster „ist der Autor von“ diesem Buch „Ein Autor ist eine Person, die Bücher schreibt“, „Ein Buch wird von einem Autor erstellt“, etc.
3.
Ontologien
19
Ontologien – Typen
Top-Level Ontology Domain Ontology Task Ontology Application Ontology Top Level Onthology: Weitgehend domänenunabhängiges Weltwissen z.B. Zustand, Zeit, Prozess etc. (Bsp.: „CyC“ oder „WordNet“) Task Ontology, Domain Model Ontology: Grundlegendes (Sub )Domänen-Vokabular (Bsp.: „UMLS“ – Unified Medical Language System) 3.
Konzepte und Definitionen,
20
Ontologien – Sprachen (Schichtstruktur)
2 Kategorien Traditionelle in HTML OWL DAML & OIL DAML Webbasierte auf XML XHTML RDFS RDF RDF/RDFS als Grundlage für: HTML XML OIL (Ontology Inference Language) – europäische Entwicklung OIL DAML (DARPA Agent Markup Language) – parallele amerikanische Entwicklung Zusammenschluss zu OWL (Web Ontology Language) – gemeinsame Weiterentwicklung 3.
Empfehlung des W3C für OWL (Februar 2004) Ontologien
22
Ontologie – Sprachen: OWL
Spezifikation des W3C zur Erstellung, Publikation und Verteilung von Ontologien anhand formaler Beschreibungssprache Erlaubt Beschreibung von Wissen auf maschinenlesbare Weise; Abbildung in dieser Logik ermöglicht eine formale Syntax und lässt logisches Schließen zu Leichte Verständlichkeit und hohe Kompatibilität durch starke Einbindung von RDF und XML Syntax Ausdrucksmächtigkeit geht über RDF hinaus; Sprachkonstrukte werden eingeführt, um Ausdrücke ähnlich der Beschreibungslogik formulieren zu können Zielsetzung: „Die“ Ontologiesprache des Internet zu werden 3.
Versionen
23
Ontologie – Sprachen: OWL
OWL Full: Sämtliche existierende Sprachkonstrukte Bedeutung von vordefinierten Konstrukten veränderbar Nachteil: Mit Logik Kalkülen nichtmehr erschließbar OWL DL: OWL Description Logic Verlangt Typenunterscheidung OWL OWL Lite Full Klassen & Attribute brauchen eindeutige Zuordnung OWL Lite: Eingeschränkter als OWL DL Klassen nur bezüglich Oberklasen definierbar Sämtliche Relationen und Restriktionen nur auf benannten Klassen anwendbar Nur Kardinalitäten 0 und 1 Einfache, leicht verständliche Implementierung vs. schwache Ausdrucksstärke 3.
Ontologien
24
Ontologie – Werkzeuge
Erfolg neuer Technologien hängt eng mit der Qualität verfügbarer Werkzeuge zusammen Kategorien an Ontologie-Werkzeugen: Entwicklungswerkzeuge Kombinations- und Integrationswerkzeuge Evaluationswerkzeuge Annotationswerkzeuge Speicher- und Anfragewerkzeuge Lernwerkzeuge 3. Ontologien
26
Ontologie – Probleme
Ontologien große Rolle bei der Entwicklung des Semantic Web Entwicklung noch nicht ausgereift, somit problematisch Keine „die“ Ontologie – fehlender Standard Entwicklungstools für Ontologien noch in Entwicklungsphase 3.
Ontologien
27
Gliederung
1.
2.
3.
4.
5.
6.
7.
Einleitung Semantic Web Grundlagen Ontologien
KAON
KAON2 Zusammenfassung Fragen und Diskussion Seminar im Sommersemester 2007: Agenten im Semantic Web
28
KAON – Eckdaten
http://kaon.semanticweb.org
Java 1.4 Plattform SQL-DB (JBoss/Tomcat opt.) Open Source (GNU LGPL) Begonnen 2001 Version 1.27 (2005) 4.
KAON
29
KAON – Entwicklung
Entwickelt durch Forschungszentrum Informatik (FZI) Karlsruhe und AIFB (Institute of Applied Informatics and Formal Description Methods der Universität Karlsruhe) Tool Suite zur Erstellung und Verwaltung von Ontologien (Open Source Infrastruktur) Module, zur Erstellung und Realisierung von ontologiebasierten Anwendungen Unterstützt klassische Ontologien- und Wissensmanagement Konzepte, sowie relationale Datenbanksysteme Referenzanwendung: VISION-Portal Semantisches „browsing und querying“ Portal Unterstützt Wissensmanagement bezüglich Unternehmen, Projekten, Forschungsgebieten und Software (derzeit nicht verfügbar!) 4.
KAON
30
KAON – Ontologie Sprache
Sprache wurde inkrementell entwickelt um Skalierbarkeit mit großen Ontologien und Wissensdatenbanken zu erhalten Zuerst einfache an RDFS orientierte Kernsprache („Karsruhe perspective on ontologies“) Definition von Konzepten, Relationen und teilweise Befehle hierauf Zentral: Unterstützung der Lexikalisierung von Konzepten und Relationen Tools: Simple Onotology Editor (KAON SOEP), Datenbank Mapper (KAON REVERSE), Prototyp für Views auf Ontologien (KAON VIEWS) Spätere Erweiterung („Ontology-Instance (OI) models“) Unterstützung von logischen Axiomen (Symmetrie etc.), Modularisierung, strikte Trennung von Ontologien und Insanzen, übergreifende Objekte 4.
Neue Tools: KAON Portal, KAON OI-modeler
31
KAON – Ontologie Sprache (2)
Versuch 2 Sprachen parallel zu unterstützen Bisher entwickelte proprietäre Sprache OWL Voller Sprachumfang von OWL für viele Anwendungen nicht benötigt Bsp.: TEXTONTO extrahiert (semi-automatisch) semantische Zusammenhänge aus Texten Komplexe OWL Axiome hier überfordernd Letztendlich gewinnt OWL Oberhand, daher neue Entwicklung 4.
KAON
32
KAON – Module
Frontend – Hauptsächlich 2 Darstellungsformen OI-Modeler (oimodeler) KAON Portal (kaonportal) Core – 2 zentrale APIs KAON Ontology Language (apionrdf, apiproxy, engineeringserver, kaonapi, query) RDF (rdfapi, rdfcrawler, rdfserver) Libraries – Verschiedene Bibliotheken innerhalb KAONS auch außerhalb nutzbar z.B. datalog, guibase, etc.
4.
KAON
33
KAON – Vorführung: Workbench (OI-Modeler)
4.
KAON
34
Gliederung
1.
2.
3.
4.
5.
6.
7.
Einleitung Semantic Web Grundlagen Ontologien KAON
KAON2
Zusammenfassung Fragen und Diskussion Seminar im Sommersemester 2007: Agenten im Semantic Web
35
Zur Erinnerung: OWL DL (Folie 24)
OWL Full: Sämtliche existierende Sprachkonstrukte Bedeutung von vordefinierten Konstrukten veränderbar Nachteil: Mit Logik Kalkülen nichtmehr erschließbar OWL DL: OWL Description Logic Verlangt Typenunterscheidung OWL OWL Lite Full Klassen & Attribute brauchen eindeutige Zuordnung OWL Lite: Eingeschränkter als OWL DL Klassen nur bezüglich Oberklasen definierbar Sämtliche Relationen und Restriktionen nur auf benannten Klassen anwendbar Nur Kardinalitäten 0 und 1 Einfache, leicht verständliche Implementierung vs. schwache Ausdrucksstärke 3.
Ontologien
36
KAON2 – Entwicklung
Seit Juli 2005 Nachfolger von KAON (letzte veröffentlichte Version von KAON) Entwickelt von Forschungskooperation aus: Institute of Applied Informatics and Formal Description Methods (AIFB) and der Universität Karlsruhe Forschungsgruppe Information Process Engineering (IPE) am Forschungszentrum Informatik (FZI Karlsruhe) Information Management Group (IMG) an der University of Manchester 5.
KAON2
37
KAON2 vs. KAON(1)
Unterscheidung durch unterstütze Ontologie Sprachen: KAON verwendet proprietäre RDF(S) Erweiterungen KAON2 basiert auf OWL-DL und F-Logic Beide Systeme somit nicht kompatibel !
5.
KAON2
38
KAON2 – Ausstattung
Entwicklungswerkzeug für Ontologien basierend auf (über APIs): OWL-DL SWRL (A Semantic Web Rule Language – OWL+RuleML) F-Logic (Frame Logic) Features Eigener Ontologie Server, der Remote Methoden Zugriffe zulässt (RMI) Anfragewerkezeuge um kombinierende Abfragen zu erstellen (SPARQL Syntax) DIG Interface für externe Tool-Zugriffe (Bsp. Protégé) Extraktions-Modul zur Entnahme von Instanzen aus relativen DB 5.
KAON2
39
KAON2 – Projekte
Entwicklung teilweise duch EU IST project DIP 507483 finanziert Verwendet in: EU IST project OntoGov EU IST project SEKT (und erweitert) BMBF project SmartWeb DLP translator (Grundlage) 5.
KAON2
40
KAON2 – OWL-Tools
Version 0.27: 16 Funktionen (Auswahl):
dump latex filter count diff
: : : gibt die Axiome und Entitäten der Ontologie aus : gibt die Axiome in lateX-integrierbarer Form aus : entfernt alle Axiome eines Typs gibt die Anzahl an Axiomen (oder Entitäten) zurück zeigt alle Axiome die eine Ontologie mehr als eine andere hat an
merge
: zurück gibt eine Ontologie mit allen Axiomen zweier Input-Ontologien
deo
: ersetzt “nominals” durch einfache Klassen (schwächt so die Ontologie)
populate
: füllt eine Ontologie zufällig mit Instanzen
dlpconvert
: wandelt eine DL Ontologie in Regeln um
satisfiable
: prüft die Reichhaltigkeit einer Ontologie 5.
KAON2
41
KAON2 – Anmerkung
Kommerzielle Version OntoBroker OWL, für Wissenschaft kostenlos Vollständig in Java 1.5 implementiert Benötigt JDK zur Ausführung; zusätzlich Apache ANT für Beispiele Keine Verarbeitung von „nominals“ (Excptions bei: owl:oneOfclass und owl:hasValue) Große Kardinalitäten können (abhängig von anderen Axiomen) nicht verarbeitet werden Somit keine volle OWL DL Abdeckung! (OWL Lite voll abgedeckt) Dokumentation bisher nur an Beispielen vorhanden 5.
KAON2
42
Und was macht die Konkurrenz?
Protégé sehr verbreitet Gut dokumentiert Volle OWL Unterstützung Open Source Plugin-Nutzung Schnittstelle zu KAON2 Weitere: CyC – Abbildung Weltwissen WordNet – Wörterbücher 5.
KAON2
43
Gliederung
1.
2.
3.
4.
5.
6.
7.
Einleitung Semantic Web Grundlagen Ontologien KAON KAON2
Zusammenfassung
Fragen und Diskussion Seminar im Sommersemester 2007: Agenten im Semantic Web
44
Zusammenfassung
Ontologien als semantisch „reichste“ Ebene der Kommunikation Ontologien als zentraler Aspekt des Semantic Web OWL als W3C empfohlene Sprache für Ontologien Erfolg neuer Technologien abhängig von verfügbaren Tools Derzeit verfügbare Werkzeuge noch in den „Kinderschuhen“, nicht massentauglich Viele Projekte/Forschung um dies zu ändern 6.
Zusammenfassung
45
Ausblick
Große Hürde: Anwender finden, die Mehraufwand betreiben um maschineninterpretierbare Webinhalte zu erstellen Kritische Masse an verfügbaren Inhalten muss erreicht werden, bevor Technologien nutzbar werden Gut entwickelte Ontologien nötig um mit semantischem Markup Bedeutung herzustellen Standardisierung erforderlich um parallel Entwicklung nicht kompatibler Systeme zu verhindern 6.
Zusammenfassung
46
Das Semantic Web – Eine Vision
Semantisch angereicherte Daten im Web Voll maschineninterpretierbare Daten, ermöglichen „Mitdenken“ des Rechners Persönlicher Web Agent Reiseplanung Logistikplanung Terminplanung Fremdverfügbarkeit Kooperative Web Agenten etc 6.
Zusammenfassung
47
Gliederung
1.
2.
3.
4.
5.
6.
7.
Einleitung Semantic Web Grundlagen Ontologien KAON KAON2 Zusammenfassung
Fragen und Diskussion
Seminar im Sommersemester 2007: Agenten im Semantic Web
48
Fragen
Nööö …
7.
Fragen und Diskussion
49
Diskussion
Welche Technologien außer Ontologien können noch einen großen Einfluss auf den Erfolg des Semantic Web haben?
Wo liegen die Vor- und Nachteile von modularen oder globalen Wissenssammlungen? Was überwiegt?
7.
Fragen und Diskussion
50