HIER DEN TITEL IN GROSSBUCHSTABEN EINGEBEN

Download Report

Transcript HIER DEN TITEL IN GROSSBUCHSTABEN EINGEBEN

Informatik-Seminar im Sommersemester 2007 Agenten im Semantic Web

Ontologien im Semantic Web Am Beispiel der KArsruhe ONtology and Semantic Web Infrastructure (KAON)

Niko Kwekkeboom

Gliederung

1.

2.

3.

4.

5.

6.

7.

Einleitung

Semantic Web Grundlagen Ontologien KAON KAON2 Zusammenfassung Fragen und Diskussion Seminar im Sommersemester 2007: Agenten im Semantic Web

2

Beispiel: Die

 Suchbeispiel: „Golf“

-Suche

 ~390.000.000 Treffer (20.06.2007)  Umfassen Golfsport, VW Golf, Golf von Mexico etc.

1.

Einleitung

3

Beispiel: Die -Suche

 Suchmaschinen indizieren Webseiten  Schlüsselwörter, Häufigkeiten, Verlinkung  Ranking-Kriterien geheim  Suchmaschine abhängig von guten Nutzereingaben für qualitative Ergebnisse  Bedeutung der Suchbegriffe kann nicht interpretiert werden  Unzulänglichkeiten in den vorhandenen Suchmöglichkeiten 1.

Einleitung

4

Semantic Web – Status quo

„The Semantic Web is not a separate Web but an extension to the current one, in which information is given well defined meaning, better enabling computers and people to work in cooperation.”

bestehenden Webs gedacht   Suchergebnisse bzw. Rechnerunterstützung im allgemeinen unbefriedigend 1.

Einleitung

5

Semantic Web – Ziel

 Sprachentwicklung zur Darstellung von Informationen in maschinenverstehbarer Form  Ziel: Daten maschinenverstehbarer gestalten und somit die Mensch Maschine- und die Maschine-Maschine-Kommunikation verbessern  Der Computer weiß, ob bei der Eingabe Golf als Auto, Sport oder Ort gemeint ist 1.

Einleitung

6

Semantic Web – Anmerkung

 Semantic Web immer noch eher Idee als Technologie  Umsetzung steckt noch in den Ansätzen  Konzepte und Technologien noch in den „Kinderschuhen“  Vor allem Standardisierung dringend nötig 1.

Einleitung

7

Gliederung

Seminar im Sommersemester 2007: Agenten im Semantic Web 1.

2.

3.

4.

5.

6.

7.

Einleitung

Semantic Web Grundlagen

Ontologien KAON KAON2 Zusammenfassung Fragen und Diskussion

8

Semantic Web – Architektur

 Schichtenmodell des Semantic Web: Self desc.

doc.

Data Rules Data Logic Ontology vocabulary RDF + RDFS Proof Trust Unicode XML + NS + xmlschema URI 2.

Semantic Web Grundlagen

9

Semantic Web – Architektur

XML + NS + xmlschema Unicode URI Grundlage  Unicode: Plattformunabhängige, eindeutiger Standard zur Zuordnung von Zeichen zu Zahlen  URI (Unified Resource Identifier): Identifizierung einer abstrakten oder physikalischen Ressource Erweiterung  XML (eXtensible Markup Language): Technologie zur Formatierung von Dokumenten mit flexibler Struktur (Gegensatz zu HTML)  xmlschema: Grammatik für XML-Dokumente, Regeln für syntaktischen Aufbau  Selbst XML-Dokument  2.

Namensräume (NS) zur Verhinderung von Konflikten eingeführt Semantic Web Grundlagen

10

Semantic Web – Architektur

RDF + RDFS  RDF (Resource Description Framework)    Setzt auf XML auf Modell zur Repräsentation vom Metadaten Konstruktion aus Statements, bestehend aus: Ressourcen, Eigenschaften, Aussagen  RDFS (Resource Description Framework Schema):   Beschreibt die Semantik eines RDF-Dokumentes, Aufbaukriterien festgelegt Ermöglicht Klassenbildung und somit Hierarchien und Ableitungen 2.

Semantic Web Grundlagen

11

Semantic Web – Ontologien

Ontology vocabulary  Ontology: Formale Beschreibung von Gegenständen und deren Beziehungen zueinander  Basierend auf RDF(S) und Erweiterung (RDF: Programmiersprache; Ontologie: Programm)  Meist lediglich kontrollierte Vokabularien  Komplexe Relationen über Relationen eher selten gebraucht  Zentraler Bestandteil der Vision des Semantic Web  Ziel: Schaffung einer gemeinsamen Sprache  Je nach Nutzen kategorisier- und einteilbar  Nicht „die eine“ Ontologie; OWL als Empfehlung des W3C 2.

Semantic Web Grundlagen

12

Semantic Web – Architektur

Trust Proof Logic  Keine technologischen Erweiterungen, sondern Regelung darunter liegender Schichten  Logic: Daten in maschinenverarbeitbarer Form, ermöglicht Anfragen mit boolschen Operatoren, Quantoren und Kardinalitätsbeschränkungen  Proof: Agenten befähigen angebotene Beweise selbstständig nachzuvollziehen Datenquellen für Nutzer ersichtlich  Trust: Korrekte Informationen nötig, in offener Architektur schwierig sicherzustellen „trusted rating services“ zur Bewertung von Quellen Rechtevergabe: „Wo darf ein Agent was?“  2.

Digital Signature: Zur Missbrauchsverhinderung des Semantic Webs verlässliche digitale Signatur erforderlich

13

Gliederung

1.

2.

3.

4.

5.

6.

7.

Einleitung Semantic Web Grundlagen

Ontologien

KAON KAON2 Zusammenfassung Fragen und Diskussion Seminar im Sommersemester 2007: Agenten im Semantic Web

14

Kommunikation

 Zur Kommunikation ist eine gemeinsame Sprache nötig, d.h.: 1.

2.

3.

4.

5.

Übereinkunft über gemeinsame Symbole und Begriffe (Index), deren Bedeutung (Glossar), Klassifikation von Begriffen (Taxonomie), Assoziation bzw. Vernetzung von Begriffen (Thesaurus/Topic Map) Regeln und Wissen (Erfahrungen) darüber, welche Vernetzungen zulässig und sinnvoll sind (Ontologie).

 Trifft in besonderem Maße auf die Kommunikation mit Maschinen zu 3.

Ontologien

15

Ontologien – Definition

 Wortursprung im Griechischen: „ontos“=„sein“, „logos“=„Wort“  Ursprüngliche Bedeutung in der Philosophie: Lehre des Seins und Seienden (Abgrenzung von der Lehre der verschiedenen Lebewesen in den Naturwissenschaften)  Untersuchung und Beschreibung der Realitäten und der Existenz von Dingen  Dinge sind als Grundlage klar definiert und akzeptiert  Verwand mit der Erkenntnistheorie 3.

Ontologien

16

Ontologien – Definition: Informatik

 In der Informatik umfasst der Begriff Ontologien Techniken zur formalen Modellierung von Begriffssystemen  Konstruktion daher stark kontextabhängig (Komplexität/Einsatzzweck)  Formalisiertes Modell der Welt (Domäne) oder ein Teil der Welt (Sudomäne)  Keine einheitlichen, allgemeinen, vollständigen Regeln zur Konstruktion  Hoher intellektueller und logistischer Aufwand 3.

Ontologien

17

Ontologien – Aufbau

 Dreigeteilter Aufbau:

Konzepte

Begriffe „Terminologische Kontrolle“ „Homonyme“, „Polyseme“ „Synonyme“ Trennung und Gruppierung: Objekt, Begriff, Benennung

Relationen

Verknüpfung zwischen Begriffen (Sind selbst Begriffe) Hierarchische Relation Ordnungsrelation Koordinative Beziehungen Symmetrie, Transitivität

Regeln

Logische Aussagen Relationen) über Begriffe (und Teilweise relationsimplizit Einhaltung von Wertebereichen Komplexere Zusammenhänge, z.B. Schlüsse aus Relationen 3.

Ontologien

18

Ontologien – Elemente

Konzepte Instanzen Erläuterung

Abstrakte Ausdrücke, in Taxonomien organisiert, stellen Elemente einer Ontologie dar Konkrete Ausprägungen von abstrakten Konzepten

Beispiel

Autor, Buch, Angestellte, etc.

(Taxonomie hier: Verlag) Carla Muster IST EINE Angestellte

Attribute Axiome

Relationen unterschiedlichen Typs (String, Integers, Boolean etc.) von vordefinierten Datentypen, charakterisieren Konzepte Regeln, die in modellierter Beweis immer gültig sind.

Domäne ohne Name des Angestellten, Buchpreis, ISBN Nummer, etc.

Relationen

Stellen Beziehungen zwischen zwei oder mehr nicht hierarchischen Konzepten dar Mario Muster „ist der Autor von“ diesem Buch „Ein Autor ist eine Person, die Bücher schreibt“, „Ein Buch wird von einem Autor erstellt“, etc.

3.

Ontologien

19

Ontologien – Typen

Top-Level Ontology Domain Ontology Task Ontology Application Ontology  Top Level Onthology: Weitgehend domänenunabhängiges Weltwissen z.B. Zustand, Zeit, Prozess etc. (Bsp.: „CyC“ oder „WordNet“)  Task Ontology, Domain Model Ontology: Grundlegendes (Sub )Domänen-Vokabular (Bsp.: „UMLS“ – Unified Medical Language System)  3.

Konzepte und Definitionen,

20

Ontologien – Sprachen (Schichtstruktur)

 2 Kategorien  Traditionelle in HTML OWL DAML & OIL DAML  Webbasierte auf XML XHTML RDFS RDF  RDF/RDFS als Grundlage für: HTML XML  OIL (Ontology Inference Language) – europäische Entwicklung OIL  DAML (DARPA Agent Markup Language) – parallele amerikanische Entwicklung  Zusammenschluss zu OWL (Web Ontology Language) – gemeinsame Weiterentwicklung 3.

 Empfehlung des W3C für OWL (Februar 2004) Ontologien

22

Ontologie – Sprachen: OWL

 Spezifikation des W3C zur Erstellung, Publikation und Verteilung von Ontologien anhand formaler Beschreibungssprache  Erlaubt Beschreibung von Wissen auf maschinenlesbare Weise; Abbildung in dieser Logik ermöglicht eine formale Syntax und lässt logisches Schließen zu  Leichte Verständlichkeit und hohe Kompatibilität durch starke Einbindung von RDF und XML Syntax  Ausdrucksmächtigkeit geht über RDF hinaus; Sprachkonstrukte werden eingeführt, um Ausdrücke ähnlich der Beschreibungslogik formulieren zu können  Zielsetzung:  „Die“ Ontologiesprache des Internet zu werden  3.

Versionen

23

Ontologie – Sprachen: OWL

  OWL Full: Sämtliche existierende Sprachkonstrukte Bedeutung von vordefinierten Konstrukten veränderbar Nachteil: Mit Logik Kalkülen nichtmehr erschließbar OWL DL: OWL Description Logic Verlangt Typenunterscheidung OWL OWL Lite Full Klassen & Attribute brauchen eindeutige Zuordnung  OWL Lite: Eingeschränkter als OWL DL Klassen nur bezüglich Oberklasen definierbar Sämtliche Relationen und Restriktionen nur auf benannten Klassen anwendbar Nur Kardinalitäten 0 und 1  Einfache, leicht verständliche Implementierung vs. schwache Ausdrucksstärke 3.

Ontologien

24

Ontologie – Werkzeuge

 Erfolg neuer Technologien hängt eng mit der Qualität verfügbarer Werkzeuge zusammen  Kategorien an Ontologie-Werkzeugen:  Entwicklungswerkzeuge  Kombinations- und Integrationswerkzeuge  Evaluationswerkzeuge  Annotationswerkzeuge  Speicher- und Anfragewerkzeuge  Lernwerkzeuge 3. Ontologien

26

Ontologie – Probleme

 Ontologien große Rolle bei der Entwicklung des Semantic Web  Entwicklung noch nicht ausgereift, somit problematisch  Keine „die“ Ontologie – fehlender Standard  Entwicklungstools für Ontologien noch in Entwicklungsphase 3.

Ontologien

27

Gliederung

1.

2.

3.

4.

5.

6.

7.

Einleitung Semantic Web Grundlagen Ontologien

KAON

KAON2 Zusammenfassung Fragen und Diskussion Seminar im Sommersemester 2007: Agenten im Semantic Web

28

KAON – Eckdaten

 http://kaon.semanticweb.org

 Java 1.4 Plattform  SQL-DB (JBoss/Tomcat opt.)  Open Source (GNU LGPL)  Begonnen 2001  Version 1.27 (2005) 4.

KAON

29

KAON – Entwicklung

 Entwickelt durch Forschungszentrum Informatik (FZI) Karlsruhe und AIFB (Institute of Applied Informatics and Formal Description Methods der Universität Karlsruhe)  Tool Suite zur Erstellung und Verwaltung von Ontologien (Open Source Infrastruktur)  Module, zur Erstellung und Realisierung von ontologiebasierten Anwendungen  Unterstützt klassische Ontologien- und Wissensmanagement Konzepte, sowie relationale Datenbanksysteme  Referenzanwendung: VISION-Portal Semantisches „browsing und querying“ Portal Unterstützt Wissensmanagement bezüglich Unternehmen, Projekten, Forschungsgebieten und Software (derzeit nicht verfügbar!) 4.

KAON

30

KAON – Ontologie Sprache

 Sprache wurde inkrementell entwickelt um Skalierbarkeit mit großen Ontologien und Wissensdatenbanken zu erhalten  Zuerst einfache an RDFS orientierte Kernsprache („Karsruhe perspective on ontologies“)   Definition von Konzepten, Relationen und teilweise Befehle hierauf Zentral: Unterstützung der Lexikalisierung von Konzepten und Relationen  Tools: Simple Onotology Editor (KAON SOEP), Datenbank Mapper (KAON REVERSE), Prototyp für Views auf Ontologien (KAON VIEWS)  Spätere Erweiterung („Ontology-Instance (OI) models“)  Unterstützung von logischen Axiomen (Symmetrie etc.), Modularisierung, strikte Trennung von Ontologien und Insanzen, übergreifende Objekte 4.

 Neue Tools: KAON Portal, KAON OI-modeler

31

KAON – Ontologie Sprache (2)

 Versuch 2 Sprachen parallel zu unterstützen   Bisher entwickelte proprietäre Sprache OWL  Voller Sprachumfang von OWL für viele Anwendungen nicht benötigt  Bsp.: TEXTONTO extrahiert (semi-automatisch) semantische Zusammenhänge aus Texten Komplexe OWL Axiome hier überfordernd  Letztendlich gewinnt OWL Oberhand, daher neue Entwicklung 4.

KAON

32

KAON – Module

 Frontend – Hauptsächlich 2 Darstellungsformen   OI-Modeler (oimodeler) KAON Portal (kaonportal)  Core – 2 zentrale APIs  KAON Ontology Language (apionrdf, apiproxy, engineeringserver, kaonapi, query)  RDF (rdfapi, rdfcrawler, rdfserver)  Libraries – Verschiedene Bibliotheken innerhalb KAONS auch außerhalb nutzbar  z.B. datalog, guibase, etc.

4.

KAON

33

KAON – Vorführung: Workbench (OI-Modeler)

4.

KAON

34

Gliederung

1.

2.

3.

4.

5.

6.

7.

Einleitung Semantic Web Grundlagen Ontologien KAON

KAON2

Zusammenfassung Fragen und Diskussion Seminar im Sommersemester 2007: Agenten im Semantic Web

35

Zur Erinnerung: OWL DL (Folie 24)

  OWL Full: Sämtliche existierende Sprachkonstrukte Bedeutung von vordefinierten Konstrukten veränderbar Nachteil: Mit Logik Kalkülen nichtmehr erschließbar OWL DL: OWL Description Logic Verlangt Typenunterscheidung OWL OWL Lite Full Klassen & Attribute brauchen eindeutige Zuordnung  OWL Lite: Eingeschränkter als OWL DL Klassen nur bezüglich Oberklasen definierbar Sämtliche Relationen und Restriktionen nur auf benannten Klassen anwendbar Nur Kardinalitäten 0 und 1  Einfache, leicht verständliche Implementierung vs. schwache Ausdrucksstärke 3.

Ontologien

36

KAON2 – Entwicklung

 Seit Juli 2005 Nachfolger von KAON (letzte veröffentlichte Version von KAON)  Entwickelt von Forschungskooperation aus:   Institute of Applied Informatics and Formal Description Methods (AIFB) and der Universität Karlsruhe  Forschungsgruppe Information Process Engineering (IPE) am Forschungszentrum Informatik (FZI Karlsruhe) Information Management Group (IMG) an der University of Manchester 5.

KAON2

37

KAON2 vs. KAON(1)

 Unterscheidung durch unterstütze Ontologie Sprachen:  KAON verwendet proprietäre RDF(S) Erweiterungen  KAON2 basiert auf OWL-DL und F-Logic  Beide Systeme somit nicht kompatibel !

5.

KAON2

38

KAON2 – Ausstattung

 Entwicklungswerkzeug für Ontologien basierend auf (über APIs):    OWL-DL SWRL (A Semantic Web Rule Language – OWL+RuleML) F-Logic (Frame Logic)  Features     Eigener Ontologie Server, der Remote Methoden Zugriffe zulässt (RMI) Anfragewerkezeuge um kombinierende Abfragen zu erstellen (SPARQL Syntax) DIG Interface für externe Tool-Zugriffe (Bsp. Protégé) Extraktions-Modul zur Entnahme von Instanzen aus relativen DB 5.

KAON2

39

KAON2 – Projekte

 Entwicklung teilweise duch EU IST project DIP 507483 finanziert  Verwendet in:     EU IST project OntoGov EU IST project SEKT (und erweitert) BMBF project SmartWeb DLP translator (Grundlage) 5.

KAON2

40

KAON2 – OWL-Tools

       Version 0.27: 16 Funktionen (Auswahl):

dump latex filter count diff

: : : gibt die Axiome und Entitäten der Ontologie aus : gibt die Axiome in lateX-integrierbarer Form aus : entfernt alle Axiome eines Typs gibt die Anzahl an Axiomen (oder Entitäten) zurück zeigt alle Axiome die eine Ontologie mehr als eine andere hat an    

merge

: zurück gibt eine Ontologie mit allen Axiomen zweier Input-Ontologien

deo

: ersetzt “nominals” durch einfache Klassen (schwächt so die Ontologie)

populate

: füllt eine Ontologie zufällig mit Instanzen

dlpconvert

: wandelt eine DL Ontologie in Regeln um

satisfiable

: prüft die Reichhaltigkeit einer Ontologie 5.

KAON2

41

KAON2 – Anmerkung

 Kommerzielle Version OntoBroker OWL, für Wissenschaft kostenlos  Vollständig in Java 1.5 implementiert  Benötigt JDK zur Ausführung; zusätzlich Apache ANT für Beispiele  Keine Verarbeitung von „nominals“ (Excptions bei: owl:oneOfclass und owl:hasValue) Große Kardinalitäten können (abhängig von anderen Axiomen) nicht verarbeitet werden Somit keine volle OWL DL Abdeckung! (OWL Lite voll abgedeckt)  Dokumentation bisher nur an Beispielen vorhanden 5.

KAON2

42

Und was macht die Konkurrenz?

 Protégé sehr verbreitet  Gut dokumentiert  Volle OWL Unterstützung  Open Source  Plugin-Nutzung  Schnittstelle zu KAON2 Weitere:  CyC – Abbildung Weltwissen  WordNet – Wörterbücher 5.

KAON2

43

Gliederung

1.

2.

3.

4.

5.

6.

7.

Einleitung Semantic Web Grundlagen Ontologien KAON KAON2

Zusammenfassung

Fragen und Diskussion Seminar im Sommersemester 2007: Agenten im Semantic Web

44

Zusammenfassung

 Ontologien als semantisch „reichste“ Ebene der Kommunikation  Ontologien als zentraler Aspekt des Semantic Web  OWL als W3C empfohlene Sprache für Ontologien  Erfolg neuer Technologien abhängig von verfügbaren Tools  Derzeit verfügbare Werkzeuge noch in den „Kinderschuhen“, nicht massentauglich  Viele Projekte/Forschung um dies zu ändern 6.

Zusammenfassung

45

Ausblick

 Große Hürde: Anwender finden, die Mehraufwand betreiben um maschineninterpretierbare Webinhalte zu erstellen  Kritische Masse an verfügbaren Inhalten muss erreicht werden, bevor Technologien nutzbar werden  Gut entwickelte Ontologien nötig um mit semantischem Markup Bedeutung herzustellen  Standardisierung erforderlich um parallel Entwicklung nicht kompatibler Systeme zu verhindern 6.

Zusammenfassung

46

Das Semantic Web – Eine Vision

 Semantisch angereicherte Daten im Web  Voll maschineninterpretierbare Daten, ermöglichen „Mitdenken“ des Rechners  Persönlicher Web Agent  Reiseplanung  Logistikplanung  Terminplanung  Fremdverfügbarkeit  Kooperative Web Agenten  etc 6.

Zusammenfassung

47

Gliederung

1.

2.

3.

4.

5.

6.

7.

Einleitung Semantic Web Grundlagen Ontologien KAON KAON2 Zusammenfassung

Fragen und Diskussion

Seminar im Sommersemester 2007: Agenten im Semantic Web

48

Fragen

Nööö …

7.

Fragen und Diskussion

49

Diskussion

 Welche Technologien außer Ontologien können noch einen großen Einfluss auf den Erfolg des Semantic Web haben?

 Wo liegen die Vor- und Nachteile von modularen oder globalen Wissenssammlungen? Was überwiegt?

7.

Fragen und Diskussion

50