Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Karl Kurbel Context-Aware Mobile Information Filtering System Anna Jankowska Doktorandenworkshop Technologien und Anwendungen von XML.

Download Report

Transcript Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Karl Kurbel Context-Aware Mobile Information Filtering System Anna Jankowska Doktorandenworkshop Technologien und Anwendungen von XML.

Lehrstuhl für Wirtschaftsinformatik
Prof. Dr. Karl Kurbel
Context-Aware
Mobile Information Filtering System
Anna Jankowska
Doktorandenworkshop
Technologien und Anwendungen von XML
Überblick










Ziel des Projektes
Kontext und kontext-adaptive Anwendungen
Kontext in Mobile Computing
Modellierung der Kontext-Informationen
Benutzerprofil
Retrieval, Filtering und mobiles IF
Semantische Netze
Webdienste und Semantische Webdienste
Probleme & Chancen
Zusammenfassung & Ausblick
1/23
Ziel des Projektes
 Entwicklung und prototypische Umsetzung eines
kontext-sensitiven Systems zur Filterung von
Dokumenten und Webdiensten für mobile Geräte.
2/23
Kontext
 ”Context is any information that can be used to characterize
the situation of an entity. An entity is a person, place or
object that is considered relevant to the interaction
between a user and an application, including the user and
application themselves.”
Anind K. Dey, Gregory D. Abowd
 Kontext-Informationen:
- Identität
- räumliche Informationen: Standort
- zeitliche Informationen: Uhrzeit
- soziale Situation: wer ist in der Nähe
- Umgebung: Temperatur
- umgebende Resourcen: Computer
- Verfügbarkeit der Resourcen: Art des Netzwerkes
3/23
Kontext-Adaptive Anwendungen
 Ein System heißt ”context-aware”, wenn es den Kontext
verwendet, um relevante Informationen und/oder
Dienste dem Benutzer zur Verfügung zu stellen, wobei
die Relevanz von der Rolle des Benutzers abhängt.”
Dey, Abowd
 Merkmale kontext-adaptiver Applikationen:
– In Abhängigkeit von den aktuellen KontextInformationen werden dem Benutzer Daten und
Dienstleistungen zur Verfügung gestellt.
– Automatische Ausführung von Diensten, wenn ein
bestimmter Zustand/Kontext auftritt.
– Verknüpfung von Kontext und Informationen für eine
spätere Wiederverwendung.
4/23
Kontext in Mobile Computing
 Mobile versus stationäre Geräte:
- nicht vorhersagbarer, variierender Kontext
- Ubiquität - Dienste & Informationen überall und
immer verfügbar
- zusätzliche Funktionalitäten (Ortslokalisierung,
Spracherkennung etc.)
- Beschränkungen (geringe CPU, kleine Displays, etc.)
 Kontext-adaptive mobile Anwendungen:
- Mobile Resource Management System
- Hydrogen Context-Framework
- Cyberguide
- Forget-Me-Not
- Context-Phonebook
- YellowMap Mobile Services
5/23
Modellierung von Kontext-Informationen
 HTTP headers
- Kontext des Gerätes: ”accept”, ”user-agent”, etc.
 CC/PP - Composite Capabilities Preference Profiles
- setzt auf RDF auf, um Metadaten über
Geräteeigenschaften und Benutzerwünsche/Bedürfnisse
zwischen Server und Browser auszutauschen
 UAProf - User Agent Profile
- berücksichtigt gerätespezifische Charakteristika,
Software-spezifische Fähigkeiten, Browser-Einstellungen
und Netzwerkeigenschaften
 ConteXtML - Context Markup Language
 Verarbeitung der Kontext-Informationen:
- DELI - DElivery Context LIbrary for CC/PP and UAProf
- DICE - Device Independent Content Engine
6/23
Format für Kontext-Informationen
 Muss folgende Anforderungen erfüllen:
– gut strukturiert
– standardisiert
– einheitlich für alle Kontext-Informationen
– austauschbar zwischen Systemkomponenten
– erweiterbar
– kompatibel mit dem Format für Modellierung der
Benutzerinformationen
 Soll auf den bereits unterstützten Formaten aufbauen
(CC/PP)
 Alle relevanten Kontext-Informationen in session profiles
 serialisierter RDF + RDF Schema (Ontologie)
7/23
Format für Kontext-Informationen
<? xml version="1.0" ?>
<rdf:RDF
Person123
xmlns:loc="http://www.x.org/ort-schemat#">
<rdf:Description about=“http://www.x.com/person#person123”>
<ccpp:component>
PhysOrt
GeogrOrt
LogOrt
<rdf:Description about=”person123PhysOrt">
<rdf:type rdf:resource="http://www.x.com/ortschemat#PhysOrt
"/>
Land
Telefon
<loc:kontinent>Europa</loc:kontinent>
<loc:land>Deutschland</loc:land>
</rdf:RDF>
153"02' E
</rdf:Description>
27"28' S
</ccpp:component>
192.168.1.102
</rdf:Description>
http://
www.berlin.org
+4933 8266131
Berlin
Dautschland
Europa
<loc:stadt>Berlin</loc: stadt>
8/23
Benutzerprofil
 Bestimmt kurzfristige und langfristige Informationsbedürfnisse
des Benutzers, ist zerlegbar
 Erstellung des Profils (Top-Down Ansatz):
- Organisationsprofil – relativ stabile Informationsbedürfnisse
- Abteilungsprofil
- Stellenbeschreibung (Rolle des Benutzers)
- Vorlieben/Interessen des Benutzers
 Wird jeweils um Kontext-Informationen aktualisiert (“Profile
Resolution“):
- Gerätekontext
- zeitliche Informationen
- räumliche Informationen
- Informationen aus TMS: Termine, Aufgaben, Kontakte
 Historischer Kontext
 Format: serialisierter RDF, XTM
9/23
Information Retrieval
 Ein Retrievalmodell besteht aus:
– einer Menge D von Repräsentationen für Dokumente
– einer Menge Q von Repräsentationen für Benutzeranfragen
– einer Rankingfunktion R, die jedem Anfrage/Dokumentpaar
eine reelle Zahl (das Ranking) zuweist, nach der Dokumente
sortiert werden
Relevant
Dokumente in
 Suche bezieht sich auf Wörter
Antwortmenge
DA
 Beurteilung der Güte der Ergebnisse:
– Recall: Anteil relevanter Dokumente,
die gefunden wurden: R=Da/D
– Precision: Anteil der gefundenen Dokumente,
die relevant sind: P=Da/A
 Ansätze:
– informatischer Ansatz
– computerlinguistischer Ansatz
Relevante
Dokumente
D
Antwortmenge
A
10/23
Informationsfilterung
 Information werdem dem Benutzer abhängig von seinen
Informationsbedürfnissen/Interessen zur Verfügung
gestellt
 Inhaltsbasierte Filterung
– für jeden Nutzer eigene Filter
– Profil: Repräsentation des Nutzerinteresses
 Soziale Filterung
– Idee: Information ist relevant, wenn andere Benutzer,
die bisher ähnliches Verhalten gezeigt haben, die
Information ebenfalls als relevant betrachtet haben
– Bewertung der Relevanz von Informationen durch
Benutzer
– Vergleich von Profilen mehrerer Nutzer
• Gemischte Ansätze
11/23
Probleme bisheriger Ansätze
 Fragen, die man bei traditionellen IF&IR Ansätzen nicht
korrekt beantworten kann:
– “Finde alle Dokumente über CAR”
semantische Information
– “Finde alle Dokumente, die im Projekt mIF verfaßt
wurden!”
Kontextinformation
– “Finde alle E-Mails mit Absender Frank Mustermann!”
Logische Struktur
– “Finde das Dokument mit dem Logo der TU Berlin oben
rechts!”
Layout
12/23
Neue Ansätze in IF, IR
 Bisherige Suchverfahren rein syntaktisch, ohne Kenntnis
der Wortbedeutungen
 Intelligentes IF, IR:
- Berücksuchtigung der Besonderheiten natürlicher
Sprachen (Polysemie, Synonymie)
- Identifizieren und Unterscheiden verschiedener
Kontexte des Wortgebrauchs
- flexible Gestaltung der Anfrage
 Die Suche kann oft verbessert werden, wenn Hilfsmittel zur
Verfügung stehen, die etwas über die Semantik des
Suchraums aussagen:
- Thesaurus
- Latent Semantic Indexing
13/23
Retrieval, Filtering, mIF
Eigenschaft
Information
Filtering
Information
Retrieval
Mobiles IF
Anzahl der
Dokumente
unendlich
endlich
unendlich
Anzahl der
Anfragen
endlich
unendlich
unendlich
kurzfristige
Interessen
langfristige
Interessen
kurz- und
langfristige
Interessen
ein Dokument
viele Anfragen
eine Anfrage
Dokumentenkollektion
eine Anfrage
Dokumentenfluss
Anfragetyp
Bearbeitungsart
14/23
mIF - Aufgaben
 Metadaten und Ontologien generieren
 Kontext-Informationen abfangen und dem System zur
Verfügung stellen
 Benutzerprofile erstellen (automatisch/manuell)
 Filterungsmaschine bauen
 Relevante Dokumente herausfiltern (Präzision wichtig)
- Antworten statt Trefferlisten
 Nützliche Informationen personalisiert und
aufgabenspezifisch anbieten
- Berücksichtigung von Kontext-Informationen bei IF und
bei Präsentation der Ergebnisse (kurzfristige und
langfristige Informationsbedürfnisse)
 Webdienste:
- relevante Webdienste herausfiltern
- Transaktionen auslösen
- Decision Support anbieten
• Unterstützung: Intelligente Softweareagenten
15/23
Semantische Netze
 Traditionelle Informationsverarbeitung beruht auf:
- Zeichenketten und kontextfreier Struktur (Syntax)
- Verarbeitung von Konzepten, Kontextabhängigkeiten
oder Kontextbedingungen werden vernachlässigt
 Zielgerichteter Zugriff auf Informationen ist problematisch,
da Inhalte im Web vom Menschen interpretiert, kombiniert
und aufbereitet werden müssen.
 Das Semantic Web: Ein Meta-Web, aufbauend auf dem
WWW, welches die Inhalte auch für Maschinen verarbeitbar
und interpretierbar macht.
 Verspricht bessere Endbenutzerdienste durch:
– Standardisierte Architektur für Dokumentenverarbeitung
– Standardisierte Vokabularien
– Standardisierte Sprachen für Kontextbedingungen
16/23
Semantische Netze
 Repräsentation durch netzartige Strukturen aus Objekten und
Relationen
 Semantische Netze bestehen aus :
- Knoten: Repräsentation von Klassen oder Klasseninstanzen
- Kanten: entsprechen 2-stelligen Relationen zwischen
Objekten
 Wissen über einen Knoten wird durch die Verbindungen
repräsentiert, die von ihnen ausgehen
 Mögliche Inferenzen:
- Beantwortung von Anfragen durch Verfolgen von Kanten
- Spreading Activation bzw. Intersection Search
- Vererbung
 Semantische Netze = Metadaten + Ontologien
17/23
Beispiel für ein semantisches Netz
„Holtmann fuhr mit seinem roten Auto auf
meinen weissen Volvo“
unfall
instance-of
u57
verursacher
besitzer
geschädigter
instance-of
a43
hatfarbe
auto
volvo
is-a
instance-of
hat-teil
rot
holtmann
instance-of
motor
farbe
a25
hatfarbe
weiss
instance-of
besitzer
andreas
instance-of
instance-of
Quelle: Hinkelmann
Individuelles
Konzept (Instanz)
Generisches
Konzept (Klasse)
person
18/23
Ontologien
• Semantik: Interpretationsfunktion von einem syntaktischen
in einen semantischen Bereich
 Idee: Spezifiziere alle durch ein Programm oder eine
Wissensbasis verwendbaren Begriffe
 Ontologie = eine Vereinbarung über ein gemeinsam zu
nutzendes Vokabular, mit dem Anfragen und Aussagen
zwischen Maschinen ausgetauscht werden:
– eine standardisierte Menge von Begriffen mit
Kontextbedingungen
– Kontextbedingungen werden durch Inferenzregeln
angegeben
 Alle potentiellen Welten müssen sich auf die vorgegebenen
Ontologien abstützen und die Einschränkungen erfüllen
 Ontologiesprachen: RDF Schema, DAML+OIL
19/23
Webdienste
 Ein Webdienst ist eine Anwendung, die es erlaubt, ihre
Methoden über eine Web-Schnittstelle aufzurufen.
UDDI
Verzeichnisdienst
URL des
Webdienstes
Suchen nach
Webdiensten
Klient
WSDL
Schnittstellenbeschreibung
WSDL-Dokument
holen
SOAP-Nachrichten
Methodenaufrufe
Anfragen und Antworten
Webdienst
20/23
Semantische Webdienste
 Entwicklung des Internet: von einem Informationsnetz zum
Servicenetz
 Semantische Webdienste sollen ermöglichen:
- automatisches Auffinden von Webdiensten
- automatische Ausführung von Webdiensten
- Komposition von Web Services
- Überwachung der Ausführung von Webdiensten
 DAML-S (DARPA Agent Markup Language for Services):
- eine DAML+OIL - Ontologie für Webdienste, dessen Ziel
es ist, Webdienste in einer computer-interpretierbaren
Art und Weise zu beschreiben
– ermöglicht den intelligenten Agenten, diverse Aufgaben
zu erfüllen
 WSMF - Web Services Modeling Framework
21/23
Probleme und Chancen
 Chancen:
 Das Semantische Web reitet auf der "Welle" HTML/XML
 Technologie entwickelt sich sehr schnell
 Killer-Applikation
 Probleme:
 Technologien noch nicht ausgereift
 Beschränkungen mobiler Geräte
 Nutzen der Information abhängig von:
- Informationsquellen
- Qualität der Information
- Kosten der Information
- Aktualität der Information
- Vertrauenswürdigkeit der Information
 “Big Brother“ – Ansatz
 Abschätzung der Qualität von Webdiensten
 Technik muss sicher und unsichtbar sein
22/23
Zusammenfassung
 Semantische Netze und Webdienste als (reale) Zukunftsvision:
- verbesserter Zugriff auf Wissen
- verbesserte Kommunikation zwischen Maschinen
- intelligente Webdienste
 Context-Aware Mobile Information Filtering System:
 innovative Anwendung im Bereich IF
 ein Filterungssystem, das im Filterungsprozess die KontextInformationen sowie Benutzerprofile berücksichtigt
 Filterung:
- Dokumente (Semantic Web)
- Webdienste
 Integration semantischer Technologien in bestehende
Ansätze des Information Filtering
 Bereitstellen der Informationen für verschiedene mobile
Geräte
 Umsetzung auch in Form eines Webdienstes
23/23
Lehrstuhl für Wirtschaftsinformatik
Prof. Dr. Karl Kurbel
Context-Aware
Mobile Information Filtering System
Anna Jankowska
Doktorandenworkshop
Technologien und Anwendungen von XML