Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Karl Kurbel Context-Aware Mobile Information Filtering System Anna Jankowska Doktorandenworkshop Technologien und Anwendungen von XML.
Download
Report
Transcript Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Karl Kurbel Context-Aware Mobile Information Filtering System Anna Jankowska Doktorandenworkshop Technologien und Anwendungen von XML.
Lehrstuhl für Wirtschaftsinformatik
Prof. Dr. Karl Kurbel
Context-Aware
Mobile Information Filtering System
Anna Jankowska
Doktorandenworkshop
Technologien und Anwendungen von XML
Überblick
Ziel des Projektes
Kontext und kontext-adaptive Anwendungen
Kontext in Mobile Computing
Modellierung der Kontext-Informationen
Benutzerprofil
Retrieval, Filtering und mobiles IF
Semantische Netze
Webdienste und Semantische Webdienste
Probleme & Chancen
Zusammenfassung & Ausblick
1/23
Ziel des Projektes
Entwicklung und prototypische Umsetzung eines
kontext-sensitiven Systems zur Filterung von
Dokumenten und Webdiensten für mobile Geräte.
2/23
Kontext
”Context is any information that can be used to characterize
the situation of an entity. An entity is a person, place or
object that is considered relevant to the interaction
between a user and an application, including the user and
application themselves.”
Anind K. Dey, Gregory D. Abowd
Kontext-Informationen:
- Identität
- räumliche Informationen: Standort
- zeitliche Informationen: Uhrzeit
- soziale Situation: wer ist in der Nähe
- Umgebung: Temperatur
- umgebende Resourcen: Computer
- Verfügbarkeit der Resourcen: Art des Netzwerkes
3/23
Kontext-Adaptive Anwendungen
Ein System heißt ”context-aware”, wenn es den Kontext
verwendet, um relevante Informationen und/oder
Dienste dem Benutzer zur Verfügung zu stellen, wobei
die Relevanz von der Rolle des Benutzers abhängt.”
Dey, Abowd
Merkmale kontext-adaptiver Applikationen:
– In Abhängigkeit von den aktuellen KontextInformationen werden dem Benutzer Daten und
Dienstleistungen zur Verfügung gestellt.
– Automatische Ausführung von Diensten, wenn ein
bestimmter Zustand/Kontext auftritt.
– Verknüpfung von Kontext und Informationen für eine
spätere Wiederverwendung.
4/23
Kontext in Mobile Computing
Mobile versus stationäre Geräte:
- nicht vorhersagbarer, variierender Kontext
- Ubiquität - Dienste & Informationen überall und
immer verfügbar
- zusätzliche Funktionalitäten (Ortslokalisierung,
Spracherkennung etc.)
- Beschränkungen (geringe CPU, kleine Displays, etc.)
Kontext-adaptive mobile Anwendungen:
- Mobile Resource Management System
- Hydrogen Context-Framework
- Cyberguide
- Forget-Me-Not
- Context-Phonebook
- YellowMap Mobile Services
5/23
Modellierung von Kontext-Informationen
HTTP headers
- Kontext des Gerätes: ”accept”, ”user-agent”, etc.
CC/PP - Composite Capabilities Preference Profiles
- setzt auf RDF auf, um Metadaten über
Geräteeigenschaften und Benutzerwünsche/Bedürfnisse
zwischen Server und Browser auszutauschen
UAProf - User Agent Profile
- berücksichtigt gerätespezifische Charakteristika,
Software-spezifische Fähigkeiten, Browser-Einstellungen
und Netzwerkeigenschaften
ConteXtML - Context Markup Language
Verarbeitung der Kontext-Informationen:
- DELI - DElivery Context LIbrary for CC/PP and UAProf
- DICE - Device Independent Content Engine
6/23
Format für Kontext-Informationen
Muss folgende Anforderungen erfüllen:
– gut strukturiert
– standardisiert
– einheitlich für alle Kontext-Informationen
– austauschbar zwischen Systemkomponenten
– erweiterbar
– kompatibel mit dem Format für Modellierung der
Benutzerinformationen
Soll auf den bereits unterstützten Formaten aufbauen
(CC/PP)
Alle relevanten Kontext-Informationen in session profiles
serialisierter RDF + RDF Schema (Ontologie)
7/23
Format für Kontext-Informationen
<? xml version="1.0" ?>
<rdf:RDF
Person123
xmlns:loc="http://www.x.org/ort-schemat#">
<rdf:Description about=“http://www.x.com/person#person123”>
<ccpp:component>
PhysOrt
GeogrOrt
LogOrt
<rdf:Description about=”person123PhysOrt">
<rdf:type rdf:resource="http://www.x.com/ortschemat#PhysOrt
"/>
Land
Telefon
<loc:kontinent>Europa</loc:kontinent>
<loc:land>Deutschland</loc:land>
</rdf:RDF>
153"02' E
</rdf:Description>
27"28' S
</ccpp:component>
192.168.1.102
</rdf:Description>
http://
www.berlin.org
+4933 8266131
Berlin
Dautschland
Europa
<loc:stadt>Berlin</loc: stadt>
8/23
Benutzerprofil
Bestimmt kurzfristige und langfristige Informationsbedürfnisse
des Benutzers, ist zerlegbar
Erstellung des Profils (Top-Down Ansatz):
- Organisationsprofil – relativ stabile Informationsbedürfnisse
- Abteilungsprofil
- Stellenbeschreibung (Rolle des Benutzers)
- Vorlieben/Interessen des Benutzers
Wird jeweils um Kontext-Informationen aktualisiert (“Profile
Resolution“):
- Gerätekontext
- zeitliche Informationen
- räumliche Informationen
- Informationen aus TMS: Termine, Aufgaben, Kontakte
Historischer Kontext
Format: serialisierter RDF, XTM
9/23
Information Retrieval
Ein Retrievalmodell besteht aus:
– einer Menge D von Repräsentationen für Dokumente
– einer Menge Q von Repräsentationen für Benutzeranfragen
– einer Rankingfunktion R, die jedem Anfrage/Dokumentpaar
eine reelle Zahl (das Ranking) zuweist, nach der Dokumente
sortiert werden
Relevant
Dokumente in
Suche bezieht sich auf Wörter
Antwortmenge
DA
Beurteilung der Güte der Ergebnisse:
– Recall: Anteil relevanter Dokumente,
die gefunden wurden: R=Da/D
– Precision: Anteil der gefundenen Dokumente,
die relevant sind: P=Da/A
Ansätze:
– informatischer Ansatz
– computerlinguistischer Ansatz
Relevante
Dokumente
D
Antwortmenge
A
10/23
Informationsfilterung
Information werdem dem Benutzer abhängig von seinen
Informationsbedürfnissen/Interessen zur Verfügung
gestellt
Inhaltsbasierte Filterung
– für jeden Nutzer eigene Filter
– Profil: Repräsentation des Nutzerinteresses
Soziale Filterung
– Idee: Information ist relevant, wenn andere Benutzer,
die bisher ähnliches Verhalten gezeigt haben, die
Information ebenfalls als relevant betrachtet haben
– Bewertung der Relevanz von Informationen durch
Benutzer
– Vergleich von Profilen mehrerer Nutzer
• Gemischte Ansätze
11/23
Probleme bisheriger Ansätze
Fragen, die man bei traditionellen IF&IR Ansätzen nicht
korrekt beantworten kann:
– “Finde alle Dokumente über CAR”
semantische Information
– “Finde alle Dokumente, die im Projekt mIF verfaßt
wurden!”
Kontextinformation
– “Finde alle E-Mails mit Absender Frank Mustermann!”
Logische Struktur
– “Finde das Dokument mit dem Logo der TU Berlin oben
rechts!”
Layout
12/23
Neue Ansätze in IF, IR
Bisherige Suchverfahren rein syntaktisch, ohne Kenntnis
der Wortbedeutungen
Intelligentes IF, IR:
- Berücksuchtigung der Besonderheiten natürlicher
Sprachen (Polysemie, Synonymie)
- Identifizieren und Unterscheiden verschiedener
Kontexte des Wortgebrauchs
- flexible Gestaltung der Anfrage
Die Suche kann oft verbessert werden, wenn Hilfsmittel zur
Verfügung stehen, die etwas über die Semantik des
Suchraums aussagen:
- Thesaurus
- Latent Semantic Indexing
13/23
Retrieval, Filtering, mIF
Eigenschaft
Information
Filtering
Information
Retrieval
Mobiles IF
Anzahl der
Dokumente
unendlich
endlich
unendlich
Anzahl der
Anfragen
endlich
unendlich
unendlich
kurzfristige
Interessen
langfristige
Interessen
kurz- und
langfristige
Interessen
ein Dokument
viele Anfragen
eine Anfrage
Dokumentenkollektion
eine Anfrage
Dokumentenfluss
Anfragetyp
Bearbeitungsart
14/23
mIF - Aufgaben
Metadaten und Ontologien generieren
Kontext-Informationen abfangen und dem System zur
Verfügung stellen
Benutzerprofile erstellen (automatisch/manuell)
Filterungsmaschine bauen
Relevante Dokumente herausfiltern (Präzision wichtig)
- Antworten statt Trefferlisten
Nützliche Informationen personalisiert und
aufgabenspezifisch anbieten
- Berücksichtigung von Kontext-Informationen bei IF und
bei Präsentation der Ergebnisse (kurzfristige und
langfristige Informationsbedürfnisse)
Webdienste:
- relevante Webdienste herausfiltern
- Transaktionen auslösen
- Decision Support anbieten
• Unterstützung: Intelligente Softweareagenten
15/23
Semantische Netze
Traditionelle Informationsverarbeitung beruht auf:
- Zeichenketten und kontextfreier Struktur (Syntax)
- Verarbeitung von Konzepten, Kontextabhängigkeiten
oder Kontextbedingungen werden vernachlässigt
Zielgerichteter Zugriff auf Informationen ist problematisch,
da Inhalte im Web vom Menschen interpretiert, kombiniert
und aufbereitet werden müssen.
Das Semantic Web: Ein Meta-Web, aufbauend auf dem
WWW, welches die Inhalte auch für Maschinen verarbeitbar
und interpretierbar macht.
Verspricht bessere Endbenutzerdienste durch:
– Standardisierte Architektur für Dokumentenverarbeitung
– Standardisierte Vokabularien
– Standardisierte Sprachen für Kontextbedingungen
16/23
Semantische Netze
Repräsentation durch netzartige Strukturen aus Objekten und
Relationen
Semantische Netze bestehen aus :
- Knoten: Repräsentation von Klassen oder Klasseninstanzen
- Kanten: entsprechen 2-stelligen Relationen zwischen
Objekten
Wissen über einen Knoten wird durch die Verbindungen
repräsentiert, die von ihnen ausgehen
Mögliche Inferenzen:
- Beantwortung von Anfragen durch Verfolgen von Kanten
- Spreading Activation bzw. Intersection Search
- Vererbung
Semantische Netze = Metadaten + Ontologien
17/23
Beispiel für ein semantisches Netz
„Holtmann fuhr mit seinem roten Auto auf
meinen weissen Volvo“
unfall
instance-of
u57
verursacher
besitzer
geschädigter
instance-of
a43
hatfarbe
auto
volvo
is-a
instance-of
hat-teil
rot
holtmann
instance-of
motor
farbe
a25
hatfarbe
weiss
instance-of
besitzer
andreas
instance-of
instance-of
Quelle: Hinkelmann
Individuelles
Konzept (Instanz)
Generisches
Konzept (Klasse)
person
18/23
Ontologien
• Semantik: Interpretationsfunktion von einem syntaktischen
in einen semantischen Bereich
Idee: Spezifiziere alle durch ein Programm oder eine
Wissensbasis verwendbaren Begriffe
Ontologie = eine Vereinbarung über ein gemeinsam zu
nutzendes Vokabular, mit dem Anfragen und Aussagen
zwischen Maschinen ausgetauscht werden:
– eine standardisierte Menge von Begriffen mit
Kontextbedingungen
– Kontextbedingungen werden durch Inferenzregeln
angegeben
Alle potentiellen Welten müssen sich auf die vorgegebenen
Ontologien abstützen und die Einschränkungen erfüllen
Ontologiesprachen: RDF Schema, DAML+OIL
19/23
Webdienste
Ein Webdienst ist eine Anwendung, die es erlaubt, ihre
Methoden über eine Web-Schnittstelle aufzurufen.
UDDI
Verzeichnisdienst
URL des
Webdienstes
Suchen nach
Webdiensten
Klient
WSDL
Schnittstellenbeschreibung
WSDL-Dokument
holen
SOAP-Nachrichten
Methodenaufrufe
Anfragen und Antworten
Webdienst
20/23
Semantische Webdienste
Entwicklung des Internet: von einem Informationsnetz zum
Servicenetz
Semantische Webdienste sollen ermöglichen:
- automatisches Auffinden von Webdiensten
- automatische Ausführung von Webdiensten
- Komposition von Web Services
- Überwachung der Ausführung von Webdiensten
DAML-S (DARPA Agent Markup Language for Services):
- eine DAML+OIL - Ontologie für Webdienste, dessen Ziel
es ist, Webdienste in einer computer-interpretierbaren
Art und Weise zu beschreiben
– ermöglicht den intelligenten Agenten, diverse Aufgaben
zu erfüllen
WSMF - Web Services Modeling Framework
21/23
Probleme und Chancen
Chancen:
Das Semantische Web reitet auf der "Welle" HTML/XML
Technologie entwickelt sich sehr schnell
Killer-Applikation
Probleme:
Technologien noch nicht ausgereift
Beschränkungen mobiler Geräte
Nutzen der Information abhängig von:
- Informationsquellen
- Qualität der Information
- Kosten der Information
- Aktualität der Information
- Vertrauenswürdigkeit der Information
“Big Brother“ – Ansatz
Abschätzung der Qualität von Webdiensten
Technik muss sicher und unsichtbar sein
22/23
Zusammenfassung
Semantische Netze und Webdienste als (reale) Zukunftsvision:
- verbesserter Zugriff auf Wissen
- verbesserte Kommunikation zwischen Maschinen
- intelligente Webdienste
Context-Aware Mobile Information Filtering System:
innovative Anwendung im Bereich IF
ein Filterungssystem, das im Filterungsprozess die KontextInformationen sowie Benutzerprofile berücksichtigt
Filterung:
- Dokumente (Semantic Web)
- Webdienste
Integration semantischer Technologien in bestehende
Ansätze des Information Filtering
Bereitstellen der Informationen für verschiedene mobile
Geräte
Umsetzung auch in Form eines Webdienstes
23/23
Lehrstuhl für Wirtschaftsinformatik
Prof. Dr. Karl Kurbel
Context-Aware
Mobile Information Filtering System
Anna Jankowska
Doktorandenworkshop
Technologien und Anwendungen von XML