Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Karl Kurbel Context-Aware Mobile Information Filtering System Anna Jankowska Doktorandenworkshop Technologien und Anwendungen von XML.
Download ReportTranscript Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Karl Kurbel Context-Aware Mobile Information Filtering System Anna Jankowska Doktorandenworkshop Technologien und Anwendungen von XML.
Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Karl Kurbel Context-Aware Mobile Information Filtering System Anna Jankowska Doktorandenworkshop Technologien und Anwendungen von XML Überblick Ziel des Projektes Kontext und kontext-adaptive Anwendungen Kontext in Mobile Computing Modellierung der Kontext-Informationen Benutzerprofil Retrieval, Filtering und mobiles IF Semantische Netze Webdienste und Semantische Webdienste Probleme & Chancen Zusammenfassung & Ausblick 1/23 Ziel des Projektes Entwicklung und prototypische Umsetzung eines kontext-sensitiven Systems zur Filterung von Dokumenten und Webdiensten für mobile Geräte. 2/23 Kontext ”Context is any information that can be used to characterize the situation of an entity. An entity is a person, place or object that is considered relevant to the interaction between a user and an application, including the user and application themselves.” Anind K. Dey, Gregory D. Abowd Kontext-Informationen: - Identität - räumliche Informationen: Standort - zeitliche Informationen: Uhrzeit - soziale Situation: wer ist in der Nähe - Umgebung: Temperatur - umgebende Resourcen: Computer - Verfügbarkeit der Resourcen: Art des Netzwerkes 3/23 Kontext-Adaptive Anwendungen Ein System heißt ”context-aware”, wenn es den Kontext verwendet, um relevante Informationen und/oder Dienste dem Benutzer zur Verfügung zu stellen, wobei die Relevanz von der Rolle des Benutzers abhängt.” Dey, Abowd Merkmale kontext-adaptiver Applikationen: – In Abhängigkeit von den aktuellen KontextInformationen werden dem Benutzer Daten und Dienstleistungen zur Verfügung gestellt. – Automatische Ausführung von Diensten, wenn ein bestimmter Zustand/Kontext auftritt. – Verknüpfung von Kontext und Informationen für eine spätere Wiederverwendung. 4/23 Kontext in Mobile Computing Mobile versus stationäre Geräte: - nicht vorhersagbarer, variierender Kontext - Ubiquität - Dienste & Informationen überall und immer verfügbar - zusätzliche Funktionalitäten (Ortslokalisierung, Spracherkennung etc.) - Beschränkungen (geringe CPU, kleine Displays, etc.) Kontext-adaptive mobile Anwendungen: - Mobile Resource Management System - Hydrogen Context-Framework - Cyberguide - Forget-Me-Not - Context-Phonebook - YellowMap Mobile Services 5/23 Modellierung von Kontext-Informationen HTTP headers - Kontext des Gerätes: ”accept”, ”user-agent”, etc. CC/PP - Composite Capabilities Preference Profiles - setzt auf RDF auf, um Metadaten über Geräteeigenschaften und Benutzerwünsche/Bedürfnisse zwischen Server und Browser auszutauschen UAProf - User Agent Profile - berücksichtigt gerätespezifische Charakteristika, Software-spezifische Fähigkeiten, Browser-Einstellungen und Netzwerkeigenschaften ConteXtML - Context Markup Language Verarbeitung der Kontext-Informationen: - DELI - DElivery Context LIbrary for CC/PP and UAProf - DICE - Device Independent Content Engine 6/23 Format für Kontext-Informationen Muss folgende Anforderungen erfüllen: – gut strukturiert – standardisiert – einheitlich für alle Kontext-Informationen – austauschbar zwischen Systemkomponenten – erweiterbar – kompatibel mit dem Format für Modellierung der Benutzerinformationen Soll auf den bereits unterstützten Formaten aufbauen (CC/PP) Alle relevanten Kontext-Informationen in session profiles serialisierter RDF + RDF Schema (Ontologie) 7/23 Format für Kontext-Informationen <? xml version="1.0" ?> <rdf:RDF Person123 xmlns:loc="http://www.x.org/ort-schemat#"> <rdf:Description about=“http://www.x.com/person#person123”> <ccpp:component> PhysOrt GeogrOrt LogOrt <rdf:Description about=”person123PhysOrt"> <rdf:type rdf:resource="http://www.x.com/ortschemat#PhysOrt "/> Land Telefon <loc:kontinent>Europa</loc:kontinent> <loc:land>Deutschland</loc:land> </rdf:RDF> 153"02' E </rdf:Description> 27"28' S </ccpp:component> 192.168.1.102 </rdf:Description> http:// www.berlin.org +4933 8266131 Berlin Dautschland Europa <loc:stadt>Berlin</loc: stadt> 8/23 Benutzerprofil Bestimmt kurzfristige und langfristige Informationsbedürfnisse des Benutzers, ist zerlegbar Erstellung des Profils (Top-Down Ansatz): - Organisationsprofil – relativ stabile Informationsbedürfnisse - Abteilungsprofil - Stellenbeschreibung (Rolle des Benutzers) - Vorlieben/Interessen des Benutzers Wird jeweils um Kontext-Informationen aktualisiert (“Profile Resolution“): - Gerätekontext - zeitliche Informationen - räumliche Informationen - Informationen aus TMS: Termine, Aufgaben, Kontakte Historischer Kontext Format: serialisierter RDF, XTM 9/23 Information Retrieval Ein Retrievalmodell besteht aus: – einer Menge D von Repräsentationen für Dokumente – einer Menge Q von Repräsentationen für Benutzeranfragen – einer Rankingfunktion R, die jedem Anfrage/Dokumentpaar eine reelle Zahl (das Ranking) zuweist, nach der Dokumente sortiert werden Relevant Dokumente in Suche bezieht sich auf Wörter Antwortmenge DA Beurteilung der Güte der Ergebnisse: – Recall: Anteil relevanter Dokumente, die gefunden wurden: R=Da/D – Precision: Anteil der gefundenen Dokumente, die relevant sind: P=Da/A Ansätze: – informatischer Ansatz – computerlinguistischer Ansatz Relevante Dokumente D Antwortmenge A 10/23 Informationsfilterung Information werdem dem Benutzer abhängig von seinen Informationsbedürfnissen/Interessen zur Verfügung gestellt Inhaltsbasierte Filterung – für jeden Nutzer eigene Filter – Profil: Repräsentation des Nutzerinteresses Soziale Filterung – Idee: Information ist relevant, wenn andere Benutzer, die bisher ähnliches Verhalten gezeigt haben, die Information ebenfalls als relevant betrachtet haben – Bewertung der Relevanz von Informationen durch Benutzer – Vergleich von Profilen mehrerer Nutzer • Gemischte Ansätze 11/23 Probleme bisheriger Ansätze Fragen, die man bei traditionellen IF&IR Ansätzen nicht korrekt beantworten kann: – “Finde alle Dokumente über CAR” semantische Information – “Finde alle Dokumente, die im Projekt mIF verfaßt wurden!” Kontextinformation – “Finde alle E-Mails mit Absender Frank Mustermann!” Logische Struktur – “Finde das Dokument mit dem Logo der TU Berlin oben rechts!” Layout 12/23 Neue Ansätze in IF, IR Bisherige Suchverfahren rein syntaktisch, ohne Kenntnis der Wortbedeutungen Intelligentes IF, IR: - Berücksuchtigung der Besonderheiten natürlicher Sprachen (Polysemie, Synonymie) - Identifizieren und Unterscheiden verschiedener Kontexte des Wortgebrauchs - flexible Gestaltung der Anfrage Die Suche kann oft verbessert werden, wenn Hilfsmittel zur Verfügung stehen, die etwas über die Semantik des Suchraums aussagen: - Thesaurus - Latent Semantic Indexing 13/23 Retrieval, Filtering, mIF Eigenschaft Information Filtering Information Retrieval Mobiles IF Anzahl der Dokumente unendlich endlich unendlich Anzahl der Anfragen endlich unendlich unendlich kurzfristige Interessen langfristige Interessen kurz- und langfristige Interessen ein Dokument viele Anfragen eine Anfrage Dokumentenkollektion eine Anfrage Dokumentenfluss Anfragetyp Bearbeitungsart 14/23 mIF - Aufgaben Metadaten und Ontologien generieren Kontext-Informationen abfangen und dem System zur Verfügung stellen Benutzerprofile erstellen (automatisch/manuell) Filterungsmaschine bauen Relevante Dokumente herausfiltern (Präzision wichtig) - Antworten statt Trefferlisten Nützliche Informationen personalisiert und aufgabenspezifisch anbieten - Berücksichtigung von Kontext-Informationen bei IF und bei Präsentation der Ergebnisse (kurzfristige und langfristige Informationsbedürfnisse) Webdienste: - relevante Webdienste herausfiltern - Transaktionen auslösen - Decision Support anbieten • Unterstützung: Intelligente Softweareagenten 15/23 Semantische Netze Traditionelle Informationsverarbeitung beruht auf: - Zeichenketten und kontextfreier Struktur (Syntax) - Verarbeitung von Konzepten, Kontextabhängigkeiten oder Kontextbedingungen werden vernachlässigt Zielgerichteter Zugriff auf Informationen ist problematisch, da Inhalte im Web vom Menschen interpretiert, kombiniert und aufbereitet werden müssen. Das Semantic Web: Ein Meta-Web, aufbauend auf dem WWW, welches die Inhalte auch für Maschinen verarbeitbar und interpretierbar macht. Verspricht bessere Endbenutzerdienste durch: – Standardisierte Architektur für Dokumentenverarbeitung – Standardisierte Vokabularien – Standardisierte Sprachen für Kontextbedingungen 16/23 Semantische Netze Repräsentation durch netzartige Strukturen aus Objekten und Relationen Semantische Netze bestehen aus : - Knoten: Repräsentation von Klassen oder Klasseninstanzen - Kanten: entsprechen 2-stelligen Relationen zwischen Objekten Wissen über einen Knoten wird durch die Verbindungen repräsentiert, die von ihnen ausgehen Mögliche Inferenzen: - Beantwortung von Anfragen durch Verfolgen von Kanten - Spreading Activation bzw. Intersection Search - Vererbung Semantische Netze = Metadaten + Ontologien 17/23 Beispiel für ein semantisches Netz „Holtmann fuhr mit seinem roten Auto auf meinen weissen Volvo“ unfall instance-of u57 verursacher besitzer geschädigter instance-of a43 hatfarbe auto volvo is-a instance-of hat-teil rot holtmann instance-of motor farbe a25 hatfarbe weiss instance-of besitzer andreas instance-of instance-of Quelle: Hinkelmann Individuelles Konzept (Instanz) Generisches Konzept (Klasse) person 18/23 Ontologien • Semantik: Interpretationsfunktion von einem syntaktischen in einen semantischen Bereich Idee: Spezifiziere alle durch ein Programm oder eine Wissensbasis verwendbaren Begriffe Ontologie = eine Vereinbarung über ein gemeinsam zu nutzendes Vokabular, mit dem Anfragen und Aussagen zwischen Maschinen ausgetauscht werden: – eine standardisierte Menge von Begriffen mit Kontextbedingungen – Kontextbedingungen werden durch Inferenzregeln angegeben Alle potentiellen Welten müssen sich auf die vorgegebenen Ontologien abstützen und die Einschränkungen erfüllen Ontologiesprachen: RDF Schema, DAML+OIL 19/23 Webdienste Ein Webdienst ist eine Anwendung, die es erlaubt, ihre Methoden über eine Web-Schnittstelle aufzurufen. UDDI Verzeichnisdienst URL des Webdienstes Suchen nach Webdiensten Klient WSDL Schnittstellenbeschreibung WSDL-Dokument holen SOAP-Nachrichten Methodenaufrufe Anfragen und Antworten Webdienst 20/23 Semantische Webdienste Entwicklung des Internet: von einem Informationsnetz zum Servicenetz Semantische Webdienste sollen ermöglichen: - automatisches Auffinden von Webdiensten - automatische Ausführung von Webdiensten - Komposition von Web Services - Überwachung der Ausführung von Webdiensten DAML-S (DARPA Agent Markup Language for Services): - eine DAML+OIL - Ontologie für Webdienste, dessen Ziel es ist, Webdienste in einer computer-interpretierbaren Art und Weise zu beschreiben – ermöglicht den intelligenten Agenten, diverse Aufgaben zu erfüllen WSMF - Web Services Modeling Framework 21/23 Probleme und Chancen Chancen: Das Semantische Web reitet auf der "Welle" HTML/XML Technologie entwickelt sich sehr schnell Killer-Applikation Probleme: Technologien noch nicht ausgereift Beschränkungen mobiler Geräte Nutzen der Information abhängig von: - Informationsquellen - Qualität der Information - Kosten der Information - Aktualität der Information - Vertrauenswürdigkeit der Information “Big Brother“ – Ansatz Abschätzung der Qualität von Webdiensten Technik muss sicher und unsichtbar sein 22/23 Zusammenfassung Semantische Netze und Webdienste als (reale) Zukunftsvision: - verbesserter Zugriff auf Wissen - verbesserte Kommunikation zwischen Maschinen - intelligente Webdienste Context-Aware Mobile Information Filtering System: innovative Anwendung im Bereich IF ein Filterungssystem, das im Filterungsprozess die KontextInformationen sowie Benutzerprofile berücksichtigt Filterung: - Dokumente (Semantic Web) - Webdienste Integration semantischer Technologien in bestehende Ansätze des Information Filtering Bereitstellen der Informationen für verschiedene mobile Geräte Umsetzung auch in Form eines Webdienstes 23/23 Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Karl Kurbel Context-Aware Mobile Information Filtering System Anna Jankowska Doktorandenworkshop Technologien und Anwendungen von XML