ΣΗΜΑΣΙΟΛΟΓΙΚΟΣ ΙΣΤΟΣ

Download Report

Transcript ΣΗΜΑΣΙΟΛΟΓΙΚΟΣ ΙΣΤΟΣ

ΣΗΜΑΣΙΟΛΟΓΙΚΟΣ ΙΣΤΟΣ
Image Video and Multimedia Laboratory
(IVML)
Βασίλης Τζουβάρας
Ανθρώπινο Δίκτυο Ε&Τ
Επιμόρφωσης σε Τεχνολογίες
Εξόρυξης και Διαχείρισης Γνώσης
από Πολυμέσα
2ο ΣΕΜΙΝΑΡΙΟ ΚΑΤΑΡΤΙΣΗΣ
15 Μαρτίου – 24 Μαρτίου 2004
Αθήνα
Ινστιτούτο Πληροφορικής & Τηλεπικοινωνιών
Εθνικό Κέντρο Έρευνας Φυσικών Επιστημών «Δημόκριτος»
Η Δημόσια Δαπάνη συγχρηματοδοτείται κατά 70% από την
Ευρωπαϊκή Ένωση – Ευρωπαϊκό Ταμείο Περιφερειακής Ανάπτυξης
και κατά 30% από το Ελληνικό Δημόσιο στο πλαίσιο της Δράσης
8.3.6. «Ανθρώπινα Δίκτυα Ερευνητικής και Τεχνολογικής
Επιμόρφωσης
του
Επιχειρησιακού
Προγράμματος
«ΑΝΤΑΓΩΝΙΣΤΙΚΟΤΗΤΑ» - Κοινοτικό Πλαίσιο Στήριξης 2000-2006
XML και HTML
Η XML ξεχωρίζει το περιεχόμενο (δεδομένα και
γλώσσα) από την παρουσίαση. Η HTML καθορίζει την
παρουσίαση
Η HTML σαφώς καθορίζει ένα σύνολο από ετικέτες
όπως και τη γραμματική (intended meaning)
<TABLE>…</TABLE>
Η XML επιτρέπει ετικέτες ή γραμματική
<BOOK>…</BOOK>
Σημείωση: και οι δύο γλώσσες είναι βασισμένες στην
Standard Generilised Markup Language (SGML)
Παράδειγμα
<?xml version = “1.0?>
<authors>
<Name>
<firstname>Larry</firstname>
<lastname>Brown</lastname>
</name>
<name>
<firstname>Marty</firstname>
<lastname>Hall</lastname>
</name>
…
</authors>
Τα στοιχεία της XML
Prolog
Καθορίζει την έκδοση της XML
Στοιχεία του αρχείου
Tags and attributes
Character data
Entities
Processing instruction
comments
RDF
Είναι ένα πλαίσιο για την έκφραση της πληροφορίας
με ένα τρόπο που μπορεί να ανταλλαχθεί μεταξύ
εφαρμογών χωρίς να χαθεί το νόημα
Η πληροφορία μπορεί να είναι διαθέσιμη σε
εφαρμογές διαφορετικές από αυτές που είχε αρχικά
δημιουργηθεί
Πως δημιουργήθηκε η OWL
DAML
OIL
RDF
All were influenced by RDF
DAML = DARPA Agent Markup Language
OIL = Ontology Inference Layer
DAML+OIL
OWL
OWL is now on track to
become a W3C Recommendation!
OWL
Η OWL είναι πανομοιότυπη με την RDF Schemas παρέχει XML λεξικό για να καθορίσει classes,
properties και relationships.
Η RDF Schema επιτρέπει την έκφραση
στοιχειωδών σχέσεων και έχει περιορισμένη
ικανότητα συμπερασματολογίας
Η OWL επιτρέπει ακόμα πιο πλούσιες σχέσεις με
αποτέλεσμα την μεγαλύτερη ικανότητα στη
παραγωγή συμπερασμάτων
Το βασικό προτέρημα της OWL είναι η ικανότητα
παραγωγής συμπερασμάτων
OWL and RDF Schema
OWL
Semantics
RDF Schema
XML/DTD/XML Schemas
Syntax
OWL = RDF Schema + more
OWL επεκτείνει την RDF Schema
logical expressions
data-typing
cardinality
Όλα τα στοιχεία και οι ιδιότητες που έχει η RDF και η
RDF Schema μπορούν να χρησιμοποιηθούν σε ένα
OWL αρχείο.
Τα επίπεδα της OWL
OWL Lite:
Ιεραρχία κατάταξης
Απλοί περιορισμοί
OWL DL:
Μέγιστη εκφραστικότητα
Τυποποιημένος καθορισμός
Συνέπεια
OWL Full:
Πολύ μεγάλη εκφραστικότητα
Δεν έχει συνέπεια
Μη τυποποιημένος καθορισμός
Όλη η συντακτική ελευθερία της RDF
Αυτο-διορθούμενη (self-modifying)
Full
Δεν έχει περιορισμούς στην έκφραση (as long as
legal RDF)
Classes as instances (and much more)
RDF θεωρητικό μοντέλο
Συμπερασματολογία πρώτης τάξης
Μέσω αξιωμάτων
Η σημασιολογία πρέπει να ανταποκρίνεται στη
σημασιολογία OWL DL
Για περιορισμένα KBs
DL
Χρήση OWL περιορισμένου λεξιλογίου
Δεν μπορεί να χρησιμοποιηθεί για πολύπλοκες
εφαρμογές (Can’t be used to do “nasty things” (I.e.,
modify OWL))
No classes as instances
Defined by abstract syntax
Μοντέλο πρώτης τάξης
Απευθείας ανταπόκριση με την FOL
DL συμπερασματολογία
LITE
Μη σαφής «άρνηση ή ένωση»
Περιορισμένη ποσότητα (0/1)
No nominals (oneOf)
Σημασιολογία όπως στη DL
Συμπερασματολογία με DL μηχανισμούς
(+datatypes)
–E.g., FaCT, RACER, Cerebra
Ποιος ανακάλυψε το
σημασιολογικό ιστό
Tim Berners-Lee
Φυσικός, Εφευρέτης του παγκοσμίου
ιστού
(1996)
Το πρόβλημα
Σύμφωνα με το UC Berkley, ο κόσμος παράγει 1-2 exabytes
καινούργια δεδομένα κάθε χρόνο. 1 εκατομμύριο terabytes
Τα 2/3 των επιχειρήσεων στην Ευρώπη και στην Αμερική
υποφέρουν από υπερφόρτωση πληροφορίας και δεν έχουν
χρόνο να μοιραστούν την πληροφορία
Οι υπάλληλοι ξοδεύουν 8 ώρες μέσο όρο την βδομάδα
αναζητώντας και χρησιμοποιώντας εξωτερική πληροφορία. Αυτό
σημαίνει για τις αμερικάνικες επιχειρήσεις $107 δισεκατομμύρια
τον χρόνο. Θα ήταν πολύ σημαντικό να δινόταν η ευκαιρία στις
εταιρείες να αυξήσουν την παραγωγικότητα κάνοντας την
εξωτερική πληροφορία προσβάσιμη
Η πληροφορία του περιεχομένου (information content) είναι μία
επιχείρηση $152 δις.
Τι είναι ο ιστός σήμερα
Μία ψηφιακή βιβλιοθήκη
Μία βιβλιοθήκη με αρχεία που λέγονται ιστοσελίδες
συνδεδεμένα μεταξύ τους με hypermedia of links
Μία βάση δεδομένων, μία πλατφόρμα
Μία κοινή πύλη για εφαρμογές προσβάσιμες μέσω σελίδων
του ιστού, και παρουσιάζοντας τα αποτελέσματα στις
σελίδες του ιστού
Μία πλατφόρμα για πολυμέσα
Terminator 3 trailers!
Ένας τρόπος αναπαράστασης
Είναι ένα μέρος όπου οι άνθρωποι κάνουν τη δουλειά και οι
υπολογιστές κάνουν μόνο την παρουσίαση
Γιατί να μην κάνουν οι υπολογιστές τη δουλειά
Τι είναι το διαδίκτυο σήμερα
Είναι ένα σύνολο από πηγές και συνδέσεις
Για τους χρήστες αυτό είναι κάτι πολύ συναρπαστικό
Για τους υπολογιστές όμως όχι αφού δεν μπορούν να
επεξεργαστούν την καταχωρημένη πληροφορία
Το νόημα της πληροφορίας είναι διαθέσιμο μόνο σε
αυτούς που γνωρίζουν καλά αγγλικά
Τι είναι το σημασιολογικό
διαδίκτυο ?
Από το άρθρο in Scientific American [Berners-Lee,
Lassila, Hendler]:
“The Semantic Web is not a separate Web but an
extension of the current one, in which information is
given well-defined meaning, better enabling computers
and people to work in cooperation.”
Οι υπολογιστές έχουν πρόσβαση σε δομημένη πληροφορία
(μία παγκόσμια κοινή βάση δεδομένων) και σε ένα σύνολο
από συμπερασματικούς κανόνες με σκοπό την αυτόματη
παραγωγή συμπερασμάτων
Τι είναι το σημασιολογικό
διαδίκτυο ?
Είναι ένα σύνολο από πηγές και συνδέσεις
Οι υπολογιστές θα μπορούν να παράγουν
συμπεράσματα έχοντας πρόσβαση σε κατανοητή σε
αυτούς γνώση
Για τους χρήστες αυτό είναι κάτι πάρα πολύ πιο
συναρπαστικό
Παράδειγμα
Φανταστείτε να πηγαίνατε σε μία μηχανή αναζήτησης και να θέλετε να
μάθετε
"How many train lines are there in Japan?" «πόσες γραμμές τραίνου
υπάρχουν στην Ιαπωνία?"
Στο σημερινό διαδίκτυο
Θα πάρεις πολλές σελίδες για απάντηση αλλά μπορεί σε καμιά να μην είναι η
απάντηση
Στο σημασιολογικό ιστό:
• http://www.transit.co.jp/lines λέει οι γραμμές τραίνου είναι πάνω από 5000
• Υπάρχει μία βάση που παρέχει τέτοιες πληροφορίες αλλά χρειάζεται κωδικό
•
•
προσβασης
Υπάρχει μια υπηρεσία διαδικτύου που μπορεί να υπολογίσει αλλά κοστίζει 500
yen
Μπορώ να βρω την απάντηση αλλά θα πάρει λίγες ώρες να το υπολογίσω
Σημασιολογικός ιστός και
οντολογίες
Οι οντολογίες προσφέρουν μία εννοιολογική θεωρία ενός
πεδίου ενδιαφέροντος κάνοντας την γνώση
επαναχρησιμοποίηση και διαμοιραζόμενη
Τα νέα διαδικτυακά πρότυπα κάνουν κατανοητή τη
σημασιολογία της πληροφορίας από τους υπολογιστές
Εκατομμύρια μικρές μηχανές συμπερασματολογίας
παρέχουν αυτόματη επίτευξη εργασιών έχοντας
πρόσβαση στη πληροφορία
Αυτό δίνει μία τελείως καινούργια προοπτική για
την πρόσβαση και την επεξεργασία της
πληροφορίας
Ωστόσο ξεπερνώντας τα σημερινά προβλήματα
δημιουργούνται κάποια νέα
Προβλήματα
Η μαζική δημιουργία οντολογιών θα δημιουργήσει
σημασιολογική πληροφορία επεξεργάσιμη από τους
υπολογιστές
Αυτό θα φέρει κάποια προβλήματα. Η χειροκίνητη
δημιουργία οντολογιών είναι δαπανηρή και
χρονοβόρα
Πρέπει να βρεθεί τρόπος ημι-αυτόματης δημιουργίας
οντολογιών με τη χρήση τεχνικών NLP, information
extraction, and machine intelligence
Προβλήματα
Η περιγραφή υλικού είναι πολύ δύσκολη
Χρειάζονται τρόποι αυτόματης περιγραφής
Έλλειψη μηχανών παραγωγής συμπερασμάτων
Δεν υπάρχει τυποποιημένη γλώσσα
Ο παγκόσμιος ιστός σήμερα
resource
href
href
resource
resource
href
href
resource
href
resource
href
resource
href
resource
href
resource
Μία σελίδα στο σημασιολογικό ιστό
<USE-ONTOLOGY ID="cs-dept-ontology" VERSION="1.0" PREFIX="cs" URL=
"http://www.cs.umd.edu/projects/plus/SHOE/cs.html">
<CATEGORY NAME="cs.Professor" FOR="http://www.cs.umd.edu/users/hendler/">
<RELATION NAME="cs.member">
<ARG POS=1 VALUE="http://www.cs.umd.edu/projects/plus/">
<ARG POS=2 VALUE="http://www.cs.umd.edu/users/hendler/">
</RELATION>
<RELATION NAME="cs.name">
<ARG POS=2 VALUE="Dr. James Hendler">
</RELATION>
which are in HTML format, but aren't using standard HTML tags, and thus didn't show
up when you went to the web page.
Πως γίνεται
Ο σχολιασμός της σελίδας είναι σε μορφή κατανοητή
από τους υπολογιστές. Το "Use-ontology" παρέχει
έναν δείκτη σε μία οντολογία
Όταν ένας crawler ψάχνει για τέτοιου είδους
σημασιολογικό υλικό βρίσκει αυτή τη πληροφορία
(την οποία δεν βλέπουμε εμείς) και την χρησιμοποιεί.
Ποιο είναι το μυστικό?
Τα μεταδεδομένα!!
Κάνουν σαφή την πληροφορία που είναι αόριστη (making explicit the
implicit)
Εκθέτουν την πληροφορία για αναζήτηση, επεξεργασία και ενοποίηση.
Μεταδεδομένα περιγραφών
Δεδομένα που περιγράφουν το περιεχόμενο και τη σημασία των
πηγών
Αλλά όλοι πρέπει να μιλάνε την ίδια γλώσσα
Ορολογίες & Οντολογίες
Διαμοιραζόμενα και κοινά λεξιλόγια
Για μηχανές εύρεσης και πράκτορες
Διαμοιραζόμενη και κοινή κατανόηση ενός πεδίου ενδιαφέροντος
Απαραίτητες για ανταλλαγή και αναζήτηση
Συμπερασματολογία
Εξαγωγή καινούργιας γνώσης και μεταδεδομένων από την
υπάρχουσα γνώση
Η δύναμη είναι στα
μεταδεδομένα
“The concept of machine-understandable documents does not
imply some magical artificial intelligence which allows machines
to comprehend human mumblings. It only indicates a machine's
ability to solve a well defined problem by performing welldefined operations on existing well-defined data. Instead of
asking machines to understand people's language, it involves
asking people to make the extra effort”
Tim Berners-Lee
Πως φτιάχνουμε το
σημασιολογικό ιστό
Εξέλιξη (evolution)
Επίπεδα (layers)
Σημασιολογική διασύνδεση (semantic linking)
Περιεχόμενο (content)
Εξέλιξη
Η σημασιολογική πληροφορία που είναι συσχετισμένη με πηγές
στο διαδίκτυο (ως μεταδεδομένα) μπορεί να ερμηνευτεί και να
συνδυαστεί από τις μηχανές με στόχο την παραγωγή λογικής
Μία πλατφόρμα για μηχανές εύρεσης και έξυπνους πράκτορες
Εξέλιξη του σημερινού διαδικτύου έτσι ώστε η πληροφορία να
μπορεί να επεξεργαστεί από ανθρώπους και μηχανές
Ο σημασιολογικός ιστός δεν αντικαθιστά το σημερινό παγκόσμιο
ιστό. Το διαδίκτυο έχει ήδη δισεκατομμύρια σελίδες.
Πρέπει όλες να είναι σημασιολογικές?
Ο σημασιολογικός ιστός κάθεται δίπλα στο σημερινό παγκόσμιο
ιστό
Που βρίσκονται οι παρούσες
προσπάθειες?
Καθορίζουν τις γλώσσες που θα πλαισιώσουν το σημασιολογικό
ιστό
ΝΑ ΚΑΘΟΡΙΣΤΕΙ
Καθορίζουν και αναπτύσσουν την αρχιτεκτονική και τα εργαλεία
που θα χρησιμοποιηθούν στο σημασιολογικό ιστό
ΝΑ ΦΤΙΑΧΤΕΙ
Χρησιμοποιούν τα εργαλεία και τις γλώσσες για να περιγράψουν
το υλικό σε εφαρμογές
ΝΑ ΕΦΑΡΜΟΣΤΕΙ
Επίπεδα
Είμαστε εδώ
OWL
DAML+OIL
SHOE
Πως θα γίνουν οι περιγραφές?
Χειροκίνητα
«Κανείς δεν θα περιγράψει τις σελίδες του με το
χέρι»
Οι «μανιακοί» με τους υπολογιστές θα το κάνουν
Οι εταιρείες θα το κάνουν
Αυτόματη περιγραφή
Natural language processing
Τι θα γίνει με τις εικόνες τον ήχο τα βίντεο?
Αυτόματη περιγραφή
Μέθοδοι εξαγωγής πληροφορίας στον σημασιολογικό
ιστός
Βοηθάει στην περιγραφή των αρχείων
Ενοποιεί την πληροφορία από διαφορετικές πηγές
Αποτέλεσμα
Ελάττωση του χρόνου περιγραφής
Ανάκτηση και ενοποίηση ανομοιογενούς
πληροφορίας
ΠΩΣ ?
Γλωσσολογική ανάλυση
Οντολογική μάθηση από κείμενο (ontology learning from text)
Γλωσσολογική/σημασιολογική ανάλυση του κειμένου με
σκοπό την εξαγωγή κλάσεων
Καταγραφή γνώσης από κείμενο (knowledge markup of text)
Γλωσσολογική/σημασιολογική ανάλυση του κειμένου με
σκοπό την εξαγωγή στιγμιότυπων
Οντολογική μάθηση
για κλάσεις
Κείμενο
Καταγραφή γνώσης
για στιγμιότυπα
Οντολογία
Γλωσσολογική ανάλυση:
Παράδειγμα
«Ο υπολογιστής με την επίπεδη οθόνη πρέπει να
απορριφθεί γιατί έχει βλάβη στη μητρική κάρτα»
Υπολογιστής
Έχει-μία
Επίπεδη οθόνη
Απόρριψη
Έχει-μία
κινούμενη-οντότητα
Μητρική
Τοποθεσίας-της
Βλάβη
Επίπεδα γλωσσολογικής
ανάλυσης
Λεξική ανάλυση
κλάσεις λέξεων
Ανάλυση προτάσεων
Η δομή των προτάσεων
Ανάλυση σημασιολογίας
Το νόημα των προτάσεων
Πότε θα συμβεί?
Πρώιμες εφαρμογές
Υπηρεσίες στον ιστό
Ενοποίηση της πληροφορίας
Σημασιολογική αναζήτηση
Διαχείριση γνώσης
Διαφημίσεις
Οι «μανιακοί»
Ποια είναι η βασική εφαρμογή?
Είναι η βασική εφαρμογή (killer application) ο ίδιος ο
σημασιολογικός ιστός όπως λέει ο Hendler ?
Το διαδίκτυο δημιούργησε το ηλεκτρονικό εμπόριο
όχι το ηλεκτρονικό εμπόριο το διαδίκτυο
Υποστήριξη στους ανθρώπους που ξοδεύουν το
χρόνο τους κάνοντας πραγματικότητα το
σημασιολογικό ιστό
Βήθεια για τη δημιουργία εφαρμογών (εύκολα και
φτηνά) Hendler
Κανείς δεν περίμενε ότι ένα μαρούλι θα έχει URL
Τι θα γίνει
Ο παγκόσμιος ιστός θα υπάρχει όπως σήμερα
Δεν θα υπάρχει ένας σημασιολογικός ιστός αλλά
πολλοί ειδικοί σημασιολογικοί ιστοί
Κλιμακωτές τεχνολογίες και διαχείριση
Ποιος καταλαβαίνει όλα αυτά?
Πρέπει να είναι προσβάσιμο
στους προγραμματιστές και
αόρατο στους χρήστες των
εφαρμογών
Να απλοποιηθεί για τους
προγραμματιστές και τους
χρήστες
Ποιες είναι οι εφαρμογές?
Agents Multimedia data
Database technologies
Natural language
Digital libraries
Ontologies
e- business
Searching and querying
e- science and the Grid
Services and service
description
Integration, mediation and
storage
Natural Language
Processing
Software Engineering
Trust and meaning
Security
Knowledge representation
and reasoning
User interfaces
Languages and
infrastructure
Visualisation and modelling
Metadata (inc. generation
and authoring)
Web mining
Σημασιολογικός ιστός και
πολυμέσα
Ποια η σχέση τους:
Η συνεχής αύξηση του διαθέσιμου πολυμεσικού υλικού
Η εξαγωγή σημασιολογικής πληροφορίας από πολυμεσικό
υλικό είναι παρά πολύ δυσκολότερη από ότι στο κείμενο
Πολυμεσικός σημασιολογικός ιστός
Περιγραφή οπτικοακουστικού υλικού
Διαλοιτουργιότητα ευφυών εφαρμογών πολυμέσων
MPEG-7 : multimedia content description interface
Περιγραφή οπτικοακουστικού υλικού σε πολλά επίπεδα
Πολυμεσικές εφαρμογές γενικά
Ελλείψεις του MPEG-7
Οντολογική γλώσσα για την δημιουργία
διαμοιραζόμενης και κοινής γνώσης
Τυποποιημένη μηχανή παραγωγής συμπερασμάτων
Πρότυπο για πολυμεσικές υπηρεσίες στο
σημασιολογικό ιστό
Πως θα συνδυαστούν
Εναρμόνιση των τεχνολογιών του σημασιολογικού
ιστού με τα πολυμεσικά πρότυπα
Επέκταση των οντολογικών γλωσσών για την
περιγραφή χαμηλού επιπέδου πολυμεσικών
χαρακτηριστικών (low level descriptors)
Ανάγκη δημιουργίας πολυμεσικών οντολογιών
(MPEG-7 ontology Hunter)
Ικανότητα εισαγωγής οπτικοακουατικής
πληροφορίας σε οντολογίες (visual models, images,
videos)
Επέκταση των υπαρχουσών μηχανών παραγωγής
συμπερασμάτων για πολυμεσικές εφαρμογές
Περιγραφή οπτοκοακουστικού
υλικού
Η περιγραφή του οπτικοακουστικού υλικού είναι από
τα βασικότερα προβλήματα
Χωρίς την περιγραφή δε μπορεί να υπάρχει
αναζήτηση με βάση το περιεχόμενο
Η χειροκίνητη περιγραφή είναι πολύ δαπανηρή και
χρονοβόρα
Πρέπει να βρεθεί τρόπος αυτόματης περιγραφής
οπτικοακουστικού υλικού
Αυτόματη περιγραφή
Γίνονται πάρα πολλές προσπάθειες από πολλές
ερευνητικές ομάδες για την επίτευξη αυτού του
στόχου
Χρειάζεται ο συνδυασμός πολλών τεχνολογιών
Επεξεργασία εικόνας και βίντεο
Επεξεργασία ήχου
Ευφυείς τεχνικές
Τεχνολογίες γνώσης
Επεξεργασία εικόνας και
βίντεο
Semantic segmentation
Summarization
Tracking
…
Υπηρεσίες στο διαδίκτυο και ο
σημασιολογικός ιστός
Υπηρεσίες:
Προγράμματα και συσκευές που είναι προσβάσιμες
στον παγκόσμιο ιστό
Κάνουν εργασίες που μπορεί να είναι από πολύ
απλές αναζητήσεις μέχρι πολύπλοκες επιχειρηματικές
λειτουργίες
Θα μετατρέψουν τον παγκόσμιο ιστό από μία
συλλογή πληροφοριών σε ένα κατανεμημένο δίκτυο
υπηρεσιών
Οι υπηρεσίες στον παγκόσμιο ιστό απαιτούν
σημασιολογική ανάλυση της πληροφορίας
Παγκόσμιος ιστός και
υπηρεσίες
Ο παγκόσμιος ιστός είναι οργανωμένος γύρο από
URIs, HTML, και HTTP.
URIs παρέχουν καθορισμένα ids για αναφορά στα
στοιχεία στον ιστό
HTML παρέχει ένα τυποποιημένο τρόπο για την
περιγραφή δομών αρχείων (allowing browsers to
render information for the human reader), και
HTTP καθορίζει ένα πρωτόκολλο για την ανάκτηση
πληροφορίας από τον ιστό
==> οι υπηρεσίες στον ιστό απαιτούν παρόμοια δομή
γύρο από τα UDDI, WSDL, and SOAP.
Παγκόσμιος ιστός και
υπηρεσίες
UDDI
WSDL
SOAP
URI
HTML
HTTP
Παγκόσμιος ιστός και
υπηρεσίες
UDDI: παρέχει ένα μηχανισμό ώστε οι χρήστες να
βρίσκουν υπηρεσίες στον παγκόσμιο ιστό
WSDL: καθορίζει τις υπηρεσίες σαν συλλογές από
network endpoints and ports
SOAP: καθορίζει έναν ομοιόμορφο τρόπο για την
διάδοση XML δεδομένων
Τα βασικά πρότυπα για
υπηρεσίες στον ιστό
•Communication
•SOAP
•Interface/Signature Description
•WSDL
•Process Flow
•BPEL4WS
•Service Discovery
•UDDI
Πρότυπα...
Πολλά άλλα πρότυπα υπάρχουν
Transport
DIME - Direct Internet Message Encapsulation
HTTPR - Reliable HTTP
Packaging & Extensions
SOAP-DSIG - SOAP Security Extensions: Digital Signature
SWA - SOAP - Messages with Attachments
WS-License - Web Services License Language
WS-Referral - Web Services Referral Protocol
WS-Routing - Web Services Routing Protocol
WS-Security - Web Services Security Language
Πρότυπα...
Πολλά άλλα πρότυπα υπήρχαν στο παρελθόν
Description
BPEL4WS - Business Processing Execution Language for
Web
WSCM - Web Services Component Model
WSMF - Web Services Modeling Framework
WSML - Web Services Meta Language
WSOL - Web Service Offerings Language
WSXL - Web Services Experience Language
WSUI - Web Services User Interface
XLANG - Web Services for Business Process Design
Discovery
USML - UDDI Search Markup Language
WS-Inspection - Web Services Inspection Language
Πρότυπα για υπηρεσίες στο
σημασιολογικό ιστό
Αναπαράσταση
RDF
Περιγραφική λογική
DAML+OIL & OWL
Υπηρεσίες οντολογίες
DAML-S
Service Profiles
Process Models
Service Grounding
DAML-S
DAML-S: Darpa Agent Markup Language for Services
Μία “upper” οντολογία για την περιγραφή των ιδιοτήτων και
των ικανοτήτων των διαμεσολαβητών και των υπηρεσιών
DAML+OIL οντολογία για υπηρεσίες στον παγκόσμιο ιστό
Εμπνευσμένη από τις γλώσσες περιγραφής της τεχνητής
νοημοσύνης
Εκφραστικότητα
Καλή καθορισμένη σημασιολογία
Οντολογίες για αντιστοίχηση, επαναχρησιμοποίηση, υποστήριξη
Η χρησιμότητα της σημασίας
για τις υπηρεσίες
Οι υπηρεσίες του ιστού θα επωφεληθούν από την
χρήση της σημασιολογίας
Για παράδειγμα, η DAML είχε σχεδιαστεί να παρέχει
οντολογίες και περιγραφική λογική για υπηρεσίες για
την ενίσχυση της διαλειτουργικότητας
Ο σημασιολογικός ιστός παρέχει εκτεταμένο
σημασιολογικό πλαίσιο για την περιγραφή και την
παρουσίαση σημασιολογικού περιεχομένου
Τι παρέχει
Διαλειτουργικότητα
Αυτόματη σύνθεση υπηρεσιών
Πρόσβαση στη γνώση του διαδικτύου
DAML-S
Μία οντολογία για υπηρεσίες στον παγκόσμιο ιστό
Ευκολία εκφραστικότητας
Δυνατότητα αυτόματων υπηρεσιών και χρήση από
διαμεσολαβητές
Δυνατότητα παραγωγής συμπερασμάτων σε
υπηρεσίες
Το cake των υπηρεσιών
WSMF
Υπάρχουν ακόμα πολλά σημαντικά στοιχεία που
λείπουν από τα προηγούμενα πρότυπα/πλαίσια. Πολύ
σημαντικό είναι η χαλαρή σύζευξη και η βαθμωτή
διαμεσολάβηση των υπηρεσιών σε ένα κατάλληλο
πλαίσιο
==> για το λόγο αυτό δημιουργήθηκε το Web
Service Modelling Framework (WSMF). Παρέχει ένα
πλούσιο εννοιολογικό μοντέλο για την ανάπτυξη και
την περιγραφή υπηρεσιών στον ιστό
WSMF
H φιλοσοφία του του WSMF είναι βασισμένη στα
ακόλουθα
Μέγιστη αποσύνδεση με
Βαθμωτή διαμεσολάβηση υπηρεσιών
WSMF
Το WSMF περιέχει 4 βασικά στοιχεία:
•Οντολογίες που παρέχουν την ορολογία
•Καθορισμό των στόχων και των
προβλημάτων που πρέπει να λυθούν
•Περιγραφές των υπηρεσιών που
καθορίζουν μία υπηρεσία στον ιστό
•Διαμεσολαβητές που χρησιμεύουν για
την προσπέραση διαλειτουργικών
προβλημάτων
WSMF
To WSMF παρέχει ένα πλαίσιο για peer to peer επικοινωνία
P2P: επικοινωνία απευθείας μεταξύ των endpoints χωρίς
μεσολαβήσεις
Endpoints: trading partners, application systems, web services,
i.e “anything that can be invokes and responds”
WSMF αρχές:
Ισχυρή αποσύνδεση
Κάθε endpoint είναι αυτόνομο στην ανταλλαγή της
συμπεριφοράς μηνυμάτων και του περιεχομένου του
μηνύματος
Διαμεσολάβηση
Εκτεταμένη υποστήριξη για την γεφύρωση των δεδομένων και
των διαδικαστικών διαφορών που δημιουργούνται από την
ισχυρή αποσύνδεση
DAML-S Vs WSMF
Το WSMF καθορίζει ένα εννοιολογικό μοντέλο για την
παροχή υπηρεσιών στον σημασιολογικό ιστό σαν ένα
πλαίσιο για eWork και eCommerce
Οι βασικές του αρχές είναι το ισχυρή αποσύνδεση
(strong decoupling) μεταξύ των παραγόντων για τη
δημιουργία eComerce εφαρμογών
Ισχυρή διαμεσολάβηση που κάνει δυνατή την
επικοινωνία όλων με όλους
Για το καθορισμό της σύνταξης και της
σημασιολογίας, μπορεί να χρησιμοποιηθεί η DAML-S
DAML-S Vs WSMF
Η DAML-S είναι μία οντολογία σε OWL για την
εισαγωγή σημασιολογίας στις περιγραφές των
υπηρεσιών
Όμως, DAML-S έχει δύο βασικά ελαττώματα
Πρώτον, έχει έλλειψη από βασικές αρχές
μοντελοποίησης που είναι σημαντικές για την
περιγραφή υπηρεσιών στο σημασιολογικό ιστό
Η DAML-S πρέπει να αναδιαμορφωθεί για αυτούς
τους σκοπούς
DAML-S Vs WSMF
Δεύτερον, δεν παρέχει τη σημασιολογία για πολλές
από τις αρχές που εκφράζονται σε αυτήν
Η OWL είναι μία γλώσσα βασισμένη στην
περιγραφική λογική και δεν παρέχει περιγραφικές
καταστάσεις και μεταβατικές καταστάσεις
Για παράδειγμα, εκφράζοντας μία διαδικασία σαν μία
οντότητα στην OWL δεν προσθέτει σημασιολογία σε
αυτό τον όρο
Ποιος θα το κάνει πραγματικότητα?
ΕΣΥ!