Diapositiva 1

Download Report

Transcript Diapositiva 1

Łódź, 5 listopada 2012 roku
Technologie
mgr inż. Tomasz Węgliński
email: [email protected]
www: http://www.tweglinski.pl
WYKŁAD 12
Semantic Web
2/34
Plan wykładu
 Na wykładzie omówimy sobie następujące zagadnienia:
 Bariery współczesnego Internetu
 Co to jest Semantic Web i jakie są jego idee?
 Przykładowe wizje działania
 Semantyczny Internet czy sztuczna inteligencja?
 Kluczowe pojęcia i technologie
 Warstwowość technologii i struktura działania
 Podsumowanie
 Literatura
Wykład 12: Semantic Web
3/34
Bariery
WWW
Powstanie sieci WWW (ang. World Wide Web) na zawsze zmieniło
sposób komunikacji międzyludzkiej i biznesowej.
 Podstawowe zastosowana Internetu to:
 wyszukiwanie informacji
 zbieranie informacji (często z wielu źródeł)
 komunikacja z innymi ludźmi (portale społecznościowe, blogi etc.)
 przeszukiwanie internetowych baz filmów, muzyki, książek…
 przeglądanie ofert firmowych
 zakupy w sieci i aukcje internetowe
 wypełnianie formularzy bankowych, sklepowych, urzędowych…
Treści prezentowane w Internecie są przekazywane w sposób
przyjazny dla odbiorcy.
Programiści stron i aplikacji WWW przykładają bardzo dużą wagę do
tworzenia jak najbardziej „przyjaznego” interfejsu użytkownika.
Wykład 12: Semantic Web
4/34
Bariery
WWW
Sukces Internetu został osiągnięty w dużej mierze dzięki tzw.
wyszukiwarkom internetowym (Google, Yahoo, Alta Vista etc…).
 Użytkownicy korzystający z wyszukiwarek na co dzień borykają się
jednak z wieloma z problemami typu:
 Dużo wyników, mało interesujących nas treści
 Mało wyników lub ich brak
 Wrażliwość na słownictwo (poprawność słów kluczowych)
 Szeroki rozrzut informacji (kolekcjonowanie informacji z wielu stron)
 Czas poświęcony na zbieranie informacji jest za długi (!)
 Trudność z oceną wiarygodności informacji na stronie (wpisy na
forum, opinie użytkowników produktu)
„The amount of Web content
outspaces technological process”
-- G. Antoniou, F. van Harmelen, The Semantic Web Vision, MIT, 2004
Wykład 12: Semantic Web
5/34
Bariery
WWW
Dlaczego wyszukiwarki internetowe mają
małą skuteczność?
 Analiza języka naturalnego jest bardzo trudna
 Treści przekazywane w Internecie są „nieprzyjazne maszynowo”
 Prosty przykład:
 I am a professor of computer science.
 I am a professor of computer science, you may think. Well…
…a może użyć technik przetwarzania tekstu,
sztucznej inteligencji…?
Wykład 12: Semantic Web
6/34
Idea
Semantic Web
 Idea Semantic Web (tłum.: Semantyczny Internet):
To nie treści (dane) są złe,
tylko sposób ich przetwarzania.
 Treści powinny być przekazywane aplikacji w sposób „przetwarzalny
maszynowo” (ang. machine-processable)
 Podejście to jest ewolucją, nie rewolucją dla współczesnego Internetu
 Semantyczny Internet to marzenie i wizja jego twórcy
– Tima
Bernersa – Lee
 Organizacje rządowe wspierają ideę Semantic Web:
 Europen Union’s Sixth Framework Programme
 DARPA Agent Markup Language (DAML)
Wykład 12: Semantic Web
7/34
Przykładowe
wizje działania
Niemal wszystkie obszary działania oraz zastosowania
współczesnego Internetu wymagają usprawnienia.
Potrzeba wprowadzenia w życie idei i wizji Semantic Web jest
widoczna na co dzień zarówno w sferze biznesu jak i prywatnej.
 Zarządzanie wiedzą (ang. Knowledge Management)
- to próba jak najlepszego wykorzystania wiedzy, która jest dostępna
w organizacji, tworzenie nowej wiedzy oraz zwiększanie jej
zrozumienia.
 Aktualne problemy:
 uciążliwe wyszukiwanie, kolekcjonowanie i gromadzenie informacji
 czasochłonne dotarcie do już zgromadzonej informacji, aktualizacje
 prezentowanie informacji (różni odbiorcy, różne potrzeby)
Wizja Semantic Web:
Wiedza zostanie zorganizowana w tzw. semantyczne przestrzenie
pojęciowe (ang. conceptual spaces), zgodnie z ich znaczeniem.
Wykład 12: Semantic Web
8/34
Przykładowe
wizje działania
B2C E-commerce (ang. Business-to-consumer Electronic Commerce)
- to nazwa relacji występujących pomiędzy firmą a klientem końcowym,
często realizowanych za pomocą Internetu (przegląd ofert, wybór,
kupno).
Przykłady: Allegro, Ebay, Amazon, Morele…
 Aktualne problemy:
 czasochłonne przeglądanie ofert
 nie sposób przejrzeć i wybrać wszystkich dostępnych ofert
 przed zakupem często nie znamy cen rynkowych
 często kupujemy „na ślepo” – im drożej tym musi być lepiej…
 Przeglądanie ofert wspomagają tzw. przeglądarki cenowe
(ang. shopbots).
Posiadają one jednak wady charakterystyczne dla typowych
wyszukiwarek internetowych.
Przeglądarki cenowe nie są w stanie przeanalizować wszystkich
cennych informacji, np. kosztów przesyłki i czasu dostawy.
Wykład 12: Semantic Web
9/34
Przykładowe
wizje działania
B2C E-commerce (ang. Business-to-consumer Electronic Commerce)
Wizja Semantic Web:
Opracujmy inteligentne programy, tzw. agentów
(ang. software agents), którzy będą umieć interpretować
informacje o produkcie oraz politykę działania firmy.
 Zalety (zadania) agentów internetowych są oczywiste:
 precyzyjny proces zbierania informacji o produkcie i producencie
 pobieranie, kolekcjonowanie oraz interpretowanie opinii klientów
 przeprowadzenie automatycznych negocjacji ofert (z innymi agentami)
zgodnie z ustaleniami i preferencjami klienta
Wykład 12: Semantic Web
10/34
Przykładowe
wizje działania
B2B E-commerce (ang. Business-to-Business Electronic Commerce)
- to nazwa relacji występujących pomiędzy firmami, określana często
mianem "klasycznego" e-biznesu.
 Aktualne problemy:
 transfer danych za pomocą EDI (ang. Electronic Data Interchange)
jest skomplikowany i zrozumiały tylko dla ekspertów
 EDI jest kosztowny i nie jest łatwy w integracji z innymi aplikacjami
biznesowymi
 język HTML używany do prezentacji danych w sieci WWW nie
posiada ustalonej struktury ani semantyki (problem wyszukiwania
informacji)
 wykorzystanie dokumentów XML do komunikacji B2B wymaga
ustalenia wspólnej, jednolitej struktury danych oraz nazewnictwa
Wizja Semantic Web:
Niezgodność terminologii oraz struktury danych zostanie
wyeliminowana przez tzw. modele abstrakcji danych oraz ich
interpretery (ang. translation services) z wykorzystaniem agentów.
Wykład 12: Semantic Web
11/34
Przykładowe
wizje działania
Agenci personalni (ang. Personal Agents)
- to specjalistyczne programy komputerowe, których zadaniem jest
ułatwienie codziennej pracy, poprzez automatyczne lub
półautomatyczne wykonywanie powierzonych im zadań w Internecie.
 Przykład Michael’a:
- Michael miał wypadek samochodowy, po którym chciałby udać się do
najlepszego specjalisty w mieście, zlecając jego wybór swojemu
personalnemu Agentowi.
- Michael jak każdy człowiek ma swoje osobiste preferencje i wie jakie
cechy powinien posiadać jego lekarz.
- Michael jest także bardzo zajętym człowiekiem, nie może umawiać
się w dowolnym terminie.
Wizja Semantic Web:
Z kilku ofert przedstawionych przez Agenta, Michael z zadowoleniem
wybiera swojego lekarza, blisko domu i w przystępnej cenie.
Dodatkowo jest już umówiony na pierwszą wizytę!
Wykład 12: Semantic Web
12/34
SW vs. AI
Semantyczny Internet == Sztuczna Inteligencja ??
Większość technologii używanych do realizacji założeń Semantic Web
opiera się na dotychczasowych osiągnięciach sztucznej inteligencji.
Sztuczna inteligencja (ang. Artificial Intelligence) to dział informatyki,
którego przedmiotem jest badanie reguł rządzących inteligentnymi
zachowaniami człowieka, tworzenie modeli formalnych tych zachowań,
a w rezultacie programów komputerowych symulujących te zachowania.
 Zasadnicza różnica:
AI
--- podejmowanie decyzji za człowieka
SW
--- wspomaganie decyzji podejmowanych przez człowieka
„The realization of the Semantic Web vision does
not rely on human-level intelligence;
the challenges are approached in different way”
-- G. Antoniou, F. van Harmelen, The Semantic Web Vision, MIT, 2004
Wykład 12: Semantic Web
13/34
Podstawowe
pojęcia SW
Współcześnie, głównym zadaniem twórców Semantycznego Internetu
jest integracja, standaryzacja, rozwój narzędzi użytkowych oraz
wprowadzenie ich do codziennego użytku.
 Do słownika podstawowych terminów związanych z SW należą:
 metadane (ang. explicit metadata)
 ontologie (ang. ontologies)
 logika (ang. logic)
 agenci (ang. agents)
Każdy z wyżej wymienionych terminów kryje w sobie zestaw
nowoczesnych technologii pozwalających na spełnienie wymagań
i założeń idei Semantycznego Internetu.
Wykład 12: Semantic Web
14/34
Standardowe
dane
 Metadane (ang. explicit metadata)
 Współczesne podejście (HTML):
<h1>Agilitas Physiotherapy Centre</h1>
Welcome to the home page of the Agilitas Physiotherapy Centre.
Do you feel pain? Have you had an injury? Let our staff
Lisa Davenport, Kelly Townsend (our lovely secretary)
and Steve Matthews take care of your body and soul.
<h2>Consultation hours</h2>
Mon 11am - 7pm<br>
Tue 11am - 7pm<br>
Czytelne dla ludzi,
Wed 3pm - 7pm<br>
nieczytelne dla maszyn…
Thu 11am - 7pm<br>
Fri 11am - 3pm<p>
But note that we do not offer consultation during the weeks of the
<a href=". . .">State Of Origin</a> games.
 Ustandaryzowane dane (XML):
<company>
<treatmentOffered> Physiotherapy</treatmentOffered>
<companyName>Agilitas Physiotherapy Centre</companyName>
<staff>
<therapist>Lisa Davenport</therapist>
Oficjalny standard danych
<therapist>Steve Matthews</therapist>
w przyszłości, wymaga
<secretary>Kelly Townsend</secretary>
</staff>
„adaptacji”…
</company>
Wykład 12: Semantic Web
15/34
Ontologie
 Ontologie (ang. ontologies)
- w sensie informatycznym to formalna reprezentacja pewnej dziedziny
wiedzy, na którą składa się zapis zbiorów pojęć (ang. concept) i
relacji między nimi.
- zapis ten tworzy schemat pojęciowy, który stanowi opis danej
dziedziny wiedzy.
- schemat pojęciowy jest podstawą do wnioskowania o
właściwościach opisywanych ontologią pojęć.
- wywodzą się z dziedziny sztucznej inteligencji (podstawa dla SW)
 Dla przykładu ontologie mogą zawierać takie informacje jak:
 właściwości – X uczy Y
 ograniczenia wartości – Tylko pracownicy wydziału mogą prowadzić kursy
 rozłączności – Pracownicy wydziałowi i ochrony nie są ze sobą powiązani
 specyfikacje logicznych powiązań między obiektami –
Każda Katedra musi posiadać co najmniej 10 pracowników wydziałowych
Wykład 12: Semantic Web
16/34
Ontologie
Ontologie wprowadzają porządek znaczeniowy w obrębie domeny,
pomagając uniknąć konfliktów nazw (podobnej terminologii).
Hierarchia znaczeniowa w obrębie domeny (przykład Uniwersytetu)
Wykład 12: Semantic Web
17/34
Ontologie
 Korzyści z zastosowania ontologii:
 łatwiejsza organizacja i nawigacja po stronie (menu, mapy strony…)
 zwiększenie skuteczności wyszukiwarek, wyszukiwanie powiązań
zamiast słów kluczowych
 wspomaganie procesu wyszukiwania – sugestia bardziej lub mniej
złożonych zapytań
 Technologie używane do opisu ontologii:
 XML – ustandaryzowane dane, brak powiązań
 XML Schema – ograniczenia specyficzne dla danych
 RDF – model danych dla obiektów, relacje pomiędzy obiektami
 RDF Schema – opis (pojęciowy) właściwości i klas obiektów RDF
 OWL – rozszerzenie RDF, z bogatszym słownikiem i składnią języka
Podstawą wszystkich wymienionych technologii jest język XML.
Wykład 12: Semantic Web
18/34
Logika
Logika (ang. logic)
- to dział matematyki, którego przedmiotem są formalne teorie
matematyczne i ich modele, dowody oraz zasięg matematycznych
rozumowań.
- przyczyniła się do rozwoju technologii komputerowych, w tym
informatyki teoretycznej
- osiągnięcia logiki formalnej wykorzystywane są w sztucznej
inteligencji
 Przykład wyprowadzeń logicznych:
Wykład 12: Semantic Web
19/34
Logika
Zastosowanie zasad logiki w Sematic Web pozwoli na:
 podejmowanie decyzji przez agentów i wykonywanie określonej
akcji
 możliwość odtworzenia logicznego procesu „myślenia” agenta
Efekt
Zwiększone zaufanie klienta do agenta SW
 możliwość weryfikacji decyzji jednego agenta przez drugiego
Agent I:
Posiadasz dług w wysokości 80 zł
Agent II:
potwierdzam
Wykład 12: Semantic Web
20/34
Aplikacje
agentowe
Agenci (ang. agents)
- to autonomiczne oprogramowanie, aktywnie wspomagające decyzje
użytkownika oraz wykonujące określone przez niego zadania

1)
2)
3)
4)
5)
6)
Podstawowy proces działania agenta:
Definicja zadania i preferencji użytkownika
Kolekcjonowanie informacji i zasobów sieciowych
Komunikacja z innymi agentami
Porównywanie znalezionych informacji z preferencjami użytkownika
Podjęcie decyzji, wybór ofert
Przedstawienie rezultatów działań użytkownikowi
 Agenci wykorzystują wszystkie omówione technologie SW:

Metadane – kolekcjonowanie informacji
z zasobów sieciowych

Ontologie – wspomaganie działania wyszukiwarek, interpretacja
wyników, komunikacja z innymi agentami

Logika – przetwarzanie zebranych informacji, podejmowanie decyzji
Wykład 12: Semantic Web
21/34
Aplikacje
agentowe
Użytkownik w sieci WWW…
Dziś…
W przyszłości…
Wykład 12: Semantic Web
22/34
Warstwowość
technologii
Rozwój technologii Semantic Web podzielony jest na kroki.
Każdy krok buduje kolejną warstwę modelu na szczycie poprzedniej.
 Strukturę warstwową Semantic Web określa się mianem
„warstwowego placka” (ang. layer cake).
Wykład 12: Semantic Web
23/34
Warstwowość
technologii
W budowie kolejnych warstw modelu Semantic Web muszą być
spełnione dwie zasadnicze reguły:
 Kompatybilność wsteczna (ang. downward compatibility)
- aplikacje pracujące w wyższej warstwie muszą umieć interpretować
i wykorzystywać informacje zapisane w niższych warstwach modelu.
 Częściowe rozumienie w przód (ang. upward partial understanding)
- aplikacje pracujące w niższej warstwie muszą posiadać zdolność
do co najmniej częściowego wykorzystania informacji z wyższych
warstw modelu.
Wykład 12: Semantic Web
24/34
Warstwowość
technologii
 Zależności pomiędzy warstwami modelu Semantic Web:
 XML, XML Schema
+ potrafi przechowywać dane w ustandaryzowany sposób,
z użyciem pojęć (nazw elementów) zdefiniowanych przez użytkownika.
+ bierze udział w procesie przesyłu danych przez sieć WWW.
 RDF, RDF Schema
+ podstawowy model danych, zawiera opis zależności między obiektami
+ nie jest zależny od XML, lecz posiada jego składnię
+ RDF Schema bazuje na RDF i jest uboższą wersją OWL
 OWL
+ jest rozszerzeniem możliwości RDF
+ stanowi podstawę do wyprowadzeń logicznych
 Logic
+ wykorzystuje i rozszerza możliwości ontologii do budowy logiki aplikacji
 Proof
+ weryfikuje proces dedukcji oraz działania niższych warstw modelu
 Trust
+ bazując na mechanizmach zabezpieczeń, certyfikacjach, podpisach
elektronicznych, ocenie i zaufaniu użytkowników zatwierdza efekt końcowy.
Wykład 12: Semantic Web
25/34
Podsumowanie
 Semantyczny Internet jest inicjatywą mającą na celu
wzbogacenie dotychczasowych technologii i sposobu użytkowania
Internetu
 Główną ideą SW jest wykorzystanie informacji „przetwarzalnej
maszynowo” (ang. machine-processable)
 Podstawowe składniki SW to metadane, ontologie, logika i
zależności oraz inteligentni agenci
 Rozwój technologii SW przebiega warstwowo (ang. layer cake)
„The Web will only achieve its full potential when users have
trust in its operations (security) and in the quality
of information provided”
-- G. Antoniou, F. van Harmelen, The Semantic Web Vision, MIT, 2004
Wykład 12: Semantic Web
33/34
Literatura
 Książki
 Grigoris Antoniou, Frank van Harmelen, A Semantic Web Primer, 2nd Edition, The
MIT Press, 2008
 John Hebeler, Matthew Fisher, Semantic Web Programming, Wiley, 2009
 John Davies, Semantic Web Technologies: Trends and Research in Ontology-based
Systems, Wiley, 2006
 T. Berners-Lee, with M. Fischetti. Weaving the Web. San Francisco: Harper,
1999.
 Źródła internetowe
 Semantic Web Primer: http://www.ics.forth.gr/isl/swprimer/presentation.htm
 W3C Semantic Web Activity: http://www.w3.org/2001/sw/
 Semantyczny Web: http://semantictechnology.eu/
 W3Schools Semantic Web: http://www.w3schools.com/web/web_semantic.asp
Wykład 12: Semantic Web
34/34