SKOS W P GUŁCE

Download Report

Transcript SKOS W P GUŁCE

PLAN WYSTĄPIENIA
• Wprowadzenie
• Semantic Web w 5 minut,
• Linked Data.
•
•
•
•
•
Czym jest SKOS?
Dlaczego SKOS?
SKOS w praktyce.
Krytyka SKOS.
Wnioski.
SEMANTIC WEB W 5 MINUT
Tim Berners-Lee (2007)
Sukces World Wide Web:
• nieograniczone możliwości łączenia
informacji (np. hiperłącza),
• otwarte standardy,
• rozdzielenie warstw sieci (komunikacja,
wizualizacja, przetwarzanie).
SEMANTIC WEB W 5 MINUT
• dzisiejsza sieć to sieć dokumentów
(statyczne, dynamiczne),
• dane w dokumentach zrozumiałe tylko dla
ludzi,
• aplikacje sieciowe nie są w stanie
przetworzyć danych.
SEMANTIC WEB W 5 MINUT
SEMANTIC WEB W 5 MINUT
• utrzymanie postulatu AAA (Anyone can
say Anything about Any topic),
• rozpowszechnienie standardów
opisywania treści,
• „zrozumienie” danych przez aplikacje,
• możliwość powiązania danych.
SEMANTIC WEB W 5 MINUT
Podstawowe standardy/specyfikacje:
• RDF (Resource Description Framework) specyfikacja modelu metadanych,
• RDF Schema (RDFS) - język reprezentacji
wiedzy,
• OWL (Web Ontology Language) – język
modelowania ontologii internetowych,
rozszerzenie RDFS.
SEMANTIC WEB W 5 MINUT
Cel
• standaryzowany i spójny model danych,
• zmiana perspektywy - dane,
• dane powiązane (Linked Data).
LINKED DATA
• nie model danych, lecz filozofia,
• metoda ekspresji, reprezentacji, łączenia
i współdzielenia danych,
• Tim Berners-Lee: data hugging,
• narzędzia:
– identyfikator URI,
– protokół http,
– RDF oraz RDFS/OWL.
LINKED DATA
Cztery zasady Linked Data:
1. Używaj URI jako nazwy dla obiektów.
2. Stosuj protokół http, po to by uzyskać
informacje o tych obiektach.
3. Aktywacja poszczególnego URI ma
spowodować pozyskanie użytecznych
informacji.
4. Wykorzystuj powiązania z innymi obiektami za
pomocą URI, aby zapewnić możliwość
eksploracji i odkrywania innych obiektów.
LINKED DATA
•
•
•
•
•
FOAF (Friend Of A Friend),
format reprezentacji danych personalnych,
internetowa tożsamość,
wizytówka sieciowa,
rozszerzenie RDF.
FOAF
FOAF
<rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"
xmlns:foaf="http://xmlns.com/foaf/0.1/"
xmlns:admin="http://webns.net/mvcb/">
</foaf:PersonalProfileDocument>
<foaf:Person rdf:ID="me">
<foaf:name>Marcin Roszkowski</foaf:name>
<foaf:givenname>Marcin</foaf:givenname>
<foaf:family_name>Roszkowski</foaf:family_name>
<foaf:mbox_sha1sum>e59bff904001aa669cc84a983fcbf6e4b97e2299</foaf:mbox_s
ha1sum>
<foaf:homepage rdf:resource="http://biblioteka.unipt.pl"/>
<foaf:based_near rdf:resource="http://sws.geonames.org/3088972/"
rdfs:label="Piotrków Trybunalski"/>
<foaf:depiction rdf:resource="http://4.bp.blogspot.com/_4XgyLS9gXg/roszkowski.jpg"/>
<foaf:workplaceHomepage rdf:resource="http://mroszkowski.blogspot.com"/>
<foaf:schoolHomepage rdf:resource="Uniwersytet Jana Kochanowskiego. Filia w
Piotrkowie Trybunalskim"/></foaf:Person>
</rdf:RDF>
FOAF + GEONAMES
LINKED DATA
LINKED DATA
Formaty danych / zbiory danych:
•
FOAF (Friend Of A Friend),
•
SIOC (Semantically-Interlinked Online Communities)
Project – format danych do opisu społeczności, jej
członków, zainteresowań
•
DOAP (Description of a Project) - format danych do
opisu projektów open source, jego twórców, przebiegu,
efektów,
•
Kartoteki wzorcowe VIAF (The Virtual International
Authority File),
•
DBpedia – ustrukturyzowane dane pochodzące
z Wikipedii.
•
SKOS (Simple Knowledge Organisation System).
CZYM JEST SKOS?
Czym jest SKOS?
• format danych dla systemów
porządkowania pojęć
(systemy organizacji wiedzy),
• formalny język reprezentacji struktury
SOW,
• rozszerzenie RDF,
• rekomendacja World Wide Web
Consortium - W3C (sierpień 2009 r.)
CZYM JEST SKOS?
Systemy organizacji wiedzy (SOW):
• systemy porządkowania pojęć,
• tradycyjne języki informacyjno-wyszukiwawcze,
• sieciowe systemy organizacji wiedzy:
– taksonomie internetowe,
– ontologie.
OPIS W SKOS
• opis pojęcia z wykorzystaniem składni
RDF,
• Trójki RDF (RDF triples) :
– podmiot – predykat – obiekt,
– pojęcie – predykat – wartość.
• Przywołanie pojęcia za pomocą
indywidualnego URI w opisywanym
zbiorze.
OPIS W SKOS
<rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"
xmlns:skos="http://www.w3.org/2004/02/skos/core#">
<skos:Concept rdf:about="http://www.ukat.org.uk/thesaurus/concept/1750">
<skos:prefLabel>Economic cooperation</skos:prefLabel>
</skos:Concept>
</rdf:RDF>
CECHY SKOS
Standaryzowany zbiór klas i własności, które
służą do:
• identyfikacji pojęcia: skos:Concept za
pomocą jego URI
– http://bn.org.pl/jhp/concept/1750
(pojęcie językoznawstwa)
• identyfikacji SOW: skos:ConceptScheme
– np. JHP BN
CECHY SKOS
•
ustalenia nazw dla pojęcia i określenie
ich statusu:
– skos:prefLabel (w różnych językach
etnicznych)  Językoznawstwo @pl,
– skos:prefLabel  Linguistics @en,
– skos:altLabel  Lingwistyka,
– skos:hiddenLabel  Językonzawstwo,
CECHY SKOS
• dodatkowych informacji o znaczeniu
pojęcia i jego zmianach:
– skos:note,
– skos:scopeNote,
– skos:definition,
– skos:editorialNote,
CECHY SKOS
• ustalenia relacji znaczeniowych pomiędzy
pojęciami:
– relacja nadrzędności zakresowej
skos:broader,
– relacja podrzędności zakresowej
skos:narrower,
– relacja skojarzeniowa
skos:related,
JHP W SKOS
JHP W SKOS
<rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"
xmlns:skos="http://www.w3.org/2004/02/skos/core#">
<skos:Concept rdf:about="http://bn.org.pl/jhp/concept/1750">
<skos:prefLabel>Językoznawstwo</skos:prefLabel>
<skos:altLabel>Lingwistyka</skos:altLabel>
<skos:hiddenLabel>Językoznwastwo</skos:hiddenLabel>
<skos:broader rdf:resource="http://bn.org.pl/jhp/concept/4382"/>
<skos:narrower rdf:resource="http://bn.org.pl/jhp/concept/2108"/>
<skos:narrower rdf:resource="http://bn.org.pl/jhp/concept/9505"/>
<skos:narrower rdf:resource="http://bn.org.pl/jhp/concept/15053"/>
<skos:narrower rdf:resource="http://bn.org.pl/jhp/concept/18987"/>
<skos:related rdf:resource="http://bn.org.pl/jhp/concept/3250"/>
<skos:inScheme rdf:resource="http://bn.org.pl/jhp"/>
</skos:Concept>
</rdf:RDF>
JHP W SKOS
EKSPRESJA SKOS
Siła ekspresji SKOS pozwala również na
uwzględnienie:
• sztucznego systemu notacyjnego, np. dla
klasyfikacji: <skos:notation>81</skos:notation>,
• odwzorowanie fasetowej struktury pola
semantycznego:
<skos:collection>Procesy</skos:collection>
• odwzorowanie zależności pomiędzy pojęciami
z różnych SOW (mapowanie), wykładniki typów
zgodności zakresowej: skos:exactMatch,
skos:closeMatch.
ELASTYCZNOŚĆ SKOS
SOW W SKOS
• UK Archival Thesaurus (UKAT),
• The General Multilingual Environmental Thesaurus
(GEMET),
• Australian Public Affairs Information Service (APAIS)
Thesaurus,
• Tezaurus AGROVOC,
• Library of Congress Subject Headings (LCSH)
• Medical Subject Headings (MeSH),
• GeoNames, kartoteka wzorcowa nazw geograficznych,
• UNESCO Thesaurus,
• ISO639 Codes for the representation of names of
languages.
SOW W SKOS
DLACZEGO SKOS?
• wspólny model danych dla opisu SOW,
• opis SOW musi być zrozumiały dla
aplikacji,
• SOW muszą być współdzielone,
• SOW jako platforma wspólnego
odniesienia.
JAK TO DZIAŁA?
Rezultaty
wyszukiwania
Rezultaty
wyszukiwania
Rezultaty
wyszukiwania
JIW
SOW1
SOW2
BAZA1
BAZA2
OPAC
JAK TO DZIAŁA?
API
http://www.flickr.com/photos/dullhunk/639163558/sizes/l/
JAK TO DZIAŁA?
KRYTYKA SKOS
• format danych vs. mechanizmy ich
przetwarzania,
• wymiar technologiczny:
– aplikacje eksplorujące i przetwarzające linked
data, języki zapytań (np. SPARQL),
– mechanizmy wizualizacji RAW DATA,
KRYTYKA SKOS
• wymiar technologiczny:
– narzędzia opisu SOW w SKOS (np. Protege,
Tematres)
• problemy:
– reprezentacja niesamodzielnych jednostek
leksykalnych (symbole pomocnicze,
określniki),
– reprezentacja zdań JIW.
PODSUMOWANIE
• formalizacja umożliwia automatyczne
przetwarzanie,
• bariery: odległość, język, granice
dyscyplinarne,
• SKOS < Linked Data,
• projekt nadal rozwijany,
• ocena bibliotekarzy?
PODSUMOWANIE
• SKOS = format danych dla SOW,
• potrzeba współdzielonych zbiorów danych,
• co z „naszymi” formatami?
PODSUMOWANIE