Metaadatok és digitális szövegek Bakonyi Géza SZTE Egyetemi Könyvtár A metaadatok filozófiája • Piaci filozófia: miért is kellenek metaadatok? – MARC és az általános metaadatok – absztrahálás – Fogalomalkotás •

Download Report

Transcript Metaadatok és digitális szövegek Bakonyi Géza SZTE Egyetemi Könyvtár A metaadatok filozófiája • Piaci filozófia: miért is kellenek metaadatok? – MARC és az általános metaadatok – absztrahálás – Fogalomalkotás •

Metaadatok és digitális
szövegek
Bakonyi Géza
SZTE Egyetemi Könyvtár
A metaadatok filozófiája
• Piaci filozófia: miért is
kellenek metaadatok?
– MARC és az általános
metaadatok
– absztrahálás
– Fogalomalkotás
• Következmény: a
digitális szöveg nem
könyvtári dokumentum,
hanem „hálózati”
dokumentum
Metaadat
megoldások
• Dublin Core
• RDF (Resource Description Framework): metaadatok
szabványos szolgáltatásának rugalmas infrastruktúrája
• OWL: „Web Ontologies Language” - „Az ontológia
kifejezéseket és összefüggéseket határoz meg egy adott
tudásterület leírásához”
• “Warwick Framework”: konténer-modell, amely a
különféle metaadat definíciók szisztematikus kezelését
biztosítja
Metaadat alkalmazások
• Középpontban a keresés, az információ
megtalálhatósága: Z39.50, OAI
• „Galaktikus Információ Kereső Szolgálat”: GILS:
– "lokátor típusú" és "dokumentum típusú" információ
források integrációja
– Decentralizált rendszerek, profilok
– Lokátor: olyan információ forrás, amely más
információ forrást azonosít
• Szürke irodalom adatbázisai: pl. PhD
disszertációk adatbázisai
• Az egyik megoldása
annak,
hogy
egy
információ
forrás
teljes
szövegéből
automatikusan
kivonjuk a fogalmi
kulcsszavakat
az,
hogy a tartalmi leírást
megadott
struktúra
szerint végezzük el
• SGML, HTML, XML,
XHTML
• TEI és TEI Header
Strukturált
szövegek
A digitális dokumentum fejlécében
elhelyezett MetaTagek
INTERNET
MetaTag
Felhasználó
Kereső Robot
Index állomány
Meta-adatlap készítése
Sorszám-Kitöltés-Alap-Leírás-Adatelem-Forrás-ElőfordulásTípus-Érték-tartomány
•
kötelező (K), ha a leírásnál minden esetben alkalmazni
kell, pl. adatállomány neve,
•
választható (V), ha a készítő dönti el, hogy megadja-e
vagy sem, pl. adatállomány készültsége,
•
egyedi (E), ha az adatállományra vonatkozólag egyedi,
és a leírás során csak egyszer lehet megadni, pl.
adatállomány címe.
•
ismétlődő (I), ha az adatállomány valamely
tulajdonsága több fogalommal írható le (pl.
kulcsszavak).
•
összetett (Ö), ha további elemekre bontható; ebben az
esetben választható, hogy adok-e leírást is magához
az összetett elemhez, vagy csak a részeihez,
•
egyszerű (P), ha további elemekre már nem bontható.
Meta-adatlap készítése
• MARC – TEI Header – DC
GILS
DUBLIN CORE
METATÉR
Title
Title
Cím
Originator
Author, Creator
Szervezet
(Un)controlled Term
Subject, Keyword
Kulcsszavak
Abstract
Description
Összefoglalás
Distributor
Publisher
Terjesztő
Contributor
Other Contributor
Kapcsolattartó
Date of Publication
Date
Publikálás Dátuma
Medium
Resource
Termék
Linkage Type
Format
Formátum
Available Linkage
Resource Identifier
(URL)
Source of Data
Source
Forrás
Language of resource
Language
Nyelv
Cross Reference
Relation
(URL)
Supplemental Information
Coverage
Térbeli és Időbeli kiterjedés
Use Constraints
Right Management
Használatbeli Korlátozások
Megfeleltetések
Standard
Usage
Dublin Core
All
EAD
FGDC
GILS
IMS
MARC
TEI
VRA Core 3
Official or
Thesauri restrictions (Y/N)
special thesauri
Crosswalks (Y/N) Descriptive levels
Data for original/surrogate
Metadata types
Separate records Single record Descriptive Administrative Structural
LCSH, MESH,
DDC, LCC, UDC,
DCMI Types,
TGN
Text (manuscripts and APPM
other documents in
archival collections),
images
Maps, places
NASA master
All
Text, images, moving
images, sound
recordings, software,
3D, maps
Text, images, moving LCSH, LCSH
images, sound
Childrens,
recordings, software, MESH, NAL,
3D, maps
Canadian subject
headings,
Repertoire des
vedettes matieres
N
Y
1
N
Y
12
N
N
N
Y
Y
Y
2
1
4
x
N
Y
1
x
Text
Images, 3D, events
N
N
Y
Y
7
1
x
x
LCSH, AAT,
TGM, ULAN,
TGN
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
DC
Element
DC Qualifier(s)
Title
Title
MARC Fields
Implementation notes
245
Alternative
Creator
130, 210, 240, 242, 246, 730,
740
100, 110, 111, 700, 710, 711
See Appendix 1 below.
720
Subject
LCSH
600, 610, 611, 630, 650
Second indicator=0
Subject
MeSH
600, 610, 611, 630, 650
Second indicator=2
Subject
LCC
050
Subject
DDC
082
Subject
UDC
080
Description
500-599, except 505, 506, 520,
530, 540, 546
Description
TableofContents
505
Description
Abstract
520
Contributor
See Appendix 1 below;
Contributor element
not used.
Publisher
Date
First indicator=3
260$a$b
Created
260$c$g
533$d
Date
Issued
260$c
008/07-10
Type
Format
DCMI Type
Vocabulary
Leader06, Leader07
See Appendix 2 for
Leader-Type rules
655
Subfield $2=dct
IMT
856$q
Extent
300$a
533$e
Medium
340$a
Identifier
URI
856$u
Source
URI
786$o
Language
ISO 639-2
008/35-37
DC elemek és részek
• Dublin Core Metadata Element Set
• "qualifiers„:
– Element Refinement. These qualifiers make
the meaning of an element narrower or more
specific
– Encoding Scheme. These qualifiers identify
schemes that aid in the interpretation of an
element value
DCMES
Element
Element Encoding
Scheme(s)
Element Refinement(s)
Title
Alternative
-
Creator
-
-
Subject
-
LCSH
MeSH
DDC
LCC
UDC
Description
Table Of Contents
Abstract
-
Publisher
-
-
Contributor
-
-
Date
Created
Valid
Available
Issued
Modified
Date Copyrighted
Date Submitted
DCMI Period
W3C-DTF
5.
6.
7.
8.
9.
10.
Publisher publisher (37)
Contributor contributor (38)
Date
dateFirstCreated (38)
dateCurrentFormCreated
(40)
dateLastModified (41)
dateValidFrom (43)
dateValidTo (44)
ReourceType resourceType (24)
Format
format (32)
Identifier identifier (33)
„Jel vagyunk, értelmezés nélkül …”
Hölderlin