Metaadatok és digitális szövegek Bakonyi Géza SZTE Egyetemi Könyvtár A metaadatok filozófiája • Piaci filozófia: miért is kellenek metaadatok? – MARC és az általános metaadatok – absztrahálás – Fogalomalkotás •
Download ReportTranscript Metaadatok és digitális szövegek Bakonyi Géza SZTE Egyetemi Könyvtár A metaadatok filozófiája • Piaci filozófia: miért is kellenek metaadatok? – MARC és az általános metaadatok – absztrahálás – Fogalomalkotás •
Metaadatok és digitális szövegek Bakonyi Géza SZTE Egyetemi Könyvtár A metaadatok filozófiája • Piaci filozófia: miért is kellenek metaadatok? – MARC és az általános metaadatok – absztrahálás – Fogalomalkotás • Következmény: a digitális szöveg nem könyvtári dokumentum, hanem „hálózati” dokumentum Metaadat megoldások • Dublin Core • RDF (Resource Description Framework): metaadatok szabványos szolgáltatásának rugalmas infrastruktúrája • OWL: „Web Ontologies Language” - „Az ontológia kifejezéseket és összefüggéseket határoz meg egy adott tudásterület leírásához” • “Warwick Framework”: konténer-modell, amely a különféle metaadat definíciók szisztematikus kezelését biztosítja Metaadat alkalmazások • Középpontban a keresés, az információ megtalálhatósága: Z39.50, OAI • „Galaktikus Információ Kereső Szolgálat”: GILS: – "lokátor típusú" és "dokumentum típusú" információ források integrációja – Decentralizált rendszerek, profilok – Lokátor: olyan információ forrás, amely más információ forrást azonosít • Szürke irodalom adatbázisai: pl. PhD disszertációk adatbázisai • Az egyik megoldása annak, hogy egy információ forrás teljes szövegéből automatikusan kivonjuk a fogalmi kulcsszavakat az, hogy a tartalmi leírást megadott struktúra szerint végezzük el • SGML, HTML, XML, XHTML • TEI és TEI Header Strukturált szövegek A digitális dokumentum fejlécében elhelyezett MetaTagek INTERNET MetaTag Felhasználó Kereső Robot Index állomány Meta-adatlap készítése Sorszám-Kitöltés-Alap-Leírás-Adatelem-Forrás-ElőfordulásTípus-Érték-tartomány • kötelező (K), ha a leírásnál minden esetben alkalmazni kell, pl. adatállomány neve, • választható (V), ha a készítő dönti el, hogy megadja-e vagy sem, pl. adatállomány készültsége, • egyedi (E), ha az adatállományra vonatkozólag egyedi, és a leírás során csak egyszer lehet megadni, pl. adatállomány címe. • ismétlődő (I), ha az adatállomány valamely tulajdonsága több fogalommal írható le (pl. kulcsszavak). • összetett (Ö), ha további elemekre bontható; ebben az esetben választható, hogy adok-e leírást is magához az összetett elemhez, vagy csak a részeihez, • egyszerű (P), ha további elemekre már nem bontható. Meta-adatlap készítése • MARC – TEI Header – DC GILS DUBLIN CORE METATÉR Title Title Cím Originator Author, Creator Szervezet (Un)controlled Term Subject, Keyword Kulcsszavak Abstract Description Összefoglalás Distributor Publisher Terjesztő Contributor Other Contributor Kapcsolattartó Date of Publication Date Publikálás Dátuma Medium Resource Termék Linkage Type Format Formátum Available Linkage Resource Identifier (URL) Source of Data Source Forrás Language of resource Language Nyelv Cross Reference Relation (URL) Supplemental Information Coverage Térbeli és Időbeli kiterjedés Use Constraints Right Management Használatbeli Korlátozások Megfeleltetések Standard Usage Dublin Core All EAD FGDC GILS IMS MARC TEI VRA Core 3 Official or Thesauri restrictions (Y/N) special thesauri Crosswalks (Y/N) Descriptive levels Data for original/surrogate Metadata types Separate records Single record Descriptive Administrative Structural LCSH, MESH, DDC, LCC, UDC, DCMI Types, TGN Text (manuscripts and APPM other documents in archival collections), images Maps, places NASA master All Text, images, moving images, sound recordings, software, 3D, maps Text, images, moving LCSH, LCSH images, sound Childrens, recordings, software, MESH, NAL, 3D, maps Canadian subject headings, Repertoire des vedettes matieres N Y 1 N Y 12 N N N Y Y Y 2 1 4 x N Y 1 x Text Images, 3D, events N N Y Y 7 1 x x LCSH, AAT, TGM, ULAN, TGN x x x x x x x x x x x x x x x x x x x x x x x x x x x DC Element DC Qualifier(s) Title Title MARC Fields Implementation notes 245 Alternative Creator 130, 210, 240, 242, 246, 730, 740 100, 110, 111, 700, 710, 711 See Appendix 1 below. 720 Subject LCSH 600, 610, 611, 630, 650 Second indicator=0 Subject MeSH 600, 610, 611, 630, 650 Second indicator=2 Subject LCC 050 Subject DDC 082 Subject UDC 080 Description 500-599, except 505, 506, 520, 530, 540, 546 Description TableofContents 505 Description Abstract 520 Contributor See Appendix 1 below; Contributor element not used. Publisher Date First indicator=3 260$a$b Created 260$c$g 533$d Date Issued 260$c 008/07-10 Type Format DCMI Type Vocabulary Leader06, Leader07 See Appendix 2 for Leader-Type rules 655 Subfield $2=dct IMT 856$q Extent 300$a 533$e Medium 340$a Identifier URI 856$u Source URI 786$o Language ISO 639-2 008/35-37 DC elemek és részek • Dublin Core Metadata Element Set • "qualifiers„: – Element Refinement. These qualifiers make the meaning of an element narrower or more specific – Encoding Scheme. These qualifiers identify schemes that aid in the interpretation of an element value DCMES Element Element Encoding Scheme(s) Element Refinement(s) Title Alternative - Creator - - Subject - LCSH MeSH DDC LCC UDC Description Table Of Contents Abstract - Publisher - - Contributor - - Date Created Valid Available Issued Modified Date Copyrighted Date Submitted DCMI Period W3C-DTF 5. 6. 7. 8. 9. 10. Publisher publisher (37) Contributor contributor (38) Date dateFirstCreated (38) dateCurrentFormCreated (40) dateLastModified (41) dateValidFrom (43) dateValidTo (44) ReourceType resourceType (24) Format format (32) Identifier identifier (33) „Jel vagyunk, értelmezés nélkül …” Hölderlin