Dokumenta teksta sagatavošana izguves procesam

Download Report

Transcript Dokumenta teksta sagatavošana izguves procesam

Jauni datu formāti – jaunas
iespējas bibliotēkām
LAILA VALDOVSKA
Valsts aģentūra “Kultūras informācijas sistēmas”
Savā referātā aplūkošu
sekojošus jautājumus



Vai nepietiek ar MARC?
XML tehnoloģijas
Jaunā Google iniciatīva Google Scholar
07.04.2006
Seminārs ,,Datu konversija: problēmas,
iespējas, risinājumi’’
2
Digitālās plaisas




Tradicionālie resursi / Digitālie resursi
Kataloģizētāji / Metadatu profesionāļi
Bibliotēku katalogi / Globālais tīmeklis
MARC / XML, CSS, XSL, XHTML
07.04.2006
Seminārs ,,Datu konversija: problēmas,
iespējas, risinājumi’’
3
Ieraksts MARC formātā
01195nam--2200289---45-0010010000000050017000100060013000270080041000400400018000810800022000992
4501040012124600990022526000210032430000260034553401170037171000220048897
0001900510081001700529990001700546990001500563991002300578852006700601852
00820066885200560075085200510080685200480085700000000720040817112204.0aLC
011130s1997 lv W 00000 lav aRSUdPTBcLPA a327x(474.3)x(4)00aEiropas
Komisijas atzinums par Latvijas pieteikumu iestāties Eiropas Savienībā :b[Agenda
2000].
30aAgenda 2000: Eiropas Komisijas atzinums par Latvijas pieteikumu iestāties
Eiropas Savienībā
a[B. v.,
c1997?].
aiv, 94, 14 lpp., tab.
aOriģ. izd.: Agenda 2000:
Commission opinion on Latvia's application for membership of the European Union
(1997)2 aEiropas Komisija. aama50 b000000702a327(474.3+4)02a327(474.3+4)04a32/E40/LL02aE 72b327(474.3+4)8 bAMAICcBLh327(474.3+4)/E 724RSU:Inform.
Centre5Reading room8 bAMAZFcZINh327(474.3+4)/E 724RSU:Scientific
lit.lend.dep. 5Scientific stock bLPA50cLASh3274LPA Fundamental
library 5Lasîtava bPTALLh32/E-40/LL4PTB:Business Information
RR bKISICcBL4KIS:Inform. Centre5Reading room
07.04.2006
Seminārs ,,Datu konversija: problēmas,
iespējas, risinājumi’’
4
XML (eXtensible Markup Language) – paplašināmās
iezīmēšanas valoda
DTD (Document Type Definition) – dokumenta tipu
definīcija
XSL (eXtensible Stylesheet Language) – paplašināmā
stilu tabulu valoda
AACR2 (Anglo-American cataloguing rules, 2nd
revised edition) - angloamerikāniskie
kataloģizācijas noteikumi, otrais, pārstrādātais
izdevums
07.04.2006
Seminārs ,,Datu konversija: problēmas,
iespējas, risinājumi’’
5
XML formāta loma bibliotēku
informācijas sistēmās



Tā ir valoda, kas atļauj pārraidīt bibliogrāfiskos datus
tehnoloģiski neatkarīgā un universāli saprotamā veidā
dažādās sistēmās,
XML ir valoda, kas atļauj noteikt kopējus likumus kādam
vienam datu formātam, kā piemēram MARC,
Valoda, kas piedāvā servisa iespējas, kurās dati var tikt
izmantoti dažādos alternatīvos veidos, kas pārsniedz
klasiskā klienta – servera pakalpojumus.
07.04.2006
Seminārs ,,Datu konversija: problēmas,
iespējas, risinājumi’’
6
XML pielietošanas veidi
1.
2.
3.
Tiek ņemts MARC formāts un “literāri” pārtulkots XML
valodā.
Tiek sākts ar AACR2 struktūru, un tā tiek attēlota,
izmantojot XML.
Tiek izmantotas priekšrocības, ko dod jaunās tehnoloģijas,
un tiek izveidota jauna struktūra, kas balstās uz
jaunākajiem kataloģizēšanas pētījumiem.
07.04.2006
Seminārs ,,Datu konversija: problēmas,
iespējas, risinājumi’’
7
Piemērs
<fd id="10.2" script="latin.chinese" name="245"
ind1="1" ind2="0" label="TITLE">
<sf name="a">Chun qiu Zuo shi jing zhuan ji jie
xu shu zheng /</sf>
<sf name="c">Cheng Yuanmin zhu</sf></fd>
07.04.2006
Seminārs ,,Datu konversija: problēmas,
iespējas, risinājumi’’
8
MODS veidošanas shēmas
fragments:
MODS (Metadata Object Description Schema –
metadatu objekta apraksta shēma)
MARC lauki
720 ind1=blank
720 ind1=1
260$a
260$b
07.04.2006
MODS tagi
<name> (with no type attribute)
<name> with type="personal"
<place>
<publisher>
Seminārs ,,Datu konversija: problēmas,
iespējas, risinājumi’’
9
MODS var izmantot:
 Kā Z39.50 nākamo paaudzi,
 Kā iespēju dot datus hārvestēšanai,
 Resursa aprakstīšanai XML sintaksē, izmantojot
MARC semantiku,
 Lai iegūtu metadatus XML formā, ko var glabāt
kopā ar elektronisko resursu.
MODS elementu kopa ir “bagātāka” kā Dublin Core
(DC)
07.04.2006
Seminārs ,,Datu konversija: problēmas,
iespējas, risinājumi’’
10
07.04.2006
Seminārs ,,Datu konversija: problēmas,
iespējas, risinājumi’’
11
Trešais veids
1. IFLA’s izstrādātais FRBR (the Functional
Requirements for Bibliographic Records)
2. XOBIS (the XML Organic Bibliographic
Information Schema)
07.04.2006
Seminārs ,,Datu konversija: problēmas,
iespējas, risinājumi’’
12
XOBIS ieraksts sastāv no trīs
daļām.
1. Kontroldati
2. Pamatelements (var būt 10 dažādi
pamatelementi)
3. Saites ar citiem ierakstiem (tiek definēts
saišu tips, saistību norāda dotā ieraksta
pamatelementam ar cita ieraksta
pamatelementu)
07.04.2006
Seminārs ,,Datu konversija: problēmas,
iespējas, risinājumi’’
13
10 dažādi pamatelementi
Jēdziens (Concept), vārds vai vārdu virkne
(String), valoda (Language), organizācija
(Organization), notikums (Event), laiks
(Time), vieta (Place), esamība – dažādas
būtnes vai personifikācijas (Being), objekts
(Object), mākslinieciski vai intelektuāli
radīts darbs (Work).
07.04.2006
Seminārs ,,Datu konversija: problēmas,
iespējas, risinājumi’’
14
XOBIS ieraksta piemērs
07.04.2006
Seminārs ,,Datu konversija: problēmas,
iespējas, risinājumi’’
15
Izmantojot Dublin Core metadata
editor http://www.ukoln.ac.uk/cgi-bin/dcdot.pl
07.04.2006
Seminārs ,,Datu konversija: problēmas,
iespējas, risinājumi’’
16
07.04.2006
Seminārs ,,Datu konversija: problēmas,
iespējas, risinājumi’’
17
MARC un XML konvertētājs
http://www.loc.gov/standards/marcxml/
07.04.2006
Seminārs ,,Datu konversija: problēmas,
iespējas, risinājumi’’
18
MARC un XML konvertētājs
http://encompass.library.cornell.edu/tools/marc2Screenxml.html
07.04.2006
Seminārs ,,Datu konversija: problēmas,
iespējas, risinājumi’’
19
07.04.2006
Seminārs ,,Datu konversija: problēmas,
iespējas, risinājumi’’
20
Google Scholar
http://scholar.google.com
07.04.2006
Seminārs ,,Datu konversija: problēmas,
iespējas, risinājumi’’
21
Google Scholar
http://scholar.google.com
07.04.2006
Seminārs ,,Datu konversija: problēmas,
iespējas, risinājumi’’
22
07.04.2006
Seminārs ,,Datu konversija: problēmas,
iespējas, risinājumi’’
23
07.04.2006
Seminārs ,,Datu konversija: problēmas,
iespējas, risinājumi’’
24
07.04.2006
Seminārs ,,Datu konversija: problēmas,
iespējas, risinājumi’’
25
Google Scholar
http://scholar.google.com
07.04.2006
Seminārs ,,Datu konversija: problēmas,
iespējas, risinājumi’’
26
Google Scholar
http://scholar.google.com
07.04.2006
Seminārs ,,Datu konversija: problēmas,
iespējas, risinājumi’’
27
Google Scholar
pieprasītais bibliotēku datu formāts
<!— Kodējums UTF-8 -->
<!—grāmatas ISBN (NEOBLIGĀTS) -->
<isbn>12345690-45X</isbn>
<!—Grāmatas izdevējs (OBLIGĀTS) -->
<publisher>
<!-- Izdevējs (OBLIGĀTS; ne vairāk kā 128 zīmes) -->
<publisher-name>Magical Publishers</publisher-name>
<!—Izdošanas vieta (NEOBLIGĀTS; ne vairāk kā 32 zīmes) -->
<publisher-loc>Wonderland, Kingdom of Oz</publisher-loc>
</publisher>
07.04.2006
Seminārs ,,Datu konversija: problēmas,
iespējas, risinājumi’’
28
Google Scholar
pieprasītais bibliotēku datu formāts
<!-- Informācija par grāmatu (OBLIGĀTS) -->
<article-meta>
<!—Grāmatas nosaukums (OBLIGĀTS) -->
<title-group>
<!-- Grāmatas nosaukums (OBLIGĀTS; ne vairāk kā 512 zīmes) -->
<article-title>Fairies in Timbuktu: A Causal Study in Creation</article-title>
<!—Grāmatas nosaukums angļu valodā. -->
<!-- Paredzēts izmantot grāmatām, kas nav angļu valodā,-->
<!— ja nosaukuma tulkojums ir pieejams -->
<!-- (NEOBLIGĀTS; ne vairāk kā 512 zīmes)
-->
<trans-title>Cybutu se Timbuktu: Tyghti Costi Nogtiparl</trans-title>
</title-group>
07.04.2006
Seminārs ,,Datu konversija: problēmas,
iespējas, risinājumi’’
29
Google Scholar
pieprasītais bibliotēku datu formāts
<!— Grāmatas autoru saraksts -->
<author-list>
Patterson, David John; Hennessy, John David and
Thomas Jr, Clarence
</author-list>
07.04.2006
Seminārs ,,Datu konversija: problēmas,
iespējas, risinājumi’’
30
Google Scholar
pieprasītais bibliotēku datu formāts
<!-- Grāmatas līdzstrādnieku saraksts -->
<contrib-group>
<!-- Autoru/redaktoru vārdi (OBLIGĀTS, ne vairāk kā 15 ierakstu -->
<!-- "contrib-type" var būt "author" vai "editor" -->
<contrib contrib-type="author">
<name>
<!—Autora uzvārds. (OBLIGĀTS; ne vairāk kā 32 zīmes -->
<surname>Patterson</surname>
<!-- Autora vārds (OBLIGĀTS; ne vairāk kā 48 zīmes -->
<given-names>David John</given-names>
</name>
</contrib>
……..
<!—Šis grupas atkārto, ja nepieciešams -->
</contrib-group>
07.04.2006
Seminārs ,,Datu konversija: problēmas,
iespējas, risinājumi’’
31
Google Scholar
pieprasītais bibliotēku datu formāts
<!—Publicēšanas datums. (NEOBLIGĀTS) -->
<pub-date pub-type="pub">
<!-- Diena (NEOBLIGĀTS) -->
<day>14</day>
<!-- Mēnesis. (NEOBLIGĀTS) -->
<month>5</month>
<!-- Gads. (OBLIGĀTS; 4 zīmes )-->
<year>2004</year>
</pub-date>
07.04.2006
Seminārs ,,Datu konversija: problēmas,
iespējas, risinājumi’’
32
Google Scholar
pieprasītais bibliotēku datu formāts
<!-- Atslēgvārdi. (NEOBLIGĀTS; ne vairāk kā 5 lauki -->
<kwd-group>
<!—Atslēgvārdu kopa. (NEOBLIGĀTS; var atkārtot) -->
<kwd>Muggles, Death-eaters, Dumbledore </kwd>
</kwd-group>
<!-- Kategorijas (NEOBLIGĀTS) -->
<article-categories>
<!-- Priekšmeti (NEOBLIGĀTS; ne vairāk kā 5 lauki ) -->
<subj-group>
<subject>Magic</subject>
<subject>Realism</subject>
</subj-group>
</article-categories>
07.04.2006
Seminārs ,,Datu konversija: problēmas,
iespējas, risinājumi’’
33
Google Scholar
pieprasītais bibliotēku datu formāts
<!—Bibliotēku skaits, kuru krājumos ir šī grāmata (OBLIGĀTS)-->
<num_libraries>20</num_libraries>
<!-- URL saite, lai pieslēgtos kopkatalogam; -->
<!--(OBLIGĀTS) ne vairāk kā 1024 zīmes -->
<self-uri xlink:href="http://www.magicrealism.org/book?isbn=12345690-45X"></self-uri>
07.04.2006
Seminārs ,,Datu konversija: problēmas,
iespējas, risinājumi’’
34
Paldies par uzmanību!