NUKAT - Stowarzyszenie Bibliotekarzy Polskich

Download Report

Transcript NUKAT - Stowarzyszenie Bibliotekarzy Polskich

NUKAT - Autostrada Informacji Cyfrowej:
rola standardów w tworzeniu katalogów bibliotecznych
Magdalena Rowińska
Centrum NUKAT
X Ogólnopolska Konferencja z cyklu „Automatyzacja Bibliotek Publicznych” pt. „Modele
współpracy bibliotek publicznych – czy razem możemy więcej, szybciej, lepiej?”
2002- 2012
0 rekordów bibliograficznych
0 symboli lokalizacji
2 377 192 rekordów bibliograficznych
8 201 521 symboli lokalizacji
NUKAT – Autostrada Informacji Cyfrowej
jest projektem realizowanym przez Bibliotekę Uniwersytecką w
Warszawie w latach 2009-2013. Wartość projektu to 9 724
313,40 zł. Projekt jest finansowany z Programu Operacyjnego
Innowacyjna Gospodarka.
Ma na celu rozbudowę i modernizację wytypowanych narzędzi
informacyjnych:
• katalogu NUKAT
• katalogu rozproszonego KaRo
• katalogu online bibliotek Uniwersytetu Warszawskiego
• biblioteki cyfrowej e-bUW
NUKAT – Autostrada Informacji Cyfrowej – scalanie danych
W fazie pisania założeń projektu wytypowanych zostało 30
bibliotek, których katalogi będą scalane. Wybór bibliotek był
niezwykle istotny, musiały to być biblioteki, których katalogi są
tworzone wg określonych zasad oraz wykorzystujące Centralną
Kartotekę Haseł Wzorcowych NUKAT.
Większość działań przeprowadzanych jest automatycznie.
W wyniku automatycznego porównania danych otrzymujemy:
• rekordy, które mają swoje odpowiedniki w katalogu NUKAT
• rekordy oryginalne, których w NUKAT nie ma
• rekordy do dalszej oceny przez administratorów i/lub
bibliotekarzy uczestniczących w scalaniu.
Scalanie danych zostało podzielone na kilka etapów:
• Etap wstępny – testowe przekazanie rekordów przez
bibliotekę i sprawdzenie ich poprawności przez
Centrum NUKAT.
• Etap I – podmiana rekordów w katalogu lokalnym na
rekordy z katalogu NUKAT.
• Etap II – scalanie właściwe.
• Etap III – prace administratorów Centrum NUKAT.
• Etap IV – ręczne scalanie przez bibliotekarzy z danej
biblioteki.
Aby prowadzić automatyczne działania na puli
rekordów, niezwykle ważne jest dokładne
wytypowanie elementów obowiązkowych w
tychże rekordach. Priorytetem działań jest
całkowita ochrona danych w katalogu
centralnym oraz w katalogach lokalnych.
Odrzucono rekordy, których porównywanie
automatyczne dawałoby niepewne,
niejednoznaczne wyniki.
Kryteria wyboru/standardy
• Format MARC21
• Format wymienny (ISO 2709)
• Centralna Kartoteka Haseł Wzorcowych
• Zawartość rekordu bibliograficznego oraz zasady
katalogowania
- dokumenty zwarte piśmiennicze
- pewna data wydania
- unikatowy dla bazy lokalnej numer systemowy
- ISBN
- dokumenty wielotomowe
- pola obowiązkowe
• Zestaw znaków - Unicode
Format MARC (MAchine-Readable Cataloging) – przeznaczony
jest do zapisu i wymiany danych. Dane zapisane w formacie są
odpowiednio uporządkowane, ujednolicone i oznaczone, dzięki
czemu są czytelne dla komputera. Format MARC21 jest
formatem wymiennym, o oznacza, że umożliwia prawidłową
wymianę danych pomiędzy różnymi systemami.
Ponadto niezwykle ważna jest prawidłowa obsługa formatu przez
system biblioteczny stosowany w danej bibliotece. System musi
umożliwiać:
- import danych w formacie wymiennym,
- eksport danych w formacie wymiennym,
- prawidłową interpretację danych i obsługę powiązań
Format wymienny zgodny ze standardem ISO 2709
Centralna Kartoteka Haseł Wzorcowych
Kartoteka haseł wzorcowych służy kontroli poprawności
haseł zastosowanych w rekordach bibliograficznych,
gwarantuje spójność danych.
Kartoteki wzorcowe wykorzystywane są przy
wprowadzaniu danych do bazy oraz przy wyszukiwaniu.
Tworzy się je dla elementów stanowiących podstawowe
czynniki wyszukiwania, tj. nazwy osobowe i ciał
zbiorowych, tytuły ujednolicone, tytuły serii
wydawniczych, hasła przedmiotowe.
Dokumenty zwarte piśmiennicze
LDR/06 – a (dokument piśmienniczy)
LDR/07 – m (poziom monograficzny)
Pewna data wydania
008/06 – s
008/07-10 – data wydania
Unikatowy dla bazy lokalnej numer systemowy
- jednoznaczna identyfikacja rekordu w katalogu
biblioteki
ISBN - międzynarodowy znormalizowany numer książki
Rekordy zakwalifikowane do automatycznego scalania muszą
zawierać przynajmniej jedno pole 020, w którym prawidłowo
został podany ISBN - w podpolu $a numer musi być poprawny, a
w podpolu $z błędny.
ISBN w powiązaniu z innymi elementami – data, tytuł,
oznaczenie wydania (lub jego brak) – jest elementem, który
pozwala na jednoznaczne scalenie dokumentów, bądź uznanie
rekordu za rekord oryginalny.
Dokumenty wielotomowe
Z automatycznego scalania wyeliminowano
rekordy dla dokumentów wielotomowych z
hierarchiczną budową tytułu właściwego – 245
$n i/lub $p.
Powód: jednolitość przyjętej zasady
opracowania, którą trudno byłoby zachować
przy scalaniu automatycznym.
Pola obowiązkowe
Oprócz pola 020 w scalanych rekordach muszą
znaleźć się obowiązkowe i niepowtarzalne pola:
- 040 – instytucja sporządzająca opis,
- 245 – strefa tytułu i oznaczenia
odpowiedzialności,
- 260 – strefa adresu wydawniczego,
- 300 – strefa opisu fizycznego.
Prace dodatkowe
Rekordy scalane automatycznie kontrolowane były m.in. pod
kątem:
- obecności pola 240 w rekordzie z katalogu lokalnego, gdy w
rekordzie w NUKAT tego pola nie było (konieczne dodanie pola
240 do rekordu w NUKAT)
- rozbieżności w podpolach $b pól 245 – podtytułu, dodatku do
tytułu (przy scalaniu automatycznym tytuły właściwe musiały być
identyczne, był to warunek konieczny scalania)
- rozbieżności w liczbowaniu stronic
W rekordach przejętych jako oryginalne sprawdzano:
- kodowanie (zgodność z zestawem znaków UTF-8)
- komunikaty o hasłach niepermanentnych.
Efekty prac prowadzonych w ramach projektu:
• wzrost centralnej informacji o zbiorach polskich
bibliotek
1 226 490 – łączna liczba rekordów scalonych
• uporządkowanie danych w katalogach lokalnych
• ograniczenie dublowania pracy w zakresie tworzenia
rekordów nowych i modyfikacji
• wypracowanie narzędzi i procedur umożliwiających
dalsze scalanie katalogów w ramach rutynowych
działań
Stan na 31.08.2012.
Stosowanie standardów przy budowaniu katalogu
bibliotecznego gwarantuje nie tylko dobry dostęp do
informacji, co jest priorytetem każdej biblioteki, ale jest
również działaniem ekonomicznym, gdyż od razu
tworzy się wysoką jakość i nie ma potrzeby
prowadzenia prac dodatkowych. Stosowanie
standardów w tworzeniu katalogów bibliotecznych
umożliwia współpracę oraz przeprowadzanie trudnych,
nietypowych działań, takich jak wymiana danych,
zmiana systemu.
Standardy zapewniają bezpieczną przyszłość.
Dziękuję za uwagę!
Magdalena Rowińska
Centrum NUKAT
[email protected]