Format MARC 21 dla rekordu UKD

Download Report

Transcript Format MARC 21 dla rekordu UKD

Format MARC 21 dla rekordu UKD
w Katalogu bibliotek publicznych
Warszawy
Ewa Florek
Baza UKD – kalendarium projektu
Idea odpowiedników słownych do symboli
UKD powstała pod koniec lat 90-tych
2001 r. do rekordu bibliograficznego
wprowadzono pole 990 $a i $c
2003 r. projekt kartoteki wzorcowej UKD
2004 r. powstanie kartoteki UKD
maj 2005 r. prezentacja kartoteki i bazy
testowej przedstawicielom bibliotek sieci
czerwiec 2005 r. pierwsza prezentacja
bazy na warsztatach w Bibliotece
Narodowej
Odpowiednik słowny do symbolu UKD
Jest to opis klasy czyli fraza w brzmieniu
najbardziej ogólnym odnosząca się
do symbolu UKD
W przypadku terminu wieloznacznego
występuje konieczność opisu kontekstu
Do jednego symbolu UKD może być
przyjęty tylko jeden odpowiednik słowny
Hasła indeksu przedmiotowego
odpowiednikami słownymi w tym znaczeniu
nie są i stanowić mogą jedynie dodatkowe
punkty dostępu
UKD w wersji elektronicznej - pytania
Jakie funkcje tematycznego wyszukiwania
informacji muszą być wspierane:
wyszukiwanie i przeglądanie,
tylko przeglądanie, tylko wyszukiwanie?
Czy UKD będzie używana samodzielnie,
czy wraz z innym alfabetycznym
systemem indeksowania?
Czy istnieją plany, aby odsłonić rekordy
kartoteki i zrobić z niej część jakiejś
większej wielojęzycznej bramy
informacyjnej? Czy istnieją plany
wsparcia automatycznej klasyfikacji
w przyszłości?
UKD w wersji elektronicznej - pytania
Jakie są projekty struktury, zawartości
i składni, które będą wspierać
klasyfikację? Czy źródła metadanych
są powiązane, czy niezależne?
Które standardy / formaty metadanych
będą nośnikiem indeksu UKD?
Które elementy / pola są wspierane
podczas korzystania z klasyfikacji?
Jakie rodzaje formatów / kodowania
są dostępne do przechowywania UKD?
UKD w wersji elektronicznej - pytania
Jak polityka katalogowania / indeksowania
i standardy metadanych mają traktować
różne dane dotyczące: osób, wydarzeń,
zasięgu, tematów?
Czy będą one dystrybuowane w różnych
polach / elementach?
Jak pola mają być ustawione w rankingu
i połączone z wyszukiwarką do formy
indeksu w używanym do odpytywania
oprogramowaniu, w którym wdrożono UKD?
UKD w wersji elektronicznej - pytania
Czy dane tematyczne są wspierane
przez kartotekę?
Jaka jest architektura metadanych
w relacji między opisem bibliograficznym
dokumentu a kartoteką?
Czy plik kartoteki będzie przechowywany
na zewnątrz systemu i czy będzie wspólny
dla różnych używanych w systemie funkcji,
takich jak mapowanie i krzyżowanie kolekcji
wyników wyszukiwań?
UKD – wymagania funkcjonalne i systemowe
Są dwa sposoby stosowania UKD:
przy użyciu tylko symboli prostych lub symboli
połączonych traktowanych jak symbole proste
za pomocą zapisu syntetycznego
W zależności od zakresu i celu stosowania klasyfikacji,
oba podejścia stwarzają problemy związane
ze sposobem udostępniania danych oraz wykorzystania
symboli w systemie wyszukiwania informacji.
UKD – wymagania funkcjonalne i systemowe
Pierwszy zestaw problemów może być mniej
lub bardziej złagodzony przez przygotowanie
różnorodnych i bogatszych danych klasyfikacji,
drugi polega na stworzeniu odpowiednich narzędzi
do zarządzania i kontroli wykorzystania danych
UKD – implementacja z zapisem prostym
Służy systematycznemu przeglądaniu
Tekst zapisu składa się z cyfr i znaczącej interpunkcji
po co trzeciej cyfrze
Symbole są automatycznie prawidłowo złożone przez
system komputerowy
Zapis symboli wstępnie połączonych może prowadzić
do zakłócenia porządku systematycznego
Zapis symboli wstępnie połączonych umożliwia
wyszukiwanie tylko po pierwszym elemencie notacji
Wyszukiwanie wspierają odpowiedniki słowne
UKD – implementacja z zapisem prostym
Problemy z wdrażaniem
Konieczność stosowania kombinacji symboli w olbrzymich
klasach np. 821 Literatura czy 94 Historia
Symbole wchodzące w skład kombinacji powinny być
oznaczone do automatycznego przetwarzania
Prawostronne skracanie symbolu musi prowadzić
do szerszego poziomu klasy (np. przypadek zakresu klas)
Konieczność zachowania odpowiedniego porządku
dodawanych symboli poddziałów wspólnych
Powstałe ciągi porządkowane są inaczej niż proponuje
system UKD
UKD – implementacja z zapisem prostym
Zarządzanie klasyfikacją
Interfejs użytkownika: prezentacja z odpowiednikami
lub bez z zaznaczeniem hierarchii (wcięcie, inny znak)
Kartoteka wspomagająca przeglądanie i wyszukiwanie:





symboli klas razem z odpowiednikami
terminów, które nie występują w opisie
odsyłaczy „zob. też”
określenie hierarchii w obsłudze odchyleń notacji
wyświetlanie (nie przetwarzanie czy sortowanie) symboli
złożonych
UKD – implementacja z zapisem syntetycznym
Synteza zwiększa złożoność systemu klasyfikacji
i wymaga wsparcia narzędziami zarządzania
Schemat symboli połączonych przeznaczony do
indeksowania to zorganizowany, uzgodniony schemat
terminów indeksacji, który ma swoje słownictwo
i składnię
a znaczenie każdego elementu pozostaje takie samo
na zewnątrz i wewnątrz kombinacji i może być
wyszukiwany niezależnie od sposobu połączenia np.
wynik wyboru (438) Polska pobierze wszystkie
elementy związane z Polską bez względu na temat
UKD – implementacja z zapisem syntetycznym
Są dwa wymagania dotyczące obsługi syntetycznej UKD:
istnienie symboli złożonych
wyszukiwanie każdego elementu, który jest wbudowany
w połączone symbole klasyfikacji
Zarządzanie UKD oznacza kontrolę nad indywidualnymi
symbolami używanymi osobno lub wbudowanymi
w symbole połączone. Kontrola ta powinna opierać się
na formatowaniu danych tak, aby każdy element symbolu
był rozpoznawany przez system bez względu
na oznaczenia i wskaźniki używane do wyświetlania
i niezależnie od jego miejsca w połączeniu
UKD – implementacja z zapisem syntetycznym
Problemy z wdrażaniem
Kluczowym znaczeniem dla funkcjonowania
klasyfikacji jest łatwość użytkowania i zarządzania
narzędziem indeksowania - plikiem zawierającym
połączone symbole
W zależności od polityki indeksowania i wdrażania,
całkowita liczba połączonych symboli może wynosić
od kilku do kilkuset tysięcy rekordów
Dlatego system połączonych symboli UKD prowadzący
do tworzenia nowych opisów pojęć, powinien być
stopniowo budowany raczej we współpracy przez wielu
implementujących
UKD – implementacja z zapisem syntetycznym
Problemy z wdrażaniem
Przeglądanie i wyszukiwanie - wymagania:
wyszukiwanie symboli prostych z wszystkich symboli
możliwość zapisu połączonych symboli UKD
możliwość wyszukiwania przez skracanie symboli
możliwość wyszukiwania oddzielnie każdego poddziału
wspólnego
możliwość wyszukiwania symboli znajdujących się
w środku zakresu symboli
Większość z tych problemów można rozwiązać, kiedy
implementowana klasyfikacja jest zakodowana
UKD – implementacja z zapisem syntetycznym
Zarządzanie klasyfikacją
Można wybrać jedno z następujących podejść:
dostarczanie zbudowanych i oddzielnie zapisanych
elementów UKD dla opisów bibliograficznych
utrzymywanie klasyfikacji jako osobnych danych
z systemem linków do wyszukiwania informacji
utrzymywanie obu – indeksu z rekordów
bibliograficznych i kartoteki danych klasyfikacji
Trzecie podejście jest najbardziej wydajne
i niezawodne, gdyż symbole można odpowiednio
przetwarzać i wymieniać
Znaczenie formatów danych
Im wyższy poziom sformalizowania
danych klasyfikacji, tym staje się ona
potężniejsza, wykazuje mniejszą
podatność na manipulację, ale wymaga
więcej pośrednictwa od obsługującego ją
człowieka oraz bardziej wyrafinowanych
mechanizmów jej wdrażania i eksploatacji.
Obecnie istniejące formaty danych
i analizy struktury mogą pomóc
w gromadzeniu informacji niezbędnych
do stworzenia funkcjonalnej bazy danych,
mogą utrzymywać funkcje kontroli przez
kartotekę, konserwacji, wymiany danych,
wyszukiwania informacji oraz odpowiednią
funkcjonalność narzędzia.
Znaczenie formatów danych
Formaty danych klasyfikacji:
UKD MRF dostępne w pliku MRF Manual:
nie ma w strukturze informacji na temat
obchodzenia się z elementami połączonych
notacji potrzebnych do pełnego
zautomatyzowania
UNIMARC Format danych klasyfikacji:
w obsłudze symboli połączonych
występowały problemy w przeszukiwaniu
znaczeń odrębnych elementów
i zarządzaniu globalnymi zmianami
w elementach składowych
Znaczenie formatów danych
Formaty danych klasyfikacji:
MARC 21 Format dla klasyfikacji:
opracowany w 1991 r. (i na bieżąco
aktualizowany) przez Bibliotekę Kongresu,
w celu zarządzania systemami
klasyfikacji: Biblioteki Kongresu oraz
Dewey’a.
Obie klasyfikacje są numeryczne,
a nie syntetyczne, więc format może
nie do końca odpowiadać na przedstawione
potrzeby.
Jednak można tu wprowadzić takie dane
jak: odpowiednik, uwagi, instrukcje,
przykłady, oznaczyć hierarchię, strukturę
indeksu terminów, odsyłacze itp.
MARC 21 dla danych klasyfikacji
Rekord MARC 21 składa się z trzech elementów:
struktury rekordu, która jest implementacją
międzynarodowego standardu Format wymiany
informacji (ISO 2709) i jego amerykańskiego
odpowiednika Bibliograficzna wymiana informacji
(ANSI / NISO Z39.2)
oznaczenia zawartości – kodów i konwencji
identyfikujących i charakteryzujących elementy
danych rekordu
treści elementów danych określone przez standardy
spoza formatów np. schemat klasyfikacji
MARC 21 dla danych klasyfikacji
ZAKRES FORMATU KLASYFIKACJI
Format MARC 21 dla danych klasyfikacji jest nośnikiem
informacji o symbolach klasyfikacji i związanych
z nimi odpowiednikami słownymi.
Źródłem informacji jest schemat klasyfikacji określony
w polu 084 (schemat klasyfikacji i wydanie),
podpolu $a (kod schematu klasyfikacji).
MARC 21 dla danych klasyfikacji
Rodzaje rekordów klasyfikacji
Rekordy klasyfikacji różnią się od innych typów
rekordów MARC kodem <w> (dane klasyfikacji)
w polu Leader/06 (typ rekordu).
Pole 008/06 (rodzaj rekordu) określa:
rekord poddziału wspólnego – pole 153 zawiera symbol
lub zakres z tablic poddziałów wspólnych – kod <a>
rekord tablic głównych – pole 153 zawiera symbol lub
zakres z tablic głównych - kod <b>
rekord indeksu terminów – pole 154 zawiera termin
reprezentujący koncept i nie związany z symbolem
lub zakresem – kod <c>
MARC 21 dla danych klasyfikacji
Rodzaje symboli
Symbole klasyfikacji wraz z odpowiednikami mogą pojawić
się w polach 153, 453, 553.
Pole 008/07 (typ symbolu klasyfikacji) określa:
symbol pojedynczy – symbol lub początek zakresu
w powtarzalnym $a
zdefiniowany zakres symboli – określona w tablicach
rozpiętość symboli od początkowego z $a, do końcowego
z $c
sumaryczny zakres symboli – pojedyncze symbole
określone są we własnych rekordach, a odpowiednik z $j
podsumowuje temat
MARC 21 dla danych klasyfikacji
Wykorzystanie symboli
w rekordach bibliograficznych i kartoteki
Pole 080 rekordu bibliograficznego zawiera symbol UKD.
Symbol klasyfikacji może być:
ważny – stosowany w rekordzie bibliograficznym,
kartotece lub do tworzenia symboli połączonych
częściowo ważny – w przypadku zakresu symboli, gdy
tylko jeden jest ważny i tylko on może być stosowany
nieważny – symbol nie może być stosowany, ale tworzy
się rekord, ponieważ wymagany jest bardziej
szczegółowy odsyłacz niż z pola 453
MARC 21 dla danych klasyfikacji
Wymagane pola danych klasyfikacji
Rekord danych klasyfikacji powinien zawierać
co najmniej następujące pola:
008 – dane kontrolne
084 – schemat klasyfikacji i wydanie
153 – symbol klasyfikacji
lub
154 – ogólny wyjaśniający indeks terminów
MARC 21 dla danych klasyfikacji
ELEMENTY REKORDÓW KLASYFIKACJI
Rekord klasyfikacji składa się z 3 głównych komponentów:
Leader – pozycjonowane liczby lub wartości kodów
dostarczające informacji do przetwarzania rekordu
Directory – tablica adresów zawierająca etykiety,
długość i położenie każdej zmiennej wyjściowej
w rekordzie
Pola danych – dane w rekordzie zorganizowane w polach
identyfikowanych 3-numeryczną etykietą
MARC 21 dla danych klasyfikacji
Typy pól danych:
pola kontrolne – pola 00X zawierające numer kontrolny
i zakodowane informacje do przetwarzania rekordów.
Nie mają wskaźników ani kodów podpól
pola danych zmiennej długości – pozostałe pola
zdefiniowane w formacie. Identyfikowane są przez
etykietę i zawierają dwa wskaźniki pozycji oraz kod
podpola poprzedzający każdy element danych
MARC 21 dla danych klasyfikacji
Bloki pól danych (według pierwszego znaku etykiety):
0XX – informacje kontrolne, numery, kody
1XX – symbole klasyfikacji i odpowiedniki
2XX – odsyłacze „zob.”
3XX – odsyłacze „zob. też”
4XX – tropy symboli odrzuconych
5XX – tropy symboli ważnych
6XX – pola uwag
70X -75X – dodatkowe punkty dostępu
76X – pola symboli zbudowanych
MARC 21 dla danych klasyfikacji
Pola symboli klasyfikacji, odsyłaczy i tropów
(153, 253, 353, 453, 553)
mają takie same dwa ostatnie znaki etykiety.
Wskaźnik pozycji – dwa pierwsze znaki w polach danych,
zawiera wartości interpretujące lub uzupełniające dane.
Kody podpól – wyróżniają elementy danych w polu
wymagające osobnej manipulacji.
MARC 21 dla danych klasyfikacji
Stałe wyświetlania są konwencją wyświetlania pojęć,
wyrażeń, odstępów, znaków interpunkcyjnych, która
może być generowana przez system w określonym
porządku w celu wizualnej prezentacji danych
najbardziej przemawiającej do użytkownika.
Do tego wykorzystywane mogą być niektóre etykiety pól,
kody podpól, wartości wskaźników oraz wartości kodów.
Stosowanie stałych wyświetlania jest określane przez
każdą organizację lub system.
Bibliografia
1.
SLAVIC, A. UDC implementation: from library shelves to
a structured indexing language. [on-line]. [dostęp 21
kwietnia 2010]. Dostępny w World Wide Web:
http://archive.ifla.org/IV/ifla69/papers/032eSlavic.pdf
2.
MARC 21 Format for Classfication Data. [on-line].
[dostęp 15 stycznia 2010]. Dostępny w World Wide
Web:
http://www.loc.gov/marc/classification/eccdhome.html
DZIĘKUJĘ ZA UWAGĘ