WYBRANE PROBLEMY TEORII I PRAKTYKI JĘZYKÓW INFORMACYJNO -WYSZUKIWAWCZYCH Czym są i do czego służą języki informacyjno-wyszukiwawcze?

Download Report

Transcript WYBRANE PROBLEMY TEORII I PRAKTYKI JĘZYKÓW INFORMACYJNO -WYSZUKIWAWCZYCH Czym są i do czego służą języki informacyjno-wyszukiwawcze?

WYBRANE PROBLEMY TEORII
I PRAKTYKI JĘZYKÓW
INFORMACYJNO
-WYSZUKIWAWCZYCH
Czym są i do czego służą języki
informacyjno-wyszukiwawcze?
Język informacyjno-wyszukiwawczy = język
informacyjny = język indeksowania = JIW
Pojęcie
języków
informacyjno-wyszukiwawczych
specyficznych, rozmaicie urzeczywistnianych systemów
językowych pojawiło się w literaturze w latach
sześćdziesiątych 20 wieku, choć same języki istniały
dużo wcześniej.
JIW jest to język sztuczny, którego wyspecjalizowanymi
funkcjami jest:
wyrażanie cech treściowych i pozatreściowych
(formalnych) dokumentów (także pytań użytkowników)
przez tworzenie ich syntetycznych reprezentacji
umożliwienie
odnalezienia
(wyszukania)
tych
dokumentów, które są potrzebne użytkownikowi.
Charakterystyka wyszukiwawcza = charakterystyka
dokumentu = reprezentacja dokumentu = opis
dokumentu
Instrukcja wyszukiwawcza = charakterystyka
pytania = reprezentacja pytania
JIW nie jest budowany jako cel sam w sobie, jako
sztuka dla sztuki. Jego przeznaczeniem jest takie
funkcjonowanie w systemie, które gwarantuje
optymalne zaspokojenie potrzeb i oczekiwań
użytkowników systemu.
JIW – podobnie jak każdy inny język – jest
systemem złożonym ze słownictwa i gramatyki.
SŁOWNICTWO
Zbiór wyrazów danego JIW.
Może być sztuczne lub paranaturalne.
Słownictwo sztuczne charakterystyczne jest np. dla
UKD:
wyraz 902 w UKD oznacza archeologię,
wyraz 09 rękopisy książki rzadkie cimelia.
Słownictwo paranaturalne charakterystyczne jest dla
języków
haseł
przedmiotowych,
języków
deskryptorowych i słów kluczowych; zawsze jest
równokształtne z wyrażeniami jakiegoś języka
naturalnego.
Z uwagi na metodykę gromadzenia i aktualizowania
języka, JIW dzieli się na:
języki o słownictwie niekontrolowanym (swobodnym) –
języki słów kluczowych zwane też językami
swobodnych słów kluczowych
języki o słownictwie kontrolowanym
Słownictwo JIW jest zazwyczaj rejestrowane
w słownikach JIW. W zależności od typu JIW
słowniki te nazywamy: tablicami klasyfikacyjnymi,
słownikami JHP (tematów i określników), tezaurusami.
GRAMATYKA
W zależności od sposobu łączenia wyrazów JIW w
zdania wyróżniamy następujące typy gramatyk JIW:
gramatykę zerową, pozycyjną, częściowo pozycyjną i nie
pozycyjną.
Gramatyka zerowa
Mamy z nią do czynienia w klasyfikacjach w pełni
wyliczających, tj. takich, w których tablicach
wymienione są wszystkie symbole dopuszczone do
użycia i w których nie ma możliwości łączenia
symboli. Utworzenie zdania polega na wybraniu z
tablic odpowiedniego symbolu. Jedyną regułą tej
gramatyki jest „reguła o niedołączaniu” kolejnych
wyrazów, co sprawia że wszystkie zdania są
jednowyrazowe.
Gramatyka pozycyjna
Mamy z nią do czynienia wtedy, gdy znaczenie i
interpretacja wyrażenia złożonego określane są ściśle
przez szyk i miejsce wyrazów w zdaniu, zaś zmiana
szyku pociąga za sobą zmianę znaczenia. Np.: w JHP
hasło Literatura polska--historia sygnuje książkę,
której przedmiotem jest historia polskiej literatury
pięknej, zaś hasło Historia--literatura polska – książkę
o obecności wątków historycznych w literaturze.
Gramatyka częściowo pozycyjna
Mamy z nią do czynienia wtedy, gdy miejsce pewnych
wyrazów w zdaniu jest ściśle określone i nie może
ulegać zmianom, zaś miejsce innych jednostek może
być zmieniane bez zmiany znaczenia całości. Ten typ
gramatyki umożliwia pewne odmienności w zapisie.
Np..: w UKD istnieje możliwość odwrócenia kolejności
symboli głównych łączonych przez + oraz : bez zmiany
znaczenia całego symbolu złożonego. Znaczenie
symboli 56 : 016 i 016 : 56 jest takie samo (bibliografia
przedmiotowa paleontologii).
Gramatyka pozycyjna i częściowo pozycyjna jest
charakterystyczna dla tych JIW, w których występują
zarówno wyrazy samodzielne składniowo (w JHP są to
tematy, w UKD – symbole główne), jak i składniowo
niesamodzielne (określniki; symbole pomocnicze).
Określenie gramatyki jako pozycyjnej lub częściowo
pozycyjnej wskazuje na cechy przeważające w danym
typie języka. Gramatyka niektórych JIW bywa podobnie
niekonsekwentna i kapryśna jak gramatyka języków
naturalnych.
Gramatyka swobodna
Mamy z nią do czynienia wtedy, gdy miejsce wyrazu
w zdaniu nie jest ustalone. Bywa nazywana
gramatyką szyku dowolnego. Obowiązuje w niej na
ogół tylko jedna zasada – nie powtarzania tego
samego wyrazu w obrębie jednego zdania. Jest
charakterystyczna dla języków słów kluczowych i
języków deskryptorowych.
JĘZYK INFORMACYJNO-WYSZUKIWAWCZY
JAKO INTEGRALNY ELEMENT SYSTEMU
Od języka informacyjno-wyszukiwawczego (JIW)
zależy zarówno wartość zbioru wyszukiwawczego, na
przykład katalogu biblioteki, będąca pochodną
możliwości wyrażenia za pomocą danego JIW
informacji zawartej w dokumentach, jak i możliwości
wyszukiwawcze systemu, wyznaczane przez strukturę
paradygmatyczną
i
syntagmatyczną
języka
informacyjno-wyszukiwawczego.
DOBRY JĘZYK INFORMACYJNO
-WYSZUKIWAWCZY
Przeprowadzone wiele lat temu badania (znane jako badania
cranfieldzkie I i II) wykazały, że:
• typ wykorzystywanego JIW ma stosunkowo niewielki wpływ na efektywność
wyszukiwania informacji;
• jeżeli do języków różnych typów wprowadzimy te same pojęcia, to języki te
będą miały taką samą lub bardzo zbliżoną efektywność;
• sposób posługiwania się językiem wpływa na efektywność wyszukiwania w
większym stopniu niż zastosowanie tego lub innego JIW. Szczególne znaczenie
mają tu kwalifikacje i rzetelność osób opracowujących dokumenty;
• teoretycznie im bogatszy jest język informacyjno-wyszukiwawczy, im
bardziej skomplikowany, tym większe ma możliwości uzyskania wysokiej
efektywności. W praktyce jest inaczej wskutek trudności spowodowanych
trudnością nauczenia się języka zarówno przez bibliotekarzy, jak i
użytkowników.
Dobry język informacyjno-wyszukiwawczy to najogólniej
taki, który jest odpowiedni, przydatny, stosowny do sytuacji
danej biblioteki, czyli:
 zawiera te pojęcia (wszystkie lub zdecydowaną większość i na odpowiednim
poziomie szczegółowości), które będą potrzebne do takiego
charakteryzowania dokumentów, żeby użytkownik mógł je odszukać w
odpowiedzi na swoje pytania. Inaczej mówiąc, dobry JIW ma wystarczająco
szeroki zakres słownictwa o dostatecznej szczegółowości;
 charakteryzuje się poprawną i właściwą paradygmatyką;
 jest jednoznaczny i niesynonimiczny;
 stosunkowo łatwy do nauczenia się przez bibliotekarzy i w pewnym stopniu
przez użytkowników; im większy jest stopień samodzielności
wyszukiwawczej użytkowników, z którym zjawiskiem mamy do czynienia w
systemach zautomatyzowanych, a zwłaszcza dostępnych w sieciach, tym
większa jest waga postulatu łatwości;
 odpowiada warunkom technicznym i finansowym biblioteki.
To warunki panujące w bibliotece są pryzmatem, przez który należy
patrzeć na różne języki informacyjno-wyszukiwawcze w celu ich
porównania, oceny i ewentualnie wyboru.
Język informacyjno-wyszukiwawczy jeśli ma być sprawnym i
przyjaznym narzędziem
wyszukiwania informacji, musi być
współuczestnikiem gry informacyjnej, jaką prowadzą z sobą
użytkownicy i systemy, a nie wyizolowanym, choćby
najdoskonalszym,
elementem
systemu
informacyjnowyszukiwawczego.
JĘZYK INFORMACYJNO-WYSZUKIWAWCZY A
ZBIÓR INFORMACYJNY
Zbiór informacyjny to dokumenty prymarne (pierwotne), na przykład
książki, czasopisma, broszury, dokumenty kartograficzne, druki
muzyczne, niepublikowane prace magisterskie, doktorskie, rękopisy,
fotografie, dokumenty elektroniczne, taśmy magnetofonowe, kasety
wideo. W rezultacie różnych działań wykonywanych na dokumentach
prymarnych
powstają
dokumenty
zwane
pochodnymi
lub
reprezentacjami dokumentów prymarnych, na przykład opisy
bibliograficzne czy rzeczowe, będące podstawą utworzenia zbioru
wyszukiwawczego.
Między językiem informacyjno-wyszukiwawczym a zbiorem
dokumentów prymarnych istnieje bezpośredni i ścisły związek. Na
ogół dostrzega się związek między treścią dokumentów prymarnych a
zakresem JIW, zapominając o takich czynnikach jak: typy tworzących
zbiór informacyjny dokumentów, wielkość zbioru (liczba dokumentów),
tempo jego przyrostu czy tempo starzenia się informacji zawartej w
dokumentach.
Nie wolno też zapominać o cechach
pozatreściowych dokumentów takich
jak forma, cechy fizyczne, w tym
cechy nośnika.
JĘZYK INFORMACYJNO-WYSZUKIWAWCZY
A UŻYTKOWNICY INFORMACJI
Problematyka użytkowników informacji, ich potrzeb i badań
mimo jej fundamentalnego znaczenia dla wszelkich działań
informacyjno-wyszukiwawczych nie jest odpowiednio
reprezentowana w teorii i praktyce bibliotecznej.
Jednym z wykładników społeczeństwa informacyjnego, którym
chcielibyśmy być, nie jest wbrew pozorom ilość informacji, ale jej
jakość, relewantność i dostępność.
Wiedza o użytkowniku, umiejętność wspólnego z użytkownikiem
rozwiązywania jego problemów, nawiązywania z nim kontaktu,
wychodzenia mu naprzeciw, to fundamenty, na których należy
budować
praktykę
biblioteczno-informacyjną.
Jedynym
wiarygodnym sprawdzianem sensu i właściwego wymiaru wielu
podejmowanych prac teoretycznych i działań praktycznych są
użytkownicy, ich zaspokojone potrzeby i satysfakcja.
Analogicznie przedstawia się wpływ użytkowników
informacji i ich potrzeb na kształt języka informacyjnowyszukiwawczego W sferze werbalnej projektowanie i
aktualizowanie JIW jest ściśle związane z użytkownikami, w
praktyce bywa różnie.
Tylko pewna część osób „użytkujących” informację, czyni to
za pośrednictwem instytucji. Znacząca (nikt nie wie, jak duża)
część użytkowników informacji zaspokaja swoje potrzeby
informacyjne kanałami nieformalnymi. Czasami dzieje się i
tak, że użytkownik zrażony, zniechęcony efektami kontaktów
z biblioteką czy ich jakością, zrywa je, przechodząc do „szarej
strefy” nie-użytkowników (ang. non-users).
Źródłem cennych informacji o problemach i potrzebach
informacyjnych użytkowników są i powinny być pytania
kierowane przez nich do systemów informacyjnowyszukiwawczych. Chodzi tu zarówno o pytania „surowe”, w
takim brzmieniu, w jakim zadają je użytkownicy, jak i o
pytania „wynegocjowane”, będące rezultatem dialogu między
pośrednikiem (bibliotekarzem, pracownikiem informacji) a
użytkownikiem.
Z użytkownikiem należy rozmawiać, a nie mówić
do niego.
JĘZYK INFORMACYJNO-WYSZUKIWAWCZY
A ŚRODKI TECHNICZNE
Wydaje się, że obecnie nie wykorzystuje się w pełni
możliwości i szans stwarzanych przez technikę. Zbyt często
JIW
stosowane
w
systemach
zautomatyzowanych
przypominają prymitywne, elektroniczne kopie ich
„papierowych” odpowiedników. Oczywiście konsekwencji
stosowania niedobrego języka lub złego używania dobrego
JIW nie zrekompensuje ani najdroższy sprzęt, ani
najnowocześniejsze oprogramowanie, z drugiej jednak strony
ignorowanie środowiska technicznego jest marnotrawstwem i
błędem.
Przede wszystkim należy pamiętać, że:
 JIW powinien stanowić „naczynie połączone” z repertuarem technik
wyszukiwawczych,
jakim
dysponuje
dany
system
i
aparatem
metainformacyjnym (m. in. odsyłacze);
 w systemach zautomatyzowanych coraz częściej rezygnuje się z ograniczania
wyszukiwania rzeczowego tylko do elementów specjalnie do tego celu
przeznaczonych (hasła przedmiotowe, symbole klasyfikacyjne, deskryptory).
Powszechnie korzysta się z możliwości przeszukiwania wszystkich lub
przynajmniej wielu pól rekordu, także przy wykorzystaniu słów kluczowych i
algebry Boole’a.
 inną tendencją jest wzbogacanie opisu dokumentu o nietypowe dla
tradycyjnych katalogów bibliotecznych elementy, np. adnotacje lub analizy
dokumentacyjne, terminy pobierane ze spisów treści czy indeksów rzeczowych,
niekiedy wręcz całe spisy i indeksy. Obserwuje się zjawisko zmierzania w
kierunku systemów hiper- i pełnotekstowych, chociaż pełnotekstowość różnie
bywa rozumiana;
 odpowiednie oprogramowanie daje bibliotekarzom możliwość zapoznawania
się z przebiegiem wyszukiwań zrealizowanych przez użytkowników, z jego
etapami, doborem terminów, strukturą wyrażeń złożonych itd., co z kolei może
i powinno być wykorzystane do modyfikowania JIW;
 istotnie zmieniło się miejsce słownika JIW w katalogu online. Słownik
powinien być zintegrowany z bazą bibliograficzną, a jego zawartość należałoby
móc oglądać na każdym etapie procesu wyszukiwawczego, modyfikując, w
miarę uzyskiwania kolejnych informacji, wyjściową instrukcję wyszukiwawczą
(poszerzając ją, zawężając lub modyfikując w inny sposób). Informacje ze
słownika JIW wzbogacają indeks zbioru wyszukiwawczego, a zbiór
wyszukiwawczy wzbogaca słownik JIW na przykład o liczniki wystąpień
wyrażeń JIW w katalogu mówiące, ile dokumentów jest scharakteryzowanych
danym terminem, co umożliwia użytkownikom m.in. przyjęcie odpowiedniej
strategii wyszukiwawczej.
WAŻNIEJSZE CZYNNIKI WPŁYWAJĄCE NA
SKUTECZNOŚĆ INFORMACYJNĄ KATALOGÓW
Wyszukiwanie rzeczowe, w tym
przedmiotowe, jest uchem igielnym
większości OPAC-ów.
Jakość opracowania rzeczowego, obok jakości samego języka
informacyjno-wyszukiwawczego i cech ergonomicznoużytkowych systemu takich jak na przykład jakość interfejsu,
jest jednym z czynników w największym stopniu
decydujących o zadowoleniu użytkowników.
Gwarancja otrzymywania usługi, jaką jest opracowanie
rzeczowe na określonym poziomie, prowadzi do powstania
bezcennej wartości psychologicznej, jaką jest zaufanie do
instytucji oferującej usługę. A co do tego, czym jest zaufanie i
jaka jest jego moc sprawcza, zwłaszcza w tak szybko
zmieniającym się środowisku samych bibliotek i ich
otoczeniu, nie trzeba nikogo przekonywać.
Jeśli proces opracowania rzeczowego modelowo podzielić na
cztery etapy:
• analiza (opracowywanego dokumentu),
• redukcja (informacji),
• tworzenie charakterystyki słownej,
• jej przekład na język informacyjno-wyszukiwawczy,
to okaże się, że na każdym z nich mogą się pojawić zagrożenia jakości
całego procesu opracowania rzeczowego.
Poczynając od tak pospolitego, jak fałszywa interpretacja
treści dokumentu, poprzez błędną ocenę relewancji
prowadzącą do nadmiernej, lub odwrotnie, zbyt ograniczonej
redukcji informacji, a na złym przekładzie kończąc. Trzeba
uczciwie przyznać, że w praktyce stosunkowo najrzadziej
zdarzają się przypadki fałszywej interpretacji treści. Gorzej
jest już na etapie redukowania informacji uzyskanych w
rezultacie analizy dokumentu.
Jakość opracowania rzeczowego zależy między innymi od:
 jakości analizy opracowywanych dokumentów,
 właściwej selekcji informacji,
 odpowiedniej syntezy wyselekcjonowanych informacji,
 prawidłowego (bezbłędnego) przekładu na JIW,
 znajomości samego JIW,
 prawidłowości doboru JIW do potrzeb systemu i jego użytkowników,
 wiedzy ogólnej i specjalistycznej osoby opracowującej dokument,
 ew. znajomości języka obcego, w jakim napisany jest dokument,
 innych czynników o charakterze predyspozycji psychicznointelektualnych, które choć trudne do uchwycenia i opanowania nie
powinny być ignorowane.
Wraz ze wzrostem liczby jednostek leksykalnych w JIW rośnie
znaczenie właściwej struktury semantycznej języka i jej prezentacji.
Struktura płaska, z którą mamy do czynienia, gdy artykuły słownikowe
są szeregowane tylko i wyłącznie abecadłowo, może nie mieć wpływu na
skuteczność wyszukiwania w przypadku niewielkich słowników
możliwych do opanowania pamięciowego. W przypadku słowników
dużych, znacznie przekraczających liczebność zasobu aktywnego
systemu leksykalnego człowieka, należałoby koniecznie zadbać o
zaopatrzenie słownika JIW w część rzeczową (systematyczną), jak to się
obligatoryjnie dzieje w językach deskryptorowych.
W przypadku JIW o notacji naturalnej, czyli takich, których wyrazy są
równokształtne z wyrazami jakiegoś języka naturalnego, trzeba troszczyć
się, żeby znaczenia poszczególnych wyrażeń JIW nie odbiegały zbyt
daleko od znaczeń odpowiadających im wyrażeń języka naturalnego.
Użytkownik odnajdując bowiem znany wyraz w JIW będzie się skłaniał
ku przypisaniu mu znaczenia takiego samego lub bliskiego znaczeniu,
jakie ma on w języku naturalnym.
Należy
pamiętać,
że
katalogi
biblioteczne, także zautomatyzowane,
wymagają własnej siatki odsyłaczy
całkowitych i uzupełniających.
Projektując JIW, ulepszając ten, który już jest wykorzystywany, tworząc
katalogi online, zwłaszcza duże, nie zapominajmy, że nie robimy tego
dla siebie. Nie ignorujmy użytkownika! Starajmy się uczynić katalogi,
interfejsy, języki informacyjno-wyszukiwawcze przyjaznymi. Ostateczna
weryfikacja naszych wysiłków dokonywana jest bowiem przez
użytkowników, którzy przychodząc do biblioteki (lub nie), korzystając z
katalogu (lub nie), oceniając go pozytywnie (lub negatywnie) itd. wydają
sąd o naszej pracy i wrażliwości na potrzeby środowiska.
Konkludując, chciałabym powiedzieć, że skądinąd imponujący dorobek
teorii języków informacyjno-wyszukiwawczych i innych dyscyplin, z
których teoria JIW czerpie swoje zasilenia informacyjne, nie ma
proporcjonalnie dużego wpływu na praktykę stosowania JIW i wszelką
działalność informacyjno-wyszukiwawczą bibliotek. Przyczyn jest wiele.
Ale najważniejszą jest chyba obustronna nieumiejętność porozumienia,
niedostateczne uznanie wzajemnych kompetencji, brak pokory wobec
własnych wad i zalet drugiej ze stron, a przede wszystkim brak potrzeby
i wizji jednego, spójnego, sprawnego i przyjaznego systemu
informacyjno-wyszukiwawczego dla określonej (mniejszej lub większej)
grupy bibliotek.