Biblioteka cyfrowa - Instytut Informacji Naukowej i Bibliologii UMK

Download Report

Transcript Biblioteka cyfrowa - Instytut Informacji Naukowej i Bibliologii UMK

Biblioteki cyfrowe
– wprowadzenie do problematyki
M. Kowalska
Kontekst bibliotek cyfrowych: e-literatura vs. liberatura
• Cyberkultura  istnienie w przestrzeni sieciowej książek, czasopism,
dzienników, zasobów źródeł, itp.  information overload i overlook, błędna
interpretacja terminów
• E-literatura:
– literatura funkcjonująca w środowisku elektronicznym,
– literatura dostępna w Internecie.
• Liberatura:
–
–
–
–
–
–
–
rodzaj literatury, w którym tekst i materialna forma książki tworzą organiczną całość, a wszelkie elementy, w tym również
niewerbalne, mogą być nośnikami znaczenia,
w utworze tego typu znacząca jest nie tylko warstwa słowna, ale również kształt i budowa książki, jej format, liczba stron,
układ typograficzny, wielkość i krój pisma, zintegrowany z tekstem rysunek czy fotografia, wreszcie rodzaj papieru lub
innego materiału, dzieło może przybierać dowolną postać i być zbudowane z dowolnego materiału,
czytelnik ma do czynienia z dziełem totalnym, które może przybrać dowolny kształt, co w praktyce oznacza niekiedy
radykalne odejście od tradycyjnej budowy książki,
jest to zarazem dzieło w pełni autorskie, kontrolowane przez pisarza na każdym etapie powstawania,
ideę liberatury jako odrębnego rodzaju literackiego wysunął w 1999 r. Zenon Fajfer, a pierwszym utworem określanym tym
mianem był trójksiąg „Oka-leczenie” autorstwa Fajfera i Katarzyny Bazarnik (wydanie prototypowe w nakładzie 9
egzemplarzy, Kraków 2000),
samo zjawisko ma tradycję znacznie starszą niż istnienie terminu, bowiem dzieła o charakterze liberackim tworzyli już tacy
pisarze jak Sterne, Blake, Mallarmé, Wyspiański, Cendrars, Joyce, Queneau, B. S. Johnson czy amerykańscy
postmoderniści z Federmanem, Gassem i Sukenickiem na czele (złamanie klasycznej struktury narracyjnej, nieliniowość
fabuły, mnożenie pozornie niespójnych wątków),
Od 2002 r. istnieje pierwsza w świecie Czytelnia Liberatury w Krakowie przy Bibliotece Sztuki Małopolskiego Instytutu
Kultury, w której zbiorach znajduje się dość pokaźna już kolekcja książek liberackich z różnych krajów i epok. Do
popularyzacji liberatury przyczynia się również seria wydawnicza Korporacji Ha!art, w której ukazują się zarówno książki
powstające współcześnie, jak i klasyka. (Więcej: http://www.liberatura.pl)
Kontekst bibliotek cyfrowych:
e-dokument vs. e-publikacja
•
•
•
Dokument elektroniczny (inaczej dokument cyfrowy, dokument binarny) - w informatyce
dokument w postaci pliku tekstowego, graficznego, muzycznego, filmowego lub mieszanego
będącego wynikiem pracy z danym programem komputerowym, dający się zapisać, a następnie
odczytać. Posiada cechy dokumentu, czyli potwierdza prawdziwość zaistnienia danego
wydarzenia, okoliczności, zjawiska oraz cechy pliku. Mogą być więc dowodem w procedurach
prawnych. Od pojęcia dokument cyfrowy należy wyraźnie odróżnić dokument podpisany cyfrowo.
Dokumentem cyfrowym zawierającym podpis cyfrowy jest np. certyfikat cyfrowy.
Normy:
– Świat: ISO 15489
– Polska:
• PN-ISO 15489-1:2006 i in.
• Ustawa o informatyzacji ... (Dz.U. 2005 nr 64, poz. 565),
• Ustawa o świadczeniu usług drogą elektroniczną (Dz.U. 2002 nr 144, poz. 1204),
• Ustawa o podpisie elektronicznym (Dz.U. 2001 nr 130, poz. 1450),
• Ustawa o zmianie ustaw w celu ujednolicenia terminologii informatycznej (Dz. U. 2008
nr 171, poz. 1056),
• Kodeks Karny.
Wg PN-ISO 690-2 „Informacja i dokumentacja. Zarządzanie dokumentami” dokument
elektroniczny to dokument istniejący w postaci elektronicznej, dostępny za pośrednictwem techniki
komputerowej  postać, medium.
Cechy dokumentu elektronicznego
• utrwalone na materialnym nośniku,
• można je wielokrotnie odtwarzać w formie umożliwiającej ich percepcję,
• nie jest istotny rodzaj nośnika (HDD, DVD ...), istotne jest, aby dane mogły
być wielokrotnie odtwarzane,
• zawartość – tekst, hypertekst, obraz, dźwięk,
• logiczna struktura, która nie musi być tożsama ze strukturą fizyczną, może być
zawarta bezpośrednio w dokumencie, w bazie danych, itp. (dołączona do
treści),
• kontekst, czyli metadane techniczne określające w jakiej postaci dokument
będzie prezentowany.
Metadane w e-dokumencie
•
E-dokument składa się niejako z dwóch warstw: widocznej dla oka treści i czytelnych dla
maszyn cyfrowych metadanych, wśród których powinny znaleźć się następujące
informacje określające:
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
twórców i współtwórców dokumentu,
rozmiar dokumentu (ilość znaków, ilustracji, rozmiar w bajtach itp.),
datę i czas powstania dokumentu,
status dokumentu (roboczy, wstępnie zatwierdzony, zatwierdzony),
datę i czas zatwierdzenia dokumentu oraz osobę/instytucję upoważnioną do zatwierdzenia,
tytuł dokumentu,
powiązania/relacje z innymi dokumentami,
tematykę dokumentu,
język dokumentu,
cel powstania dokumentu (w szczególności adresatów dokumentu),
dostępność treści dokumentu (ograniczenia dotyczące czasu lub osób upoważnionych do odczytania treści)
prawa autorskie (czy dokument jest chroniony prawem autorskim, ewentualne ograniczanie dotyczące czasu,
lub obszaru eksploatacyjnego praw autorskich),
typ dokumentu (np. rozporządzenie, sprawozdanie, kwestionariusz, raport) kategorię archiwalną dokumentu
/informację o długoterminowym
przechowywaniu (obowiązkowy czas przechowywania dokumentu wraz z kompletem metadanych, czas
przekazania do archiwum państwowego),
unikatowy numer dokumentu nadany przez system teleinformatyczny,
numer kancelaryjny dokumentu określony zgodnie z obowiązującą w instytucji publicznej instrukcją
kancelaryjną.
Struktura logiczna e-dokumentu
•
Struktura logiczna dokumentu elektronicznego – sposób ułożenia informacji w dokumencie
elektronicznym zdefiniowany poprzez określenie elementów informacyjnych oraz powiązań
między nimi.
•
Kodowanie struktury logicznej dokumentu umożliwiają specjalne języki strukturalne, np.
SGML (XML, RDF).
•
Dokument w formacie strukturalnym znakomicie nadają się do przetwarzania, indeksowania,
klasyfikowania, umieszczania w bazach danych.
•
Format strukturalny nie określa ani cech fizycznych dokumentu, ani atrybutów typograficznych
(formatowanie, czcionka). Dokumenty poprawnie zapisane w formacie strukturalnym można
łatwo i automatycznie przetransformować do formatu prezencyjnego. Operacja odwrotna nie
jest możliwa.
•
Tworzenie bardzo uproszczonej struktury logicznej umożliwiają także popularne edytory dzięki
mechanizmowi „styl”.
•
SGML (ang. Standard Generalized Markup Language) został formalnie opublikowany w
październiku 1986 r. jako standard ISO-8879. SGML umożliwia kodowanie tekstów w sposób
strukturalny. Nie jest to, żaden program, ani konkretny format kodowania tekstu, ale coś
bardziej ogólnego. Jest to „metajęzyk” (czy „metaformat”) pozwalający definiować języki
(formaty) służące do opisywania logicznej struktury dokumentów.
Struktura fizyczna e-dokumentu
•
•
Struktura fizyczna dokumentu elektronicznego wynik przetworzenia, w tym
kodowania i szyfrowania, informacji zawartych w dokumencie elektronicznym na
dane w układzie bitowym (czyli format danych).
Struktura fizyczna dokumentu jest najczęściej utożsamiana z formatem
prezencyjnym dokumentu.
•
Przykładami takich formatów są dokumenty zakodowane w specjalnym języku, np.
PostScript, PDF, DJVu, RTF czy HTML.
•
Format fizyczny określa m.in.:
– atrybuty fizyczne (np. algorytmy kompresji i kodowanie),
– atrybuty typograficzne (formatowanie, czcionka).
Etapy dostępu do e-dokumentów
• Autoryzacja – proces sprawdzający, czy podmiot
(o ustalonej tożsamości) ma prawo dostępu do
zasobów, o które prosi,
• Identyfikacja - proces sprawdzający, czy
przedstawiająca się osoba (komputer, urządzenie
lub usługa) jest tą za którą się podaje,
• Autentykacja – czyli uwierzytelnianie (czy dany
podmiot jest naprawdę tym, za kogo się podaje
(identyfikacja)
i
jakie
ma
uprawnienia
(autoryzacja).
Kontekst bibliotek cyfrowych:
e-dokument vs. e-publikacja (2)
•
•
•
Publikacja elektroniczna (ang. electronic publication) — dokument, muzyka itp., utworzone z
wykorzystaniem techniki multimedialnej oraz hipertekstu i rozpowszechniane za pomocą mediów
informatycznych (w tym w Internecie). Do publikacji elektronicznych zaliczają się zarówno dokumenty
elektroniczne, jak i skomplikowane wydawnictwa, takie jak gry komputerowe.
Cechy publikacji elektronicznej:
– likwidacja barier miejsca (nieograniczony zasięg dystrybucji), czasu (szybki proces przykazu), nakładu
(dostęp przez Internet tworzy w praktyce nielimitowane audytorium),
– niski koszt nośnika (1 DVD = 1 500 000 stron tekstu),
– wyszukiwanie pełnotekstowe,
– łatwość replikowania, kopiowania,
– trwałość nośnika? (trwałość on-line?),
– możliwość prowadzenia statystyk lektury, dostępu,
– niski koszt utrzymania (serwer a magazyn),
– niskie koszty dystrybucji (w praktyce nie istnieją). indywidualizacja tempa lektury
– są odporne na „cenzurę”,
– są spontanicznym nośnikiem kultury,
– sprzyjają globalizacji,
– mogą być uzupełniane, aktualizowane i poprawiane,
– nie ulegają fizycznemu starzeniu,
– można je systematyzować wg tych samych kryteriów, co publikacje tradycyjne (drukowane), np. książki,
czasopisma, encyklopedie, itp.
Obiekty bibliotek cyfrowych to raczej publikacje elektroniczne niż dokumenty, ponieważ
przypominają książki tradycyjne i podobny jest w nich proces tworzenia (digitalizacja), redakcji
(metadane) i składu (strukturalizacja).
E-publikacja (rodzaje)
•
•
•
•
Ze wzgl. na sposób dostępu:
– on-line,
– offlinie.
Ze wzgl. na formę:
– elektroniczny wariant edycji drukowanej - wtórne (pochodne),
– wydane wyłącznie w wersji elektronicznej - prymarne,
Ze względu na wewnętrzną strukturę:
– hipertekstowe,
– hipermedialne.
Ze wzg. na analogię do dokumentów drukowanych:
– e-książki:
•
•
•
•
–
–
–
–
–
książka multimedialna - jej przekaz został wzbogacony o elementy multimedialne,
książka on-line, książka internetowa - dostępna przez Internet;
hiperksiążka, hiper-książka - jej konstrukcja przekazu oparta jest na hipertekście,
książka wizualna - prezentuje na ekranie obraz książki drukowanej, powstały w wyniku
zeskanowania tradycyjnych książek bądź też poprzez inne zabiegi techniczne,
• „żywa" książka - zawiera ilustracje, które użytkownik może zdynamizować,
• książka interaktywna, multiksiążka – jej tekst jest tworzony przez grupę autorów nadzorowaną
przez moderatora.
e-czasopisma,
e-encyklopedie, słowniki
gry i programy edukacyjne,
prezentacje instytucji,
atlasy geograficzne, historyczne itp.
Publikacja tradycyjna a e-publikacja
Przygotowanie
Autor
Recenzent
Redakcja
DTP
Maszyny
drukarskie
Publikacja tradycyjna
PDF
E-publikacja
Przygotowanie
+ metadane
E-biblioteka
Rejestracja e-dokumentów a raczej e-publikacji
w Polsce
• „Bibliografia Dokumentów Elektronicznych” jest bibliografią selekcyjną.
Rejestruje publikacje, których wydawca lub współwydawca ma siedzibę na
terenie Polski oraz wydawnictwa ogłoszone poza terenem państwa, jeżeli
ich wydawcą lub współwydawcą są instytucje krajowe lub ich agendy
zagraniczne. Nie stosuje się kryterium językowego i wartościującego.
Dobór i selekcja publikacji jest przeprowadzana na podstawie kryteriów
formalnych.
• „Bibliografia Dokumentów Elektronicznych” rejestruje:
–
–
–
–
–
–
–
Wydawnictwa zwarte,
Materiały konferencyjne,
Rozprawy doktorskie i habilitacyjne,
Spisy bibliograficzne,
Dokumenty kartograficzne,
Programy multimedialne i edukacyjne,
W wyborze wydawnictwa ciągłe publikowane w kraju z adresem redakcji i
siedzibą wydawcy na terenie Polski.
Wybrani wydawcy e-publikacji w Polsce
•
•
•
•
•
•
•
•
•
•
•
•
Edgard Multimedia - mają w dorobku publikacje elektroniczne do nauki języków obcych (Profesor Henry – angielski,
Profesor Klaus – niemiecki, Profesor Pierre – francuski) oraz inne multimedia edukacyjne (m. in. Wojny światowe,
Multimedialny świat Biblii),
Fogra Multimedia - przejęte w 2000 roku przez Optimus-Pascal Multimedia, wypuścili m.in. kilka edycji
Multimedialnej Encyklopedii Powszechnej na CD-ROM-ie, czyli elektronicznej wersji papierowej dwudziestotomowej
encyklopedii,
Longsoft Multimedia - wydawca gier (m.in. bestsellerowej Clash) oraz popularnej serii Familijny CD-Romek, która
zawiera gry edukacyjne, oparte na utworach Andersena, Barriego, Collodiego, braci Grimm,
Marksoft - wydawca gier komputerowych, programów edukacyjnych, m.in. Polonez (do nauki języka polskiego),
Prawo jazdy,
MM Interactive - wydawca między innymi rękopisu Pana Tadeusza na CD-ROM-ie,
Polskie Media Amercom - wydające periodycznie Popularną Encyklopedię A-Z i Multimedialną Encyklopedię Królów
Polskich,
Polskie Przedsiębiorstwo Wydawnictw Kartograficznych im. Eugeniusza Romera - publikuje multimedialne plany
miast polskich oraz Wielki multimedialny atlas świata i Multimedialny atlas historyczny świata,
Wydawnictwa Naukowo-Techniczne - mające w dorobku między innymi Multimedialny słownik angielsko-polski i
polsko-angielski i Multimedialny słownik niemiecko-polski i polsko-niemiecki,
Wydawnictwo Prawnicze LexisNexis - publikujące programy dla prawników Lex Polonica Maxima (prawo z
komentarzami na CD-ROM-ie), a także Lex Polonica, Lex Polonica Prima,
Wydawnictwo Wiedza i Życie - opublikowało multimedialny Leksykon polskich filmów fabularnych oraz leksykon
filmów wschodnich sztuk walki Od Bruce’a Lee do Van Damme’a,
Young Digital Poland - największym w Polsce i jednym z największych w Europie podmiotów zajmujących się
realizacją multimedialnych programów do nauki języków obcych, m. in. pakiety EuroPlus+, Wirtualna Szkoła.
Matematyka, wielojęzyczny słownik dla dzieci Lingua Land, słowniki: polsko-angielski i angielsko-polski Collinsa,
polsko-niemiecki i niemieckopolski Langenscheidta, zawierające hasła udźwiękowione, Multimedialny świat Jana
Brzechwy, Multimedialny świat Juliana Tuwima, album Andy Warhol. Legenda XX wieku, Interaktywny kurs rysowania
komiksów,
Optimus-Pascal Multimedia (Onet.pl S.A.) - encyklopedie tematyczne wydawane na licencji angielskiej firmy Dorling
Kindersley Multimedia, m. in. Dookoła Polski, Dzieje cywilizacji, Encyklopedia małego człowieka, Encyklopedia
przyrody, Historia świata, Kronika XX wieku.
Platforma udostępniania e-publikacji czyli e-biblioteka
• funkcje typowe dla drukarni:
– przetwarzanie składu;
– montowanie publikacji;
– skanowanie, konwersja;
• funkcje typowe dla wydawców:
– umowy licencyjne;
– regulacja praw autorskich;
– doraźna redakcja i skład DTP;
• funkcje typowe dla firm hostingowych:
– utrzymanie w ruchu infrastruktury serwerów i łączy.
E-biblioteka czyli biblioteka cyfrowa
•
Terminologia: biblioteka zautomatyzowana, polimedialna, elektroniczna, pełnotekstowa,
hydrydowa.
•
Biblioteka cyfrowa – to cyfrowe zasoby, cyfrowe opracowanie i cyfrowe udostępnianie.
Wychodzimy od zgromadzenia dokumentów cyfrowych (elektroniczne teksty, bazy danych,
multimedia) i/lub digitalizacji dokumentów tradycyjnych na formę cyfrową, co daje nam w
rezultacie pewien zasób, który fizycznie może być umieszczony na jednym lub wielu
serwerach. Tym, co odróżnia tworzenie tego zasobu od przypadkowego zbioru dokumentów
dostępnych w sieci, jest świadomość jego twórców, że ich zasoby będą częścią pewnej całości.
•
Biblioteka wirtualna – fizycznie mocno rozproszony zbiór cyfrowy z "przezroczystym"
dostępem  użytkownik natrafiając np. na dowolną wzmiankę o pisarzu, temacie czy zjawisku,
może natychmiast otrzymać (oczywiście na życzenie) relewantny dokument poszerzający
wskazaną tematykę, nie zważając zupełnie na to, jakimi technikami dokument został
wyszukany oraz z jakiego fizycznie miejsca pochodzi. Wykaz odnośników.
Rozważania definicyjne:
– za granicą: M. Buchland (1992), P. Barker - Encyclopedia of Library and ... (1996);
– w Polsce: E. Chmielewska-Gorczyca (1996), J. Czermiński (1997), A. Radwański (1999);
– całość: D. Grygrowski: Dokumenty nieksiążkowe w bibliotece. Warszawa 2001, s. 157-164.
Typy bibliotek wg Google’a
2007 r.
2008 r.
2010 r.
Biblioteka cyfrowa a strony WWW
•
•
•
•
•
•
Biblioteka cyfrowa to źródło informacji kwalifikowanej –podobnie jak biblioteka
tradycyjna.
Biblioteka cyfrowa gromadzi i udostępnia informacje:
– rzetelne,
– publikacje o trwałej wartości,
– gwarantuje trwałość linków – np. http://publication/9967/,
– publikuje zgodnie z prawem.
Biblioteka cyfrowa – nie jest i nie może być podobna do ulotnej strony WWW. Jej
cechą jest trwałość!
Katalog on-line nie jest biblioteką cyfrową.
Biblioteka cyfrowa odzwierciedla stan zbiorów konkretnej biblioteki i prezentuje
zdigitalizowaną wersję oryginalnego dokumentu – wymaga specjalistycznego
oprogramowania.
Witryna internetowa zamieszcza kopie tekstów utworów bez nawiązań do
konkretnego egzemplarza – w dużej mierze nie wymaga specjalistycznego
oprogramowania.
Biblioteka cyfrowa a kolekcja tematyczna
i wirtualna wystawa
•
Kolekcja tematyczna to twór pośredni między biblioteką cyfrową a wystawą
internetową. Jej zakres i zasięg ograniczony jest tematycznie do jednego zagadnienia lub
jednego typu zbiorów. Podobnie jak biblioteka cyfrowa musi być ona przeszukiwalna,
opatrzona jest jednak komentarzem charakteryzującym wyselekcjonowany zbiór.
•
Wirtualna wystawa - prezentacja w Internecie zdigitalizowanych dokumentów (głównie
ikonograficznych) i towarzyszących im tekstów objaśniających, tworzona przez instytucję
w oparciu o własne zbiory. Ekspozycja wirtualna często jest przedłużeniem rzeczywistej
wystawy mającej miejsce w murach biblioteki, choć zdarzają się też wystawy tworzone
wyłącznie na potrzeby Internetu.
Wystawa wirtualna, a w szczególności taka, która od początku tworzona jest na potrzeby
Internetu, nie będąca wyłącznie "pokłosiem" czy reklamą wystawy rzeczywistej, nie musi
spełniać wymogu pełnej przeszukiwalności. Jest ona, podobnie jak kolekcja tematyczna,
wyselekcjonowanym zbiorem eksponatów, posiada jednak bardzo rozbudowane
komentarze, charakteryzujące zarówno cały zbiór, jak i omawiające szczegółowo każdy
prezentowany na tej wystawie eksponat czy całą ich grupę.
•
Biblioteka cyfrowa a bazy danych i repozytoria
Własności
Baza danych
Repozytorium
Biblioteka cyfrowa
Wybrane
definicje
• zbiór wzajemnie powiązanych
danych opisujących pewien wybrany
fragment rzeczywistości, wyposażony
w oprogramowanie umożliwiające
ich definiowanie, wykorzystywanie i
modyfikowanie;
• uporządkowany zbiór informacji
(opisowych i content units) z
określonej dziedziny lub tematyki, ze
wspólnym interfejsem użytkownika i
oprogramowaniem przeznaczonym
do wyszukiwania i przetwarzania
danych.
• centralny „magazyn informacji”
przeszłych danych, nie ulegających już
zmianie,
•„magazyn” wszelkiego typu
dokumentów: elektronicznych obrazów
zeskanowanych dokumentów
papierowych, dokumentów
elektronicznych, danych z systemów
informatycznych, plików dźwiękowych
i wideo,
• miejsce uporządkowanego
przechowywania dokumentów, z
których wszystkie przeznaczone są do
udostępniania,
• magazyn najrozmaitszych zasobów
cyfrowych,
• system udostępniający metadane na
temat obiektów cyfrowych,
• baza danych, w której
przechowywane są metadane o
publikacjach (m.in. rekordy
bibliograficzne) oraz zawartości
publikacji,
• baza danych wymagań systemu.
• zasoby przeszukiwalne za pomocą
techniki komputerowej,
• zasoby udostępniane lokalnie i
zdalnie,
• punkt dostępu do wielu źródeł
informacji naukowej wraz z usługami
instruktażowymi,
• kolekcja materiałów
zdygitalizowanych lub kodowanych
cyfrowo,
• biblioteka posiadająca dostęp do
zasobów Internetu i zbiory CD-ROM,
• agencja, która jednoczy instytucje dla
zapewnienia dostępu do informacji
elektronicznej,
• biblioteka skanująca swoje materiały,
• archiwum cyfrowe,
•repozytorium wiedzy,
• baza danych, chroniona raczej
prawem sui generis niż autorskim.
Biblioteka cyfrowa a bazy danych i repozytoria (2)
Własności
Wymagania /
funkcje
Baza danych
Repozytorium
•gwarantowanie spójności danych ,
•zapewnienie bezpieczeństwa i
autentyczności danych,
•zapewnienie efektywnego
przetwarzania danych,
•właściwe odzwierciedlanie
obiektów i zależności między nimi,
•ochrona przed nieautoryzowanym
dostępem do danych,
•przestrzeganie prawa autorskiego,
•zapewnienie jednoczesnego
dostępu do danych wielu
użytkownikom,
•zapewnienie dostępu do źródeł
informacji kwalifikowanej,
•udostępnianie metadanych,
•zachowanie standardów
międzynarodowych,
•zapewnienie trwałości
organizacyjnej i finansowej.
jak w przypadku baz danych +
•przyjęcie odpowiedzialności za
długookresowe przechowywanie
zasobów cyfrowych,
•zapewnienie metod ewaluacji
systemu,
•zapewnienie mierzalności i oceny
polityk i praktyk przechowywania
informacji,
•określenie rodzaju i zakresu
przechowywanych danych cyfrowych,
•zapewnienie możliwości składowania
danych przez różnego rodzaju
dostawców,
•zapewnienie możliwości
wyszukiwania informacji zapisanej w
wielu, często odmiennych, językach.
Biblioteka cyfrowa
jak w przypadku baz danych i
repozytoriów +
•zapewnienie możliwości
wyszukiwania rozproszonego,
umożliwiającego przeszukiwanie
zawartości różnych bibliotek
cyfrowych przy pomocy jednego
narzędzia,
•zapewnienie możliwości
przeszukiwania pełnotekstowego
publikacji,
•wspieranie procesu e-learningu,
•przełamywanie barier dotyczących
„cyfrowego wykluczenia”,
•promowanie kultury narodowej,
•wspieranie rozwoju infrastruktury
społeczeństwa informacyjnego.
Biblioteka cyfrowa a bazy danych i repozytoria (3)
Własności
Typologia
Baza danych
Ze wzg. na:
•rodzaj gromadzonej inf. np.
bibliograficzne i faktograficzne,
•rodzaj denotacji utrwalonych danych
np. faktograficzne, źródłowe,
odsyłające,
•zakres tematyczny np. jedno- i
wielodziedzinowe,
•podstawę znakowania np. alfanumeryczne, numeryczne, tekstowe,
ikonograficzne,
•organizację danych np. logiczne,
fizyczne,
•przyjęty model danych np.
hierarchiczne, sieciowe, relacyjne,
•zakres realizacji funkcji
wyszukiwawczej w charakterystyce
wyszukiwawczej np. pełnotekstowe,
•przeznaczenie np. zadaniowe,
informatorowe, adresowe,
programowe.
Repozytorium
Ze wzg. na:
•typ gromadzonych materiałów np.
eprintów, prac badawczych, artykułów z
czasopism, born digital, counterparts,
•zakres tematyczny np. dziedzinowe,
tematyczne,
•podmiot nadzorujący np. instytucjonalne,
osobowe, wydziałowe,
•zasięg terytorialny np. narodowe,
regionalne, lokalne.
Biblioteka cyfrowa
Ze wzg. na:
•podmiot nadzorujący np.
instytucjonalne, konsorcjalne,
pojedyncze, współpracujące,
scalone,
•zastosowane technologie np. I,
II i III generacji,
•typ gromadzonych materiałów
np. dziedzictwa narodowego,
interdyscyplinarne, regionalne.
Biblioteka cyfrowa a bazy danych i repozytoria (4)
Własności
Baza danych
Repozytorium
Biblioteka cyfrowa
Dostęp
•za pośrednictwem sieci
komputerowych,
•w trybie wsadowym (CD-ROM,
dyskietki).
za pośrednictwem sieci komputerowych
za pośrednictwem sieci
komputerowych
Przykłady
BazTech, Bazy BN, SympoNet,
ARTON, AGRO, SIGŻ, Pedagog,
Edukacja, BAZHUM,PBL, ERIC,
LISTA, MEDLINE, INSPEC, itp.
ePrints, ROAR, E-LIS, OpenDOAR,
eScholarship, itp
biblioteki cyfrowe dLibry,
Digitalni Knihovna, Digitale
Sammlungen, Europeana,
American Memory Historical
Collections, itp.
Biblioteka cyfrowa a bazy danych i repozytoria (5)
• Elementy różnicujące:
– gromadzenie i selekcja materiałów,
– rozproszenie zasobów,
– możliwości wyszukiwawcze,
– sposób dostępu,
– zróżnicowanie treści,
– poziom sformalizowania.
Cechy biblioteki cyfrowej
•
•
Zbiory – wyłącznie cyfrowe (własna kolekcja);
Procesy:
–
•
•
•
•
•
gromadzenie (planowe, systematyczne);
– opracowanie (zestandaryzowane);
– udostępnianie (zarządzanie dostępem*);
– digitalizacja i publikowanie* (nowa funkcja);
– zarządzanie prawami autorskimi* (nowa funkcja);
Organizacja – tradycyjna (ale wzrost roli pracy zdalnej);
Komunikacja – elektroniczna i tradycyjna;
Lokalizacja organizatora – określona;
Lokalizacja serwisów – nieokreślona*;
Użytkownicy – tradycyjni i anonimowi*.
Wartość dodana bibliotek cyfrowych
•
•
•
•
Wartość dodana (ang. Added Value) – przyrost wartości dóbr w wyniku określonego
procesu produkcji lub tworzenia usługi (zysk). W działalności gospodarczej jest to
różnica między przychodem ze sprzedaży a kosztami produkcji.
W przypadku bibliotek cyfrowych wartością dodaną jest samo środowisko cyfrowe
integrujące wszystkie tradycyjne funkcje współczesnej biblioteki w jeden wspólny
organizm.
Wszystko to, co biblioteki od siebie dodają do zdigitalizowanego zasobu, co może
przynieść zysk użytkownikom, a więc hiperlinki, komentarze, wyszukiwanie
pełnotekstowe i boolowskie, „manipulowanie tekstem” (zoom, OCR) oraz to, co
może przynieść prestiż i zysk autorom (skrócenie czasu wydania, szybka
dystrybucja) stanowi wartość dodaną bibliotek cyfrowych.
Europejska wartość dodana polega na zapewnieniu komplementarności oraz
wymianie sprawdzonych rozwiązań.
Historia bibliotek cyfrowych w pigułce
•
Spekulacje - 1937 r. (esej Georga Wellsa)
–
•
"The Idea of a Permanent World Encyclopaedia" (Idea stałej światowej encyklopedii), był szczególnie godny
uwagi ze względu na zaprezentowanie wizji podobnej do dzisiejszych Wikipedii. Esej ukazał się pierwotnie
w Encyclopédie Française i przedstawiał wizję Wellsa dotyczącą rodzaju "izby rozrachunkowej" ludzkiego
umysłu, magazynu wiedzy i idei pozyskanych, uporządkowanych, podsumowanych, objaśnionych i
porównanych. Wells przewidywał, że mogą być w tym użyteczne nowe osiągnięcia techniczne, jak
mikrofilmy. Każda zainteresowana osoba mogłaby usiąść przy swoim projektorze i zapoznać się z
mikrofilmową repliką każdego zgromadzonego w bazie dokumentu. Następstwem był projekt World Brain
bazujący na pomyśle zbudowania sieci wiedzy, podobnej w swojej istocie do dzisiejszego Internetu i World
Wide Web.
Wizje - 1945 r. (Memex - Vannevar Bush)
–
Memex to teoretyczny komputer analogowy, opisany w 1945 r. przez naukowca i inżyniera Vannevara Busha
w zamieszczonym w "The Atlantic Monthly" artykule "As We May Think". Bush opisał w nim urządzenie
podłączone elektrycznie do biblioteki, potrafiące wyświetlać zawarte w niej książki i filmy i zdolne do
automatycznego przechodzenia od zawartych w nich odniesień do innych prac. Idea ta, która bezpośrednio
doprowadziła do koncepcji hipertekstu i hipermediów. Memex potrafił więcej niż tylko dawać połączone ze
sobą informacje. Było to narzędzie mające także tworzyć powiązania i śledzić je. Technika miała być
kombinacją elektromechanicznych urządzeń sterujących, kamer i czytników, zintegrowanych na dużym
pulpicie. Większość mikrofilmowej biblioteki byłaby zawarta na pulpicie, z możliwością dodawania lub
usuwania taśm mikrofilmowych. Memex mógłby być także używany bez połączeń, do generowania
informacji na mikrofilmach, przez przenoszenie fotografii z papieru lub wrażliwego na dotyk
przezroczystego ekranu.
Historia bibliotek cyfrowych w pigułce (2)
•
Wczesne eksperymenty - 1968 r. (Augmentation Research Center – Douglas
Engelbart)
– Wynalazca myszy komputerowej i współtwórca hipertekstu. Uruchomił projekt oNLine System (NLS), który jako pierwszy praktycznie wdrażał łącza hipertekstowe,
mysz komputerową, monitor, okna, prezentacje komputerowe i inne nowoczesne
pomysły. NLS był zaprojektowany do pracy na maszynie Scientific Data Systems
SDS 940 z 96 MB pamięci dyskowej. Mógł pracować jednocześnie na 16 stacjach
roboczych z monitorami, trójklawiszową myszą i klawiaturą akordową. Informacja
wprowadzana z klawiatury była przenoszona do specjalnego podsystemu, który
przekazywał ją szyną do kontrolerów i generatorów wyświetlania. Wprowadzony
tekst był przesyłany do 5-calowej lampy obrazowej (CRT) zamkniętej pod
specjalną pokrywą a nałożony obraz był pobierany przez czarno-białą kamerę
telewizyjną. Informacja z kamery była ostatecznie wyświetlana na monitorze
każdej ze stacji roboczych. System był finansowany przez ARPA, NASA i U.S. Air
Force i posłużył jakopierwsze węzły ARPANETu.
•
•
•
Pierwsze wdrożenie - 1971 r. (Michael Hart - Gutenberg Project)
Działania na dużą skalę - 1995 r. (American Memory Historicall Collections)
Doświadczenia - 2010 r. (kilkaset tys. projektów, w tym 58 na platformie
dLibra)
Generacje bibliotek cyfrowych
•
•
•
•
Okres pionierski [1971-1995]
Biblioteki pierwszej generacji [1995-2002]
Biblioteki drugiej generacji [2002-]
Biblioteki trzeciej generacji – repozytoria
rozproszone [2004-]
Cechy projektów pionierskich
•
•
•
•
•
•
•
•
•
•
poczucie misji,
niezależność od komercyjnych pokus,
chęć zapewnienia swobodnego dostępu do informacji,
niezależność w tworzeniu elektronicznych wersji dzieł (dobór),
zasób – dzieła z domeny publicznej,
niewielka liczba obiektów - skanowanie OCR,
dostęp nielimitowany,
formaty dokumentów (tekstowe lub graficzne),
brak kontroli dostępu i zarządzania zasobem,
słabe mechanizmy zarządzania metadanymi.
Przykłady pierwszych projektów
•
•
•
•
•
•
•
•
•
•
Project Gutenberg: http://www.gutenberg.org/
Project Gutenberg of Australia: http://gutenberg.net.au/
Project Gutenberg DE (1994 - Niemcy): http://gutenberg.spiegel.de/
Project Runeberg (1992 - Skandynawia): http://runeberg.org/
Perseus Digital Library (1987): http://www.perseus.tufts.edu/
The Complete Works of Shakespeare (1993): http://shakespeare.mit.edu/
Bartleby (1993 - nowa wersja) : http://www.bartleby.com/
The Humanities Text Initiative (1994): http://www.hti.umich.edu/
American Memory (1995): http://memory.loc.gov/
+ pierwsze projekty digitalizacji czasopism:
– Tulip (1991-1995)
– Uniwersytet Cornell (1991)
– Projekt Swetscan (1992)
– Projekt Galen (1991) i Galen II (1995)
– JSTOR (Journal Storage Project) – 1995 (F. Mellona)
Cechy bibliotek I generacji
1. Zasób - dzieła z domeny publicznej,
2. Dostęp – nielimitowany,
3. Formaty dokumentów (tekstowe lub graficzne),
4. Brak kontroli dostępu i zarządzania zasobem,
5. Słabe mechanizmy zarządzania metadanymi.
Dwa modele:
• tzw. model „strona WWW”,
• tzw. model „katalog obiektów cyfrowych”
Przykłady bibliotek I generacji
•
•
•
•
•
World Public Library http://WorldLibrary.net/
Internet Archive http://www.archive.org/
Netlibrary http://company.netlibrary.com/
Wirtualna biblioteka literatury polskiej http://literat.ug.edu.pl/books.htm
Cyfrowa kolekcja czasopism polskich
http://buwcd.buw.uw.edu.pl/e_zbiory/ckcp/CKCP.html
• Prasa w Internecie http://www.bilp.uw.edu.pl/prasa/index.html
• Staropolska on-line http://www.staropolska.pl/barok/barok_005.html
Wybrane cechy bibliotek II generacji
1. Zasób – dowolny,
2. Dostęp - kontrolowany (lub możliwość kontroli),
3. Formaty dokumentów – dominują hybrydowe,
4. Zaawansowane mechanizmy zarządzania zasobem,
5. Zaawansowane mechanizmy zarządzania metadanymi,
6. Obsługa specj. standardów komunikacyjnych,
7. Na świecie skanowanie z OCR i wyszukiwanie pełnotekstowe,
8. Współpraca z repozytoriami rozproszonymi.
Prawie w każdym rozwiniętym kraju:
- przynajmniej 1 biblioteka o aspiracjach narodowych;
- przynajmniej 1 udostępniająca dziedzictwo historyczne;
- przynajmniej 1 serwująca teksty klasyki literackiej;
- liczne biblioteki czasopism historycznych;
- liczne biblioteki regionalne/stanowe;
- liczne biblioteki uniwersyteckie;
- liczne biblioteki instytucjonalne.
Przykłady bibliotek II generacji
•
•
•
•
•
•
Project Gutenberg Consortia Center: http://gutenberg.cc/index.htm
Europeana: http://www.europeana.eu/portal/
TEL (The European Library): http://www.theeuropeanlibrary.org/
European Digital Library Project: http://edlproject.eu/
Biblioteki cyfrowe dLibry
http://fbc.pionier.net.pl/owoc?action=ChangeLanguageAction&language=pl
International Children's Digital Library: http://www.childrenslibrary.org/
Wybrane cechy bibliotek III generacji –
repozytoriów rozproszonych
•
•
•
•
•
•
•
•
rozmiary — system rozproszony tworzy wiele zasobów sieciowych, zawierających różne rodzaje
obiektów biblioteki cyfrowej (np. serie cyfrowych książek, fotografii itp.),
zasoby zawierają „dobrze zdefiniowane” (spójne) klasy obiektów biblioteki cyfrowej — książki
cyfrowe, czasopisma, fotografie. Każda klasa obiektów cyfrowych obsługiwana jest przez
zestawy oprogramowania, które spowodują odpowiednie zachowania w stosunku do tej klasy
(np. dla książki cyfrowej przejście do następnej strony, poprzedniej strony, do spisu treści).
standaryzacja narzędzi funkcjonujących w zasobach: można utworzyć narzędzia do przeglądania
lub wyszukiwania książek cyfrowych z różnych zasobów;
samowystarczalność narzędzi: ta koncepcja zakłada, że każdy zasób udostępnia pewną ilość
podstawowych narzędzi dla każdego typu przechowywanych obiektów, jest więc
samowystarczalny w zakresie dostarczania dostępu do przechowywanych zasobów,
elastyczny rozwój systemu: utworzenie dowolnej ilości klas obiektów biblioteki cyfrowej,
stopniowy dostęp: użycie priorytetów i metod przechowywania danych, oczekujących na
pobranie,
mechanizmy archiwizacji: podczas długoterminowego przechowywania niezbędne staje się
odświeżanie zasobów ze względu na postęp w technologii komputerowej, mediach
i oprogramowaniu,
integracja i autentyczność: zachowanie wartości intelektualnych realizuje się poprzez
zachowanie nośnika i technologii zapewniającej ochronę struktury informacji w postaci
zapisanej przez autora.
•
•
•
•
•
•
•
•
•
•
•
•
Wybrane cechy repozytoriów (2)
recenzowanie materiałów,
hierarchiczna struktura,
grupowanie obiektów (kolekcje tematyczne wg dyscyplin naukowych),
treść ma charakter naukowy, kumulacyjny, permanentny,
zasób uniwersalny wyszukiwawczo (zgodność z Open Archives Initiative Protocol for
Metadata Harvesting - OAI-PMH),
wyszukiwanie proste i złożone (możliwość określania poszczególnych pól metadanych),
przeszukiwanie pełnotekstowe,
przeszukiwanie konkretnych dziedzin (pozwala początkującemu użytkownikowi szybko
zapoznać się ze zbiorami),
możliwość pobierania utworów,
zaawansowane mechanizmy zarządzania zasobem,
zaawansowane mechanizmy zarządzania metadanymi,
istnienie osobistej przestrzeni roboczej.
Zadania dla repozytoriów godnych zaufania:
•
niezawodny, długotrwały dostęp do zasobów cyfrowych,
•
długotrwałe zarządzanie zasobami;
•
zapewnienie informacji o zasobach;
•
stałe źródła finansowania;
•
zachowanie zasad i standardów;
•
ocena systemu;
•
jasne i znane zasady funkcjonowania;
•
określona polityka funkcjonowania.
Repozytoria wg kontynentów
Repozytoria wg krajów
Polska - 19
Repozytoria wg typów
Przykłady repozytoriów
•
•
•
•
•
•
•
OAISTER (obecnie w WorldCat) bramka:
http://oaister.worldcat.org/
Scientific Commons: http://en.scientificcommons.org/
DOAJ: http://www.doaj.org/
OpenDOAR: http://www.opendoar.org/
Institutional Archives Registry - http://archives.eprints.org/
WorldCat: http://www.worldcat.org/
Google Book Search: http://books.google.com/
Ćwiczenia
•
http://www.liberatura.pl
•
•
Project Runeberg (1992 - Skandynawia): http://runeberg.org/
Perseus Digital Library (1987): http://www.perseus.tufts.edu/
•
•
Europeana: http://www.europeana.eu/portal/
Biblioteki cyfrowe dLibry
http://fbc.pionier.net.pl/owoc?action=ChangeLanguageAction&language=pl
•
•
•
•
OAISTER (obecnie w WorldCat) bramka: http://oaister.worldcat.org/
DOAJ: http://www.doaj.org/
OpenDOAR: http://www.opendoar.org/
WorldCat: http://www.worldcat.org/
Następne zajęcia
•
•
•
•
•
•
•
•
•
•
Biblioteki cyfrowe wg NISO
Biblioteki cyfrowe wg UE
Etapy organizacji biblioteki cyfrowej
Elementy bibliotek cyfrowych i wirtualnych
Funkcje bibliotek cyfrowych
Formaty bibliotek cyfrowych, metadane, oprogramowanie
Prawo autorskie a biblioteki cyfrowe
Bariery na drodze tworzenia
Rola bibliotekarza w bibliotece cyfrowej
Biblioteki cyfrowe a trendy XXI wieku