Digitální knihovna AV ČR Martina Nezbedová Knihovna AV ČR, v. v. i. Seminář Zpřístupňování dokumentů v digitálních knihovnách ČR 8.

Download Report

Transcript Digitální knihovna AV ČR Martina Nezbedová Knihovna AV ČR, v. v. i. Seminář Zpřístupňování dokumentů v digitálních knihovnách ČR 8.

Digitální knihovna AV ČR
Martina Nezbedová
Knihovna AV ČR, v. v. i.
Seminář
Zpřístupňování dokumentů v digitálních
knihovnách ČR
8. 3. 2012
Obsah





Digitalizační centrum Knihovny AV ČR
Zpracování
Systém pro zpřístupnění Kramerius
Projekt „Registr digitalizace CZ“
Digitální knihovna AV ČR
Akademie věd ČR
•
•
•
•
54 vědeckých ústavů
7 000 zaměstnanců, (2 700 VaV)
> 11 000 článků, věd. zpráv, atd. ročně
vydává 103 časopisů (cca 3000 článků)
Knihovna Akademie věd ČR
Digitalizační centrum KNAV ČR

zřízeno a provozováno KNAV od roku 2004

digitalizace, popis a zpřístupnění
- často žádaných časopisů a monografií
vydávaných AV ČR
- vzácných materiálů z fondů knihoven AV ČR

archivace digitalizovaných materiálů
HW vybavení - skenery
DigiBook 10000 RGB – barevný






max. formát A1 při rozlišení 400 dpi
max. rozlišení 1000 dpi při formátu 2 x A5
rychlost 100 stran/hod. 2 x A4 / 400 dpi
CCD line 3 x 10000 pixelů RGB
max. tloušťka knihy 50 cm
max. váha 40 kg
HW vybavení - skenery
ProServ ScannTech – 600i barevný




max. formát A0 při rozlišení 600 dpi
rozlišení: 600 dpi
CCD kamery: 3 x 7 300 pixelů
přítlačné sklo po celé ploše
HW vybavení - skenery
Zeutchel OS 7000 – 256 grey-scale





max. formát A2 při rozlišení 400 dpi
max. rozlišení 800 dpi při formátu A4
rychlost 180 stran/hod. A4 / 400 dpi
CCD line 7500 pixelů
max. tloušťka knihy 50 cm
HW vybavení - skenery
ScanRobot SR301



max. rozlišení 300 dpi
max. rozměry předlohy 32x30x12 cm
Color / Grayscale / BW
SW vybavení





Book Restorer, i2S
IrfanView, Irfan Skiljan
Sirius, Elsyst Engineering
Kramerius, Qbizm (opensource)
Registr digitalizace
Skenování
Zpracování – Book Restorer
Zpracování – Book Restorer
Upravený obrázek
Sirius
DMS Sirius
Národní knihovnou definovaná struktura popisu




1 XML soubor popisuje kompletně celé
periodikum (monografii, ...)
automatizované vytváření metadat
možnost grafických úprav obrázků
export do XML + obrazové soubory ve
formátu TIFF, JPG, DJVU
Kramerius –
vývojová skupina a technologie





Open source – vývoj od roku 2003
Účel vývoje – zpřístupnění digitalizovaných
dokumentů (periodik a monografií)
Národní knihovna ČR, Knihovna AV ČR,
Qbizm technologies, Moravská zemská
knihovna v Brně
Vývoj financován zejména z projektů
financovaných MK ČR a MŠMT ČR
Použité technologie: JAVA, Linux, Apache,
Tomcat, Postgres SQL, Lucene
Kramerius – aktuální stav







DTD pro periodika a monografie
Import XML, TXT a obrazových souborů
Grafický formát DjVu, JPG, PNG, PDF
Fulltextové vyhledávání (Convera, Lucene)
Replikace dat mezi jednotlivými instalacemi
OAI-PMH – možnost sklízení metadat
METS, PREMIS, MIX – standardy pro
metadata
Kramerius – aktuální stav







automatizované zviditelňování a nastavení
přístupnosti titulů
vyhledávání podle data
export monografií do statické HTML podoby
perzistentní identifikátor na všech úrovních
dokumentu (UUID)
vylepšené interní fulltextové vyhledávání
zjednodušení uživatelského rozhraní pro
vyhledávání
Proof of Concept: využití systému Fedora
Kramerius – aktuální stav



Propojení do portálů:
- The European Library
http://www.theeuropeanlibrary.org
- Jednotná informační brána JIB
http://www.jib.cz/
Propojení do katalogu NK ČR a do Souborného
katalogu ČR – link z Krameria na základě ISSN
a link z katalogů na digit. dokument
Podpora perzistentních URL umožňuje stabilní
prolinkování do knihovního OPACu
Kramerius – plán vývoje





Zásadní změna – využití digitálního repozitáře
FEDORA jako jádra (open source USA)
Důvody – FEDORA je robustní stroj
s podporou složených objektů,
vhodný i z hlediska dlouhodobé archivace
Rozšíření administrace – zejména správa
uživatelských a přístupových práv
Dávkové operace s digitálními dokumenty
Nové typy dokumentů (mapy, audio, video,…)
Kramerius – uživatelé







Národní knihovna ČR
Moravská zemská knihovna v Brně
Moravskoslezská vědecká knihovna v Ostravě
Státní technická knihovna
Vědecká knihovna v Olomouci
Mendelova zemědělská a lesnická knihovna
v Brně
Jihočeská vědecká knihovna v Českých
Budějovicích
Kramerius – uživatelé







Krajská knihovna Františka Bartoše Zlín
Severočeská vědecká knihovna v Ústí n. L.
Městská knihovna v Praze
Národní lékařská knihovna v Praze
Knihovna Akademie věd ČR
Muzejní knihovny: UPM Praha, ŽM Praha,
DU Praha, MVČ Hradec Králové
Celkem cca 6.600.000 stran (cca 500 titulů
časopisů, 8500 titulů monografií a 840 map)
Kramerius – podpora

Knihovna AV ČR – digitalizační centrum –
Mail list Kramerius
http://digit.knav.cz/

Instalace a údržba
http://www.unidata.cz/
Projekt „Registr digitalizace CZ“




Národní knihovna a Knihovna AV ČR –
projekt v rámci programu MK ČR
centrální evidence – registr digitalizovaných
dokumentů v ČR
sledování digitalizačního workflow, stažení
bibliografického popisu z knihovního
systému
přenesení informace o zahájení digitalizace
do SK ČR (příp. do OPACu) a prolinkování
na digitální dokument po dokončení
Československá parazitologie
Digitální knihovna AV ČR






Projekt z programu AV ČR (2004-2009)
Digitalizace dříve vydaných ročníků časopisů
AV ČR (> 100 let),
Digitalizováno téměř 2 000 000 stran
Vývoj open source systému Kramerius pro
zpřístupnění
Zpřístupněno 850 000 stran, bez dělení na
články
Plnotextové vyhledávání
Digitální knihovna AV ČR




Nové články – jiný přístup
Open source E-prints (Uni of Southampton)
Smlouvy s ústavy – definice podmínek
zpřístupnění
Finální stav - sloučení obou knihoven a
kompletní dělení na články
Spolupráce s Googlem



Digitalizované časopisy v systému Kramerius
- indexace plných textů, rozdělení na články,
link z Google na 1.stranu článku
Nové články v E-prints
- indexace plných textů, link na 1.str článku
Publikační činnost – ASEP
- využití pro extrakci dat z Krameria, případně
provázání s plnými texty v Google Scholar
Centrální úložiště dat AV ČR





Velký objem dat z digitalizace
Nyní cca 4 TB
Velký růst také vzhledem k velkoformátové
barevné digitalizaci a k robotickému
skenování
2009 - řešení pro dlouhodobou archivaci od
fy Sun Microsystems – disk. pole > 30 TB
Trvalé uložení výsledků VaV celé AV ČR
Děkuji za pozornost!
Martina Nezbedová
[email protected]
www.knav.cz