Kansalliskirjasto

Download Report

Transcript Kansalliskirjasto

Digitoitavan aineiston
elinkaaren hallinta
Esa-Pekka Keskitalo - 28.9.2011 – Rovaniemi
Armas Launis: Seitsemän veljestä –sävellyskäsikirjoitus (1913). Kansalliskirjasto
http://urn.fi/URN:NBN:fi-fe201109092370
Esittäjästä
 Pitkäaikaissäilytyksen toimintayksikön vetäjä; yksikkö vastaa
digitaalisesta säilyttämisestä, e-vapaakappaleiden keräämisestä,
URN-tunnisteista
 Tiiviisti mukana KDK-pitkäaikaissäilytyshankkeessa ja KDKkokonaisarkkitehtuurissa
 Kansalliskirjastossa v:sta 2002
 www.helsinki.fi/people/esa-pekka.keskitalo , [email protected]
KIRJASTOVERKKOPALVELUT
2
Esityksen aiheet






Digitaalisen aineiston elinkaari
Digitoinnin suunnittelun lähtökohdat
Digitoinnin käytännön järjestelyistä
Digitointi ja pitkäaikaissäilytys
Kansalliskirjaston palvelut
Yhteistyön mahdollisuuksista
KIRJASTOVERKKOPALVELUT
3
Digitoitavan aineiston elinkaari
KIRJASTOVERKKOPALVELUT
Aineiston synty ja käyttö
Valmistelu digitointiin
Digitointi
Jälkikäsittely
Käyttöönasettaminen
Pitkäaikaissäilytys
4
Digitoitavan aineiston elinkaari - metadata
Tekninen metadata
Konservointitedot
Kokoelman kuvaus
Rakenteellinen metadata
Käyttöoikeustiedot
Provenienssi
Käyttötilastot
Bibliografiset tiedot
KIRJASTOVERKKOPALVELUT
5
Digitoitavan aineiston elinkaari
 Digitointi on vain pieni osa aineiston elinkaaresta.
 Itse skannaus tai kuvaus on vain osa digitoinnin prosessista.
 Elinkaari ennen digitointia vaikuttaa digitointiin.
 Ajatus elinkaaresta digitoinnin jälkeen vaikuttaa digitointiin.
 Koko elinkaari tuottaa relevanttia metadataa.
KIRJASTOVERKKOPALVELUT
6
Digitoinnin suunnittelun lähtökohdat
 Kokoelmapolitiikka – Digitointipolitiikka Säilytyspolitiikka
http://digi.kansalliskirjasto.fi/aikakausi/secure/showPage.html?conversationId=1&action=entryPage&id=925688
KIRJASTOVERKKOPALVELUT
7
Kokoelmapolitiikka




Mikä on kirjaston toiminta-ajatus ja kohderyhmä?
Mitä kokoelmia kirjastolla on; mikä on niiden taso ja status?
Mihin suuntaan kokoelmia kehitetään?
Tuoko digitointi näihin lisäarvoa? Miten digitoitu aineisto niveltyy
palvelujen kokonaisuteen?
 Muuttaako digitointi kokoelmapolitiikkaa?
 Digitaaliset kokoelmat osana jotakin laajempaa politiikkaa /
verkkoaineistot osana omaa politiikkaa
KIRJASTOVERKKOPALVELUT
8
Digitointipolitiikka






Digitoinnin perustelu: suojelu / käytettyys / kiinnostavuus
Käyttöoikeuksien vaikutus digitointipäätöksiin
Digitointi tarpeen mukaan / ennakoiden
Digitointi yksittäiskappalein / kokoelmittain
Digitoinnin laatutaso ja soveltaminen käyttötarkoitukseen
Konservointiperiaatteet
KIRJASTOVERKKOPALVELUT
9
Säilytyspolitiikka




Kuka vastaa aineiston säilymisestä
Säilymiselle asetettavat tavoitteet
Suunnitelmat kriisitilanteisiin (talous, organisaatiomuutokset)
”Testamentti”
KIRJASTOVERKKOPALVELUT
10
Digitoinnin käytännön järjestelyistä
Constantinuns Africanus
Theorica Pantegni .
Helsinki-käsikirjoitus
KIRJASTOVERKKOPALVELUT
(Codex EÖ.II.14)
11
”Köyhällä ei ole varaa halpaan”
 Digitointi kannattaa tehdä vain kerran
 Digitointiprosessi on yhtä onnistunut kuin sen heikoin kohta
 Hyvin pienelle aineistolle onnistuneen prosessin luominen saattaa olla
suhteettoman kallista
 Skannaaminen ei ole digitointia!
KIRJASTOVERKKOPALVELUT
12
Digitoinnin logistiikka





Aineisto on hyvin kuvailtu ja tunnistettu
Digitoija saa aineiston ajoissa ja järjestyksessä
Aineisto palautuu oikealle paikalleen
Aineisto ei huku, vahingoitu eikä mene sekaisin
Aineiston sijaintia ja tilaa seurataan
– Kansallisikirjastossa viivakoodeihin
perustuva seurantaohjelmisto
– Aiemmin käytössä
paperiset lähetyslistat
KIRJASTOVERKKOPALVELUT
13
Aineisto ja sen metadata
 Aineiston sisällönkuvailun tulisi olla kunnossa ennen digitointia.
 Digitoinnista syntyy tärkeää uutta metadataa.
 Aineiston ja metadatan kohtaaminen varmistettava
– Mm. syntyvien tiedostojen ja kuvailun yksilölliset tunnukset
KIRJASTOVERKKOPALVELUT
14
Digitoinnin tilat
 Valaistuksen optimointi
 Värimaailman optimointi
 Ilmankosteuden säätely
KIRJASTOVERKKOPALVELUT
15
Digitoinnin laitteistot




Laitevalinnat on tehtävä aineiston ehdoilla.
Massadigitointi vai erikoisdigitointi?
Täytyykö aineistoa kohdella hellävaroen?
Aineiston luonne (painettu, mikrofilmi, valokuva, negatiivi jne.)

Epson GT-15000, Epson GT-20000, Epson V750 perfection Pro,
I2s Digibook SopraScan2, Kodak i620, Atiz BookDrive,
4 DigitalBooks DL 3000, Nextscan Eclipse, Wicks & Wilson 8850, Wicks & Wilson FS300
KIRJASTOVERKKOPALVELUT
16
Digitoinnin formaatti
 Säilytysformaatti ja käyttöformaatti
– Korkea laatu / käsiteltävissä oleva koko
– Kansalliskirjastossa säilytyskopion formaatin (tiff) muuntaminen käyttö- ja
esitysformaatteihin (jpg, jpg2000, pdf) automatisoitu
 Formaatin profiili
– Monia tiedostoformaatteja voi käyttää hyvin monin tavoin
KIRJASTOVERKKOPALVELUT
17
KDK-suosituksia (luonnos)

Broadcast Wave Format
(BWF)
Joint photographic experts
group (JPEG)

Waveform Audio Format
(WAV)
Joint photographic experts
group jpeg 2000 (JP2)

Tagged image file format
(TIFF)
TEKSTI
ÄÄNI

EPUB for electronic books


Extensible Hypertext Markup
Language (XHTML)



Extensible Markup Language
(XML)

Hypertext Markup Language
(HTML)

AAC
ELOKUVA

Open Document Format (ODF) 

PDF for long-term preservation
(PDF/A)

Text (plain text)
KIRJASTOVERKKOPALVELUT
AIFF (PCM-koodattu)
MXF / Motion JPEG 2000
lossless compression
KUVA
18
VERKKOARKISTO

Web Archive Format (WARC)
TIETOKANNAT

Software indpt archiving of
relational db’s (SIARD)
Digitoinnista syntyy paketillinen tietoa
 Digitaalinen objekti (tiedosto/tiedostot)
 Yhteen kuuluvien tiedostojen suhteiden kuvailu (esim. kirjan sivut
oikeassa järjestyksessä)
 Kuvaileva metadata (bibliografinen data)
 Hallinnollinen metadata (objektin historia; käyttöoikeudet yms.)
 Tekninen metadata
 Tämän kaiken esittäminen kokonaisuutena
KIRJASTOVERKKOPALVELUT
19
METS-kääreformaatti





Kongressin kirjaston ylläpitämä standardi
Kuvailee aineiston rakenteen ja liittää siihen eri typpiset kuvailut
XML-paketointi
Keskeisellä sijalla KDK-hankkeessa.
http://www.loc.gov/standards/mets/
KIRJASTOVERKKOPALVELUT
20
Digitointi ja pitkäaikaissäilytys
KIRJASTOVERKKOPALVELUT
21
Kansallisen audiovisuaalisen arkiston
Radio- ja tv-arkisto
Mitä on pitkäaikaissäilytys (PAS)
 Pitkäaikaissäilytys tarkoittaa säilyttämistä yli
– Ihmisten
– organisaatioiden ja
– tietojärjestelmien muutosten
KIRJASTOVERKKOPALVELUT
22
Miten säilyttäminen toteutuu
 Säilyttäminen on
– riskien hallintaa,
– prosessien ja järjestelmien laadunvarmistusta ja
– oikea-aikaisia toimenpiteitä
– taloudellisesti kestävällä tavalla.
KIRJASTOVERKKOPALVELUT
23
Pitkäaikaissäilytyksen päämäärä




Aineiston käytettävyyden säilyttäminen;
kohderyhmän tarpeita ajatellen.
Kohderyhmän (designated community) määrittely on tärkeää.
”Kansalaisella” eri tarpeet kuin ”tutkijalla”
KIRJASTOVERKKOPALVELUT
24
Säilyttämisen kolme tasoa
 Bittitason säilyttäminen
 Käytettävyyden säilyttäminen
 Ymmärrettävyyden säilyttäminen
KIRJASTOVERKKOPALVELUT
25
Bittitason säilyttäminen
 Säilytetään digitaalinen objekti täsmälleen alkuperäisenä.
 Passiivinen säilöminen ei riitä.
– Digitaalinen aineisto rappeutuu itsestään.
 Aineistoa tulee tarkkailla ja korjata
– esim. vertailemalla useaa kopiota ja korjaamalla poikkeavuudet
KIRJASTOVERKKOPALVELUT
26
Käytettävyyden säilyttäminen
 (A) Pidetään yllä ympäristöä, jolla aineistoa voidaan käyttää
(”emulointi”).
 (B) Muunnetaan aineisto niin, että sitä voi käyttää kulloisessakin
ympäristössä (”migrointi”).
KIRJASTOVERKKOPALVELUT
27
Säilymisen uhat





Korruptio: biteillä on taipumus muuttua spontaanisti
Muistivälineiden käyttö – aina vaara, että jotakin tapahtuu
Muistivälineiden vanhentuminen (lerppu…)
Formaattien vanhentuminen (TEKO…)
Käyttöjärjestelmien muuttuminen (vaikka olisikin TEKO-ohjelmisto,
pyöriikö se nykyisillä koneilla?)
 Kaikki tejnologia on hankalaa – tarvitaan riskienhallintaa ja
laadunvarmistusta.
KIRJASTOVERKKOPALVELUT
28
Digitointi ja metadata
 Metadata on elintärkeä osa digitaalista aineistoa
 Kuvailutiedot: mistä aineistossa on kysymys, mihin se liittyy jne.
 Hallinnollinen metadata: kuka saa käyttää aineistoa, kuka omistaa sen
jne.
 Tekninen metadata: mitä tarvitaan näyttämiseen; minkä tasoinen jne.
KIRJASTOVERKKOPALVELUT
29
PAS ja Kansallinen digitaalinen kirjasto







PAS-yhteistyötä valmisteltu jo vuodesta 2007
Osaksi KDK-hanketta: PAS-jaosto
Loppuraportti 2010 – jatkohanke 2011
Suunnitelma yhteiseksi pitkäaikaissäilytysjärjestelmäksi
Standardi- ja protokollasuosituksia
”Pienten organisaatioiden” tukipalveluita suunnitteilla
www.kdk.fi
KIRJASTOVERKKOPALVELUT
30
Digitoitujen aineistojen käyttö
KIRJASTOVERKKOPALVELUT
31
Hintaluettelo no 11. Helios – teknillinen tehdas, Riihimäki.
http://digi.kansalliskirjasto.fi/pienpainate/secure/showPage.html?action=page&id=345283
Data ja palvelu ovat eri asia
KIRJASTOVERKKOPALVELUT
Älä vangitse tietoa palvelimeen /
tietokantaan / järjestelmään / käyttöliittymään
32
Datan avoimuus








Aineisto, joka leviää, on aineistoa, jota käytetään ja joka säilyy
Älä tuijota käyttöliittymän käyntimääriin / kirjaston logon näkymiseen.
Näkyvyys hakukoneille; linkitettävyys
Standardien johdonmukainen käyttö
OAI-PMH- ja SRU-rajapinnat ym.
Näkyvyys asiakasliittymässä ja muissa vastaavissa
Linkki kirjastojärjestelmään
Pysyvät tunnisteet
KIRJASTOVERKKOPALVELUT
33
Kansalliskirjaston palvelut
Polska (Metsän puita tuuli tuudittaa) - 1901
Suomalainen Lauluseura;
Sivori, Emil (sov.); Putro, Mooses (joht.)
http://urn.fi/URN:NBN:FI:RAI-Gramophone24558
Mooses Putron kuva: www.inkeri.com
KIRJASTOVERKKOPALVELUT
34
Kansalliskirjaston strategiset päämäärät
 Kansallisaineiston saatavuudella säilyvyydellä on turvattu
kansakunnan muisti ja kansalaisten oikeus tietoon
 Palvelujen ja tietosisältöjen muodostama kansallinen tiedon
infrastruktuuri on yhteiskunnalle tehokas ja taloudellisesti
kannattava
 Kirjastoverkko tarjoaa nopean ja helpon tiedonsaannin
tiedeyhteisölle ja kansalaisille
 Kirjastoverkko, muistiorganisaatiot, tiedeyhteisö ja julkishallinto
hyötyvät Kansalliskirjaston kansainvälisestä yhteistyöstä
KIRJASTOVERKKOPALVELUT
35
Kansalliskirjasto ja digitointi
 Digitointi / Digitointi- ja konservointikeskus, Mikkeli
– Merkittävä massadigitoija
– Digitoinnin asiantuntija
 Digitaalinen pitkäaikaissäilytys / Kirjastoverkkopalvelut
– Standardit
– Pitkäaikaissäilytyksen ratkaisut; mukana KDK-PAS-hankkeessa
 Aineistot ja niiden kuvailu / Tutkimuskirjastopalvelut
– Metadata
– Asiakaspalvelu
KIRJASTOVERKKOPALVELUT
36
Kansalliskirjasto digitoijana
• Luotettava kumppani
laadukas
• Kokemusta prosesseista
• Tuntee kirjastoalan
• Kansainvälisestikin vertaillen
Asiakas
Digitointi- ja konservointikeskus
KIRJASTOVERKKOPALVELUT
37
Elektroniset vapaakappaleet
 ” Kansalliskirjaston tehtävänä on ohjelmallisesti hakea ja tallentaa
yleisön saatavilla olevaa verkkoaineistoa tietoverkoista.”
 Verkkoarkisto: haravoitua aineistoa
– http://verkkoarkisto.kansalliskirjasto.fi/
 Luovutuksia: esim. musiikkia, kartta-aineistoja ja muuta, jota ei voida
haravoida.
KIRJASTOVERKKOPALVELUT
38
Miksi vapaakappaleet eivät korvaa PAS:tä
 Hyvin rajattu käyttö (vapaakappalekirjastojen tiloissa)
 Vapaakappaleista ei voida antaa julkaisijallekaan aineistoa
digitaalisena
 Verkkoharava tallentaa tietoa sellaisena kuin se näkyy käyttäjälle
 Verkkoharava ei tallenna tietokantoja tms.
 Luovutuksia otetaan vastaan resurssien mukaan.
KIRJASTOVERKKOPALVELUT
39
Kansalliskirjaston palvelut aineistojen esiinpanossa
 Dspace-ohjelmistoon perustuvat julkaisuarkistot
– www.doria.fi
– publications.theseus.fi
 Fokus kurantissa tieteellisessä julkaisussa, mutta käytetty myös
kulttuuriaineistojen julkaisemiseen
 Sanomalehdillä, kausijulkaisuilla, pienpainatteilla itse tehty järjestelmä
KIRJASTOVERKKOPALVELUT
40
Pysyvät tunnisteet




WWW-osoitteet muuttuvat, pysyvä tunnus säilyy
Kansalliskirjasto suosittelee URN-tunnuksia
http://www.kansalliskirjasto.fi/julkaisuala/urn.html
URN-tunnus edellyttää järjestelmää, joka pystyy pitämään yllä
ajantasaista URN-rekisteriä.
URN?
”URN=URL”
URN
URL
Repository
KIRJASTOVERKKOPALVELUT
41
URN
Resolver
URL
Yhteistyön mahdollisuuksista
KIRJASTOVERKKOPALVELUT
42
Mieluummin yhdessä kuin yksin
 Erottamalla datan ja palvelun taso säilytetään vapaus kehittää
hyvinkin erityisiä palveluita paikallisesti
 Korkealaatuinen digitointiprosessi ei synny käden käänteessä
 KAM-ulottuvuus?
 http://www.digiwiki.fi/fi/
KIRJASTOVERKKOPALVELUT
43