Avisdigitalisering, Niels Bønding, Statsbiblioteket

Download Report

Transcript Avisdigitalisering, Niels Bønding, Statsbiblioteket

DIGITALISERING
AF
32 MIO. AVISSIDER PÅ 3 ÅR
Middelfart 22-05-2014
Niels Bønding
[email protected]
HVEM ER JEG?
• Niels Bønding
• 46 år og vendelbo
• Cand. phil. i filosofi 1998
• 11 år som proceskonsulent
og projektleder i TDC
• PRINCE2 Practitioner
og IPMA C certificeret
• Ansat på Statsbiblioteket fra 15. august 2013 som projektleder for
Avisdigitaliseringsprojektet – samme dag som beslutningen om Ninestars
som leverandør blev truffet.
Niels Bønding
[email protected]
• Scanning i Hamburg
• Manuel efterbehandling i Chennai
• Hovedkvarter og IT-udvikling
i Bangalore
Ninestars bygning i Chennai
Niels Bønding
[email protected]
PRODUKTIONSPROCES
Niels Bønding
[email protected]
SCANNING AF MIKROFILM
•
Mekel Mach 5 scannere placeret i
Hamburg
•
Vi har været med ved kalibreringen af
scannerne. Vi og Ninestars har ved
fælles hjælp opnået et rigtig godt
resultat.
•
Det rå output er TIFF scannet i 300
dpi. Den endelige fil er en JPEG2000
og kæden mellem dem er lossless
•
Vi får samtidig målt emulsion density
på mikrofilmene til brug for
kassationsprocessen
Niels Bønding
[email protected]
BILLEDKVALITET – BEVARINGSKVALITET?
Niels Bønding
[email protected]
BILLEDKVALITET – BEVARINGSKVALITET!
Niels Bønding
[email protected]
OCR OG SEGMENTERING - FORMIDLING
Modtaget 30-12-2013
Niels Bønding
[email protected]
Modtaget 24-02-2014
OCR OG SEGMENTERING - FORMIDLING
Modtaget 30-12-2013
Niels Bønding
[email protected]
Modtaget 24-02-2014
HVILKEN KVALITET TIL HVILKET FORMÅL?
• Vi skal bevare aviserne i den bedst mulige kvalitet for
fremtiden
• Vi skal formidle aviserne i den bedst mulige kvalitet for
nutiden
• Vi skal kunne afgøre hvorvidt en bevaringskopi (og en
mikrofilm) er tilstrækkelig god til, at vi kan vælge at
kassere den kopi, der ligger i Vestindisk Pakhus i
København. For det er her pengene kommer fra.
Niels Bønding
[email protected]
METADATA REGISTRERES I PROCESSEN
• Tekniske metadata om den enkelte scannede side
• Fx størrelse, opløsning, dato og operatør
• Metadata om mikrofilmen
• Titler, datoer, film og filmning
• Udgave og udgivelse og den enkelte side
• Morgen, aften, weekend, ekstra eller særudgave
• Placering af siden i udgaven og på mikrofilmen
Niels Bønding
[email protected]
SUPPLERENDE METADATA
• Sammenkædning af titler over tid
• Kobling til De Danske Aviser
• Geografiske data
Niels Bønding
[email protected]
ADGANG TIL AVISERNE
Periode
Adgang på
SB og KB
Snippets/thumbnails
Fjernadgang alle
Academic Licens
1950+
Ja
Afhænger af Copydanaftale
Nej
Afhænger af Copydanaftale
1940
Ja
Afhænger af Copydanaftale
Nej
Afhænger af Copydanaftale
1930
Ja
Afhænger af Copydanaftale
Afhænger af Copydanaftale
Afhænger af Copydanaftale
1920
Ja
Afhænger af Copydanaftale
Afhænger af Copydanaftale
Afhænger af Copydanaftale
1910
Ja
Måske ophavsret?
Måske ophavsret?
Måske ophavsret?
1900
Ja
Måske ophavsret?
Måske ophavsret?
Måske ophavsret?
1890
Ja
Måske ophavsret?
Måske ophavsret?
Måske ophavsret?
1880
Ja
Måske ophavsret?
Måske ophavsret?
Måske ophavsret?
1870
Ja
Ja
Ja
Ja
1860
Ja
Ja
Ja
Ja
ældre
Ja
Ja
Ja
Ja
Niels Bønding
[email protected]
MEDIESTREAM
•
Mediestream er
Statsbibliotekets online portal,
hvor digitaliserede samlinger
af dansk audiovisuel kulturarv
tilgængeliggøres.
•
I dag er der adgang til radio,
tv og reklamefilm, som er
opdelt i såkaldte ”subportaler”
(i topmenuen).
•
De digitaliserede aviser vil
blive tilgængelige i en sådan
subportal i Mediestream
inden udgangen af 2014.
•
Pt. foreligger designudkast til
hvordan aviserne vil blive
fremvist.
Niels Bønding
[email protected]
AVIS-SUBPORTAL
•
Brugeren præsenteres for
denne side efter at have
klikket på ”AVIS” i topmenuen.
•
Herfra er det muligt at søge i
de digitaliserede aviser.
Ligeledes er der link til en
oversigt over alle
digitaliserede aviser.
•
Brugerne inddrages i portalen
via avisforsider fra for 100 år
siden.
Niels Bønding
[email protected]
SØGERESULTATER
•
Hvert søgeresultat består af en hel avis
som fx første resultat: Aarhus
Amtstidende 8. oktober 1902.
•
I denne avis er der tre hits, som matcher
søgningen på ”program”. Det vises ved at
opliste overskriften i de artikler, som
”program” optræder i. Bemærk at det er et
kvalificeret bud på overskriften, men det
kan også være den første sætning fra en
annonce, tv-oversigt og lignende, eller det
kan være en sætning fra midten af
artiklen, hvis systemet tager fejl.
•
Thumbnails vil max være avisens
sidebredde, og der zoomes ikke
yderligere ind.
Niels Bønding
[email protected]
SØGERESULTATER
•
•
I udsnittet til højre ses et enkelt
søgeresultat. På thumbnailen er
det angivet med en grøn
markering, hvor på avissiden det
første hit optræder. Der zoomes
hverken ind eller ud på
thumbnails. Deres maksimale
bredde er altid avisens
sidebredde, men der panoreres
op eller ned på avissiden for at
vise den relevante markering.
Igen ses kvalificerede bud på
overskrifter. Bemærk, at der ikke
er tale om en såkaldt ”snippet”,
da ordene umiddelbart omkring
søgeordet ikke vises.
Niels Bønding
[email protected]
Rettighedsbeskyttet materiale:
1. Thumbnails, ca. 170x100 px, både
sort/hvid og farve
2. “Overskrift” på
artikel/annonce/dødsannonce mv.:
Maksimalt de første 10 ord.
FULDPOSTVISNING
•
Ved at klikke på et søgeresultat
kommer brugeren til en fuldpostvisning, som ses til højre.
•
Til forskel fra foregående side vises
her ikke kun et udsnit men derimod
hele avissiden som thumbnail ud fra
den definerede størrelse.
•
Ved at klikke på et af de tre
søgeresultater kan brugeren få vist en
thumbnail af den avisside, hvor
søgeresultatet optræder.
Niels Bønding
[email protected]
AVISOVERSIGT
•
Hvis brugeren fra forsiden
klikker på linket til
oversigten over alle
digitaliserede aviser, vises
siden til højre.
•
Her er det muligt at finde en
enkelt titel og klikke sig
videre til yderligere
oplysninger om denne.
Niels Bønding
[email protected]
AVISHISTORIK
•
Til højre ses detaljerne for
en enkelt avis. Det
inkluderer titelhistorik,
samlingens omfang,
udgivelsessted mv.
•
For at inspirere brugerne
vises de mest sete udgaver
af avisen i bunden af siden.
Niels Bønding
[email protected]