Projekt VIPAR
Download
Report
Transcript Projekt VIPAR
Rudolf Mumenthaler
Zwischen Bestandespflege
und Öffentlichkeitsarbeit
am Beispiel der Spezialsammlungen
der ETH-Bibliothek
Tagung Wolfsberg, 18. März 2002
Inhalt der Präsentation
I. Bestandeserhaltung (Preservation)
Konservation
Datenerhalt: Digitalisieren versus
Mikroverfilmung
II. Zugänglichkeit/Nutzung (Access)
Metadaten
Erfassung in Datenbanken
online-Nutzung (Anwendungsbeispiele)
Ausblick
Der Hintergrund: Bildbestand der ETH-Bibliothek
Porträts
Ansichten
Comet Fotoarchiv
Dias/Negative
Fotos/Dias in Nachlässen
Negativarchiv des Photographischen
Instituts
total: ca. 1.2 Mio. Bilder
Karten
Buchillustrationen
I. Bestandeserhalt Preservation
• Bilder rücken durch Entwicklung
des Internets ins Zentrum
• Widersprüchliche Ziele:
– Verstärkte, ev. kommerzielle
Nutzung (Bildarchiv als
Profitcenter)
– Langfristige Sicherung des Bildes
als Kulturgut und Informationsträger
Konservatorische
Massnahmen
• Aufbewahrung
– Säurefreies Papier/Karton
• Umpacken der Bestände notwendig
– Klimatische Bedingungen im
Magazin
• Leider oft bloss ein Traum...
• Restaurierung von Originalen
• Kostspielige Variante für Objekte mit
künstlerischem Anspruch
• Foto als Kulturgut
Datenerhalt als
Konservation
• Konzept des Datenerhalts
– Langfristige Sicherung der
Information - nicht des Mediums
– Methoden: analoge
Mikroverfilmung und/oder
Digitalisierung
Analoge Sicherung:
Mikrofilm
• Vorteile Mikroverfilmung
– Haltbarkeit des Mediums (>100
Jahre)
– Hohe Auflösung
– Unabhängigkeit von Hard- und
Software
– Geringe Lagerkosten
Analoge Sicherung:
Mikrofilm (2)
• Nachteile Mikroverfilmung
– Benutzerunfreundlichkeit
• Handling der Mikrofilme/-fichen
• Benutzung nur an Ort und mit
Lesegeräten
• Eingeschränkte Nutzung
– Verwaltung
• Starre Reihenfolge (Rollfilm)
• Metadaten über externes Medium
Digitalisierung und
Sicherheit
Lebensdauer von Speichermedien
Magnetische Disk-Systeme
Floppy-Disk
10 Jahre
1.4 MB
Magnetische Band-Systeme
DDT-Tapes
15 Jahre
8 GB
Optische/magneto-optische Systeme
CD-ROM
CD-R
CD-RW
MO-Discs
3-10 Jahre 700 MB
unsicher
700 MB
sehr unsicher650 MB
20-30 Jahre 1.3 GB
Digitalisierung und
Sicherheit (2)
Abhängigkeit von Hard- und Software
Änderung von Systemen, Hardware, Software
Möglichst langlebige Dateiformate, d.h.
unkomprimierte Standardformate
Umkopieren alle 5 Jahre, Qualitätskontrolle
hohe Kosten für digitales Faksimile
ergibt Dateien von gegen 250 MB
lange Bearbeitungszeit durch Scanner, Speicherung
schwieriges Handling (durch Bibliothek und
Benutzer)
hoher Speicherbedarf, hohe Speicherkosten
Digitalisierung und
Sicherheit (3)
Archivtaugliche Formate
Unkomprimierte Formate (Tiff, Bitmap)
Textdokumente: ASCII, XML
Nicht für Archivierung geeignete Formate
Verlustbehaftete Komprimierung als Sackgasse:
JPEG, GIF, PDF – aber wichtig für Nutzung
Verluste können nicht rückgängig gemacht werden
Wechsel auf neue Formate (JPEG2000) verbaut
Nur relative Sicherheit
Digitalisierungsformate in
der Praxis (vip@r)
Archivkopie
Auflösung: 300 dpi (Fotoabzüge bis
Format A5)
1200 dpi für Kleinbildnegative und Dias
Modus: Graustufen 8 Bit für s/w-Vorlagen
RGB 24 bit bei Farbvorlagen (8 bit pro
Kanal)
Format: Tiff, unkomprimiert
Dateigrösse: 5 MB (s/w) bis 30 MB (farbig)
Speichermedium
CD-R, dann Band (Backup)
neue Technologien: nearline-Speicher
Digitalisierungsformate (2)
Benutzungskopie: JPEG
Nutzung im Web und für Prints
niedrig komprimiert (ca. 10x kleiner als Tiff)
Neuer Standard: JPEG2000
Speichermedium
online verfügbar auf Server
günstiger, da 10x weniger Speicherplatz
benötigt
Richtet sich am „normalen“
Kundenbedürfnis aus (90-95% der
Fälle)
hohe Servicebereitschaft
JPEG2000
• Neuer Standard (ISO/IEC-Standard 15444-1)
• Höhere Kompressionsfaktoren bei besserer
Bildqualität
• basiert auf Wavelet-Verfahren (einzelne
Schwingungspakete)
• Kompressionsfaktoren bis zu 100 möglich
• weniger auffällige Bildfehler bei höheren
Kompressionsraten
• Robustheit gegenüber Übertragungsfehlern
(v.a. für drahtlose Anwendungen wichtig)
Vergleich JPEG-JPEG2000
• JPEG
– Qualität 1
– Grösse: 28 KB
• JPEG2000
– Qualität 10%
– Grösse: 11 KB
Verfilmung/Digitalisierung
Zweck
Verfilmung
Zweck
Digitalisierung
Sicherheitskopie Benutzungskopie
Schonung des
Basis für
Originals
Benutzungskopie
Basis für Repro
langfristiger
Inventar
Datenerhalt (<
Recherche
100 Jahre)
besserer Zugriff
Kombination von Verfilmung
und Digitalisierung
• Hybridverfahren
– Parallele Verarbeitung
• Digitalisierung ab Mikrofilm
– Optimal bei Kontaktkopie ab Negativ
oder Abzug
– Problematisch für Originale mit hoher
Dichte (Glasdias und –negative)
• Computer Output on Microfiche
(COM)
– Mikrosave-Verfahren
Vergleich Digitalisierung
direkt und ab Mikrofilm
• Digitalisierung
direkt ab Dia
• Digitalisierung
ab Mikrofilm
Problemfall Glasdias
• Hohe Dichte des
Originals
• Hoher Kontrastumfang
• Beschränkte
Wiedergabe auf
Mikrofilm
Problemfall Glasdias:
Bildkorrektur
Anwendung im Bildarchiv:
Entscheidungsprozess
Auswahl der Dokumente
Sujet, Bestand
Ev. Marktanalyse/Marketingkonzept
Bestimmen der Methode
Sicherung notwendig?
Wenn ja: Sicherheitsverfilmung auf Mikrofilm
Wenn nein: direkte Digitalisierung
Geplanter Verwendungszweck?
Ausgabegrösse als Print (Norm: A4, = 95%
Kundenwunsch)
Bestimmt Format MF und Digitalisierung
Testreihe
Kontrolle am Print, nicht am Bildschirm (72
dpi)
Digitalisierung extern/intern
Extern
Auswahl/Vorbereitung
Transport
Digitalisierung/Verfilmung/Bildbearbeitung
Hardware
PC
Server
Qualitätskontrolle
Archivierung
Glasdias, -negative
grosse Mengen
Verfilmung
Intern
Auswahl/Vorbereitung
Hardware
Scanner
PC/Software
Server
Know-how
Ablauforganisation
Digitalisierung
Bildbearbeitung
Archivierung
Fotoabzüge,
Kleinbilddias, -negative
Spezialfälle, Aufträge
II. Zugänglichkeit und
Nutzung
• Resultat der
Digitalisierung:
– Stapel von CDs
– Voller Server...
• Die Arbeit geht
weiter:
• Indexierung,
Erschliessung
• Erfassen in einer
Datenbank
Kundenbedürfnisse
– Wer sind unsere (potentiellen) Kunden?
– Welches sind unsere Produkte?
• Auswahl von Beständen, Definition von
Formaten, Bestimmung von Preisen
– Konkurrenz? Partner?
• Marktanalyse
• ETH-Bib kein Gesamtmarktanbieter
• Konzentration auf eigene Stärken
• Zusammenarbeit mit Partnern
• Marketingkonzept
Zweck Bilddatenbank
Inventar der Sammlung,
Überblick
verbesserter Zugriff für
BenutzerInnen
Recherche
Online-Zugriff
mehr Kunden
kommerzielle Nutzung
Metadaten (1): formale
Erschliessung
• Standardisierung im Bild- weniger
weit als im Bibliotheksbereich
• Standards:
– Dublin-Core
– MARC, AACR2 (Bibliotheken)
– EAD, ISAD(G) (Archive)
– IPTC (Presse, Bildagenturen)
Dublin Core angewandt
Dublin Core
ETH-Bibliothek
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
Titel (Bildtitel)
Bildinhalt (Bildlegende)
Name des Fotografen
Schlagwörter
Urheber
Quelle
Datum
Signatur/Bildcode
Medientyp
Indexsprache
Verweis
•
Dateityp des Originals
Title
Description
Creator
Subject
Rights
Source
Date
Identifier
Type
Language
Relation
publisher
coverage
format
Metadaten (2):
Sacherschliessung
• Thesauri
–
–
–
–
–
IconClass
Thesaurus for Graphic Materials
Universal-Dezimalklassifikation
Art and Architecture Thesaurus
...
• Eigener Thesaurus:
– Beispiel vip@r
Sachkatalog vip@r
Oberbegriffe
Alltagsleben, Freizeit
Architektur
Bildung
Gesellschaft
Kunst & Kultur
Medizin
Natur
Politik & Staat
Soziale Themen
Technik und Verkehr
Wirtschaft, Arbeit
Wissenschaften
Unterbegriffe
Brauchtum
Essen & Trinken
Freizeitgestaltung
Kleidung
Konsum
Hygiene
Medien
Religion
Sexualität
Sport
Sterben, Tod
Volltext oder
Sachkatalog?
Volltextbeschreibung Sachkatalog/Thesaurus
freie Wortwahl
präzise
schnell
Einheitliche Begriffe
detaillierte Be Mehrsprachigkeit
schreibung
Angebot an
möglich
Suchbegriffen
uneinheitlich
Aufwendige Pflege
einsprachig
Wenig detailliert
„Schuss ins Blaue“
bei Recherche
Bilddatenbank ETHBibliothek
Eingabemaske
Bildsets in ImageFinder
Anwendungen
Pilotversuch eines Bildverbundes (2000-01)
Testinstallation vip@r
Partner im Projekt vip@r
Anwendungen (2)
EPICS
Interaktives Bildinformationssystem im
Rahmen von ETH World
(Projekt von Okt 2001-April 2003)
Pilotversion ab Juli 2002
Ausblick:
Bildähnlichkeitssuche
• Projekt Chariot an der ETHZ
• Database Research Group, Prof. Schek
• http://simulant.ethz.ch
• Analyse der
Bildstruktur
und -farben
• Analyse von
Bildregionen
• Suche des
nächsten
Nachbarn
Ergebnis der
Ähnlichkeitssuche
Ähnliche
Bilder
Start der
Suche mit
diesem Bild
Kombination von Text
und Bildinhalt
• Metadaten für Einstieg in Bildsuche
unumgänglich
• Kern einer Datenbank mit
indexierten Bildern
• Suche auch über nicht erschlossene
Bilder möglich
• Prognose: intellektuelle Bilderschliessung wird nicht
überflüssig...
... und die Arbeit geht uns nicht
aus...