Projekt VIPAR

Download Report

Transcript Projekt VIPAR

Rudolf Mumenthaler
Zwischen Bestandespflege
und Öffentlichkeitsarbeit
am Beispiel der Spezialsammlungen
der ETH-Bibliothek
Tagung Wolfsberg, 18. März 2002
Inhalt der Präsentation
 I. Bestandeserhaltung (Preservation)
 Konservation
 Datenerhalt: Digitalisieren versus
Mikroverfilmung
 II. Zugänglichkeit/Nutzung (Access)




Metadaten
Erfassung in Datenbanken
online-Nutzung (Anwendungsbeispiele)
Ausblick
Der Hintergrund: Bildbestand der ETH-Bibliothek




Porträts
Ansichten
Comet Fotoarchiv
Dias/Negative
 Fotos/Dias in Nachlässen
 Negativarchiv des Photographischen
Instituts
 total: ca. 1.2 Mio. Bilder
 Karten
 Buchillustrationen
I. Bestandeserhalt Preservation
• Bilder rücken durch Entwicklung
des Internets ins Zentrum
• Widersprüchliche Ziele:
– Verstärkte, ev. kommerzielle
Nutzung (Bildarchiv als
Profitcenter)
– Langfristige Sicherung des Bildes
als Kulturgut und Informationsträger
Konservatorische
Massnahmen
• Aufbewahrung
– Säurefreies Papier/Karton
• Umpacken der Bestände notwendig
– Klimatische Bedingungen im
Magazin
• Leider oft bloss ein Traum...
• Restaurierung von Originalen
• Kostspielige Variante für Objekte mit
künstlerischem Anspruch
• Foto als Kulturgut
Datenerhalt als
Konservation
• Konzept des Datenerhalts
– Langfristige Sicherung der
Information - nicht des Mediums
– Methoden: analoge
Mikroverfilmung und/oder
Digitalisierung
Analoge Sicherung:
Mikrofilm
• Vorteile Mikroverfilmung
– Haltbarkeit des Mediums (>100
Jahre)
– Hohe Auflösung
– Unabhängigkeit von Hard- und
Software
– Geringe Lagerkosten
Analoge Sicherung:
Mikrofilm (2)
• Nachteile Mikroverfilmung
– Benutzerunfreundlichkeit
• Handling der Mikrofilme/-fichen
• Benutzung nur an Ort und mit
Lesegeräten
• Eingeschränkte Nutzung
– Verwaltung
• Starre Reihenfolge (Rollfilm)
• Metadaten über externes Medium
Digitalisierung und
Sicherheit
 Lebensdauer von Speichermedien
 Magnetische Disk-Systeme
 Floppy-Disk
10 Jahre
1.4 MB
 Magnetische Band-Systeme
 DDT-Tapes
15 Jahre
8 GB
 Optische/magneto-optische Systeme




CD-ROM
CD-R
CD-RW
MO-Discs
3-10 Jahre 700 MB
unsicher
700 MB
sehr unsicher650 MB
20-30 Jahre 1.3 GB
Digitalisierung und
Sicherheit (2)
 Abhängigkeit von Hard- und Software
 Änderung von Systemen, Hardware, Software
 Möglichst langlebige Dateiformate, d.h.
unkomprimierte Standardformate
 Umkopieren alle 5 Jahre, Qualitätskontrolle
 hohe Kosten für digitales Faksimile
 ergibt Dateien von gegen 250 MB
 lange Bearbeitungszeit durch Scanner, Speicherung
 schwieriges Handling (durch Bibliothek und
Benutzer)
 hoher Speicherbedarf, hohe Speicherkosten
Digitalisierung und
Sicherheit (3)
 Archivtaugliche Formate
 Unkomprimierte Formate (Tiff, Bitmap)
 Textdokumente: ASCII, XML
 Nicht für Archivierung geeignete Formate
 Verlustbehaftete Komprimierung als Sackgasse:
JPEG, GIF, PDF – aber wichtig für Nutzung
 Verluste können nicht rückgängig gemacht werden
 Wechsel auf neue Formate (JPEG2000) verbaut
Nur relative Sicherheit
Digitalisierungsformate in
der Praxis (vip@r)
 Archivkopie
 Auflösung: 300 dpi (Fotoabzüge bis
Format A5)
 1200 dpi für Kleinbildnegative und Dias
 Modus: Graustufen 8 Bit für s/w-Vorlagen
 RGB 24 bit bei Farbvorlagen (8 bit pro
Kanal)
 Format: Tiff, unkomprimiert
 Dateigrösse: 5 MB (s/w) bis 30 MB (farbig)
 Speichermedium
 CD-R, dann Band (Backup)
 neue Technologien: nearline-Speicher
Digitalisierungsformate (2)
 Benutzungskopie: JPEG
 Nutzung im Web und für Prints
 niedrig komprimiert (ca. 10x kleiner als Tiff)
 Neuer Standard: JPEG2000
 Speichermedium
 online verfügbar auf Server
 günstiger, da 10x weniger Speicherplatz
benötigt
 Richtet sich am „normalen“
Kundenbedürfnis aus (90-95% der
Fälle)
 hohe Servicebereitschaft
JPEG2000
• Neuer Standard (ISO/IEC-Standard 15444-1)
• Höhere Kompressionsfaktoren bei besserer
Bildqualität
• basiert auf Wavelet-Verfahren (einzelne
Schwingungspakete)
• Kompressionsfaktoren bis zu 100 möglich
• weniger auffällige Bildfehler bei höheren
Kompressionsraten
• Robustheit gegenüber Übertragungsfehlern
(v.a. für drahtlose Anwendungen wichtig)
Vergleich JPEG-JPEG2000
• JPEG
– Qualität 1
– Grösse: 28 KB
• JPEG2000
– Qualität 10%
– Grösse: 11 KB
Verfilmung/Digitalisierung
 Zweck
Verfilmung
 Zweck
Digitalisierung
 Sicherheitskopie  Benutzungskopie
 Schonung des
 Basis für
Originals
Benutzungskopie
 Basis für Repro
 langfristiger
 Inventar
Datenerhalt (<
 Recherche
100 Jahre)
 besserer Zugriff
Kombination von Verfilmung
und Digitalisierung
• Hybridverfahren
– Parallele Verarbeitung
• Digitalisierung ab Mikrofilm
– Optimal bei Kontaktkopie ab Negativ
oder Abzug
– Problematisch für Originale mit hoher
Dichte (Glasdias und –negative)
• Computer Output on Microfiche
(COM)
– Mikrosave-Verfahren
Vergleich Digitalisierung
direkt und ab Mikrofilm
• Digitalisierung
direkt ab Dia
• Digitalisierung
ab Mikrofilm
Problemfall Glasdias
• Hohe Dichte des
Originals
• Hoher Kontrastumfang
• Beschränkte
Wiedergabe auf
Mikrofilm
Problemfall Glasdias:
Bildkorrektur
Anwendung im Bildarchiv:
Entscheidungsprozess
 Auswahl der Dokumente
 Sujet, Bestand
 Ev. Marktanalyse/Marketingkonzept
 Bestimmen der Methode
 Sicherung notwendig?
 Wenn ja: Sicherheitsverfilmung auf Mikrofilm
 Wenn nein: direkte Digitalisierung
 Geplanter Verwendungszweck?
 Ausgabegrösse als Print (Norm: A4, = 95%
Kundenwunsch)
 Bestimmt Format MF und Digitalisierung
 Testreihe
 Kontrolle am Print, nicht am Bildschirm (72
dpi)
Digitalisierung extern/intern
 Extern
 Auswahl/Vorbereitung
 Transport
 Digitalisierung/Verfilmung/Bildbearbeitung
 Hardware
 PC
 Server
 Qualitätskontrolle
 Archivierung
 Glasdias, -negative
 grosse Mengen
 Verfilmung
 Intern
 Auswahl/Vorbereitung
 Hardware
 Scanner
 PC/Software
 Server





Know-how
Ablauforganisation
Digitalisierung
Bildbearbeitung
Archivierung
 Fotoabzüge,
Kleinbilddias, -negative
 Spezialfälle, Aufträge
II. Zugänglichkeit und
Nutzung
• Resultat der
Digitalisierung:
– Stapel von CDs
– Voller Server...
• Die Arbeit geht
weiter:
• Indexierung,
Erschliessung
• Erfassen in einer
Datenbank
Kundenbedürfnisse
– Wer sind unsere (potentiellen) Kunden?
– Welches sind unsere Produkte?
• Auswahl von Beständen, Definition von
Formaten, Bestimmung von Preisen
– Konkurrenz? Partner?
• Marktanalyse
• ETH-Bib kein Gesamtmarktanbieter
• Konzentration auf eigene Stärken
• Zusammenarbeit mit Partnern
• Marketingkonzept
Zweck Bilddatenbank
 Inventar der Sammlung,
Überblick
 verbesserter Zugriff für
BenutzerInnen
 Recherche
 Online-Zugriff
 mehr Kunden
 kommerzielle Nutzung
Metadaten (1): formale
Erschliessung
• Standardisierung im Bild- weniger
weit als im Bibliotheksbereich
• Standards:
– Dublin-Core
– MARC, AACR2 (Bibliotheken)
– EAD, ISAD(G) (Archive)
– IPTC (Presse, Bildagenturen)
Dublin Core angewandt
Dublin Core
ETH-Bibliothek
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
Titel (Bildtitel)
Bildinhalt (Bildlegende)
Name des Fotografen
Schlagwörter
Urheber
Quelle
Datum
Signatur/Bildcode
Medientyp
Indexsprache
Verweis
•
Dateityp des Originals
Title
Description
Creator
Subject
Rights
Source
Date
Identifier
Type
Language
Relation
publisher
coverage
format
Metadaten (2):
Sacherschliessung
• Thesauri
–
–
–
–
–
IconClass
Thesaurus for Graphic Materials
Universal-Dezimalklassifikation
Art and Architecture Thesaurus
...
• Eigener Thesaurus:
– Beispiel vip@r
Sachkatalog vip@r
 Oberbegriffe












Alltagsleben, Freizeit
Architektur
Bildung
Gesellschaft
Kunst & Kultur
Medizin
Natur
Politik & Staat
Soziale Themen
Technik und Verkehr
Wirtschaft, Arbeit
Wissenschaften
 Unterbegriffe











Brauchtum
Essen & Trinken
Freizeitgestaltung
Kleidung
Konsum
Hygiene
Medien
Religion
Sexualität
Sport
Sterben, Tod
Volltext oder
Sachkatalog?
 Volltextbeschreibung  Sachkatalog/Thesaurus
 freie Wortwahl
 präzise
 schnell
 Einheitliche Begriffe
 detaillierte Be Mehrsprachigkeit
schreibung
 Angebot an
möglich
Suchbegriffen
 uneinheitlich
 Aufwendige Pflege
 einsprachig
 Wenig detailliert
 „Schuss ins Blaue“
bei Recherche
Bilddatenbank ETHBibliothek
Eingabemaske
Bildsets in ImageFinder
Anwendungen
Pilotversuch eines Bildverbundes (2000-01)
Testinstallation vip@r
Partner im Projekt vip@r
Anwendungen (2)
EPICS
Interaktives Bildinformationssystem im
Rahmen von ETH World
(Projekt von Okt 2001-April 2003)
Pilotversion ab Juli 2002
Ausblick:
Bildähnlichkeitssuche
• Projekt Chariot an der ETHZ
• Database Research Group, Prof. Schek
• http://simulant.ethz.ch
• Analyse der
Bildstruktur
und -farben
• Analyse von
Bildregionen
• Suche des
nächsten
Nachbarn
Ergebnis der
Ähnlichkeitssuche
Ähnliche
Bilder
Start der
Suche mit
diesem Bild
Kombination von Text
und Bildinhalt
• Metadaten für Einstieg in Bildsuche
unumgänglich
• Kern einer Datenbank mit
indexierten Bildern
• Suche auch über nicht erschlossene
Bilder möglich
• Prognose: intellektuelle Bilderschliessung wird nicht
überflüssig...
... und die Arbeit geht uns nicht
aus...