Umsetzung von EAD(DDB)

Download Report

Transcript Umsetzung von EAD(DDB)

EAD(DDB) in der Praxis
Die Verwendung in der
DDB und im Archivportal-D
Umsetzung
1.
2.
3.
4.
5.
6.
7.
Objektseiten
Suchfilter
Normdaten
Verlinkung und
Binärcontent
Identifier
Ingestprozess
Ausblick
Objektseiten


Unterschiedliche Anzeige je Verzeichnungsstufe
Archivportal-D Objektseiten analog zur DDB
Hierarchien

Nicht alle Stufen haben eine Objektansicht
Strukturierung der Beschreibungen durch
Absätze wichtig: Absätze im Freitext in </lb>
umwandeln
Suchfilter

Zeit: ISO-8601 („YYYY-TT-MM“)
– Bereinigungsprozess in der DDB




Sprache: ISO 639-2 („ger“)
Medientyp: fixes Vokabular
Sparte / Datenlieferant: aus der
Registrierung befüllt
Person / Ort / Stichwort:
– Indexbegriffe
– + Urheber/Provenienz und
Archivalientyp
– Archivalientyp-Vokabular
sollte normalisiert
angegeben werden
– sinnvoll Einträge doppelt
anzugeben
Verlinkung und Binärcontent
Links
-
zurück ins Findmittelsystem
zu einem Viewer
zum Findbuch
Binärcontent
-
Link zum „freistehenden“ Digitalisat
Direkte Mitlieferung der Digitalisate Angabe der relativen Pfade
Normdaten
GND
Wikipedia
Personen-Seite




GND
DDB
GND: Zentrales Element
zur Vernetzung der
Inhalte
Entitätenseiten als
zusätzlicher Einstieg
Anreicherung mit
externen Inhalten
Möglich Normdaten
anzugeben für
Indexbegriffe,
Provenienz und Urheber
Stabile Identifier
 DDB interner Identifier baut auf IDs aus EAD(DDB) auf
 Zum Überschreiben alter Datensätze bei Neulieferungen
 Um Verlinkung zwischen Tektonik und Findbuch zu
gewährleisten
 Zum Abgleich der Datenlieferung bei verschiedenen
Lieferwegen
 Stabile Objektreferenz in myDDB
 Grundlage für Persistent Identifier Systeme
Anforderungen
 Nicht sprechende technische Identifikatoren
 Eindeutigkeit (Findbuch und Tektonik) innerhalb der
Institution zentral (nicht nur innerhalb der Datei)
 Auch für Gliederungsstufen und Binärcontent
 Wird nicht erst beim Export erzeugt
 Stabilität bei Neulieferungen muss gewährleistet sein
 Muss auch bei einem Software-Umstieg stabil bleiben
 Im besten Falle beruhen auch die Links auf den
Identifiern (Permalink-System)
Umsetzungsbeispiele
 LABW: aid: zusammengesetzt aus einem
Archividentifier und der scope-id (eindeutige ID in
scope für jeden Datensatz)
– Beispiel: 1-2951896
 LAV: weltweit eindeutige Identifier (UUIDs/GUIDs)
werden pro Verzeichnisebene vergeben
– Beispiel: 936DA01F-9ABD-4D9D-80C702AF85C822A8
Ingestprozess
Datenlieferanten schicken Testdaten
Kontrolle anhand des Schemas
Laden in ein Testsystem (inhaltliche Kontrolle)
Im Moment: Anpassungen vor dem Ingest von der
Fachstelle Archiv
 zukünftig standardisiertes EAD(DDB) von zentraler
Bedeutung
 Plan 2014: Fachstelle Archiv: Standardisierung der
Export-Schnittstellen




Ausblick
 METS: Nutzen eines gemeinsamen Viewers
 Spezifischere Rechteauszeichnung je Digitalisat
 Persistent Identifier-Systeme: stabile Links in der
DDB
 Rollen: spezifischere Auszeichnung der Personen
 Geo-Koordinaten: Kartenanwendungen
 OAI-PMH: Protocol for Metadata Harvesting
Valides EAD(DDB)
Die Schemata
Valides EAD(DDB)
1.
2.
3.
4.
5.
6.
7.
Änderungen in EAD 1.1
Dokumentation
Zweck der Schemata
Schemata
Normiertes Vokabular
Mögliche Probleme bei der Validierung
Anforderungen an die Exportschnittstellen
EAD(DDB) 1.1
 Geringe Erweiterungen
– Einfachere Unterscheidung zwischen Findbuch und
Tektonik Datei
– Angaben zum Archiv und zur Überorganisation
besser getrennt
– Mehr Möglichkeiten zur Einbindung von Normdaten
– In der Format-Definition in Excel ausgezeichnet
• rot: Änderungen
• grün: Ergänzungen
Dokumentation
 Jeweils pro Tektonik und Findbuch-Datei
– Beschreibende Informationen in Word: erläuternde
Informationen
– Dokumentation in Excel-Form
• Überblick über Struktur von EAD(DDB) und den
Verpflichtungsgrad der Elemente
– Testdateien in einer minimalen und maximalen Ausprägung
– Schemata
 Verfügbar unter
http://www.landesarchiv-bw.de/ead (Version 1.1)
Zweck der Schemata
 EAD 2002 ermöglicht eine sehr breite Verwendung
aller Elemente  Reduktion der Möglichkeiten
 Hilfestellung bei der Erstellung von Schnittstellen
 Kontrollfunktion beim Import
 Weiterlieferung an das Archivportal Europa mit
einem Mapping ermöglichen
Schemata


Unterscheidung zwischen Tektonik- und Findbuch-Schema
Zwei Versionen:
– XSD 1.1 (Referenzversion)
– XSD 1.0 (für ältere XML-Software  ungenauer)
• kein Zusammenhang mit EAD(DDB) 1.0!
– Kein dtd vorgesehen!



Sehr eng gehalten, um Abweichungen möglichst schnell zu
entdecken
Basiert auf großem EAD: EAD(DDB) ist valide zu EAD
EAD(DDB) 1.1 Validierung möglich mit dem DPT von APEx
Kontrollierte Vokabulare







21
Bundesland (offizielle Bezeichnungen)
Archivtyp (VDA-Fachgruppen)
Medientyp (TEXT, BILD, AUDIO, VIDEO)
Archivalientyp: normiertes Vokabular
Datum: ISO-8601
ISIL: z.B.: DE-1951
@xlink:role: für Linktyp/Digitalisatstyp
Mögliche Validierungsprobleme 1

Richtigen Namespace verwenden

Die Reihenfolge der Elemente ist in vielen Abschnitten von
EAD zentral
– ead-namespace muss ausgezeichnet sein!
– bedingt durch das große EAD Schema


Manche Elemente dürfen nicht ohne Unterelemente erzeugt
werden
Elemente und Attribute sollen nur dort erlaubt sein, wo dies
vorgesehen ist
– Einfache Kontrolle, ob das Mapping richtig ist

Elemente sollen je nach Definition im oder nicht im
Gruppierungselement (<did>) verwendet werden
Mögliche Validierungsprobleme 2
 Header / Angaben zum Archiv
 Keine c01-c12 Elemente sonder nur c-Elemente
 Es sollen keine Überschriften (<head>) ohne Inhalt
(<p>) erzeugt werden
 Die IDs sollten der Ansetzung von XML-IDs entsprechen
– z.B.: dürfen nicht mit Namen anfangen, dürfen nicht leer
sein
 Das normalisierte Datumsfeld sollte ISO-8601 konform
sei, soweit dies gewährleistet werden kann
Anforderungen an die Schnittstellen
 Nichtvalides EAD sollte vom Nutzer nicht erzeugt
werden können
 Basis EAD(DDB)-Export sollte ohne Konfiguration
möglich sein
Notwendigkeiten
1. Stabile Identifier sind zentral!
2. Verknüpfung zwischen Findbuch und Tektonik
muss gewährleistet sein!
3. Links zurück ins Findbuchsystem und auf
„freistehende“ Digitalisate sollen, so fern
vorhanden, mitgeliefert werden
Vielen Dank für Ihre
Aufmerksamkeit
Fragen? Hinweise? Anregungen?
Martin Reisacher
Tel.: 0711/212-4298
Email: [email protected]