Transcript GND - hbz
Die Gemeinsame Normdatei (GND) im hbz-Verbund Einführung Silke Tölle Gliederung Worum geht es eigentlich? das GND-Format GND in Aleph Indexierung Redaktionsvereinbarungen Ausblick 2 Gliederung Worum geht es eigentlich? das GND-Format GND in Aleph Indexierung Redaktionsvereinbarungen Ausblick 3 Worum geht es eigentlich? Aufhebung heterogene Datenhaltung Aufhebung Formatunterschiede Normdateien Aufhebung unterschiedlicher Ansetzungsregeln Formal- u. Sacherschließung Zusammenführung zu einer modernen, web-fähigen Normdatei (Semantic Web) 4 Suchprobleme Peking / Olympische SWD: Spiele 2008 GKD: Olympic Games <29, 2008, Beijing> 5 Ausgangssituation Regelwerk RAK-WB, Resource RAK Description Musik and Access RSWK Normdateien PND Titeldaten GKD SWD Normdaten EST Musik Format MAB PND MAB MARCSWD 21 MAB GKD Authority PICA-MAB Aleph-MAB als Internformat 6 Zielsituation Vereinbarung eines Gemeinsamen Normdatenformats (GNF) einheitliche Übergangsregeln Zusammenführung der Normdateien Onlineredaktionsverfahren Umsetzung der bestehenden Normdateien Updateverfahren 7 Die GND-Gruppe (DNB und Verbünde) GBV HBZ OBV KOBV GND BVB HEBIS DNB SWB für eine Gemeinsame Normdatei 8 Gliederung Worum geht es eigentlich? das GND-Format GND in Aleph Indexierung Redaktionsvereinbarungen Ausblick 9 Datenmodell Theorie: Entity–Relationship–Modell (ERM) Entitäten haben Attribute und Beziehungen zu anderen Entitäten Beziehungen werden durch Codes näher definiert Modulare Datenstruktur (Unterfelder) GND in sich ein semantisches Netz 10 Anforderungen an das Format Einheitliche Struktur bisher unterschiedlicher Normdatenformate für PND, GKD, SWD und EST Dateninhalte der Normdateien bleiben erhalten Eindeutigkeit eines Datensatzes wird gewährleistet keine redundanten Datensätze (FE/SE) Nach Produktionsstart: für eine Übergangszeit Redundanzen im Kontext „Körperschaften“ Relationen zwischen Entitäten IDN-Verknüpfung bei Relationen Weitestgehende Auflösung der komplexen Strukturen bei Mehrgliedrigkeit 11 Die entwickelten Datenformate Austauschformat: GND-MARC-Format in MARC 21 Authority Erfassungsformat: GND-Aleph-Format weitgehend an MARC21 orientiert zusätzlich Aleph-spezifischen Feldern (katalogisierungsergonomischen Gründe) Wiedergabe im Aleph-Erfassungsleitfaden (ELF) auf den hbz-Webseiten und in den Hilfefenstern 12 Terminologie Bisherige Terminologie Ansetzungsform Homonymenzusatz / Ordnungshilfe Verweisung Relation GND-Terminologie Bevorzugter Name (Individualname) bzw. bevorzugte Benennung (Sachbegriff) Identifizierender Zusatz abweichender Name / abweichende Benennung Beziehung 13 Grundstruktur Feldnummern 0XX 1XX 2XX 3XX 4XX Nummern, Codes, Notationen Bevorzugter Name/ Bevorzugte Benennung Komplexe Schlagworthinweise (HWS) Heading Information Abweichender Name/ Abweichende Benennung Entitäten Personen X00 Personennamen X00 Körperschaften X10 Kongresse X11 Geografika X51 5XX Beziehungen 6XX Bemerkungen Werke 7XX Bevorzugter Name in anderem Datenbestand Sachbegriffe 9XX Lokale Angaben X30|X1X 14 X50 Grundstruktur Bevorzugter Name 1XX Personen X00 110 – Bevorzugter Name der Körperschaft Personennamen X00 Körperschaften X10 410 – Abweichender Name der Körperschaft 4XX Kongresse X11 Relationen/Beziehungen 500 – in Beziehung stehende Person Werke X30 510 – in Beziehung stehende Körperschaft 5XX Sachbegriffe X50 Bevorzugte Namen aus 710 – Bevorzugter Name aus anderen Geografika anderen Datenbeständen Datenbeständen (z.B. LoC) X51 Namensvarianten 7XX 15 Wichtige Felder Bereich Nummern/Codierungen FMT Format 001/035 $a Identifikationsnummer 005 Datum 043 Ländercode 065 Systematik 093 Entitätencodierung 095 Level 097 Satztyp 098 Teilbestandskennzeichen 16 Die Entitäten - Strukturen Entität = Satztyp Unterf. Format (FMT) Personennamen n p PN Personen p p/P PF, PS Körperschaften b k KF, KS Kongresse f e VF, VS Geografika g g GG, GS, GF Werke (Titel) u t MS, MF, TS, TF Sachschlagwort s s SA 17 Feld FMT: Format Feld 098: Teilbestandskennzeichen Feld 098 steuert das Format f = Formalerschließung s = Sacherschließung TBK „s“ dominiert TBK „f“ bei der Formatbildung Format relevant bei Altdatennutzung und Personennamensätzen in PSW Sacherschließung ergänzt TBK bei bestehenden Sätzen („Adelung“) korrekte TBK bereits in Schablonen 18 Feld 093: Entitätencodierung für alle Satztypen (Entitäten) verpflichtend (außer für Satztyp „n“) innerhalb eines Satztypes Unterscheidung verschiedener Entitätengruppen Beispiele s. Erfassungsleitfaden 19 Feld 043: Ländercode verpflichtend außer für Satztyp „n“ wenn Erfassung LC nicht möglich: Code „ZZ“ als Platzhalter max. 4 LC Angabe des hierarchischen LC bei Deutschland, Österreich, die Schweiz, Tibet und Südtirol Erfassung d. „Bundesländer“ (Gliedstaaten ) Ausnahme: bei Personen nur für Tibet abgeschl. Körperschaften, Kongresse, Geografika u. verstorbene Personen: aktueller + zeitlich zutreffender Code (XA-DXDE und XA-AAAT für FE zusätzlich zugelassen) 20 Beziehungen – allgemeine Sachverhalte Beziehungen von der betrachteten Entität zu anderen Entitäten werden in Kategorie 5XX abgelegt. Darstellung des Entitätentyps der in Beziehung stehenden Entität durch 2. und 3. Position der Feldnummer 21 Darstellung von Beziehungen in der GND Typisierung der Beziehung erfolgt durch Codierungen in Unterfeld $4 Verknüpfung von in Beziehung stehenden Daten mittels IDN in Unterfeld $9 Zeitangaben werden im Feld 548 strukturiert abgelegt 22 Codierung in Unterfeld $4 Codierung im Unterfeld $4 erfolgt in allen Satzarten bei Beziehungen (5XX) bei alternativen Formen: Art der alternativen Form aber: viele Codes gelten nur für bestimmte Satzarten. in den 5XX-Feldern ist die Vergabe eines $4Codes Pflicht Codes in ELF, Liste der $4-Codierungen (DNB-Seite) und über Strg + F8 23 Beispiel Beziehung Attribute 100 $p Braun, Gerhard 550 $s Biologe $4 berc $9 (DE-588)… Codierung Beziehung 150 $s Biologe 450 $s Diplombiologe 550 $s Naturwissenschaftler $4 obal $9 (DE-588)… 24 abweichende Namen / Benennungen abweichende Namen bzw. abweichende Benennungen nur für dieselbe Entität Altdaten enthalten noch (in vielen Fällen) mehrgliedrige abweichende Namen / Benennungen Möglichkeit der Erläuterung der Verweisung durch Codierung 110 $k Bäcker-Innung Hamburg 410 $k Bäcker-Innung Hamburg $b Vorstand $4 spio 25 Identifikationsnummern Neue GND-Normsätze Neue GND-ID + ein ISIL-Präfix Migrierte GND-Normsätze: Bisherige Norm-ID wird zur GND-ID + ISIL-Präfix (001 $a + 035 $a) Bisherige Norm-ID ohne Präfix: Feld 970 $a Alte regionale und überregionale IDs: 039 $z + 960 $a Beispiel: 001 035 039 960 970 $a(DE-588)100020836 $a(DE-588)100020836 $z(DE-588a)100020836 $a HP12345678 $a 100020836 Präfix = ISIL: DE-588 [GND], DE-588a [PND], DE-588b [GKD], DE-588c [SWD] 26 Titel in der GND Werke der Musik aus EST-Datei des DMA und Werktitel der SWD enthalten Aufbau im Format Verfasser- und Urheberwerke: Feld 100, 110, 111 (und 400, 410,411) in $t … Sachtitelwerke in 130, 430 derzeit nur Nutzung der Werktitel der SWD durch Sacherschließer Nutzung der Werke der Musik aus EST-Datei des DMA Nachfolgeprojekt Beispiel: „Goethe: Faust“ + „Jahrbuch der Kinderliteratur“ 27 Gliederung Worum geht es eigentlich? das GND-Format GND in Aleph Indexierung Redaktionsvereinbarungen Ausblick 28 Bewährtes übernehmen Vorhalten einer vollständigen Kopie der Quelldatei der DN in Aleph Datei HBZ18 Synchronisierung Online-Schnittstelle und Harvester Katalogisierungshilfen Schablonen je Entität getrennt nach FE/SE F3-Listen (Berufe, Personen, Körperschaften usw.) Hilfen Strg + F8-Listen, Feldhilfen 29 Anbindung Titel / Normdaten Verlinkung Titel/Normdatensatz mittels Strg+F3 100/800ff Index PPE 200/802ff Index PKO 902 ff Index PSW ID führt auch unabhängig von Text der Ansetzungsform zur korrekten Verknüpfung Unterfelder des Normdatensatzes werden im Aleph-Internformat der Titel wiedergegeben (Erweiterung der MAB-UF) s. Dokument „GND-Unterfelder in MAB-Titeln“ 30 GND-Verlinkung -1Titel vor GND 100 $a Lynch, David $9 119035316 $b [Hrsg.] Titel mit GND 100 $p Lynch, David $d 1946- $9 (DE-588)119035316 $b [Hrsg.] GND neu: Komplexe Unterfeldstrukturen neu: Verknüpfung nur über ID Titel mit GND 902 $p Lynch, David $d 1946- $9 (DE-588)119035316 GND Titel vor GND 902 $p Lynch, David $9 119035316 31 Gliederung Worum geht es eigentlich? das GND-Format GND in Aleph Indexierung Redaktionsvereinbarungen Ausblick 32 Indexierung HBZ18 bisher: Entitäten auf drei Libraries verteilt Konsequenz: spezifische Suche in eigener Library neu: alle Entitäten in Library HBZ18 enthalten Konsequenzen: gemeinsame Indizes für alle Entitäten spezifische Indizes für einzelne Entitäten Indizes für Sacherschließung umfassen auch Formalerschließungs-Entitäten (Kennzeichnung durch FMT) Indexstruktur = Formatstruktur Aleph Indexeintrag besteht aus verschiedenen Unterfeldern 33 Die Entitäten - Strukturen Entität = Satztyp Unterf. Format (FMT) Personennamen n p PN Personen p p/P PF, PS Körperschaften b k KF, KS Veranstaltungen f e VF, VS Geografika g g GG, GS, GF Werke (Titel) u t MS, MF, TS, TF Sachschlagwort s s SA 34 Die Entitäten – Indexierung GND Entitätentyp Personennamen Personen Körperschaften Veranstaltungen Geografika Werke (Titel) Sachschlagwort Index Entität.-Gruppen Phrasenindex PPE Wortindex WPE Phrasenindex PKO Wortindex WKO Phrasenindex PSW Wortindex WSW Index Entität. WPE, PPT WPI, PPT WKS, PKT WCO, PCT WGE, PGE WTI, PET WSS, PSS Alle Entitäten - WRD 35 Wort-Indizes Wortindizes enthalten: für die Entitäten: wpe, wpi, wks, wco, wge und wss enthalten keine Titel für Beziehungen zwischen Entitäten (5XX) wpb, wkb, wcb, wsb, wgb enthalten keine Titel Titel enthalten in: wsw (aus 1XX $t und aus 130/430/730) wti (aus 1XX $t und aus 130/430/730) wtb (aus 5XX $t) wrd enthält Titel aus 1XX $t und aus 130/430 und 5XX $t 36 Inhalte und Struktur der Phrasenindizes Phrasenindizes über mehrere Entitäten: Inhalte aus Felder zu bevorzugten Namen und abweichenden Namen und Namen anderer Datenbestände Bildung zusätzlicher Sucheinstiege zur Erhaltung des Suchkomforts trotz Wegfall von Verweisungen spezielle Phrasenindizes für einzelne Entitäten enthalten auch Titel GEN: enthält alle Entitäten, aber keine zusätzlichen Sucheinstiege, FMT und Level 37 Zusätzliche Sucheinstiege Bildung virtueller Felder aus 5XX zur Erzeugung notwendiger Indexeinträge Ortssitze bei Körperschaften (z.B. bei TSV) früher Homonymenzusätze bei Personen mehrgliedrige Verweisungen der Sacherschließung Achtung: nur Auswertung des bevorzugten Namens der Beziehung 38 Beispiel virtuelle Felder Person 39 Beispiel virtuelle Felder Körperschaft 40 Anzeige der Browseindizes Anzeige aller Unterfelder, mit Ausnahme von $v strukturiert durch Pipe-Zeichen führende/doppelte Pipe-Zeichen aufgrund begrenzter Anzeigekonfigurationsmöglichkeiten (virtuelle Sucheinstiege) zusätzlich Format und Level jeweils hinter der ID 41 Wissenswertes und Tipps zur Recherche – 1 – Sortierung in Indizes: AUT: alle Unterfelder inkl. Lebensdaten und FMT BIB: keine Sortierung der Lebensdaten (nur Anzeige) kombinierte Einträge aus mehreren Entitäten: nur Ansetzungsformen werden verwendet Organe Gebietskörperschaften: Italien / Ministero Werktitel: Čajkovskij …: Schwanensee 42 Wissenswertes und Tipps zur Recherche – 2 – Positionierung in Phrasenindizes bei langen „Indexlisten“ (Berücksichtigung von Titeln) „Lösung“: Suche mit „Mitteltext“ Achtung: Performance wird berücksichtigt Nutzung der Codierungen: Suche über das „Begriffsumfeld“ Index PSW: Personen zusätzlich ohne Lebendaten indexiert können in Browseindex ignoriert werden, d.h. sind nicht zu nutzen 43 Sonstige Indizes Datum getrennt für Mailbox, Ersterfassung, Korrektur (WMD, WDE, WDK) Bibl.-Kennz. getrennt nach Mailbox, Bibl. Ersterfassung, Bibl. Korrektur (WMA, WBE, WBK) Satztyp, Format, Entitätencodierung, TBK WTY, WFT, WEC, WTK Titeldaten: Index PGI, indexiert GND-IDs aus $9 Funktion Suche mit GND-IDs in Titeldaten Funktion Lokalisieren aus HBZ18 44 Gliederung Worum geht es eigentlich? das GND-Format GND in Aleph Indexierung Redaktionsvereinbarungen Ausblick 45 Rahmenbedingung Redaktionskonzept Rahmenbedingung: prinzipiell Erhalt der Redaktionskonzepte aus PND, GKD, SWD Primärdatei GND liegt bei der DNB Spiegel der GND in hbz-Verbunddatenbank alle Arbeiten in der GND direkt in der Primärdatei via Onlineschnittstelle Normdatei (ONS) gleiche Kommunikationswege wie in alten drei Normdateien 46 Grundlagen Neuaufnahmen Nutzung der ONS für Neuaufnahmen keine Anlage regionaler Normdatensätze Korrekturen je nach Berechtigung selbst durchführen oder per Korrekturantrag (s. Folgefolie) Formalerschließung: Entitäten Körperschaften, Geografika, Kongresse Meldung an „DE-1“ via Mailboxfeld (901) andere Korrekturanträge per Redaktionssatz 47 Berechtigungen GND-Level Aleph-Level GND-Level 3 = Aleph-Level 60 GND-Level 1 oder 2 = Aleph-Level 90 GND-Level 4 – 8 = Aleph-Level 50 Berechtigungen Level 3 Korrekturberechtigungen für alle Sätze mit Level 3 und niedriger Korrekturberechtigungen für Sätze mit Level 1 und 2: alle Felder mit Ausnahme von 1XX, Idenitfiern, Datum/Inst. Ersterfassung/Korrektur, Level, Satztyp, Redaktionsfeld Umlenkungen etc. 48 Dubletten bestehende Verbundvereinbarungen gelten weiter mit Einführung der GND „Auflösung“ bestehender regionaler Normdatensätze „nur“ noch überregionale Dubletten vh. Zusammenführung alter regionaler Sätze auf überregionale + Umhängung der Titel Kennzeichnung der Sätze: Feld 960 enthält die IDN der Verlierersätze 49 Zusammenführungen altes UML-Verfahren entfällt für Bibliotheken Umlenkungsanträge: generell per Redaktionssatz Verknüpfung über Feld 023g Formalerschließung Entitäten Körperschaften, Geografika, Kongresse: Meldung an „DE-1“ bei Zuständigkeit (vgl. Verbundvereinbarung) 50 Altdatennutzung Nutzung in den Titeldaten FE: Nutzung des eigenen Bestandes, außer bei Geografika (dort GS) SE: Nutzung des eigenen Bestandes bei Personensätzen der FE: TBK setzen Nutzung innerhalb der Normdaten (Beziehungen) Feld 510 und 511 mit Formalerschließungssätzen verknüpfen (KF, VF) Feld 551 Sacherschließungssatz verknüpfen (GS) 51 Altdatenbearbeitung im Mai 2012 Neuaufnahmen Korrekturen und Ergänzungen außer des bevorzugten Namens aber: keine Korrektur des bevorzugten Namens keine Umlenkungen keine Löschungen 52 Altdatenbearbeitung im Juni 2012 Neuaufnahmen alle Korrekturen und Ergänzungen * Umlenkungen * Löschungen * * Einschränkung: Mit den zu bearbeitenden Normsätzen dürfen nicht mehr als 100 Titel verknüpft sein. Ende Juni: systematische intellektuelle Zusammenführung der TOP 500 sowie maschinelles Match-&Merge-Verfahren 53 Parallele Entitäten Auflösung von GKD-Splits und Zusammenführung Namensänderung von Körperschaften (Wegfall Split bei Änderung identifizierende Zusätze) Namensänderungen von Gebietskörperschaften (Wegfall Split Kreis / Landkreis) Zusammenführung GKD / SWD bei Satztyp b und f gewinnt der GKD-Satz bei Satztyp g gewinnt der SWD-Satz Match & Merge erst ca. Ende Juni 54 Gliederung Worum geht es eigentlich? das GND-Format GND in Aleph Indexierung Redaktionsvereinbarungen Ausblick 55 Migrationsablauf ab 5. April 2012: Redaktionsschluss überregionale Normdateien und Migration DNB Sperrung der überregionalen Normdatei(en), auch über ONS keine Änderungen mehr in hbzNormdateien mehr möglich Hintergrund: überregionale Sätze können wg. Ausfall der ONS nicht bearbeitet werden, regionale Sätze werden nicht migriert 56 Migrationsablauf 19. April 2012 Lieferung der migrierten GND an die Verbünde Öffnung der überregionalen GND, jedoch nur über direktem PICA-Zugriff ab 20. April 2012 Migration Verbund-DB weiterhin keine Änderungen innerhalb der hbz-Normdateien HBZ10, HBZ11 und HBZ12 sind eingefroren Aufbau der GND noch nicht erfolgt 57 Migrationsablauf ab ca. 17. KW mehrtägige Downtime keine Katalogisierung möglich Rechercheumlenkung erfolgt ab ca. 2. Mai 2012 GND-Produktionsstart im hbz-Verbund vollständige Migration der hbzVerbunddatenbank Ausnahme: HBZ02 wird nachfolgend migriert 58 Unterlagen Präsentation zur Einführung Anwendungsbestimmungen (AWB) = Kommentar zu den Übergangsregeln Erfassungsleitfaden (ELF) = Format auf hbz-Homepage unter: http://www.hbz-nrw.de/ angebote/verbunddatenbank/dienstleistungen/normdateien/gnd 59 Unterlagen Übergangsregeln = Ergänzung zu den RAK Liste der Codierungen in Unterfeld 4 Auswahl der jeweils häufigsten: AlephGND Erfassungsleitfaden Entitätencodierungen auf DNB-Homepage unter: http://www.dnb.de/DE/Standardisierung/Normdaten/GND/gnd _node.html 60 Welche Unterlagen fehlen noch? Dokument zur Indexierung GND-Handbuch kompakt (hbz-Version) Verbundvereinbarungen Beispielsammlung 61 Informationen zur GND im hbz Tests und Schulungen erfolgen im hbzSchulungssystem „triton9“ Verbindungsparameter werden per versioncheck ausgeliefert bzw. für Aleph-Systeme per Mail mitgeteilt Inhalte: HBZ18 komplett HBZ01 nicht migriert, nicht passend zur HBZ18 HBZ02 teilmigriert (nicht zu testen) Accounts werden per Mail mitgeteilt 62 … und dann kann es losgehen Viel Erfolg! 63 Vielen Dank für Ihre Aufmerksamkeit! Fragen, Anregungen, Fehlermeldungen? Kontakt: gnd-kat<at>hbz-nrw.de