Folie 1 - Startseite

Download Report

Transcript Folie 1 - Startseite

Metadatenmanagement in der
GDI-BE/BB
Qualitätsmaß für Metadaten
Agenda





10:00 – 11:30
11:30 – 12:30
12:30 – 14:00
14:00 – 14:30
14:30 – 16:00
Aktualisierung BE/BB-Profil
Mittagspause
Vorstellung / Diskussion Qualitätsmaß
Kaffeepause
Vorstellung / Diskussion Qualitätsmaß
Qualitätsmaß für Metadaten, 07.05.2013
2
Qualitätsmaß
 Externe Sicht auf die Metadaten:
Wie finde ich die Daten mittels der Metadaten am besten?
Das betrifft die generelle Auffindbarkeit und die inhaltliche
Abgrenzbarkeit gegenüber den anderen Metadaten.
 Definition von betroffenen Metadaten-Elementen
 Maß-Berechnung
 Interne Sicht auf die Metadaten:
Wie kann ich die Geodaten am besten mit Metadaten
beschreiben? Das betrifft im Wesentlichen die ‚vollständige‘
inhaltliche Beschreibung.
 Dokumentation für die Metadatenerzeuger
Qualitätsmaß für Metadaten, 07.05.2013
3
Vorgehensweise (1)
 Identifizieren von Fragestellungen, die für den Umgang
mit (Geo-)Metadaten von besonderer Bedeutung sind
 Ableitung von Submaßen in Bezug auf die
Fragestellungen
 Identifizieren von Metadaten-Elemente zu den
Submaßen
 Aufstellung einer Bewertungsmatrix
Qualitätsmaß für Metadaten, 07.05.2013
4
Vorgehensweise (2)
 Diskussion und Festlegung,
 wie sich die Qualitätsmaße berechnen
 welche Qualitätsmaße für die GDI-BE/BB gelten sollen
 Die Definitionen der Qualitätsmaße werden von DELPHI
IMM dokumentiert
 für Einsteiger
 Für Experten
Qualitätsmaß für Metadaten, 07.05.2013
5
Grundgedanken
 Vergleichbares Maß
 Wie kann der gleiche Bezug gewährleistet werden?
 Einfaches Maß
 Wie kann das Maß so einfach und transparent wie
möglich gehalten werden?
 Praktikables Maß
 Wie kann das Maß auf einfache Weise
computertechnisch umgesetzt werden?
Qualitätsmaß für Metadaten, 07.05.2013
6
Identifizieren von Fragestellungen
 Wie werden die benötigten Ressourcen gefunden
(Auffindbarkeit)?
 Wozu eignen sich die Daten (Eignung)?
 Wie kann auf die Daten zugegriffen werden
(Erreichbarkeit)?
 Sind die Daten verständlich (Verständlichkeit)?
Qualitätsmaß für Metadaten, 07.05.2013
7
Ableitung von Submaßen
Validität
Eignung
Erreichbarkeit
Verständlichkeit
Qualitätsmaß für Metadaten, 07.05.2013
Qualitätsmaß
Auffindbarkeit
8
Spielregeln für die Kriterien und die
Bewertung der Submaße (1)
 Für jedes Submaß werden Metadaten-Elemente identifiziert.
 Als Bewertung gibt es 2 Kriterien, die für jedes Element angewandt
werden:
 1. Vorhanden / nicht vorhanden
 2. Syntaktisch richtig / semantisch sinnvoll
 Jedes identifizierte Metadaten-Element wird mit max. 1 Punkt
bewertet, aufgeteilt nach beiden Kriterien (für jedes Kriterium
ergibt dies 0,5 Punkte).
 Bei einigen Metadaten-Elementen erscheint eine syntaktische als
auch semantische Prüfung als nicht möglich oder sinnvoll. Hier
erhält das Metadaten-Element nur für das Vorhandensein 1 Punkt.
Qualitätsmaß für Metadaten, 07.05.2013
9
Spielregeln für die Kriterien und die
Bewertung der Submaße (2)
 Einige Metadaten-Elemente werden bei verschiedenen Submaßen
identifiziert, wie z.B. der Titel oder die Bounding Box. Diese
Elemente gehen dann auch bei mehreren Submaßen mit in die
Bewertung und erhalten dadurch ein höheres Gewicht.
 Die erreichten Punkte eines Dokumentes werden immer auf die
gleiche maximal zu erreichende Punktzahl bezogen, um die
Vergleichbarkeit zu gewährleisten.
 Die 3 Teile des BE/BB-Profils (datset/series, services und other)
unterscheiden sich dabei. Dies führt zu 3 verschiedenen
Ausprägungen, je nach Datentyp.
 Teil 3 enthält sehr unterschiedliche Datentypen in sich, so dass
eine Vergleichbarkeit hierfür erschwert wird.
Qualitätsmaß für Metadaten, 07.05.2013
10
Auffindbarkeit
Wie werden die benötigten Ressourcen gefunden?
 Bei der Suche sollen sich Metadatendokumente (zu passenden
Ressourcen) in der Trefferliste befinden
 Unterschiedliche Suchportale lassen eine Suche über
unterschiedliche Elemente für die Filterung zu:
=> Möglichst viele Elemente sollen hierzu für das Qualitätsmaß
identifiziert werden
 Bei der Suche sollen Metadatendokumente (zu passenden Ressourcen)
durch das Ranking als erste Treffer angezeigt werden
 Für das Ranking ist es wichtig die Angaben so spezifisch wie möglich
zu machen, z.B. Landkreis-Raumbezug sollte nicht auf BrandenburgRaumbezug ausgedehnt werden
=> Unterstützung erfolgt hierbei in der Dokumentation
 Qualitätsmaß kann zusätzlich für das Ranking verwendet werden
Qualitätsmaß für Metadaten, 07.05.2013
11
MetadatenServicePortal
Qualitätsmaß für Metadaten, 07.05.2013
12
Geoportal Brandenburg
Qualitätsmaß für Metadaten, 07.05.2013
13
Kriterien für die Auffindbarkeit
Datum der
Metadaten
IsoNr.
6
9
38
39
53
Referenzsystem
207
208.1
341
Geographische
Bezug
343
Datum der GeoRessource
360
376
394
395
vorhanden/nicht
Elemente
vorhanden
syntaktisch richtig / semantisch sinnvoll
hierarchyLevel (3)
Ja
richtige Codeliste und richtiger Eintrag
dateStamp (7)
Ja
richtiges Format
spatialResolution/MD_Resolutio 57-denominator oder 57: integer Wert zwischen 1000 bis 1 Mio
n
61 distance
61: floating Zahl
nur 3 Buchstaben
language
Ja
richtige Zuordnung 'ger' für Germany
keyword
Ja
zulässiges Keyword aus einer Liste
referenceSystemIdentifier
/*/code
Ja
Enthält den String 'EPSG: '
codeSpace
Ja
Länge
mindestens 3 Wertepaare
Längengrad zwischen -90 und 90
EX_BoundingPolygon
Breitengrad zwischen -180 und 360
alle 4 Unterelemente sind gesetzt
Namespace Informationen evtl.
EX_GeographicBoundingBox
Ja
zuordnung welches Gebiet / Brandenburg
Länge des Titels
Vergleich ob bestimmte Worte
title (2)
Ja
vorkommen wie z.B. das Bundesland
organisationName
Ja
Länge
date
Ja
richtiges Format
dateType
Ja
richtige Codeliste und richtiger Eintrag
Qualitätsmaß für Metadaten, 07.05.2013
14
Eignung
Wozu eignen sich die Daten ?
 Für dieses Submaß wurden die meisten
Metadatenelementen identifiziert.
 Der Anwender möchte hierbei genau Angaben, wie die
Ressourcen aufbereitet wurden, für welchen Maßstab
diese geeignet sind, aber auch welche
Nutzungsbedingungen vorliegen.
 Die identifizierten Elemente müssen eine ausreichende
Entscheidungsgrundlage in Bezug auf die Beschaffung
der Ressourcen darstellen.
Qualitätsmaß für Metadaten, 07.05.2013
15
Kriterien für die Eignung
vector, grid, etc.
Vorschaubild
Zugang und
Nutzung
Datenqualität
IsoNr.
6
9
25
37
Elemente
hierarchyLevel (3)
dateStamp (7)
abstract (2)
spatialRepresentationType (3)
38
49
53
55
63
68
70
83
87
93
135
137
143
spatialResolution/MD_Resolution
MD_BrowseGraphic/fileName
keyword
thesaurus
specificUsage (2)
useLimitation (2a)
accessConstraints (3)
statement (2)
LI_ProcessStep/description (2)
LI_Source/description (2)
valueUnit
value
maintenanceAndUpdateFrequency
207
208.1
referenceSystemIdentifier /*/code
codeSpace
360
394
394
title (2)
date
dateType
vorhanden/nicht
vorhanden
syntaktisch richtig / semantisch sinnvoll
Ja
richtige Codeliste und richtiger Eintrag
Ja
richtiges Format
Ja
Keyword verwendet
Ja
Länge
57: integer Wert zwischen 1000 bis 1
57-denominator
Mio
oder 61 distance
61: floating Zahl
Ja
Grafikformat
Ja
zulässiges Keyword aus einer Liste
Ja
Länge
Ja
Länge
Ja
Länge
Ja
richtige Codeliste und richtiger Eintrag
Ja
Länge
Ja
Länge
Ja
Länge
Ja
Läne
Ja
Floating Zahl
Ja
richtige Codeliste und richtiger Eintrag
Enthält den String
Ja
'EPSG: '
Ja
Länge
Länge des Titels
Vergleich ob bestimmte Worte
Ja
vorkommen wie z.B. das Bundesland
Ja
richtiges Format
Ja
richtige Codeliste und richtiger Eintrag
Qualitätsmaß für Metadaten, 07.05.2013
16
Erreichbarkeit
Wie kann auf die Daten zugegriffen werden?
 Nachdem die Entscheidung für die Datenbeschaffung gefallen ist,
muss relativ leicht der Bezug der Ressourcen ermöglicht werden.
 Alle notwendigen Informationen über den Kontakt und die
Bürozeiten sollten ausgefüllt sein.
 Es gibt unterschiedliche Ansprechpartner. Entscheidend hierbei
sind:
 pointOfContact (Kontakt für die Ressourcen)
 distributorContact (Vetriebskontakt)
 Contact (Metadateb)
Qualitätsmaß für Metadaten, 07.05.2013
17
Kriterien für die Erreichbarkeit
Ja
Ja
Ja
Ja
syntaktisch richtig /
semantisch sinnvoll
Länge
richtige Codeliste und richtiger
Eintrag
Länge
Format
Länge
386 electronicMailAddress
391 hoursOfService
392 contactInstructions
Ja
Ja
Ja
Format
Länge
Länge
397 linkage
Ja
Format / kein toter Link
408 voice
Ja
Format
IsoNr. Elemente
376 organisationName
Straße und Hausnr.
Bürozeiten
Öffnungszeiten
Telefon
379
381
384
385
role
deliveryPoint
postalCode
city
vorhanden/nicht
vorhanden
Ja
Qualitätsmaß für Metadaten, 07.05.2013
18
Verständlichkeit
Sind die Daten verständlich?
 Neben den bisherigen Fragestellungen ist es für den
Nutzer auch entscheidend, dass er die Ressourcen auch
versteht.
 Die Sprache ist hierbei ein zentrales Element, aber auch
ein Übersichtsbild.
Qualitätsmaß für Metadaten, 07.05.2013
19
Kriterien für die Verständlichkeit
IsoNr. Elemente
360 title (2)
39
49
207
208.1
361
language
MD_BrowseGraphic/fileName
referenceSystemIdentifier /*/code
codeSpace
alternativeTitle (2)
vorhanden/nichtvo
rhanden
syntaktisch richtig / semantisch sinnvoll
Ja
Länge des Titels
Vergleich ob bestimmte Worte vorkommen wie
z.B. das Bundesland / Landkreis
Ja
Ja
Ja
Ja
Ja
nur 3 Buchstaben
richtige Zuordnung 'ger' für Germany
Grafikformat
Enthält den String 'EPSG: '
Länge
Länge des Titels
Qualitätsmaß für Metadaten, 07.05.2013
20
Element-Übersicht für dataset/series
IsoNr.
6
9
25
37
38
39
49
53
55
63
68
70
83
87
93
135
137
143
207
208.1
341
343
360
361
376
379
381
384
385
386
391
392
394
395
397
408
Elemente
hierarchyLevel (3)
dateStamp (7)
- abstract (2)
- spatialRepresentationType (3)
spatialResolution/MD_Resolution
- language
- fileName
- keyword
- thesaurusName
- specificUsage (2)
- useLimitation (2a)
- accessConstraints (3)
- statement (2)
LI_ProcessStep/description (2)
- description (2)
valueUnit
value
- maintenanceAndUpdateFrequency
referenceSystemIdentifier /*/code
codeSpace
EX_BoundingPolygon
EX_GeographicBoundingBox
- title (2)
- alternateTitle (2)
- organisationName
role
- deliveryPoint
- postalCode
city
- electronicMailAddress
- hoursOfService
- contactInstructions
- date
- dateType
- linkage
- voice
Auffindbarkeit
X
X
X
X
X
X
X
X
X
X
Eignung/Zuordbarkeit Erreichbarkeit Verständlichkeit
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
21
Element-Übersicht für services
Xml, … webservices
Discovery, view, …
Tight, mixed, loose
IsoNr.
6
9
25
37
38
39
49
53
55
63
68
70
83
87
93
135
137
143
207
208.1
341
343
360
361
376
379
381
384
385
386
391
392
394
395
397
408
S17
S2
S3
S7
S10
Qualitätsmaße
Elemente( - Unterelement)
hierarchyLevel (3)
dateStamp (7)
- abstract (2)
- spatialRepresentationType (3)
spatialResolution/MD_Resolution
- language
MD_BrowseGraphic/fileName
- keyword
- thesaurusName
- specificUsage (2)
- useLimitation (2a)
- accessConstraints (3)
- statement (2)
LI_ProecessStep/description
LI_Source/description (2)
valueUnit
value
- maintenanceAndUpdateFrequency
- code
codeSpace
EX_BoundingPolygon
EX_GeographicBoundingBox
- title (2)
- alternateTitle (2)
- organisationName
role
- deliveryPoint
- postalCode
city
- electronicMailAddress
- hoursOfService
- contactInstructions
- date
- dateType
- linkage
- voice
- DCP (3)
- serviceType
- serviceTypeVersion
couplingType
operatesOn
queryable/
returnable
R
Suche
X
R
Q/R
R
X
X
X
R
Q/R
Q
Q
X
X
X
X
X
Eignung
X
X
X
X
X
X
X
X
X
X
X
X
X
X
0
0
0
X
X
X
X
X
X
X
X
X
X
Erreichbarke Verständlich
it
keit
X
X
X
X
X
X
X
X
X
X
X
X
X
X
R
R
X
X
X
X
X
X
Daten-Service-Kopplung
22
Element-Übersicht für alle 3 Teile
IsoNr.
6
9
25
37
38
39
49
53
55
63
68
70
83
87
93
135
137
143
207
208.1
341
343
360
361
376
379
381
384
385
386
391
392
394
395
397
408
S17
S2
S3
S7
S10
Qualitätsmaße
Elemente
hierarchyLevel (3)
dateStamp (7)
- abstract (2)
- spatialRepresentationType (3)
spatialResolution/MD_Resolution
- language
- fileName
- keyword
- thesaurusName
- specificUsage (2)
- useLimitation (2a)
- accessConstraints (3)
- statement (2)
LI_ProecessStep/description
LI_Source/description (2)
valueUnit
value
- maintenanceAndUpdateFrequency
referenceSystemIdentifier /*/code
codeSpace
EX_BoundingPolygon
EX_GeographicBoundingBox
- title (2)
- alternateTitle (2)
- organisationName
role
- deliveryPoint
- postalCode
city
- electronicMailAddress
- hoursOfService
- contactInstructions
- date
- dateType
- linkage
- voice
- DCP (3)
- serviceType
- serviceTypeVersion
couplingType
operatesOn
Suche
X
X
X
X
X
Eignung/Zuo Erreichbarke Verständlich
rdbarkeit
it
keit
X
X
X
ist für Application nicht sinnvoll
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
rot: wird nur für services benötigt
durchgestrichen: für services nicht geeignet
kursiv: für application bedingt geeignet
blau: für application nicht geeignet
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
23
Bewertung des Qualitätsmaßes
 Das Qualitätsmaß berechnet sich aus dem Durchschnitt der
Submaße
 Die Submaße können dabei unterschiedlich gewichtet werden. Die
Auffindbarkeit stellt dabei ein entscheidendes Maß dar.
 Für erste Tests und zur Diskussion steht folgender Vorschlag für die
Gewichtung
 Auffindbarkeit: 3
 Eignung: 2
 Erreichbarkeit: 1
 Verständlichkeit: 1
Qualitätsmaß für Metadaten, 07.05.2013
24
Beispielsrechnung für das
Qualitätsmaß
Validität
Erreichbarkeit
50%
Eignung
40%
Verständlichkeit
100%
Qualitätsmaß für Metadaten, 07.05.2013
Qualitätsmaß
Auffindbarkeit
70%
63%
25
Mehrere Qualitätsmaße?
 Berechnungsverfahren ist für alle 3 Teile des BE/BBProfils gleich, aber es gibt eine unterschiedliche Basis.
 Unterscheidung von Teil 1 (dataset/series) zu Teil 2
(services) und Teil 3 (other)?
 Wenn ja, dann müsste immer ein Hinweis kommen
‚Qualitätsmaß für dataset/series‘
 Teil 3 enthält sehr unterschiedliche Datentypen, eine
Vergleichbarkeit ist hierbei nicht immer gegeben, da bspw. ein
‚nichtgeografischer Datensatz‘ anders beschrieben werden
sollte als eine ‚Anwendung‘
 Wie notwendig ist ein Qualitätsmaß für Teil 3?
Qualitätsmaß für Metadaten, 07.05.2013
26
Berücksichtigung der Validität?
 Viele Pflichtfelder des BE/BB-Profils werden im Qualitätsmaß
bereits berücksichtigt, aber nicht alle.
 Pflichtfelder des BE/BB-Profils, die für das Qualitätsmaß nicht
angegeben sind betreffen meist technische Aspekte, wie z.B.
 characterSet (4)
 metadataStandardName (10)
 metadataStandardVersion (11)
 Es gibt unterschiedliche Metadatenprofile, die geprüft werden
könnten. Wenn die Validität mit in die Qualität eingeht, dann
könnte ein Metadatendokument nach ISO eine andere Qualität als
nach dem BE/BB-Profil aufweisen.
Qualitätsmaß für Metadaten, 07.05.2013
27
Vorschlag zur Validität
 Der bisherige Ansatz berücksichtigt keine Validität an sich, sondern
nur geeignete Elemente.
 Nach Absprachen zum bisherigen Ansatz kann in Test-Beispielen
geprüft werden, inwieweit sich ‚valide‘ und ‚nicht valide‘
Dokumente beim Qualitätswert unterscheiden.
 Vorschlag für die Einbindung der Validität
 Einen Standardwert als Abzug für nicht-valide Dokumente
vereinbaren, z.B. beim vorigen Beispiel von 63%, denn Wert um
25% für nicht-valide verringern
Qualitätsmaß für Metadaten, 07.05.2013
28
Dokumentation des Qualitätsmaß
 Definition der Qualitätsmaße für Einsteiger
 Identifizierung der Qualitätsmaße
 Beschreibung der Metadaten-Elemente
 Beispiele für qualitativ hochwertige Eintragungen
 Hinweis zur spezifischen Eintragung
 Hinweis, welche Bausteine der Titel oder Abstract
aufweisen sollen
 Definition der Qualitätsmaße für Experten
 Liste mit Xpath
Qualitätsmaß für Metadaten, 07.05.2013
29
Beispiel TerraCatalog - Auffindbarkeit
38
vorhanden/nicht
vorhanden
Ja
Ja
57-denominator oder
spatialResolution/MD_Resolution
61 distance
39
language
Ja
keyword
referenceSystemIdentifier /*/code
codeSpace
Ja
Ja
Ja
IsoNr.
6
9
53
207
208.1
Elemente
hierarchyLevel (3)
dateStamp (7)
341
EX_BoundingPolygon
343
360
376
394
EX_GeographicBoundingBox
title (2)
organisationName
date
Ja
Ja
Ja
Ja
395
dateType
Ja
syntaktisch richtig / semantisch sinnvoll
richtige Codeliste und richtiger Eintrag
richtiges Format
57: integer Wert zwischen 1000 bis 1 Mio
61: floating Zahl
nur 3 Buchstaben
richtige Zuordnung 'ger' für Germany
zulässiges Keyword aus einer Liste
Enthält den String 'EPSG: '
Länge / URL
mindestens 3 Wertepaare
Längengrad zwischen -90 und 90
Breitengrad zwischen -180 und 360
alle 4 Unterelemente sind gesetzt
Namespace Informationen evtl. Zuordnung
welches Gebiet / Brandenburg
Länge des Titels: 5 < länge <= 100
Länge: > 5 und <= 100
richtiges Format: yyyy-MM-dd(Thh:mm:ss)
richtige Codeliste und richtiger Eintrag:
CI_DateTypeCode: creation, publication,
revision
Bedingung für
syntaktisch/sematisch
MD_ScopeCode: dataset
2013-04-09
Erreichte
Punktzahl für
Beispiel Terra
Katalog
'Flächennutzungs
plan Podelzig'
1
1
nicht vorhanden
0
ger
Raumordnung und -planung
- GEMET
Bauleitplanung - BE/BB
25833
urn:ogc:def:crs:EPSG
1
1
1
0,5
nicht vorhanden
0
vorhanden
5 < länge <= 100
5 < länge <= 100
yyyy-MM-dd(Thh:mm:ss)
1
1
1
1
CI_DateTypeCode: creation,
publication, revision
1
10,5/13
entspricht 81%
Qualitätsmaß für Metadaten, 07.05.2013
30
Beispiel aus dem TerraCatalog
Qualitätsmaß für Metadaten, 07.05.2013
31
Beispiel TerraCatalog - Eignung
IsoNr.
Elemente
6
9
25
37
hierarchyLevel (3)
dateStamp (7)
abstract (2)
spatialRepresentationType (3)
38
49
spatialResolution/MD_Resolution
MD_BrowseGraphic/fileName
53
63
68
keyword
specificUsage (2)
useLimitation (2a)
70
83
87
93
135
137
accessConstraints (3)
statement (2)
LI_ProcessStep/description (2)
LI_Source/description (2)
valueUnit
value
143
maintenanceAndUpdateFrequency
207
208.1
referenceSystemIdentifier /*/code
codeSpace
Erreichte
Punktzahl für
Beispiel Terra
Katalog
'Flächennutzung
Bedingung für syntaktisch/sematisch splan Podelzig'
vorhanden/nicht syntaktisch richtig / semantisch
vorhanden
sinnvoll
richtige Codeliste und richtiger
Ja
Eintrag
MD_ScopeCode: dataset
Ja
richtiges Format
2013-04-09
Ja
Keyword verwendet
vorhanden
Ja
Länge
vector
57: integer Wert zwischen 1000 bis
57-denominator
1 Mio
oder 61 distance
61: floating Zahl
nicht vorhhanden
Ja
Grafikformat
FNP_Podelzig.jpg
Raumordnung und -planung - GEMET
Ja
zulässiges Keyword aus einer Liste Bauleitplanung - BE/BB
Ja
Länge
nicht vorhanden
Ja
Länge
Bürgerinformation
richtige Codeliste und richtiger otherRestriction / interner
Ja
Eintrag
Amtsgebrauch
Ja
Länge
Digiatlisierung im XPlan-Format
Ja
Länge
nicht vorhanden
Ja
Länge
nicht vorhanden
Ja
Länge
nicht vorhanden
Ja
Floating Zahl
richtige Codeliste und richtiger
Ja
Eintrag
asNeeded (nicht aus Codeliste)
Enthält den String
Ja
'EPSG: '
25833
Ja
Länge
urn:ogc:def:crs:EPSG
360
394
title (2)
date
Ja
Ja
394
dateType
Ja
Länge des Titels
Vergleich ob bestimmte Worte
vorkommen wie z.B. das
Bundesland
richtiges Format
richtige Codeliste und richtiger
Eintrag
1
1
1
1
0
1
1
1
1
1
0
0
0
0
0
0,5
1
1
Flächennutzungsplan Podelzig
2013-01-28
1
1
publication
Qualitätsmaß für Metadaten, 07.05.2013
1
14,5/21
entspricht
69%
32
Beispiel TerraCatalog - Eignung
Qualitätsmaß für Metadaten, 07.05.2013
33
Beispiel TerraCatalog - Erreichbarkeit
IsoNr.
376
379
381
384
385
Elemente
organisationName
role
deliveryPoint
postalCode
city
syntaktisch richtig / semantisch sinnvoll
Länge: > 5 und <= 100
richtige Codeliste und richtiger Eintrag
Länge: > 5 und <= 100
Format: 5 Ziffern
Länge: > 3 und <= 100
Bedingung für
syntaktisch/sematisch
Amt Lebus
CI_RoleCode: pointOfContact
Breite Straße 1
15326
Lebus
Erreichte
Punktzahl für
Beispiel Terra
Katalog
'Flächennutzun
gsplan
Podelzig'
1
0,5
1
1
1
386 electronicMailAddress
391 hoursOfService
392 contactInstructions
Format:
lokalen Part: erlaubte Zeichen: A-Za-z0-9.!#$%&'*+-/=?^_`{|}~.
@ Zeichen; domain Part: Domain und TopLevel Domain - Domain kann
bestehen aus mehreren Hostnamen getrennt durch '.', jedoch jeder nur 1–63
Zeichen und gesamt Zeichenanzahl für Domain max 255
- Für die Hostnamen erlaubte Zeichen: A-Za-z0-9 '-' aber nicht am Anfang oder
am Ende
- nur existierende TopLevel Domains (z.B. .de oder .com etc.)
[email protected]
Länge: >10 und <= 100
nicht vorhanden
Länge: > 5 und <= 100
nicht vorhanden
1
0
0
397 linkage
Format / kein toter Link:
Protokoll: http://
Host: Name des Hosrrechners (durch Punkte getrennte angaben) am ende der
Hostadresse zulässige TopLevel Domain
http://geo.landkreismol.de/arcgis
Pfad: Pfad zur Datei auf dem Hostrechner
/services/ExterneDienste/BP_Leb
Link testen auf Erreichbarkeit: keine Http Fehlerseite
us/MapServer/WMSServer
1
408 voice
Format:
mit Vorwahl der Stadt; Ziffern mit evtl + / - als Sonderzeichen und evtl auch
Leerzeichen
3360444551
1
7,5 von 8
Punkte
94%
Qualitätsmaß für Metadaten, 07.05.2013
34
Beispiel aus dem TerraCatalog
Qualitätsmaß für Metadaten, 07.05.2013
35
Beispiel aus dem TerraCatalog
Qualitätsmaß für Metadaten, 07.05.2013
36
Beispiel aus dem TerraCatalog
Qualitätsmaß für Metadaten, 07.05.2013
37
Beispiel TerraCatalog Verständlichkeit
IsoNr. Elemente
360
39
49
207
208.1
361
syntaktisch richtig / semantisch sinnvoll
Länge des Titels
Vergleich ob bestimmte Worte vorkommen
title (2)
wie z.B. das Bundesland
nur 3 Buchstaben
language
richtige Zuordnung 'ger' für Germany
MD_BrowseGraphic/fileName
Grafikformat
referenceSystemIdentifier /*/code
Enthält den String 'EPSG: '
codeSpace
Länge
alternativeTitle (2)
Länge des Titels
Bedingung für syntaktisch/sematisch
Erreichte Punktzahl für
Beispiel Terra Katalog
'Flächennutzungsplan
Podelzig'
Flächennutzungsplan Podelzig
ger
FNP_Podelzig.jpg
25833
urn:ogc:def:crs:EPSG
nicht vorhanden
1
1
1
1
0,5
0
4,5/6 entspricht 75%
Qualitätsmaß für Metadaten, 07.05.2013
38
Beispiel aus dem TerraCatalog
Qualitätsmaß für Metadaten, 07.05.2013
39
Beispiel TerraCatalog
Validität
Auffindbarkeit
81% (3)
69 % (2)
Erreichbarkeit
75% (1)
Verständlichkeit
83% (1)
Qualitätsmaß
Eignung
77 %
Qualitätsmaß für Metadaten, 07.05.2013
40
Beispiel DOP
Validität
Auffindbarkeit
90% (3)
96 % (2)
Erreichbarkeit
100% (1)
Verständlichkeit
77% (1)
Qualitätsmaß
Eignung
91 %
Qualitätsmaß für Metadaten, 07.05.2013
41
Fehlende Elemente





CodeSpace
LI_ProcessStep/description
LI_Source/description
valueUnit (report)
Value (report)
Qualitätsmaß für Metadaten, 07.05.2013
42
Schlussbetrachtung
 Vergleichbares Maß?
 Generell ja, da sich der Wert immer auf die gleiche Gesamtmenge bezieht.
 Die Gewichtung muss festgelegt werden.
 Nicht ganz vergleichbar stellt sich der Teil 3 des BE/BB-Profils da, durch die
heterogenen Datentypen.
 Die Validität, sofern diese mit einfließt, könnte auch zu weiteren
Qualitätsunterscheidungen führen: ‚Qualitätsmaß für dataset/series und
unter Berücksichtigung des BE/BB-Profils‘.
 Einfaches Maß?
 Die Vergabe zwischen 0 und 1 Punkt ist für alle Metadatenelemente gleich.
 Der Berechnung liegt eine einfache, transparente Formel zugrunde.
 Praktikables Maß?
 Alle Kriterien können computertechnisch ausgewertet werden.
Qualitätsmaß für Metadaten, 07.05.2013
43
Diskussionpunkte
 Qualitätsmaß für dataset / series, services und für other?
 Validität mit einbeziehen oder als Abzugspunkte?
 Sollte das Datum ggf. 3fach bewertet werden (creation,
publication, revision)?
 Sind 3 Schlagworte ausreichend?
 Mehrfach-Pfade werden mehrfach berücksichtigt: z.b.
contact, pointOfContact, distributorContact
Qualitätsmaß für Metadaten, 07.05.2013
44
Herzlichen Dank für die Aufmerksamkeit !
Qualitätsmaß für Metadaten, 07.05.2013
45