Qualitätsanforderungen an Geodaten von Matthias Thomae 10. Zittauer Umweltsymposium 21.-22. April 2009 in Ostritz 1. 2. 3. 4. 5. GLIEDERUNG Bedeutung von Geodaten Geodaten und Datenbanken „Fachleute“ als Datenbankdesigner Probleme mit Datenbankinhalten Auswege aus.
Download ReportTranscript Qualitätsanforderungen an Geodaten von Matthias Thomae 10. Zittauer Umweltsymposium 21.-22. April 2009 in Ostritz 1. 2. 3. 4. 5. GLIEDERUNG Bedeutung von Geodaten Geodaten und Datenbanken „Fachleute“ als Datenbankdesigner Probleme mit Datenbankinhalten Auswege aus.
Slide 1
Qualitätsanforderungen an Geodaten
von
Matthias Thomae
10. Zittauer Umweltsymposium 21.-22. April 2009 in Ostritz
1.
2.
3.
4.
5.
GLIEDERUNG
Bedeutung von Geodaten
Geodaten und Datenbanken
„Fachleute“ als Datenbankdesigner
Probleme mit Datenbankinhalten
Auswege aus dem Datenchaos
Bedeutung von Geodaten
… vor ca. 150 Jahren war das Wissen
über unsere Erde und der in und auf
ihr stattfindenden Prozesse
bescheiden
Geodaten gab es nicht flächendeckend,
wie die „weißen Flecken“ auf dem
Globus zeigen
Bibliotheksglobus, Berlin 1871
1871 veröffentlicht Darwin "The Descent of Man".
Bedeutung von Geodaten
Das Wissen ist in den letzten 150 Jahren exponentiell gewachsen
w issenschaftliche Veröffentlichungen
100
20000
90
18000
80
16000
70
14000
60
12000
Anzahl
Anzahl [Mio.]
Wissenschaftler
50
10000
40
8000
30
6000
20
4000
10
2000
0
0
1950
1850
1950
Jahr
2000
Jahr
2000
1880 kannte die Chemie 20 000 chemische Verbindungen, heute sind es ca. 17 Millionen
Bedeutung von Geodaten
Was sind eigentlich Geodaten ?
•Geodaten sind digitale Informationen, denen
eine bestimmte räumliche Lage zugewiesen
werden kann (Geoinformationen, Geobezug)
•Geodaten bestehen aus Geobasisdaten und
Geofachdaten, die aus unterschiedlichen
raumbezogenen Fachdatenbanken stammen
•Metadaten beschreiben die eigentlichen
räumlichen Daten hinsichtlich des Zeitbezugs
und der Datenquelle
•Geoinformationssystem dienen zur
Visualisierung und Recherche von Geodaten
Geodaten und Datenbanken
Informationen der analogen Geodaten
sind auf eine Ebene,
die statische Karte begrenzt
Informationen der digitalen
Geodaten sind theoretisch
unbegrenzt als dynamische Karte
dargestellt und sind mit
Sachdaten verbunden
Geodaten und Datenbanken
Komplexität und Variabilität der Geodaten
verlangt eine Datenhaltung in Datenbanken
Geodaten im Jahre 2009
Fläche 44 km² (9,4 km x 4,7 km)
27 Themen (Ebenen)
4 komplexe Datenbanken
136 Polygone (geologische Flächen)
Geodaten und Datenbanken
Computerbasierte datenverarbeitende Technologien revolutionieren alle
gesellschaftlichen Bereiche
Es gibt enorm effiziente Techniken, informationstragende Daten
zu speichern,
zu transportieren
und in neue Daten zu transformieren.
Alle gesellschaftlichen Bereiche sind gezwungen, sich so umzugestalten, dass in ihnen
die computerbasierten datenverarbeitenden Technologien genutzt werden können.
Völlig zu Unrecht wird dieser technologische und ökonomische Großtrend als Weg zur
"Wissens- und Kommunikationsgesellschaft" gefeiert.
In Wahrheit handelt es sich nicht um Wege zur Wissensgesellschaft,
sondern erst einmal nur um die Zwänge einer Gesellschaft
computerbasierte datenverarbeitende Technologien in allen
gesellschaftlichen Bereichen durchzusetzen.
Geodaten und Datenbanken
Strukturierte Ablage von Geodaten ist notwendig …
… ABER welches Datenbankmodell ?
•Hierarchisches Datenbankmodell ?
Datenobjekte stehen in einer Eltern-KindBeziehungen zueinander.
Netzwerkdatenbankmodell ?
Datenobjekte werden miteinander in
Netzen verbunden.
•Relationale Datenbank ?
Die Daten werden zeilenweise in Tabellen
verwaltet. Es kann beliebige Beziehungen
zwischen Daten geben.
•Objektdatenbank ?
Beziehungen zwischen Datenobjekten
werden vom Datenbanksystem selbst
verwaltet. Objekte können Eigenschaften
und Daten von anderen Objekten erben.
„Fachleute“ als Datenbankdesigner
meine Daten
mein Problem
meine Lösung
Individualsicht - Nutzersicht
single-user Datenbanksystem
•viele alphanumerische Felder
•zu geringe Aufgliederung der
Felder
•Tabellen- und Feldnamen sind
nur dem Entwickler verständlich
… und wie sehen eigentlich die Daten aus ?
•Keine optimale
Tabellenverknüpfung und
Indizierung
„Fachleute“ als Datenbankdesigner
Tyisch für analoge Geodaten sind:
•Inkonsistenz:
Widersprüchlichkeit zwischen den Daten
•Inhomogenität:
Uneinheitlichkeit der Elemente einer
Menge
•Mehrdeutigkeit:
mehrere Bedeutungen eines Begriffes
oder Zeichens
• Redundanz:
Informationen in einer Informationsquelle
sind mehrfach vorhanden
Probleme mit Datenbankinhalten
Bergbau- und Rohstoffdatenbank
Teildatenbank Rohstoffe
Mehrdeutige Dateninhalte im
Feld „Nutzungskonflikte“
machen qualifizierte
Recherchen unmöglich
Bei nur 669 Datensätzen
erfolgte keine Evaluierung
der Dateninhalte !
Probleme mit Datenbankinhalten
Landesamt für Geologie und Bergwesen
Halle, den 16.04.2009
Bearbeitungsstand der Landesbohrdatenbank
Bearbeitungsstand: 05.03.2009
Erfasste Bohrungen:
190.855
Davon
Schichtdaten SEP1 insgesamt:
Schichtdaten SEP3 insgesamt:
1.511.178
163.534
Probleme mit Datenbankinhalten
Probleme mit Datenbankinhalten
Verschlüsselung mit SchichtenErfassungs-Programm (SEP 1)
+VT;
kgf-dc,ce,
bro4("q","fs",G:s,du:0.001),deu,ss,wl,ss
mm,bn(F:h,F:d),klfl("kao","ca","ch"),
Z:TZ(58.3-60.0,kao4-gr4,zg)
+VT-G(v);
kgm-kgg,ce
("fs","q",G:s),c4(duz:0.010.1,+Gp,^u,^s),bro4("q",duz:0.0010.002,ds-ml,"fs",duz:0.0010.005,F:hro,voe,duh:0.015),zt,+VT^b,ssmm(s),klv2,par,ss,klfl,"hm",^fs^gs-lag,zt,^u-lag
Probleme mit Datenbankinhalten
Inkonsistenz
Inhomogenität
Mehrdeutigkeit
Eine DV-technische
Überarbeitung ist
nur teilweise
möglich
Auflösung von zusammengefassten Schichten in Schicht und Unterschicht
Probleme mit Datenbankinhalten
SEP 3 ist kein Programm und
auch kein Dateiformat, sondern
die Beschreibung einer
Datenstruktur.
Auswertung ….?
Quo vadis Geodaten …
Auswege aus dem Datenchaos
multi-user Datenbanksystem
Umfangreiche Datenanalyse
Wer hat
Wer pflegt
Wer braucht
Wem nutzt
Maximale Datenintegration
Keine Mammutprojekte
sondern stufenweiser
Ausbau nach einem
Gesamtkonzept
•Neustrukturierung der Dateninhalte aus der
Perspektive der Datenrecherche
•Numerische Daten haben Vorrang vor
alphanumerischen Daten
•Kleinteilige Feldstrukturierungen
•Sinnvolle Auswahllisten
•Selbsterklärende Feld- und Tabellennamen
Take off in die schöne neue Geodatenwelt
Gegenseitige Information
Transparenz
Zusammenarbeit
Projektarbeit
Projektdiskussion
Datenanalyse
Datenevaluierung
Datenintegration
Datenbankentwicklung
Vielen Dank und gute Landung
Slide 2
Qualitätsanforderungen an Geodaten
von
Matthias Thomae
10. Zittauer Umweltsymposium 21.-22. April 2009 in Ostritz
1.
2.
3.
4.
5.
GLIEDERUNG
Bedeutung von Geodaten
Geodaten und Datenbanken
„Fachleute“ als Datenbankdesigner
Probleme mit Datenbankinhalten
Auswege aus dem Datenchaos
Bedeutung von Geodaten
… vor ca. 150 Jahren war das Wissen
über unsere Erde und der in und auf
ihr stattfindenden Prozesse
bescheiden
Geodaten gab es nicht flächendeckend,
wie die „weißen Flecken“ auf dem
Globus zeigen
Bibliotheksglobus, Berlin 1871
1871 veröffentlicht Darwin "The Descent of Man".
Bedeutung von Geodaten
Das Wissen ist in den letzten 150 Jahren exponentiell gewachsen
w issenschaftliche Veröffentlichungen
100
20000
90
18000
80
16000
70
14000
60
12000
Anzahl
Anzahl [Mio.]
Wissenschaftler
50
10000
40
8000
30
6000
20
4000
10
2000
0
0
1950
1850
1950
Jahr
2000
Jahr
2000
1880 kannte die Chemie 20 000 chemische Verbindungen, heute sind es ca. 17 Millionen
Bedeutung von Geodaten
Was sind eigentlich Geodaten ?
•Geodaten sind digitale Informationen, denen
eine bestimmte räumliche Lage zugewiesen
werden kann (Geoinformationen, Geobezug)
•Geodaten bestehen aus Geobasisdaten und
Geofachdaten, die aus unterschiedlichen
raumbezogenen Fachdatenbanken stammen
•Metadaten beschreiben die eigentlichen
räumlichen Daten hinsichtlich des Zeitbezugs
und der Datenquelle
•Geoinformationssystem dienen zur
Visualisierung und Recherche von Geodaten
Geodaten und Datenbanken
Informationen der analogen Geodaten
sind auf eine Ebene,
die statische Karte begrenzt
Informationen der digitalen
Geodaten sind theoretisch
unbegrenzt als dynamische Karte
dargestellt und sind mit
Sachdaten verbunden
Geodaten und Datenbanken
Komplexität und Variabilität der Geodaten
verlangt eine Datenhaltung in Datenbanken
Geodaten im Jahre 2009
Fläche 44 km² (9,4 km x 4,7 km)
27 Themen (Ebenen)
4 komplexe Datenbanken
136 Polygone (geologische Flächen)
Geodaten und Datenbanken
Computerbasierte datenverarbeitende Technologien revolutionieren alle
gesellschaftlichen Bereiche
Es gibt enorm effiziente Techniken, informationstragende Daten
zu speichern,
zu transportieren
und in neue Daten zu transformieren.
Alle gesellschaftlichen Bereiche sind gezwungen, sich so umzugestalten, dass in ihnen
die computerbasierten datenverarbeitenden Technologien genutzt werden können.
Völlig zu Unrecht wird dieser technologische und ökonomische Großtrend als Weg zur
"Wissens- und Kommunikationsgesellschaft" gefeiert.
In Wahrheit handelt es sich nicht um Wege zur Wissensgesellschaft,
sondern erst einmal nur um die Zwänge einer Gesellschaft
computerbasierte datenverarbeitende Technologien in allen
gesellschaftlichen Bereichen durchzusetzen.
Geodaten und Datenbanken
Strukturierte Ablage von Geodaten ist notwendig …
… ABER welches Datenbankmodell ?
•Hierarchisches Datenbankmodell ?
Datenobjekte stehen in einer Eltern-KindBeziehungen zueinander.
Netzwerkdatenbankmodell ?
Datenobjekte werden miteinander in
Netzen verbunden.
•Relationale Datenbank ?
Die Daten werden zeilenweise in Tabellen
verwaltet. Es kann beliebige Beziehungen
zwischen Daten geben.
•Objektdatenbank ?
Beziehungen zwischen Datenobjekten
werden vom Datenbanksystem selbst
verwaltet. Objekte können Eigenschaften
und Daten von anderen Objekten erben.
„Fachleute“ als Datenbankdesigner
meine Daten
mein Problem
meine Lösung
Individualsicht - Nutzersicht
single-user Datenbanksystem
•viele alphanumerische Felder
•zu geringe Aufgliederung der
Felder
•Tabellen- und Feldnamen sind
nur dem Entwickler verständlich
… und wie sehen eigentlich die Daten aus ?
•Keine optimale
Tabellenverknüpfung und
Indizierung
„Fachleute“ als Datenbankdesigner
Tyisch für analoge Geodaten sind:
•Inkonsistenz:
Widersprüchlichkeit zwischen den Daten
•Inhomogenität:
Uneinheitlichkeit der Elemente einer
Menge
•Mehrdeutigkeit:
mehrere Bedeutungen eines Begriffes
oder Zeichens
• Redundanz:
Informationen in einer Informationsquelle
sind mehrfach vorhanden
Probleme mit Datenbankinhalten
Bergbau- und Rohstoffdatenbank
Teildatenbank Rohstoffe
Mehrdeutige Dateninhalte im
Feld „Nutzungskonflikte“
machen qualifizierte
Recherchen unmöglich
Bei nur 669 Datensätzen
erfolgte keine Evaluierung
der Dateninhalte !
Probleme mit Datenbankinhalten
Landesamt für Geologie und Bergwesen
Halle, den 16.04.2009
Bearbeitungsstand der Landesbohrdatenbank
Bearbeitungsstand: 05.03.2009
Erfasste Bohrungen:
190.855
Davon
Schichtdaten SEP1 insgesamt:
Schichtdaten SEP3 insgesamt:
1.511.178
163.534
Probleme mit Datenbankinhalten
Probleme mit Datenbankinhalten
Verschlüsselung mit SchichtenErfassungs-Programm (SEP 1)
+VT;
kgf-dc,ce,
bro4("q","fs",G:s,du:0.001),deu,ss,wl,ss
mm,bn(F:h,F:d),klfl("kao","ca","ch"),
Z:TZ(58.3-60.0,kao4-gr4,zg)
+VT-G(v);
kgm-kgg,ce
("fs","q",G:s),c4(duz:0.010.1,+Gp,^u,^s),bro4("q",duz:0.0010.002,ds-ml,"fs",duz:0.0010.005,F:hro,voe,duh:0.015),zt,+VT^b,ssmm(s),klv2,par,ss,klfl,"hm",^fs^gs-lag,zt,^u-lag
Probleme mit Datenbankinhalten
Inkonsistenz
Inhomogenität
Mehrdeutigkeit
Eine DV-technische
Überarbeitung ist
nur teilweise
möglich
Auflösung von zusammengefassten Schichten in Schicht und Unterschicht
Probleme mit Datenbankinhalten
SEP 3 ist kein Programm und
auch kein Dateiformat, sondern
die Beschreibung einer
Datenstruktur.
Auswertung ….?
Quo vadis Geodaten …
Auswege aus dem Datenchaos
multi-user Datenbanksystem
Umfangreiche Datenanalyse
Wer hat
Wer pflegt
Wer braucht
Wem nutzt
Maximale Datenintegration
Keine Mammutprojekte
sondern stufenweiser
Ausbau nach einem
Gesamtkonzept
•Neustrukturierung der Dateninhalte aus der
Perspektive der Datenrecherche
•Numerische Daten haben Vorrang vor
alphanumerischen Daten
•Kleinteilige Feldstrukturierungen
•Sinnvolle Auswahllisten
•Selbsterklärende Feld- und Tabellennamen
Take off in die schöne neue Geodatenwelt
Gegenseitige Information
Transparenz
Zusammenarbeit
Projektarbeit
Projektdiskussion
Datenanalyse
Datenevaluierung
Datenintegration
Datenbankentwicklung
Vielen Dank und gute Landung
Slide 3
Qualitätsanforderungen an Geodaten
von
Matthias Thomae
10. Zittauer Umweltsymposium 21.-22. April 2009 in Ostritz
1.
2.
3.
4.
5.
GLIEDERUNG
Bedeutung von Geodaten
Geodaten und Datenbanken
„Fachleute“ als Datenbankdesigner
Probleme mit Datenbankinhalten
Auswege aus dem Datenchaos
Bedeutung von Geodaten
… vor ca. 150 Jahren war das Wissen
über unsere Erde und der in und auf
ihr stattfindenden Prozesse
bescheiden
Geodaten gab es nicht flächendeckend,
wie die „weißen Flecken“ auf dem
Globus zeigen
Bibliotheksglobus, Berlin 1871
1871 veröffentlicht Darwin "The Descent of Man".
Bedeutung von Geodaten
Das Wissen ist in den letzten 150 Jahren exponentiell gewachsen
w issenschaftliche Veröffentlichungen
100
20000
90
18000
80
16000
70
14000
60
12000
Anzahl
Anzahl [Mio.]
Wissenschaftler
50
10000
40
8000
30
6000
20
4000
10
2000
0
0
1950
1850
1950
Jahr
2000
Jahr
2000
1880 kannte die Chemie 20 000 chemische Verbindungen, heute sind es ca. 17 Millionen
Bedeutung von Geodaten
Was sind eigentlich Geodaten ?
•Geodaten sind digitale Informationen, denen
eine bestimmte räumliche Lage zugewiesen
werden kann (Geoinformationen, Geobezug)
•Geodaten bestehen aus Geobasisdaten und
Geofachdaten, die aus unterschiedlichen
raumbezogenen Fachdatenbanken stammen
•Metadaten beschreiben die eigentlichen
räumlichen Daten hinsichtlich des Zeitbezugs
und der Datenquelle
•Geoinformationssystem dienen zur
Visualisierung und Recherche von Geodaten
Geodaten und Datenbanken
Informationen der analogen Geodaten
sind auf eine Ebene,
die statische Karte begrenzt
Informationen der digitalen
Geodaten sind theoretisch
unbegrenzt als dynamische Karte
dargestellt und sind mit
Sachdaten verbunden
Geodaten und Datenbanken
Komplexität und Variabilität der Geodaten
verlangt eine Datenhaltung in Datenbanken
Geodaten im Jahre 2009
Fläche 44 km² (9,4 km x 4,7 km)
27 Themen (Ebenen)
4 komplexe Datenbanken
136 Polygone (geologische Flächen)
Geodaten und Datenbanken
Computerbasierte datenverarbeitende Technologien revolutionieren alle
gesellschaftlichen Bereiche
Es gibt enorm effiziente Techniken, informationstragende Daten
zu speichern,
zu transportieren
und in neue Daten zu transformieren.
Alle gesellschaftlichen Bereiche sind gezwungen, sich so umzugestalten, dass in ihnen
die computerbasierten datenverarbeitenden Technologien genutzt werden können.
Völlig zu Unrecht wird dieser technologische und ökonomische Großtrend als Weg zur
"Wissens- und Kommunikationsgesellschaft" gefeiert.
In Wahrheit handelt es sich nicht um Wege zur Wissensgesellschaft,
sondern erst einmal nur um die Zwänge einer Gesellschaft
computerbasierte datenverarbeitende Technologien in allen
gesellschaftlichen Bereichen durchzusetzen.
Geodaten und Datenbanken
Strukturierte Ablage von Geodaten ist notwendig …
… ABER welches Datenbankmodell ?
•Hierarchisches Datenbankmodell ?
Datenobjekte stehen in einer Eltern-KindBeziehungen zueinander.
Netzwerkdatenbankmodell ?
Datenobjekte werden miteinander in
Netzen verbunden.
•Relationale Datenbank ?
Die Daten werden zeilenweise in Tabellen
verwaltet. Es kann beliebige Beziehungen
zwischen Daten geben.
•Objektdatenbank ?
Beziehungen zwischen Datenobjekten
werden vom Datenbanksystem selbst
verwaltet. Objekte können Eigenschaften
und Daten von anderen Objekten erben.
„Fachleute“ als Datenbankdesigner
meine Daten
mein Problem
meine Lösung
Individualsicht - Nutzersicht
single-user Datenbanksystem
•viele alphanumerische Felder
•zu geringe Aufgliederung der
Felder
•Tabellen- und Feldnamen sind
nur dem Entwickler verständlich
… und wie sehen eigentlich die Daten aus ?
•Keine optimale
Tabellenverknüpfung und
Indizierung
„Fachleute“ als Datenbankdesigner
Tyisch für analoge Geodaten sind:
•Inkonsistenz:
Widersprüchlichkeit zwischen den Daten
•Inhomogenität:
Uneinheitlichkeit der Elemente einer
Menge
•Mehrdeutigkeit:
mehrere Bedeutungen eines Begriffes
oder Zeichens
• Redundanz:
Informationen in einer Informationsquelle
sind mehrfach vorhanden
Probleme mit Datenbankinhalten
Bergbau- und Rohstoffdatenbank
Teildatenbank Rohstoffe
Mehrdeutige Dateninhalte im
Feld „Nutzungskonflikte“
machen qualifizierte
Recherchen unmöglich
Bei nur 669 Datensätzen
erfolgte keine Evaluierung
der Dateninhalte !
Probleme mit Datenbankinhalten
Landesamt für Geologie und Bergwesen
Halle, den 16.04.2009
Bearbeitungsstand der Landesbohrdatenbank
Bearbeitungsstand: 05.03.2009
Erfasste Bohrungen:
190.855
Davon
Schichtdaten SEP1 insgesamt:
Schichtdaten SEP3 insgesamt:
1.511.178
163.534
Probleme mit Datenbankinhalten
Probleme mit Datenbankinhalten
Verschlüsselung mit SchichtenErfassungs-Programm (SEP 1)
+VT;
kgf-dc,ce,
bro4("q","fs",G:s,du:0.001),deu,ss,wl,ss
mm,bn(F:h,F:d),klfl("kao","ca","ch"),
Z:TZ(58.3-60.0,kao4-gr4,zg)
+VT-G(v);
kgm-kgg,ce
("fs","q",G:s),c4(duz:0.010.1,+Gp,^u,^s),bro4("q",duz:0.0010.002,ds-ml,"fs",duz:0.0010.005,F:hro,voe,duh:0.015),zt,+VT^b,ssmm(s),klv2,par,ss,klfl,"hm",^fs^gs-lag,zt,^u-lag
Probleme mit Datenbankinhalten
Inkonsistenz
Inhomogenität
Mehrdeutigkeit
Eine DV-technische
Überarbeitung ist
nur teilweise
möglich
Auflösung von zusammengefassten Schichten in Schicht und Unterschicht
Probleme mit Datenbankinhalten
SEP 3 ist kein Programm und
auch kein Dateiformat, sondern
die Beschreibung einer
Datenstruktur.
Auswertung ….?
Quo vadis Geodaten …
Auswege aus dem Datenchaos
multi-user Datenbanksystem
Umfangreiche Datenanalyse
Wer hat
Wer pflegt
Wer braucht
Wem nutzt
Maximale Datenintegration
Keine Mammutprojekte
sondern stufenweiser
Ausbau nach einem
Gesamtkonzept
•Neustrukturierung der Dateninhalte aus der
Perspektive der Datenrecherche
•Numerische Daten haben Vorrang vor
alphanumerischen Daten
•Kleinteilige Feldstrukturierungen
•Sinnvolle Auswahllisten
•Selbsterklärende Feld- und Tabellennamen
Take off in die schöne neue Geodatenwelt
Gegenseitige Information
Transparenz
Zusammenarbeit
Projektarbeit
Projektdiskussion
Datenanalyse
Datenevaluierung
Datenintegration
Datenbankentwicklung
Vielen Dank und gute Landung
Slide 4
Qualitätsanforderungen an Geodaten
von
Matthias Thomae
10. Zittauer Umweltsymposium 21.-22. April 2009 in Ostritz
1.
2.
3.
4.
5.
GLIEDERUNG
Bedeutung von Geodaten
Geodaten und Datenbanken
„Fachleute“ als Datenbankdesigner
Probleme mit Datenbankinhalten
Auswege aus dem Datenchaos
Bedeutung von Geodaten
… vor ca. 150 Jahren war das Wissen
über unsere Erde und der in und auf
ihr stattfindenden Prozesse
bescheiden
Geodaten gab es nicht flächendeckend,
wie die „weißen Flecken“ auf dem
Globus zeigen
Bibliotheksglobus, Berlin 1871
1871 veröffentlicht Darwin "The Descent of Man".
Bedeutung von Geodaten
Das Wissen ist in den letzten 150 Jahren exponentiell gewachsen
w issenschaftliche Veröffentlichungen
100
20000
90
18000
80
16000
70
14000
60
12000
Anzahl
Anzahl [Mio.]
Wissenschaftler
50
10000
40
8000
30
6000
20
4000
10
2000
0
0
1950
1850
1950
Jahr
2000
Jahr
2000
1880 kannte die Chemie 20 000 chemische Verbindungen, heute sind es ca. 17 Millionen
Bedeutung von Geodaten
Was sind eigentlich Geodaten ?
•Geodaten sind digitale Informationen, denen
eine bestimmte räumliche Lage zugewiesen
werden kann (Geoinformationen, Geobezug)
•Geodaten bestehen aus Geobasisdaten und
Geofachdaten, die aus unterschiedlichen
raumbezogenen Fachdatenbanken stammen
•Metadaten beschreiben die eigentlichen
räumlichen Daten hinsichtlich des Zeitbezugs
und der Datenquelle
•Geoinformationssystem dienen zur
Visualisierung und Recherche von Geodaten
Geodaten und Datenbanken
Informationen der analogen Geodaten
sind auf eine Ebene,
die statische Karte begrenzt
Informationen der digitalen
Geodaten sind theoretisch
unbegrenzt als dynamische Karte
dargestellt und sind mit
Sachdaten verbunden
Geodaten und Datenbanken
Komplexität und Variabilität der Geodaten
verlangt eine Datenhaltung in Datenbanken
Geodaten im Jahre 2009
Fläche 44 km² (9,4 km x 4,7 km)
27 Themen (Ebenen)
4 komplexe Datenbanken
136 Polygone (geologische Flächen)
Geodaten und Datenbanken
Computerbasierte datenverarbeitende Technologien revolutionieren alle
gesellschaftlichen Bereiche
Es gibt enorm effiziente Techniken, informationstragende Daten
zu speichern,
zu transportieren
und in neue Daten zu transformieren.
Alle gesellschaftlichen Bereiche sind gezwungen, sich so umzugestalten, dass in ihnen
die computerbasierten datenverarbeitenden Technologien genutzt werden können.
Völlig zu Unrecht wird dieser technologische und ökonomische Großtrend als Weg zur
"Wissens- und Kommunikationsgesellschaft" gefeiert.
In Wahrheit handelt es sich nicht um Wege zur Wissensgesellschaft,
sondern erst einmal nur um die Zwänge einer Gesellschaft
computerbasierte datenverarbeitende Technologien in allen
gesellschaftlichen Bereichen durchzusetzen.
Geodaten und Datenbanken
Strukturierte Ablage von Geodaten ist notwendig …
… ABER welches Datenbankmodell ?
•Hierarchisches Datenbankmodell ?
Datenobjekte stehen in einer Eltern-KindBeziehungen zueinander.
Netzwerkdatenbankmodell ?
Datenobjekte werden miteinander in
Netzen verbunden.
•Relationale Datenbank ?
Die Daten werden zeilenweise in Tabellen
verwaltet. Es kann beliebige Beziehungen
zwischen Daten geben.
•Objektdatenbank ?
Beziehungen zwischen Datenobjekten
werden vom Datenbanksystem selbst
verwaltet. Objekte können Eigenschaften
und Daten von anderen Objekten erben.
„Fachleute“ als Datenbankdesigner
meine Daten
mein Problem
meine Lösung
Individualsicht - Nutzersicht
single-user Datenbanksystem
•viele alphanumerische Felder
•zu geringe Aufgliederung der
Felder
•Tabellen- und Feldnamen sind
nur dem Entwickler verständlich
… und wie sehen eigentlich die Daten aus ?
•Keine optimale
Tabellenverknüpfung und
Indizierung
„Fachleute“ als Datenbankdesigner
Tyisch für analoge Geodaten sind:
•Inkonsistenz:
Widersprüchlichkeit zwischen den Daten
•Inhomogenität:
Uneinheitlichkeit der Elemente einer
Menge
•Mehrdeutigkeit:
mehrere Bedeutungen eines Begriffes
oder Zeichens
• Redundanz:
Informationen in einer Informationsquelle
sind mehrfach vorhanden
Probleme mit Datenbankinhalten
Bergbau- und Rohstoffdatenbank
Teildatenbank Rohstoffe
Mehrdeutige Dateninhalte im
Feld „Nutzungskonflikte“
machen qualifizierte
Recherchen unmöglich
Bei nur 669 Datensätzen
erfolgte keine Evaluierung
der Dateninhalte !
Probleme mit Datenbankinhalten
Landesamt für Geologie und Bergwesen
Halle, den 16.04.2009
Bearbeitungsstand der Landesbohrdatenbank
Bearbeitungsstand: 05.03.2009
Erfasste Bohrungen:
190.855
Davon
Schichtdaten SEP1 insgesamt:
Schichtdaten SEP3 insgesamt:
1.511.178
163.534
Probleme mit Datenbankinhalten
Probleme mit Datenbankinhalten
Verschlüsselung mit SchichtenErfassungs-Programm (SEP 1)
+VT;
kgf-dc,ce,
bro4("q","fs",G:s,du:0.001),deu,ss,wl,ss
mm,bn(F:h,F:d),klfl("kao","ca","ch"),
Z:TZ(58.3-60.0,kao4-gr4,zg)
+VT-G(v);
kgm-kgg,ce
("fs","q",G:s),c4(duz:0.010.1,+Gp,^u,^s),bro4("q",duz:0.0010.002,ds-ml,"fs",duz:0.0010.005,F:hro,voe,duh:0.015),zt,+VT^b,ssmm(s),klv2,par,ss,klfl,"hm",^fs^gs-lag,zt,^u-lag
Probleme mit Datenbankinhalten
Inkonsistenz
Inhomogenität
Mehrdeutigkeit
Eine DV-technische
Überarbeitung ist
nur teilweise
möglich
Auflösung von zusammengefassten Schichten in Schicht und Unterschicht
Probleme mit Datenbankinhalten
SEP 3 ist kein Programm und
auch kein Dateiformat, sondern
die Beschreibung einer
Datenstruktur.
Auswertung ….?
Quo vadis Geodaten …
Auswege aus dem Datenchaos
multi-user Datenbanksystem
Umfangreiche Datenanalyse
Wer hat
Wer pflegt
Wer braucht
Wem nutzt
Maximale Datenintegration
Keine Mammutprojekte
sondern stufenweiser
Ausbau nach einem
Gesamtkonzept
•Neustrukturierung der Dateninhalte aus der
Perspektive der Datenrecherche
•Numerische Daten haben Vorrang vor
alphanumerischen Daten
•Kleinteilige Feldstrukturierungen
•Sinnvolle Auswahllisten
•Selbsterklärende Feld- und Tabellennamen
Take off in die schöne neue Geodatenwelt
Gegenseitige Information
Transparenz
Zusammenarbeit
Projektarbeit
Projektdiskussion
Datenanalyse
Datenevaluierung
Datenintegration
Datenbankentwicklung
Vielen Dank und gute Landung
Slide 5
Qualitätsanforderungen an Geodaten
von
Matthias Thomae
10. Zittauer Umweltsymposium 21.-22. April 2009 in Ostritz
1.
2.
3.
4.
5.
GLIEDERUNG
Bedeutung von Geodaten
Geodaten und Datenbanken
„Fachleute“ als Datenbankdesigner
Probleme mit Datenbankinhalten
Auswege aus dem Datenchaos
Bedeutung von Geodaten
… vor ca. 150 Jahren war das Wissen
über unsere Erde und der in und auf
ihr stattfindenden Prozesse
bescheiden
Geodaten gab es nicht flächendeckend,
wie die „weißen Flecken“ auf dem
Globus zeigen
Bibliotheksglobus, Berlin 1871
1871 veröffentlicht Darwin "The Descent of Man".
Bedeutung von Geodaten
Das Wissen ist in den letzten 150 Jahren exponentiell gewachsen
w issenschaftliche Veröffentlichungen
100
20000
90
18000
80
16000
70
14000
60
12000
Anzahl
Anzahl [Mio.]
Wissenschaftler
50
10000
40
8000
30
6000
20
4000
10
2000
0
0
1950
1850
1950
Jahr
2000
Jahr
2000
1880 kannte die Chemie 20 000 chemische Verbindungen, heute sind es ca. 17 Millionen
Bedeutung von Geodaten
Was sind eigentlich Geodaten ?
•Geodaten sind digitale Informationen, denen
eine bestimmte räumliche Lage zugewiesen
werden kann (Geoinformationen, Geobezug)
•Geodaten bestehen aus Geobasisdaten und
Geofachdaten, die aus unterschiedlichen
raumbezogenen Fachdatenbanken stammen
•Metadaten beschreiben die eigentlichen
räumlichen Daten hinsichtlich des Zeitbezugs
und der Datenquelle
•Geoinformationssystem dienen zur
Visualisierung und Recherche von Geodaten
Geodaten und Datenbanken
Informationen der analogen Geodaten
sind auf eine Ebene,
die statische Karte begrenzt
Informationen der digitalen
Geodaten sind theoretisch
unbegrenzt als dynamische Karte
dargestellt und sind mit
Sachdaten verbunden
Geodaten und Datenbanken
Komplexität und Variabilität der Geodaten
verlangt eine Datenhaltung in Datenbanken
Geodaten im Jahre 2009
Fläche 44 km² (9,4 km x 4,7 km)
27 Themen (Ebenen)
4 komplexe Datenbanken
136 Polygone (geologische Flächen)
Geodaten und Datenbanken
Computerbasierte datenverarbeitende Technologien revolutionieren alle
gesellschaftlichen Bereiche
Es gibt enorm effiziente Techniken, informationstragende Daten
zu speichern,
zu transportieren
und in neue Daten zu transformieren.
Alle gesellschaftlichen Bereiche sind gezwungen, sich so umzugestalten, dass in ihnen
die computerbasierten datenverarbeitenden Technologien genutzt werden können.
Völlig zu Unrecht wird dieser technologische und ökonomische Großtrend als Weg zur
"Wissens- und Kommunikationsgesellschaft" gefeiert.
In Wahrheit handelt es sich nicht um Wege zur Wissensgesellschaft,
sondern erst einmal nur um die Zwänge einer Gesellschaft
computerbasierte datenverarbeitende Technologien in allen
gesellschaftlichen Bereichen durchzusetzen.
Geodaten und Datenbanken
Strukturierte Ablage von Geodaten ist notwendig …
… ABER welches Datenbankmodell ?
•Hierarchisches Datenbankmodell ?
Datenobjekte stehen in einer Eltern-KindBeziehungen zueinander.
Netzwerkdatenbankmodell ?
Datenobjekte werden miteinander in
Netzen verbunden.
•Relationale Datenbank ?
Die Daten werden zeilenweise in Tabellen
verwaltet. Es kann beliebige Beziehungen
zwischen Daten geben.
•Objektdatenbank ?
Beziehungen zwischen Datenobjekten
werden vom Datenbanksystem selbst
verwaltet. Objekte können Eigenschaften
und Daten von anderen Objekten erben.
„Fachleute“ als Datenbankdesigner
meine Daten
mein Problem
meine Lösung
Individualsicht - Nutzersicht
single-user Datenbanksystem
•viele alphanumerische Felder
•zu geringe Aufgliederung der
Felder
•Tabellen- und Feldnamen sind
nur dem Entwickler verständlich
… und wie sehen eigentlich die Daten aus ?
•Keine optimale
Tabellenverknüpfung und
Indizierung
„Fachleute“ als Datenbankdesigner
Tyisch für analoge Geodaten sind:
•Inkonsistenz:
Widersprüchlichkeit zwischen den Daten
•Inhomogenität:
Uneinheitlichkeit der Elemente einer
Menge
•Mehrdeutigkeit:
mehrere Bedeutungen eines Begriffes
oder Zeichens
• Redundanz:
Informationen in einer Informationsquelle
sind mehrfach vorhanden
Probleme mit Datenbankinhalten
Bergbau- und Rohstoffdatenbank
Teildatenbank Rohstoffe
Mehrdeutige Dateninhalte im
Feld „Nutzungskonflikte“
machen qualifizierte
Recherchen unmöglich
Bei nur 669 Datensätzen
erfolgte keine Evaluierung
der Dateninhalte !
Probleme mit Datenbankinhalten
Landesamt für Geologie und Bergwesen
Halle, den 16.04.2009
Bearbeitungsstand der Landesbohrdatenbank
Bearbeitungsstand: 05.03.2009
Erfasste Bohrungen:
190.855
Davon
Schichtdaten SEP1 insgesamt:
Schichtdaten SEP3 insgesamt:
1.511.178
163.534
Probleme mit Datenbankinhalten
Probleme mit Datenbankinhalten
Verschlüsselung mit SchichtenErfassungs-Programm (SEP 1)
+VT;
kgf-dc,ce,
bro4("q","fs",G:s,du:0.001),deu,ss,wl,ss
mm,bn(F:h,F:d),klfl("kao","ca","ch"),
Z:TZ(58.3-60.0,kao4-gr4,zg)
+VT-G(v);
kgm-kgg,ce
("fs","q",G:s),c4(duz:0.010.1,+Gp,^u,^s),bro4("q",duz:0.0010.002,ds-ml,"fs",duz:0.0010.005,F:hro,voe,duh:0.015),zt,+VT^b,ssmm(s),klv2,par,ss,klfl,"hm",^fs^gs-lag,zt,^u-lag
Probleme mit Datenbankinhalten
Inkonsistenz
Inhomogenität
Mehrdeutigkeit
Eine DV-technische
Überarbeitung ist
nur teilweise
möglich
Auflösung von zusammengefassten Schichten in Schicht und Unterschicht
Probleme mit Datenbankinhalten
SEP 3 ist kein Programm und
auch kein Dateiformat, sondern
die Beschreibung einer
Datenstruktur.
Auswertung ….?
Quo vadis Geodaten …
Auswege aus dem Datenchaos
multi-user Datenbanksystem
Umfangreiche Datenanalyse
Wer hat
Wer pflegt
Wer braucht
Wem nutzt
Maximale Datenintegration
Keine Mammutprojekte
sondern stufenweiser
Ausbau nach einem
Gesamtkonzept
•Neustrukturierung der Dateninhalte aus der
Perspektive der Datenrecherche
•Numerische Daten haben Vorrang vor
alphanumerischen Daten
•Kleinteilige Feldstrukturierungen
•Sinnvolle Auswahllisten
•Selbsterklärende Feld- und Tabellennamen
Take off in die schöne neue Geodatenwelt
Gegenseitige Information
Transparenz
Zusammenarbeit
Projektarbeit
Projektdiskussion
Datenanalyse
Datenevaluierung
Datenintegration
Datenbankentwicklung
Vielen Dank und gute Landung
Slide 6
Qualitätsanforderungen an Geodaten
von
Matthias Thomae
10. Zittauer Umweltsymposium 21.-22. April 2009 in Ostritz
1.
2.
3.
4.
5.
GLIEDERUNG
Bedeutung von Geodaten
Geodaten und Datenbanken
„Fachleute“ als Datenbankdesigner
Probleme mit Datenbankinhalten
Auswege aus dem Datenchaos
Bedeutung von Geodaten
… vor ca. 150 Jahren war das Wissen
über unsere Erde und der in und auf
ihr stattfindenden Prozesse
bescheiden
Geodaten gab es nicht flächendeckend,
wie die „weißen Flecken“ auf dem
Globus zeigen
Bibliotheksglobus, Berlin 1871
1871 veröffentlicht Darwin "The Descent of Man".
Bedeutung von Geodaten
Das Wissen ist in den letzten 150 Jahren exponentiell gewachsen
w issenschaftliche Veröffentlichungen
100
20000
90
18000
80
16000
70
14000
60
12000
Anzahl
Anzahl [Mio.]
Wissenschaftler
50
10000
40
8000
30
6000
20
4000
10
2000
0
0
1950
1850
1950
Jahr
2000
Jahr
2000
1880 kannte die Chemie 20 000 chemische Verbindungen, heute sind es ca. 17 Millionen
Bedeutung von Geodaten
Was sind eigentlich Geodaten ?
•Geodaten sind digitale Informationen, denen
eine bestimmte räumliche Lage zugewiesen
werden kann (Geoinformationen, Geobezug)
•Geodaten bestehen aus Geobasisdaten und
Geofachdaten, die aus unterschiedlichen
raumbezogenen Fachdatenbanken stammen
•Metadaten beschreiben die eigentlichen
räumlichen Daten hinsichtlich des Zeitbezugs
und der Datenquelle
•Geoinformationssystem dienen zur
Visualisierung und Recherche von Geodaten
Geodaten und Datenbanken
Informationen der analogen Geodaten
sind auf eine Ebene,
die statische Karte begrenzt
Informationen der digitalen
Geodaten sind theoretisch
unbegrenzt als dynamische Karte
dargestellt und sind mit
Sachdaten verbunden
Geodaten und Datenbanken
Komplexität und Variabilität der Geodaten
verlangt eine Datenhaltung in Datenbanken
Geodaten im Jahre 2009
Fläche 44 km² (9,4 km x 4,7 km)
27 Themen (Ebenen)
4 komplexe Datenbanken
136 Polygone (geologische Flächen)
Geodaten und Datenbanken
Computerbasierte datenverarbeitende Technologien revolutionieren alle
gesellschaftlichen Bereiche
Es gibt enorm effiziente Techniken, informationstragende Daten
zu speichern,
zu transportieren
und in neue Daten zu transformieren.
Alle gesellschaftlichen Bereiche sind gezwungen, sich so umzugestalten, dass in ihnen
die computerbasierten datenverarbeitenden Technologien genutzt werden können.
Völlig zu Unrecht wird dieser technologische und ökonomische Großtrend als Weg zur
"Wissens- und Kommunikationsgesellschaft" gefeiert.
In Wahrheit handelt es sich nicht um Wege zur Wissensgesellschaft,
sondern erst einmal nur um die Zwänge einer Gesellschaft
computerbasierte datenverarbeitende Technologien in allen
gesellschaftlichen Bereichen durchzusetzen.
Geodaten und Datenbanken
Strukturierte Ablage von Geodaten ist notwendig …
… ABER welches Datenbankmodell ?
•Hierarchisches Datenbankmodell ?
Datenobjekte stehen in einer Eltern-KindBeziehungen zueinander.
Netzwerkdatenbankmodell ?
Datenobjekte werden miteinander in
Netzen verbunden.
•Relationale Datenbank ?
Die Daten werden zeilenweise in Tabellen
verwaltet. Es kann beliebige Beziehungen
zwischen Daten geben.
•Objektdatenbank ?
Beziehungen zwischen Datenobjekten
werden vom Datenbanksystem selbst
verwaltet. Objekte können Eigenschaften
und Daten von anderen Objekten erben.
„Fachleute“ als Datenbankdesigner
meine Daten
mein Problem
meine Lösung
Individualsicht - Nutzersicht
single-user Datenbanksystem
•viele alphanumerische Felder
•zu geringe Aufgliederung der
Felder
•Tabellen- und Feldnamen sind
nur dem Entwickler verständlich
… und wie sehen eigentlich die Daten aus ?
•Keine optimale
Tabellenverknüpfung und
Indizierung
„Fachleute“ als Datenbankdesigner
Tyisch für analoge Geodaten sind:
•Inkonsistenz:
Widersprüchlichkeit zwischen den Daten
•Inhomogenität:
Uneinheitlichkeit der Elemente einer
Menge
•Mehrdeutigkeit:
mehrere Bedeutungen eines Begriffes
oder Zeichens
• Redundanz:
Informationen in einer Informationsquelle
sind mehrfach vorhanden
Probleme mit Datenbankinhalten
Bergbau- und Rohstoffdatenbank
Teildatenbank Rohstoffe
Mehrdeutige Dateninhalte im
Feld „Nutzungskonflikte“
machen qualifizierte
Recherchen unmöglich
Bei nur 669 Datensätzen
erfolgte keine Evaluierung
der Dateninhalte !
Probleme mit Datenbankinhalten
Landesamt für Geologie und Bergwesen
Halle, den 16.04.2009
Bearbeitungsstand der Landesbohrdatenbank
Bearbeitungsstand: 05.03.2009
Erfasste Bohrungen:
190.855
Davon
Schichtdaten SEP1 insgesamt:
Schichtdaten SEP3 insgesamt:
1.511.178
163.534
Probleme mit Datenbankinhalten
Probleme mit Datenbankinhalten
Verschlüsselung mit SchichtenErfassungs-Programm (SEP 1)
+VT;
kgf-dc,ce,
bro4("q","fs",G:s,du:0.001),deu,ss,wl,ss
mm,bn(F:h,F:d),klfl("kao","ca","ch"),
Z:TZ(58.3-60.0,kao4-gr4,zg)
+VT-G(v);
kgm-kgg,ce
("fs","q",G:s),c4(duz:0.010.1,+Gp,^u,^s),bro4("q",duz:0.0010.002,ds-ml,"fs",duz:0.0010.005,F:hro,voe,duh:0.015),zt,+VT^b,ssmm(s),klv2,par,ss,klfl,"hm",^fs^gs-lag,zt,^u-lag
Probleme mit Datenbankinhalten
Inkonsistenz
Inhomogenität
Mehrdeutigkeit
Eine DV-technische
Überarbeitung ist
nur teilweise
möglich
Auflösung von zusammengefassten Schichten in Schicht und Unterschicht
Probleme mit Datenbankinhalten
SEP 3 ist kein Programm und
auch kein Dateiformat, sondern
die Beschreibung einer
Datenstruktur.
Auswertung ….?
Quo vadis Geodaten …
Auswege aus dem Datenchaos
multi-user Datenbanksystem
Umfangreiche Datenanalyse
Wer hat
Wer pflegt
Wer braucht
Wem nutzt
Maximale Datenintegration
Keine Mammutprojekte
sondern stufenweiser
Ausbau nach einem
Gesamtkonzept
•Neustrukturierung der Dateninhalte aus der
Perspektive der Datenrecherche
•Numerische Daten haben Vorrang vor
alphanumerischen Daten
•Kleinteilige Feldstrukturierungen
•Sinnvolle Auswahllisten
•Selbsterklärende Feld- und Tabellennamen
Take off in die schöne neue Geodatenwelt
Gegenseitige Information
Transparenz
Zusammenarbeit
Projektarbeit
Projektdiskussion
Datenanalyse
Datenevaluierung
Datenintegration
Datenbankentwicklung
Vielen Dank und gute Landung
Slide 7
Qualitätsanforderungen an Geodaten
von
Matthias Thomae
10. Zittauer Umweltsymposium 21.-22. April 2009 in Ostritz
1.
2.
3.
4.
5.
GLIEDERUNG
Bedeutung von Geodaten
Geodaten und Datenbanken
„Fachleute“ als Datenbankdesigner
Probleme mit Datenbankinhalten
Auswege aus dem Datenchaos
Bedeutung von Geodaten
… vor ca. 150 Jahren war das Wissen
über unsere Erde und der in und auf
ihr stattfindenden Prozesse
bescheiden
Geodaten gab es nicht flächendeckend,
wie die „weißen Flecken“ auf dem
Globus zeigen
Bibliotheksglobus, Berlin 1871
1871 veröffentlicht Darwin "The Descent of Man".
Bedeutung von Geodaten
Das Wissen ist in den letzten 150 Jahren exponentiell gewachsen
w issenschaftliche Veröffentlichungen
100
20000
90
18000
80
16000
70
14000
60
12000
Anzahl
Anzahl [Mio.]
Wissenschaftler
50
10000
40
8000
30
6000
20
4000
10
2000
0
0
1950
1850
1950
Jahr
2000
Jahr
2000
1880 kannte die Chemie 20 000 chemische Verbindungen, heute sind es ca. 17 Millionen
Bedeutung von Geodaten
Was sind eigentlich Geodaten ?
•Geodaten sind digitale Informationen, denen
eine bestimmte räumliche Lage zugewiesen
werden kann (Geoinformationen, Geobezug)
•Geodaten bestehen aus Geobasisdaten und
Geofachdaten, die aus unterschiedlichen
raumbezogenen Fachdatenbanken stammen
•Metadaten beschreiben die eigentlichen
räumlichen Daten hinsichtlich des Zeitbezugs
und der Datenquelle
•Geoinformationssystem dienen zur
Visualisierung und Recherche von Geodaten
Geodaten und Datenbanken
Informationen der analogen Geodaten
sind auf eine Ebene,
die statische Karte begrenzt
Informationen der digitalen
Geodaten sind theoretisch
unbegrenzt als dynamische Karte
dargestellt und sind mit
Sachdaten verbunden
Geodaten und Datenbanken
Komplexität und Variabilität der Geodaten
verlangt eine Datenhaltung in Datenbanken
Geodaten im Jahre 2009
Fläche 44 km² (9,4 km x 4,7 km)
27 Themen (Ebenen)
4 komplexe Datenbanken
136 Polygone (geologische Flächen)
Geodaten und Datenbanken
Computerbasierte datenverarbeitende Technologien revolutionieren alle
gesellschaftlichen Bereiche
Es gibt enorm effiziente Techniken, informationstragende Daten
zu speichern,
zu transportieren
und in neue Daten zu transformieren.
Alle gesellschaftlichen Bereiche sind gezwungen, sich so umzugestalten, dass in ihnen
die computerbasierten datenverarbeitenden Technologien genutzt werden können.
Völlig zu Unrecht wird dieser technologische und ökonomische Großtrend als Weg zur
"Wissens- und Kommunikationsgesellschaft" gefeiert.
In Wahrheit handelt es sich nicht um Wege zur Wissensgesellschaft,
sondern erst einmal nur um die Zwänge einer Gesellschaft
computerbasierte datenverarbeitende Technologien in allen
gesellschaftlichen Bereichen durchzusetzen.
Geodaten und Datenbanken
Strukturierte Ablage von Geodaten ist notwendig …
… ABER welches Datenbankmodell ?
•Hierarchisches Datenbankmodell ?
Datenobjekte stehen in einer Eltern-KindBeziehungen zueinander.
Netzwerkdatenbankmodell ?
Datenobjekte werden miteinander in
Netzen verbunden.
•Relationale Datenbank ?
Die Daten werden zeilenweise in Tabellen
verwaltet. Es kann beliebige Beziehungen
zwischen Daten geben.
•Objektdatenbank ?
Beziehungen zwischen Datenobjekten
werden vom Datenbanksystem selbst
verwaltet. Objekte können Eigenschaften
und Daten von anderen Objekten erben.
„Fachleute“ als Datenbankdesigner
meine Daten
mein Problem
meine Lösung
Individualsicht - Nutzersicht
single-user Datenbanksystem
•viele alphanumerische Felder
•zu geringe Aufgliederung der
Felder
•Tabellen- und Feldnamen sind
nur dem Entwickler verständlich
… und wie sehen eigentlich die Daten aus ?
•Keine optimale
Tabellenverknüpfung und
Indizierung
„Fachleute“ als Datenbankdesigner
Tyisch für analoge Geodaten sind:
•Inkonsistenz:
Widersprüchlichkeit zwischen den Daten
•Inhomogenität:
Uneinheitlichkeit der Elemente einer
Menge
•Mehrdeutigkeit:
mehrere Bedeutungen eines Begriffes
oder Zeichens
• Redundanz:
Informationen in einer Informationsquelle
sind mehrfach vorhanden
Probleme mit Datenbankinhalten
Bergbau- und Rohstoffdatenbank
Teildatenbank Rohstoffe
Mehrdeutige Dateninhalte im
Feld „Nutzungskonflikte“
machen qualifizierte
Recherchen unmöglich
Bei nur 669 Datensätzen
erfolgte keine Evaluierung
der Dateninhalte !
Probleme mit Datenbankinhalten
Landesamt für Geologie und Bergwesen
Halle, den 16.04.2009
Bearbeitungsstand der Landesbohrdatenbank
Bearbeitungsstand: 05.03.2009
Erfasste Bohrungen:
190.855
Davon
Schichtdaten SEP1 insgesamt:
Schichtdaten SEP3 insgesamt:
1.511.178
163.534
Probleme mit Datenbankinhalten
Probleme mit Datenbankinhalten
Verschlüsselung mit SchichtenErfassungs-Programm (SEP 1)
+VT;
kgf-dc,ce,
bro4("q","fs",G:s,du:0.001),deu,ss,wl,ss
mm,bn(F:h,F:d),klfl("kao","ca","ch"),
Z:TZ(58.3-60.0,kao4-gr4,zg)
+VT-G(v);
kgm-kgg,ce
("fs","q",G:s),c4(duz:0.010.1,+Gp,^u,^s),bro4("q",duz:0.0010.002,ds-ml,"fs",duz:0.0010.005,F:hro,voe,duh:0.015),zt,+VT^b,ssmm(s),klv2,par,ss,klfl,"hm",^fs^gs-lag,zt,^u-lag
Probleme mit Datenbankinhalten
Inkonsistenz
Inhomogenität
Mehrdeutigkeit
Eine DV-technische
Überarbeitung ist
nur teilweise
möglich
Auflösung von zusammengefassten Schichten in Schicht und Unterschicht
Probleme mit Datenbankinhalten
SEP 3 ist kein Programm und
auch kein Dateiformat, sondern
die Beschreibung einer
Datenstruktur.
Auswertung ….?
Quo vadis Geodaten …
Auswege aus dem Datenchaos
multi-user Datenbanksystem
Umfangreiche Datenanalyse
Wer hat
Wer pflegt
Wer braucht
Wem nutzt
Maximale Datenintegration
Keine Mammutprojekte
sondern stufenweiser
Ausbau nach einem
Gesamtkonzept
•Neustrukturierung der Dateninhalte aus der
Perspektive der Datenrecherche
•Numerische Daten haben Vorrang vor
alphanumerischen Daten
•Kleinteilige Feldstrukturierungen
•Sinnvolle Auswahllisten
•Selbsterklärende Feld- und Tabellennamen
Take off in die schöne neue Geodatenwelt
Gegenseitige Information
Transparenz
Zusammenarbeit
Projektarbeit
Projektdiskussion
Datenanalyse
Datenevaluierung
Datenintegration
Datenbankentwicklung
Vielen Dank und gute Landung
Slide 8
Qualitätsanforderungen an Geodaten
von
Matthias Thomae
10. Zittauer Umweltsymposium 21.-22. April 2009 in Ostritz
1.
2.
3.
4.
5.
GLIEDERUNG
Bedeutung von Geodaten
Geodaten und Datenbanken
„Fachleute“ als Datenbankdesigner
Probleme mit Datenbankinhalten
Auswege aus dem Datenchaos
Bedeutung von Geodaten
… vor ca. 150 Jahren war das Wissen
über unsere Erde und der in und auf
ihr stattfindenden Prozesse
bescheiden
Geodaten gab es nicht flächendeckend,
wie die „weißen Flecken“ auf dem
Globus zeigen
Bibliotheksglobus, Berlin 1871
1871 veröffentlicht Darwin "The Descent of Man".
Bedeutung von Geodaten
Das Wissen ist in den letzten 150 Jahren exponentiell gewachsen
w issenschaftliche Veröffentlichungen
100
20000
90
18000
80
16000
70
14000
60
12000
Anzahl
Anzahl [Mio.]
Wissenschaftler
50
10000
40
8000
30
6000
20
4000
10
2000
0
0
1950
1850
1950
Jahr
2000
Jahr
2000
1880 kannte die Chemie 20 000 chemische Verbindungen, heute sind es ca. 17 Millionen
Bedeutung von Geodaten
Was sind eigentlich Geodaten ?
•Geodaten sind digitale Informationen, denen
eine bestimmte räumliche Lage zugewiesen
werden kann (Geoinformationen, Geobezug)
•Geodaten bestehen aus Geobasisdaten und
Geofachdaten, die aus unterschiedlichen
raumbezogenen Fachdatenbanken stammen
•Metadaten beschreiben die eigentlichen
räumlichen Daten hinsichtlich des Zeitbezugs
und der Datenquelle
•Geoinformationssystem dienen zur
Visualisierung und Recherche von Geodaten
Geodaten und Datenbanken
Informationen der analogen Geodaten
sind auf eine Ebene,
die statische Karte begrenzt
Informationen der digitalen
Geodaten sind theoretisch
unbegrenzt als dynamische Karte
dargestellt und sind mit
Sachdaten verbunden
Geodaten und Datenbanken
Komplexität und Variabilität der Geodaten
verlangt eine Datenhaltung in Datenbanken
Geodaten im Jahre 2009
Fläche 44 km² (9,4 km x 4,7 km)
27 Themen (Ebenen)
4 komplexe Datenbanken
136 Polygone (geologische Flächen)
Geodaten und Datenbanken
Computerbasierte datenverarbeitende Technologien revolutionieren alle
gesellschaftlichen Bereiche
Es gibt enorm effiziente Techniken, informationstragende Daten
zu speichern,
zu transportieren
und in neue Daten zu transformieren.
Alle gesellschaftlichen Bereiche sind gezwungen, sich so umzugestalten, dass in ihnen
die computerbasierten datenverarbeitenden Technologien genutzt werden können.
Völlig zu Unrecht wird dieser technologische und ökonomische Großtrend als Weg zur
"Wissens- und Kommunikationsgesellschaft" gefeiert.
In Wahrheit handelt es sich nicht um Wege zur Wissensgesellschaft,
sondern erst einmal nur um die Zwänge einer Gesellschaft
computerbasierte datenverarbeitende Technologien in allen
gesellschaftlichen Bereichen durchzusetzen.
Geodaten und Datenbanken
Strukturierte Ablage von Geodaten ist notwendig …
… ABER welches Datenbankmodell ?
•Hierarchisches Datenbankmodell ?
Datenobjekte stehen in einer Eltern-KindBeziehungen zueinander.
Netzwerkdatenbankmodell ?
Datenobjekte werden miteinander in
Netzen verbunden.
•Relationale Datenbank ?
Die Daten werden zeilenweise in Tabellen
verwaltet. Es kann beliebige Beziehungen
zwischen Daten geben.
•Objektdatenbank ?
Beziehungen zwischen Datenobjekten
werden vom Datenbanksystem selbst
verwaltet. Objekte können Eigenschaften
und Daten von anderen Objekten erben.
„Fachleute“ als Datenbankdesigner
meine Daten
mein Problem
meine Lösung
Individualsicht - Nutzersicht
single-user Datenbanksystem
•viele alphanumerische Felder
•zu geringe Aufgliederung der
Felder
•Tabellen- und Feldnamen sind
nur dem Entwickler verständlich
… und wie sehen eigentlich die Daten aus ?
•Keine optimale
Tabellenverknüpfung und
Indizierung
„Fachleute“ als Datenbankdesigner
Tyisch für analoge Geodaten sind:
•Inkonsistenz:
Widersprüchlichkeit zwischen den Daten
•Inhomogenität:
Uneinheitlichkeit der Elemente einer
Menge
•Mehrdeutigkeit:
mehrere Bedeutungen eines Begriffes
oder Zeichens
• Redundanz:
Informationen in einer Informationsquelle
sind mehrfach vorhanden
Probleme mit Datenbankinhalten
Bergbau- und Rohstoffdatenbank
Teildatenbank Rohstoffe
Mehrdeutige Dateninhalte im
Feld „Nutzungskonflikte“
machen qualifizierte
Recherchen unmöglich
Bei nur 669 Datensätzen
erfolgte keine Evaluierung
der Dateninhalte !
Probleme mit Datenbankinhalten
Landesamt für Geologie und Bergwesen
Halle, den 16.04.2009
Bearbeitungsstand der Landesbohrdatenbank
Bearbeitungsstand: 05.03.2009
Erfasste Bohrungen:
190.855
Davon
Schichtdaten SEP1 insgesamt:
Schichtdaten SEP3 insgesamt:
1.511.178
163.534
Probleme mit Datenbankinhalten
Probleme mit Datenbankinhalten
Verschlüsselung mit SchichtenErfassungs-Programm (SEP 1)
+VT;
kgf-dc,ce,
bro4("q","fs",G:s,du:0.001),deu,ss,wl,ss
mm,bn(F:h,F:d),klfl("kao","ca","ch"),
Z:TZ(58.3-60.0,kao4-gr4,zg)
+VT-G(v);
kgm-kgg,ce
("fs","q",G:s),c4(duz:0.010.1,+Gp,^u,^s),bro4("q",duz:0.0010.002,ds-ml,"fs",duz:0.0010.005,F:hro,voe,duh:0.015),zt,+VT^b,ssmm(s),klv2,par,ss,klfl,"hm",^fs^gs-lag,zt,^u-lag
Probleme mit Datenbankinhalten
Inkonsistenz
Inhomogenität
Mehrdeutigkeit
Eine DV-technische
Überarbeitung ist
nur teilweise
möglich
Auflösung von zusammengefassten Schichten in Schicht und Unterschicht
Probleme mit Datenbankinhalten
SEP 3 ist kein Programm und
auch kein Dateiformat, sondern
die Beschreibung einer
Datenstruktur.
Auswertung ….?
Quo vadis Geodaten …
Auswege aus dem Datenchaos
multi-user Datenbanksystem
Umfangreiche Datenanalyse
Wer hat
Wer pflegt
Wer braucht
Wem nutzt
Maximale Datenintegration
Keine Mammutprojekte
sondern stufenweiser
Ausbau nach einem
Gesamtkonzept
•Neustrukturierung der Dateninhalte aus der
Perspektive der Datenrecherche
•Numerische Daten haben Vorrang vor
alphanumerischen Daten
•Kleinteilige Feldstrukturierungen
•Sinnvolle Auswahllisten
•Selbsterklärende Feld- und Tabellennamen
Take off in die schöne neue Geodatenwelt
Gegenseitige Information
Transparenz
Zusammenarbeit
Projektarbeit
Projektdiskussion
Datenanalyse
Datenevaluierung
Datenintegration
Datenbankentwicklung
Vielen Dank und gute Landung
Slide 9
Qualitätsanforderungen an Geodaten
von
Matthias Thomae
10. Zittauer Umweltsymposium 21.-22. April 2009 in Ostritz
1.
2.
3.
4.
5.
GLIEDERUNG
Bedeutung von Geodaten
Geodaten und Datenbanken
„Fachleute“ als Datenbankdesigner
Probleme mit Datenbankinhalten
Auswege aus dem Datenchaos
Bedeutung von Geodaten
… vor ca. 150 Jahren war das Wissen
über unsere Erde und der in und auf
ihr stattfindenden Prozesse
bescheiden
Geodaten gab es nicht flächendeckend,
wie die „weißen Flecken“ auf dem
Globus zeigen
Bibliotheksglobus, Berlin 1871
1871 veröffentlicht Darwin "The Descent of Man".
Bedeutung von Geodaten
Das Wissen ist in den letzten 150 Jahren exponentiell gewachsen
w issenschaftliche Veröffentlichungen
100
20000
90
18000
80
16000
70
14000
60
12000
Anzahl
Anzahl [Mio.]
Wissenschaftler
50
10000
40
8000
30
6000
20
4000
10
2000
0
0
1950
1850
1950
Jahr
2000
Jahr
2000
1880 kannte die Chemie 20 000 chemische Verbindungen, heute sind es ca. 17 Millionen
Bedeutung von Geodaten
Was sind eigentlich Geodaten ?
•Geodaten sind digitale Informationen, denen
eine bestimmte räumliche Lage zugewiesen
werden kann (Geoinformationen, Geobezug)
•Geodaten bestehen aus Geobasisdaten und
Geofachdaten, die aus unterschiedlichen
raumbezogenen Fachdatenbanken stammen
•Metadaten beschreiben die eigentlichen
räumlichen Daten hinsichtlich des Zeitbezugs
und der Datenquelle
•Geoinformationssystem dienen zur
Visualisierung und Recherche von Geodaten
Geodaten und Datenbanken
Informationen der analogen Geodaten
sind auf eine Ebene,
die statische Karte begrenzt
Informationen der digitalen
Geodaten sind theoretisch
unbegrenzt als dynamische Karte
dargestellt und sind mit
Sachdaten verbunden
Geodaten und Datenbanken
Komplexität und Variabilität der Geodaten
verlangt eine Datenhaltung in Datenbanken
Geodaten im Jahre 2009
Fläche 44 km² (9,4 km x 4,7 km)
27 Themen (Ebenen)
4 komplexe Datenbanken
136 Polygone (geologische Flächen)
Geodaten und Datenbanken
Computerbasierte datenverarbeitende Technologien revolutionieren alle
gesellschaftlichen Bereiche
Es gibt enorm effiziente Techniken, informationstragende Daten
zu speichern,
zu transportieren
und in neue Daten zu transformieren.
Alle gesellschaftlichen Bereiche sind gezwungen, sich so umzugestalten, dass in ihnen
die computerbasierten datenverarbeitenden Technologien genutzt werden können.
Völlig zu Unrecht wird dieser technologische und ökonomische Großtrend als Weg zur
"Wissens- und Kommunikationsgesellschaft" gefeiert.
In Wahrheit handelt es sich nicht um Wege zur Wissensgesellschaft,
sondern erst einmal nur um die Zwänge einer Gesellschaft
computerbasierte datenverarbeitende Technologien in allen
gesellschaftlichen Bereichen durchzusetzen.
Geodaten und Datenbanken
Strukturierte Ablage von Geodaten ist notwendig …
… ABER welches Datenbankmodell ?
•Hierarchisches Datenbankmodell ?
Datenobjekte stehen in einer Eltern-KindBeziehungen zueinander.
Netzwerkdatenbankmodell ?
Datenobjekte werden miteinander in
Netzen verbunden.
•Relationale Datenbank ?
Die Daten werden zeilenweise in Tabellen
verwaltet. Es kann beliebige Beziehungen
zwischen Daten geben.
•Objektdatenbank ?
Beziehungen zwischen Datenobjekten
werden vom Datenbanksystem selbst
verwaltet. Objekte können Eigenschaften
und Daten von anderen Objekten erben.
„Fachleute“ als Datenbankdesigner
meine Daten
mein Problem
meine Lösung
Individualsicht - Nutzersicht
single-user Datenbanksystem
•viele alphanumerische Felder
•zu geringe Aufgliederung der
Felder
•Tabellen- und Feldnamen sind
nur dem Entwickler verständlich
… und wie sehen eigentlich die Daten aus ?
•Keine optimale
Tabellenverknüpfung und
Indizierung
„Fachleute“ als Datenbankdesigner
Tyisch für analoge Geodaten sind:
•Inkonsistenz:
Widersprüchlichkeit zwischen den Daten
•Inhomogenität:
Uneinheitlichkeit der Elemente einer
Menge
•Mehrdeutigkeit:
mehrere Bedeutungen eines Begriffes
oder Zeichens
• Redundanz:
Informationen in einer Informationsquelle
sind mehrfach vorhanden
Probleme mit Datenbankinhalten
Bergbau- und Rohstoffdatenbank
Teildatenbank Rohstoffe
Mehrdeutige Dateninhalte im
Feld „Nutzungskonflikte“
machen qualifizierte
Recherchen unmöglich
Bei nur 669 Datensätzen
erfolgte keine Evaluierung
der Dateninhalte !
Probleme mit Datenbankinhalten
Landesamt für Geologie und Bergwesen
Halle, den 16.04.2009
Bearbeitungsstand der Landesbohrdatenbank
Bearbeitungsstand: 05.03.2009
Erfasste Bohrungen:
190.855
Davon
Schichtdaten SEP1 insgesamt:
Schichtdaten SEP3 insgesamt:
1.511.178
163.534
Probleme mit Datenbankinhalten
Probleme mit Datenbankinhalten
Verschlüsselung mit SchichtenErfassungs-Programm (SEP 1)
+VT;
kgf-dc,ce,
bro4("q","fs",G:s,du:0.001),deu,ss,wl,ss
mm,bn(F:h,F:d),klfl("kao","ca","ch"),
Z:TZ(58.3-60.0,kao4-gr4,zg)
+VT-G(v);
kgm-kgg,ce
("fs","q",G:s),c4(duz:0.010.1,+Gp,^u,^s),bro4("q",duz:0.0010.002,ds-ml,"fs",duz:0.0010.005,F:hro,voe,duh:0.015),zt,+VT^b,ssmm(s),klv2,par,ss,klfl,"hm",^fs^gs-lag,zt,^u-lag
Probleme mit Datenbankinhalten
Inkonsistenz
Inhomogenität
Mehrdeutigkeit
Eine DV-technische
Überarbeitung ist
nur teilweise
möglich
Auflösung von zusammengefassten Schichten in Schicht und Unterschicht
Probleme mit Datenbankinhalten
SEP 3 ist kein Programm und
auch kein Dateiformat, sondern
die Beschreibung einer
Datenstruktur.
Auswertung ….?
Quo vadis Geodaten …
Auswege aus dem Datenchaos
multi-user Datenbanksystem
Umfangreiche Datenanalyse
Wer hat
Wer pflegt
Wer braucht
Wem nutzt
Maximale Datenintegration
Keine Mammutprojekte
sondern stufenweiser
Ausbau nach einem
Gesamtkonzept
•Neustrukturierung der Dateninhalte aus der
Perspektive der Datenrecherche
•Numerische Daten haben Vorrang vor
alphanumerischen Daten
•Kleinteilige Feldstrukturierungen
•Sinnvolle Auswahllisten
•Selbsterklärende Feld- und Tabellennamen
Take off in die schöne neue Geodatenwelt
Gegenseitige Information
Transparenz
Zusammenarbeit
Projektarbeit
Projektdiskussion
Datenanalyse
Datenevaluierung
Datenintegration
Datenbankentwicklung
Vielen Dank und gute Landung
Slide 10
Qualitätsanforderungen an Geodaten
von
Matthias Thomae
10. Zittauer Umweltsymposium 21.-22. April 2009 in Ostritz
1.
2.
3.
4.
5.
GLIEDERUNG
Bedeutung von Geodaten
Geodaten und Datenbanken
„Fachleute“ als Datenbankdesigner
Probleme mit Datenbankinhalten
Auswege aus dem Datenchaos
Bedeutung von Geodaten
… vor ca. 150 Jahren war das Wissen
über unsere Erde und der in und auf
ihr stattfindenden Prozesse
bescheiden
Geodaten gab es nicht flächendeckend,
wie die „weißen Flecken“ auf dem
Globus zeigen
Bibliotheksglobus, Berlin 1871
1871 veröffentlicht Darwin "The Descent of Man".
Bedeutung von Geodaten
Das Wissen ist in den letzten 150 Jahren exponentiell gewachsen
w issenschaftliche Veröffentlichungen
100
20000
90
18000
80
16000
70
14000
60
12000
Anzahl
Anzahl [Mio.]
Wissenschaftler
50
10000
40
8000
30
6000
20
4000
10
2000
0
0
1950
1850
1950
Jahr
2000
Jahr
2000
1880 kannte die Chemie 20 000 chemische Verbindungen, heute sind es ca. 17 Millionen
Bedeutung von Geodaten
Was sind eigentlich Geodaten ?
•Geodaten sind digitale Informationen, denen
eine bestimmte räumliche Lage zugewiesen
werden kann (Geoinformationen, Geobezug)
•Geodaten bestehen aus Geobasisdaten und
Geofachdaten, die aus unterschiedlichen
raumbezogenen Fachdatenbanken stammen
•Metadaten beschreiben die eigentlichen
räumlichen Daten hinsichtlich des Zeitbezugs
und der Datenquelle
•Geoinformationssystem dienen zur
Visualisierung und Recherche von Geodaten
Geodaten und Datenbanken
Informationen der analogen Geodaten
sind auf eine Ebene,
die statische Karte begrenzt
Informationen der digitalen
Geodaten sind theoretisch
unbegrenzt als dynamische Karte
dargestellt und sind mit
Sachdaten verbunden
Geodaten und Datenbanken
Komplexität und Variabilität der Geodaten
verlangt eine Datenhaltung in Datenbanken
Geodaten im Jahre 2009
Fläche 44 km² (9,4 km x 4,7 km)
27 Themen (Ebenen)
4 komplexe Datenbanken
136 Polygone (geologische Flächen)
Geodaten und Datenbanken
Computerbasierte datenverarbeitende Technologien revolutionieren alle
gesellschaftlichen Bereiche
Es gibt enorm effiziente Techniken, informationstragende Daten
zu speichern,
zu transportieren
und in neue Daten zu transformieren.
Alle gesellschaftlichen Bereiche sind gezwungen, sich so umzugestalten, dass in ihnen
die computerbasierten datenverarbeitenden Technologien genutzt werden können.
Völlig zu Unrecht wird dieser technologische und ökonomische Großtrend als Weg zur
"Wissens- und Kommunikationsgesellschaft" gefeiert.
In Wahrheit handelt es sich nicht um Wege zur Wissensgesellschaft,
sondern erst einmal nur um die Zwänge einer Gesellschaft
computerbasierte datenverarbeitende Technologien in allen
gesellschaftlichen Bereichen durchzusetzen.
Geodaten und Datenbanken
Strukturierte Ablage von Geodaten ist notwendig …
… ABER welches Datenbankmodell ?
•Hierarchisches Datenbankmodell ?
Datenobjekte stehen in einer Eltern-KindBeziehungen zueinander.
Netzwerkdatenbankmodell ?
Datenobjekte werden miteinander in
Netzen verbunden.
•Relationale Datenbank ?
Die Daten werden zeilenweise in Tabellen
verwaltet. Es kann beliebige Beziehungen
zwischen Daten geben.
•Objektdatenbank ?
Beziehungen zwischen Datenobjekten
werden vom Datenbanksystem selbst
verwaltet. Objekte können Eigenschaften
und Daten von anderen Objekten erben.
„Fachleute“ als Datenbankdesigner
meine Daten
mein Problem
meine Lösung
Individualsicht - Nutzersicht
single-user Datenbanksystem
•viele alphanumerische Felder
•zu geringe Aufgliederung der
Felder
•Tabellen- und Feldnamen sind
nur dem Entwickler verständlich
… und wie sehen eigentlich die Daten aus ?
•Keine optimale
Tabellenverknüpfung und
Indizierung
„Fachleute“ als Datenbankdesigner
Tyisch für analoge Geodaten sind:
•Inkonsistenz:
Widersprüchlichkeit zwischen den Daten
•Inhomogenität:
Uneinheitlichkeit der Elemente einer
Menge
•Mehrdeutigkeit:
mehrere Bedeutungen eines Begriffes
oder Zeichens
• Redundanz:
Informationen in einer Informationsquelle
sind mehrfach vorhanden
Probleme mit Datenbankinhalten
Bergbau- und Rohstoffdatenbank
Teildatenbank Rohstoffe
Mehrdeutige Dateninhalte im
Feld „Nutzungskonflikte“
machen qualifizierte
Recherchen unmöglich
Bei nur 669 Datensätzen
erfolgte keine Evaluierung
der Dateninhalte !
Probleme mit Datenbankinhalten
Landesamt für Geologie und Bergwesen
Halle, den 16.04.2009
Bearbeitungsstand der Landesbohrdatenbank
Bearbeitungsstand: 05.03.2009
Erfasste Bohrungen:
190.855
Davon
Schichtdaten SEP1 insgesamt:
Schichtdaten SEP3 insgesamt:
1.511.178
163.534
Probleme mit Datenbankinhalten
Probleme mit Datenbankinhalten
Verschlüsselung mit SchichtenErfassungs-Programm (SEP 1)
+VT;
kgf-dc,ce,
bro4("q","fs",G:s,du:0.001),deu,ss,wl,ss
mm,bn(F:h,F:d),klfl("kao","ca","ch"),
Z:TZ(58.3-60.0,kao4-gr4,zg)
+VT-G(v);
kgm-kgg,ce
("fs","q",G:s),c4(duz:0.010.1,+Gp,^u,^s),bro4("q",duz:0.0010.002,ds-ml,"fs",duz:0.0010.005,F:hro,voe,duh:0.015),zt,+VT^b,ssmm(s),klv2,par,ss,klfl,"hm",^fs^gs-lag,zt,^u-lag
Probleme mit Datenbankinhalten
Inkonsistenz
Inhomogenität
Mehrdeutigkeit
Eine DV-technische
Überarbeitung ist
nur teilweise
möglich
Auflösung von zusammengefassten Schichten in Schicht und Unterschicht
Probleme mit Datenbankinhalten
SEP 3 ist kein Programm und
auch kein Dateiformat, sondern
die Beschreibung einer
Datenstruktur.
Auswertung ….?
Quo vadis Geodaten …
Auswege aus dem Datenchaos
multi-user Datenbanksystem
Umfangreiche Datenanalyse
Wer hat
Wer pflegt
Wer braucht
Wem nutzt
Maximale Datenintegration
Keine Mammutprojekte
sondern stufenweiser
Ausbau nach einem
Gesamtkonzept
•Neustrukturierung der Dateninhalte aus der
Perspektive der Datenrecherche
•Numerische Daten haben Vorrang vor
alphanumerischen Daten
•Kleinteilige Feldstrukturierungen
•Sinnvolle Auswahllisten
•Selbsterklärende Feld- und Tabellennamen
Take off in die schöne neue Geodatenwelt
Gegenseitige Information
Transparenz
Zusammenarbeit
Projektarbeit
Projektdiskussion
Datenanalyse
Datenevaluierung
Datenintegration
Datenbankentwicklung
Vielen Dank und gute Landung
Slide 11
Qualitätsanforderungen an Geodaten
von
Matthias Thomae
10. Zittauer Umweltsymposium 21.-22. April 2009 in Ostritz
1.
2.
3.
4.
5.
GLIEDERUNG
Bedeutung von Geodaten
Geodaten und Datenbanken
„Fachleute“ als Datenbankdesigner
Probleme mit Datenbankinhalten
Auswege aus dem Datenchaos
Bedeutung von Geodaten
… vor ca. 150 Jahren war das Wissen
über unsere Erde und der in und auf
ihr stattfindenden Prozesse
bescheiden
Geodaten gab es nicht flächendeckend,
wie die „weißen Flecken“ auf dem
Globus zeigen
Bibliotheksglobus, Berlin 1871
1871 veröffentlicht Darwin "The Descent of Man".
Bedeutung von Geodaten
Das Wissen ist in den letzten 150 Jahren exponentiell gewachsen
w issenschaftliche Veröffentlichungen
100
20000
90
18000
80
16000
70
14000
60
12000
Anzahl
Anzahl [Mio.]
Wissenschaftler
50
10000
40
8000
30
6000
20
4000
10
2000
0
0
1950
1850
1950
Jahr
2000
Jahr
2000
1880 kannte die Chemie 20 000 chemische Verbindungen, heute sind es ca. 17 Millionen
Bedeutung von Geodaten
Was sind eigentlich Geodaten ?
•Geodaten sind digitale Informationen, denen
eine bestimmte räumliche Lage zugewiesen
werden kann (Geoinformationen, Geobezug)
•Geodaten bestehen aus Geobasisdaten und
Geofachdaten, die aus unterschiedlichen
raumbezogenen Fachdatenbanken stammen
•Metadaten beschreiben die eigentlichen
räumlichen Daten hinsichtlich des Zeitbezugs
und der Datenquelle
•Geoinformationssystem dienen zur
Visualisierung und Recherche von Geodaten
Geodaten und Datenbanken
Informationen der analogen Geodaten
sind auf eine Ebene,
die statische Karte begrenzt
Informationen der digitalen
Geodaten sind theoretisch
unbegrenzt als dynamische Karte
dargestellt und sind mit
Sachdaten verbunden
Geodaten und Datenbanken
Komplexität und Variabilität der Geodaten
verlangt eine Datenhaltung in Datenbanken
Geodaten im Jahre 2009
Fläche 44 km² (9,4 km x 4,7 km)
27 Themen (Ebenen)
4 komplexe Datenbanken
136 Polygone (geologische Flächen)
Geodaten und Datenbanken
Computerbasierte datenverarbeitende Technologien revolutionieren alle
gesellschaftlichen Bereiche
Es gibt enorm effiziente Techniken, informationstragende Daten
zu speichern,
zu transportieren
und in neue Daten zu transformieren.
Alle gesellschaftlichen Bereiche sind gezwungen, sich so umzugestalten, dass in ihnen
die computerbasierten datenverarbeitenden Technologien genutzt werden können.
Völlig zu Unrecht wird dieser technologische und ökonomische Großtrend als Weg zur
"Wissens- und Kommunikationsgesellschaft" gefeiert.
In Wahrheit handelt es sich nicht um Wege zur Wissensgesellschaft,
sondern erst einmal nur um die Zwänge einer Gesellschaft
computerbasierte datenverarbeitende Technologien in allen
gesellschaftlichen Bereichen durchzusetzen.
Geodaten und Datenbanken
Strukturierte Ablage von Geodaten ist notwendig …
… ABER welches Datenbankmodell ?
•Hierarchisches Datenbankmodell ?
Datenobjekte stehen in einer Eltern-KindBeziehungen zueinander.
Netzwerkdatenbankmodell ?
Datenobjekte werden miteinander in
Netzen verbunden.
•Relationale Datenbank ?
Die Daten werden zeilenweise in Tabellen
verwaltet. Es kann beliebige Beziehungen
zwischen Daten geben.
•Objektdatenbank ?
Beziehungen zwischen Datenobjekten
werden vom Datenbanksystem selbst
verwaltet. Objekte können Eigenschaften
und Daten von anderen Objekten erben.
„Fachleute“ als Datenbankdesigner
meine Daten
mein Problem
meine Lösung
Individualsicht - Nutzersicht
single-user Datenbanksystem
•viele alphanumerische Felder
•zu geringe Aufgliederung der
Felder
•Tabellen- und Feldnamen sind
nur dem Entwickler verständlich
… und wie sehen eigentlich die Daten aus ?
•Keine optimale
Tabellenverknüpfung und
Indizierung
„Fachleute“ als Datenbankdesigner
Tyisch für analoge Geodaten sind:
•Inkonsistenz:
Widersprüchlichkeit zwischen den Daten
•Inhomogenität:
Uneinheitlichkeit der Elemente einer
Menge
•Mehrdeutigkeit:
mehrere Bedeutungen eines Begriffes
oder Zeichens
• Redundanz:
Informationen in einer Informationsquelle
sind mehrfach vorhanden
Probleme mit Datenbankinhalten
Bergbau- und Rohstoffdatenbank
Teildatenbank Rohstoffe
Mehrdeutige Dateninhalte im
Feld „Nutzungskonflikte“
machen qualifizierte
Recherchen unmöglich
Bei nur 669 Datensätzen
erfolgte keine Evaluierung
der Dateninhalte !
Probleme mit Datenbankinhalten
Landesamt für Geologie und Bergwesen
Halle, den 16.04.2009
Bearbeitungsstand der Landesbohrdatenbank
Bearbeitungsstand: 05.03.2009
Erfasste Bohrungen:
190.855
Davon
Schichtdaten SEP1 insgesamt:
Schichtdaten SEP3 insgesamt:
1.511.178
163.534
Probleme mit Datenbankinhalten
Probleme mit Datenbankinhalten
Verschlüsselung mit SchichtenErfassungs-Programm (SEP 1)
+VT;
kgf-dc,ce,
bro4("q","fs",G:s,du:0.001),deu,ss,wl,ss
mm,bn(F:h,F:d),klfl("kao","ca","ch"),
Z:TZ(58.3-60.0,kao4-gr4,zg)
+VT-G(v);
kgm-kgg,ce
("fs","q",G:s),c4(duz:0.010.1,+Gp,^u,^s),bro4("q",duz:0.0010.002,ds-ml,"fs",duz:0.0010.005,F:hro,voe,duh:0.015),zt,+VT^b,ssmm(s),klv2,par,ss,klfl,"hm",^fs^gs-lag,zt,^u-lag
Probleme mit Datenbankinhalten
Inkonsistenz
Inhomogenität
Mehrdeutigkeit
Eine DV-technische
Überarbeitung ist
nur teilweise
möglich
Auflösung von zusammengefassten Schichten in Schicht und Unterschicht
Probleme mit Datenbankinhalten
SEP 3 ist kein Programm und
auch kein Dateiformat, sondern
die Beschreibung einer
Datenstruktur.
Auswertung ….?
Quo vadis Geodaten …
Auswege aus dem Datenchaos
multi-user Datenbanksystem
Umfangreiche Datenanalyse
Wer hat
Wer pflegt
Wer braucht
Wem nutzt
Maximale Datenintegration
Keine Mammutprojekte
sondern stufenweiser
Ausbau nach einem
Gesamtkonzept
•Neustrukturierung der Dateninhalte aus der
Perspektive der Datenrecherche
•Numerische Daten haben Vorrang vor
alphanumerischen Daten
•Kleinteilige Feldstrukturierungen
•Sinnvolle Auswahllisten
•Selbsterklärende Feld- und Tabellennamen
Take off in die schöne neue Geodatenwelt
Gegenseitige Information
Transparenz
Zusammenarbeit
Projektarbeit
Projektdiskussion
Datenanalyse
Datenevaluierung
Datenintegration
Datenbankentwicklung
Vielen Dank und gute Landung
Slide 12
Qualitätsanforderungen an Geodaten
von
Matthias Thomae
10. Zittauer Umweltsymposium 21.-22. April 2009 in Ostritz
1.
2.
3.
4.
5.
GLIEDERUNG
Bedeutung von Geodaten
Geodaten und Datenbanken
„Fachleute“ als Datenbankdesigner
Probleme mit Datenbankinhalten
Auswege aus dem Datenchaos
Bedeutung von Geodaten
… vor ca. 150 Jahren war das Wissen
über unsere Erde und der in und auf
ihr stattfindenden Prozesse
bescheiden
Geodaten gab es nicht flächendeckend,
wie die „weißen Flecken“ auf dem
Globus zeigen
Bibliotheksglobus, Berlin 1871
1871 veröffentlicht Darwin "The Descent of Man".
Bedeutung von Geodaten
Das Wissen ist in den letzten 150 Jahren exponentiell gewachsen
w issenschaftliche Veröffentlichungen
100
20000
90
18000
80
16000
70
14000
60
12000
Anzahl
Anzahl [Mio.]
Wissenschaftler
50
10000
40
8000
30
6000
20
4000
10
2000
0
0
1950
1850
1950
Jahr
2000
Jahr
2000
1880 kannte die Chemie 20 000 chemische Verbindungen, heute sind es ca. 17 Millionen
Bedeutung von Geodaten
Was sind eigentlich Geodaten ?
•Geodaten sind digitale Informationen, denen
eine bestimmte räumliche Lage zugewiesen
werden kann (Geoinformationen, Geobezug)
•Geodaten bestehen aus Geobasisdaten und
Geofachdaten, die aus unterschiedlichen
raumbezogenen Fachdatenbanken stammen
•Metadaten beschreiben die eigentlichen
räumlichen Daten hinsichtlich des Zeitbezugs
und der Datenquelle
•Geoinformationssystem dienen zur
Visualisierung und Recherche von Geodaten
Geodaten und Datenbanken
Informationen der analogen Geodaten
sind auf eine Ebene,
die statische Karte begrenzt
Informationen der digitalen
Geodaten sind theoretisch
unbegrenzt als dynamische Karte
dargestellt und sind mit
Sachdaten verbunden
Geodaten und Datenbanken
Komplexität und Variabilität der Geodaten
verlangt eine Datenhaltung in Datenbanken
Geodaten im Jahre 2009
Fläche 44 km² (9,4 km x 4,7 km)
27 Themen (Ebenen)
4 komplexe Datenbanken
136 Polygone (geologische Flächen)
Geodaten und Datenbanken
Computerbasierte datenverarbeitende Technologien revolutionieren alle
gesellschaftlichen Bereiche
Es gibt enorm effiziente Techniken, informationstragende Daten
zu speichern,
zu transportieren
und in neue Daten zu transformieren.
Alle gesellschaftlichen Bereiche sind gezwungen, sich so umzugestalten, dass in ihnen
die computerbasierten datenverarbeitenden Technologien genutzt werden können.
Völlig zu Unrecht wird dieser technologische und ökonomische Großtrend als Weg zur
"Wissens- und Kommunikationsgesellschaft" gefeiert.
In Wahrheit handelt es sich nicht um Wege zur Wissensgesellschaft,
sondern erst einmal nur um die Zwänge einer Gesellschaft
computerbasierte datenverarbeitende Technologien in allen
gesellschaftlichen Bereichen durchzusetzen.
Geodaten und Datenbanken
Strukturierte Ablage von Geodaten ist notwendig …
… ABER welches Datenbankmodell ?
•Hierarchisches Datenbankmodell ?
Datenobjekte stehen in einer Eltern-KindBeziehungen zueinander.
Netzwerkdatenbankmodell ?
Datenobjekte werden miteinander in
Netzen verbunden.
•Relationale Datenbank ?
Die Daten werden zeilenweise in Tabellen
verwaltet. Es kann beliebige Beziehungen
zwischen Daten geben.
•Objektdatenbank ?
Beziehungen zwischen Datenobjekten
werden vom Datenbanksystem selbst
verwaltet. Objekte können Eigenschaften
und Daten von anderen Objekten erben.
„Fachleute“ als Datenbankdesigner
meine Daten
mein Problem
meine Lösung
Individualsicht - Nutzersicht
single-user Datenbanksystem
•viele alphanumerische Felder
•zu geringe Aufgliederung der
Felder
•Tabellen- und Feldnamen sind
nur dem Entwickler verständlich
… und wie sehen eigentlich die Daten aus ?
•Keine optimale
Tabellenverknüpfung und
Indizierung
„Fachleute“ als Datenbankdesigner
Tyisch für analoge Geodaten sind:
•Inkonsistenz:
Widersprüchlichkeit zwischen den Daten
•Inhomogenität:
Uneinheitlichkeit der Elemente einer
Menge
•Mehrdeutigkeit:
mehrere Bedeutungen eines Begriffes
oder Zeichens
• Redundanz:
Informationen in einer Informationsquelle
sind mehrfach vorhanden
Probleme mit Datenbankinhalten
Bergbau- und Rohstoffdatenbank
Teildatenbank Rohstoffe
Mehrdeutige Dateninhalte im
Feld „Nutzungskonflikte“
machen qualifizierte
Recherchen unmöglich
Bei nur 669 Datensätzen
erfolgte keine Evaluierung
der Dateninhalte !
Probleme mit Datenbankinhalten
Landesamt für Geologie und Bergwesen
Halle, den 16.04.2009
Bearbeitungsstand der Landesbohrdatenbank
Bearbeitungsstand: 05.03.2009
Erfasste Bohrungen:
190.855
Davon
Schichtdaten SEP1 insgesamt:
Schichtdaten SEP3 insgesamt:
1.511.178
163.534
Probleme mit Datenbankinhalten
Probleme mit Datenbankinhalten
Verschlüsselung mit SchichtenErfassungs-Programm (SEP 1)
+VT;
kgf-dc,ce,
bro4("q","fs",G:s,du:0.001),deu,ss,wl,ss
mm,bn(F:h,F:d),klfl("kao","ca","ch"),
Z:TZ(58.3-60.0,kao4-gr4,zg)
+VT-G(v);
kgm-kgg,ce
("fs","q",G:s),c4(duz:0.010.1,+Gp,^u,^s),bro4("q",duz:0.0010.002,ds-ml,"fs",duz:0.0010.005,F:hro,voe,duh:0.015),zt,+VT^b,ssmm(s),klv2,par,ss,klfl,"hm",^fs^gs-lag,zt,^u-lag
Probleme mit Datenbankinhalten
Inkonsistenz
Inhomogenität
Mehrdeutigkeit
Eine DV-technische
Überarbeitung ist
nur teilweise
möglich
Auflösung von zusammengefassten Schichten in Schicht und Unterschicht
Probleme mit Datenbankinhalten
SEP 3 ist kein Programm und
auch kein Dateiformat, sondern
die Beschreibung einer
Datenstruktur.
Auswertung ….?
Quo vadis Geodaten …
Auswege aus dem Datenchaos
multi-user Datenbanksystem
Umfangreiche Datenanalyse
Wer hat
Wer pflegt
Wer braucht
Wem nutzt
Maximale Datenintegration
Keine Mammutprojekte
sondern stufenweiser
Ausbau nach einem
Gesamtkonzept
•Neustrukturierung der Dateninhalte aus der
Perspektive der Datenrecherche
•Numerische Daten haben Vorrang vor
alphanumerischen Daten
•Kleinteilige Feldstrukturierungen
•Sinnvolle Auswahllisten
•Selbsterklärende Feld- und Tabellennamen
Take off in die schöne neue Geodatenwelt
Gegenseitige Information
Transparenz
Zusammenarbeit
Projektarbeit
Projektdiskussion
Datenanalyse
Datenevaluierung
Datenintegration
Datenbankentwicklung
Vielen Dank und gute Landung
Slide 13
Qualitätsanforderungen an Geodaten
von
Matthias Thomae
10. Zittauer Umweltsymposium 21.-22. April 2009 in Ostritz
1.
2.
3.
4.
5.
GLIEDERUNG
Bedeutung von Geodaten
Geodaten und Datenbanken
„Fachleute“ als Datenbankdesigner
Probleme mit Datenbankinhalten
Auswege aus dem Datenchaos
Bedeutung von Geodaten
… vor ca. 150 Jahren war das Wissen
über unsere Erde und der in und auf
ihr stattfindenden Prozesse
bescheiden
Geodaten gab es nicht flächendeckend,
wie die „weißen Flecken“ auf dem
Globus zeigen
Bibliotheksglobus, Berlin 1871
1871 veröffentlicht Darwin "The Descent of Man".
Bedeutung von Geodaten
Das Wissen ist in den letzten 150 Jahren exponentiell gewachsen
w issenschaftliche Veröffentlichungen
100
20000
90
18000
80
16000
70
14000
60
12000
Anzahl
Anzahl [Mio.]
Wissenschaftler
50
10000
40
8000
30
6000
20
4000
10
2000
0
0
1950
1850
1950
Jahr
2000
Jahr
2000
1880 kannte die Chemie 20 000 chemische Verbindungen, heute sind es ca. 17 Millionen
Bedeutung von Geodaten
Was sind eigentlich Geodaten ?
•Geodaten sind digitale Informationen, denen
eine bestimmte räumliche Lage zugewiesen
werden kann (Geoinformationen, Geobezug)
•Geodaten bestehen aus Geobasisdaten und
Geofachdaten, die aus unterschiedlichen
raumbezogenen Fachdatenbanken stammen
•Metadaten beschreiben die eigentlichen
räumlichen Daten hinsichtlich des Zeitbezugs
und der Datenquelle
•Geoinformationssystem dienen zur
Visualisierung und Recherche von Geodaten
Geodaten und Datenbanken
Informationen der analogen Geodaten
sind auf eine Ebene,
die statische Karte begrenzt
Informationen der digitalen
Geodaten sind theoretisch
unbegrenzt als dynamische Karte
dargestellt und sind mit
Sachdaten verbunden
Geodaten und Datenbanken
Komplexität und Variabilität der Geodaten
verlangt eine Datenhaltung in Datenbanken
Geodaten im Jahre 2009
Fläche 44 km² (9,4 km x 4,7 km)
27 Themen (Ebenen)
4 komplexe Datenbanken
136 Polygone (geologische Flächen)
Geodaten und Datenbanken
Computerbasierte datenverarbeitende Technologien revolutionieren alle
gesellschaftlichen Bereiche
Es gibt enorm effiziente Techniken, informationstragende Daten
zu speichern,
zu transportieren
und in neue Daten zu transformieren.
Alle gesellschaftlichen Bereiche sind gezwungen, sich so umzugestalten, dass in ihnen
die computerbasierten datenverarbeitenden Technologien genutzt werden können.
Völlig zu Unrecht wird dieser technologische und ökonomische Großtrend als Weg zur
"Wissens- und Kommunikationsgesellschaft" gefeiert.
In Wahrheit handelt es sich nicht um Wege zur Wissensgesellschaft,
sondern erst einmal nur um die Zwänge einer Gesellschaft
computerbasierte datenverarbeitende Technologien in allen
gesellschaftlichen Bereichen durchzusetzen.
Geodaten und Datenbanken
Strukturierte Ablage von Geodaten ist notwendig …
… ABER welches Datenbankmodell ?
•Hierarchisches Datenbankmodell ?
Datenobjekte stehen in einer Eltern-KindBeziehungen zueinander.
Netzwerkdatenbankmodell ?
Datenobjekte werden miteinander in
Netzen verbunden.
•Relationale Datenbank ?
Die Daten werden zeilenweise in Tabellen
verwaltet. Es kann beliebige Beziehungen
zwischen Daten geben.
•Objektdatenbank ?
Beziehungen zwischen Datenobjekten
werden vom Datenbanksystem selbst
verwaltet. Objekte können Eigenschaften
und Daten von anderen Objekten erben.
„Fachleute“ als Datenbankdesigner
meine Daten
mein Problem
meine Lösung
Individualsicht - Nutzersicht
single-user Datenbanksystem
•viele alphanumerische Felder
•zu geringe Aufgliederung der
Felder
•Tabellen- und Feldnamen sind
nur dem Entwickler verständlich
… und wie sehen eigentlich die Daten aus ?
•Keine optimale
Tabellenverknüpfung und
Indizierung
„Fachleute“ als Datenbankdesigner
Tyisch für analoge Geodaten sind:
•Inkonsistenz:
Widersprüchlichkeit zwischen den Daten
•Inhomogenität:
Uneinheitlichkeit der Elemente einer
Menge
•Mehrdeutigkeit:
mehrere Bedeutungen eines Begriffes
oder Zeichens
• Redundanz:
Informationen in einer Informationsquelle
sind mehrfach vorhanden
Probleme mit Datenbankinhalten
Bergbau- und Rohstoffdatenbank
Teildatenbank Rohstoffe
Mehrdeutige Dateninhalte im
Feld „Nutzungskonflikte“
machen qualifizierte
Recherchen unmöglich
Bei nur 669 Datensätzen
erfolgte keine Evaluierung
der Dateninhalte !
Probleme mit Datenbankinhalten
Landesamt für Geologie und Bergwesen
Halle, den 16.04.2009
Bearbeitungsstand der Landesbohrdatenbank
Bearbeitungsstand: 05.03.2009
Erfasste Bohrungen:
190.855
Davon
Schichtdaten SEP1 insgesamt:
Schichtdaten SEP3 insgesamt:
1.511.178
163.534
Probleme mit Datenbankinhalten
Probleme mit Datenbankinhalten
Verschlüsselung mit SchichtenErfassungs-Programm (SEP 1)
+VT;
kgf-dc,ce,
bro4("q","fs",G:s,du:0.001),deu,ss,wl,ss
mm,bn(F:h,F:d),klfl("kao","ca","ch"),
Z:TZ(58.3-60.0,kao4-gr4,zg)
+VT-G(v);
kgm-kgg,ce
("fs","q",G:s),c4(duz:0.010.1,+Gp,^u,^s),bro4("q",duz:0.0010.002,ds-ml,"fs",duz:0.0010.005,F:hro,voe,duh:0.015),zt,+VT^b,ssmm(s),klv2,par,ss,klfl,"hm",^fs^gs-lag,zt,^u-lag
Probleme mit Datenbankinhalten
Inkonsistenz
Inhomogenität
Mehrdeutigkeit
Eine DV-technische
Überarbeitung ist
nur teilweise
möglich
Auflösung von zusammengefassten Schichten in Schicht und Unterschicht
Probleme mit Datenbankinhalten
SEP 3 ist kein Programm und
auch kein Dateiformat, sondern
die Beschreibung einer
Datenstruktur.
Auswertung ….?
Quo vadis Geodaten …
Auswege aus dem Datenchaos
multi-user Datenbanksystem
Umfangreiche Datenanalyse
Wer hat
Wer pflegt
Wer braucht
Wem nutzt
Maximale Datenintegration
Keine Mammutprojekte
sondern stufenweiser
Ausbau nach einem
Gesamtkonzept
•Neustrukturierung der Dateninhalte aus der
Perspektive der Datenrecherche
•Numerische Daten haben Vorrang vor
alphanumerischen Daten
•Kleinteilige Feldstrukturierungen
•Sinnvolle Auswahllisten
•Selbsterklärende Feld- und Tabellennamen
Take off in die schöne neue Geodatenwelt
Gegenseitige Information
Transparenz
Zusammenarbeit
Projektarbeit
Projektdiskussion
Datenanalyse
Datenevaluierung
Datenintegration
Datenbankentwicklung
Vielen Dank und gute Landung
Slide 14
Qualitätsanforderungen an Geodaten
von
Matthias Thomae
10. Zittauer Umweltsymposium 21.-22. April 2009 in Ostritz
1.
2.
3.
4.
5.
GLIEDERUNG
Bedeutung von Geodaten
Geodaten und Datenbanken
„Fachleute“ als Datenbankdesigner
Probleme mit Datenbankinhalten
Auswege aus dem Datenchaos
Bedeutung von Geodaten
… vor ca. 150 Jahren war das Wissen
über unsere Erde und der in und auf
ihr stattfindenden Prozesse
bescheiden
Geodaten gab es nicht flächendeckend,
wie die „weißen Flecken“ auf dem
Globus zeigen
Bibliotheksglobus, Berlin 1871
1871 veröffentlicht Darwin "The Descent of Man".
Bedeutung von Geodaten
Das Wissen ist in den letzten 150 Jahren exponentiell gewachsen
w issenschaftliche Veröffentlichungen
100
20000
90
18000
80
16000
70
14000
60
12000
Anzahl
Anzahl [Mio.]
Wissenschaftler
50
10000
40
8000
30
6000
20
4000
10
2000
0
0
1950
1850
1950
Jahr
2000
Jahr
2000
1880 kannte die Chemie 20 000 chemische Verbindungen, heute sind es ca. 17 Millionen
Bedeutung von Geodaten
Was sind eigentlich Geodaten ?
•Geodaten sind digitale Informationen, denen
eine bestimmte räumliche Lage zugewiesen
werden kann (Geoinformationen, Geobezug)
•Geodaten bestehen aus Geobasisdaten und
Geofachdaten, die aus unterschiedlichen
raumbezogenen Fachdatenbanken stammen
•Metadaten beschreiben die eigentlichen
räumlichen Daten hinsichtlich des Zeitbezugs
und der Datenquelle
•Geoinformationssystem dienen zur
Visualisierung und Recherche von Geodaten
Geodaten und Datenbanken
Informationen der analogen Geodaten
sind auf eine Ebene,
die statische Karte begrenzt
Informationen der digitalen
Geodaten sind theoretisch
unbegrenzt als dynamische Karte
dargestellt und sind mit
Sachdaten verbunden
Geodaten und Datenbanken
Komplexität und Variabilität der Geodaten
verlangt eine Datenhaltung in Datenbanken
Geodaten im Jahre 2009
Fläche 44 km² (9,4 km x 4,7 km)
27 Themen (Ebenen)
4 komplexe Datenbanken
136 Polygone (geologische Flächen)
Geodaten und Datenbanken
Computerbasierte datenverarbeitende Technologien revolutionieren alle
gesellschaftlichen Bereiche
Es gibt enorm effiziente Techniken, informationstragende Daten
zu speichern,
zu transportieren
und in neue Daten zu transformieren.
Alle gesellschaftlichen Bereiche sind gezwungen, sich so umzugestalten, dass in ihnen
die computerbasierten datenverarbeitenden Technologien genutzt werden können.
Völlig zu Unrecht wird dieser technologische und ökonomische Großtrend als Weg zur
"Wissens- und Kommunikationsgesellschaft" gefeiert.
In Wahrheit handelt es sich nicht um Wege zur Wissensgesellschaft,
sondern erst einmal nur um die Zwänge einer Gesellschaft
computerbasierte datenverarbeitende Technologien in allen
gesellschaftlichen Bereichen durchzusetzen.
Geodaten und Datenbanken
Strukturierte Ablage von Geodaten ist notwendig …
… ABER welches Datenbankmodell ?
•Hierarchisches Datenbankmodell ?
Datenobjekte stehen in einer Eltern-KindBeziehungen zueinander.
Netzwerkdatenbankmodell ?
Datenobjekte werden miteinander in
Netzen verbunden.
•Relationale Datenbank ?
Die Daten werden zeilenweise in Tabellen
verwaltet. Es kann beliebige Beziehungen
zwischen Daten geben.
•Objektdatenbank ?
Beziehungen zwischen Datenobjekten
werden vom Datenbanksystem selbst
verwaltet. Objekte können Eigenschaften
und Daten von anderen Objekten erben.
„Fachleute“ als Datenbankdesigner
meine Daten
mein Problem
meine Lösung
Individualsicht - Nutzersicht
single-user Datenbanksystem
•viele alphanumerische Felder
•zu geringe Aufgliederung der
Felder
•Tabellen- und Feldnamen sind
nur dem Entwickler verständlich
… und wie sehen eigentlich die Daten aus ?
•Keine optimale
Tabellenverknüpfung und
Indizierung
„Fachleute“ als Datenbankdesigner
Tyisch für analoge Geodaten sind:
•Inkonsistenz:
Widersprüchlichkeit zwischen den Daten
•Inhomogenität:
Uneinheitlichkeit der Elemente einer
Menge
•Mehrdeutigkeit:
mehrere Bedeutungen eines Begriffes
oder Zeichens
• Redundanz:
Informationen in einer Informationsquelle
sind mehrfach vorhanden
Probleme mit Datenbankinhalten
Bergbau- und Rohstoffdatenbank
Teildatenbank Rohstoffe
Mehrdeutige Dateninhalte im
Feld „Nutzungskonflikte“
machen qualifizierte
Recherchen unmöglich
Bei nur 669 Datensätzen
erfolgte keine Evaluierung
der Dateninhalte !
Probleme mit Datenbankinhalten
Landesamt für Geologie und Bergwesen
Halle, den 16.04.2009
Bearbeitungsstand der Landesbohrdatenbank
Bearbeitungsstand: 05.03.2009
Erfasste Bohrungen:
190.855
Davon
Schichtdaten SEP1 insgesamt:
Schichtdaten SEP3 insgesamt:
1.511.178
163.534
Probleme mit Datenbankinhalten
Probleme mit Datenbankinhalten
Verschlüsselung mit SchichtenErfassungs-Programm (SEP 1)
+VT;
kgf-dc,ce,
bro4("q","fs",G:s,du:0.001),deu,ss,wl,ss
mm,bn(F:h,F:d),klfl("kao","ca","ch"),
Z:TZ(58.3-60.0,kao4-gr4,zg)
+VT-G(v);
kgm-kgg,ce
("fs","q",G:s),c4(duz:0.010.1,+Gp,^u,^s),bro4("q",duz:0.0010.002,ds-ml,"fs",duz:0.0010.005,F:hro,voe,duh:0.015),zt,+VT^b,ssmm(s),klv2,par,ss,klfl,"hm",^fs^gs-lag,zt,^u-lag
Probleme mit Datenbankinhalten
Inkonsistenz
Inhomogenität
Mehrdeutigkeit
Eine DV-technische
Überarbeitung ist
nur teilweise
möglich
Auflösung von zusammengefassten Schichten in Schicht und Unterschicht
Probleme mit Datenbankinhalten
SEP 3 ist kein Programm und
auch kein Dateiformat, sondern
die Beschreibung einer
Datenstruktur.
Auswertung ….?
Quo vadis Geodaten …
Auswege aus dem Datenchaos
multi-user Datenbanksystem
Umfangreiche Datenanalyse
Wer hat
Wer pflegt
Wer braucht
Wem nutzt
Maximale Datenintegration
Keine Mammutprojekte
sondern stufenweiser
Ausbau nach einem
Gesamtkonzept
•Neustrukturierung der Dateninhalte aus der
Perspektive der Datenrecherche
•Numerische Daten haben Vorrang vor
alphanumerischen Daten
•Kleinteilige Feldstrukturierungen
•Sinnvolle Auswahllisten
•Selbsterklärende Feld- und Tabellennamen
Take off in die schöne neue Geodatenwelt
Gegenseitige Information
Transparenz
Zusammenarbeit
Projektarbeit
Projektdiskussion
Datenanalyse
Datenevaluierung
Datenintegration
Datenbankentwicklung
Vielen Dank und gute Landung
Slide 15
Qualitätsanforderungen an Geodaten
von
Matthias Thomae
10. Zittauer Umweltsymposium 21.-22. April 2009 in Ostritz
1.
2.
3.
4.
5.
GLIEDERUNG
Bedeutung von Geodaten
Geodaten und Datenbanken
„Fachleute“ als Datenbankdesigner
Probleme mit Datenbankinhalten
Auswege aus dem Datenchaos
Bedeutung von Geodaten
… vor ca. 150 Jahren war das Wissen
über unsere Erde und der in und auf
ihr stattfindenden Prozesse
bescheiden
Geodaten gab es nicht flächendeckend,
wie die „weißen Flecken“ auf dem
Globus zeigen
Bibliotheksglobus, Berlin 1871
1871 veröffentlicht Darwin "The Descent of Man".
Bedeutung von Geodaten
Das Wissen ist in den letzten 150 Jahren exponentiell gewachsen
w issenschaftliche Veröffentlichungen
100
20000
90
18000
80
16000
70
14000
60
12000
Anzahl
Anzahl [Mio.]
Wissenschaftler
50
10000
40
8000
30
6000
20
4000
10
2000
0
0
1950
1850
1950
Jahr
2000
Jahr
2000
1880 kannte die Chemie 20 000 chemische Verbindungen, heute sind es ca. 17 Millionen
Bedeutung von Geodaten
Was sind eigentlich Geodaten ?
•Geodaten sind digitale Informationen, denen
eine bestimmte räumliche Lage zugewiesen
werden kann (Geoinformationen, Geobezug)
•Geodaten bestehen aus Geobasisdaten und
Geofachdaten, die aus unterschiedlichen
raumbezogenen Fachdatenbanken stammen
•Metadaten beschreiben die eigentlichen
räumlichen Daten hinsichtlich des Zeitbezugs
und der Datenquelle
•Geoinformationssystem dienen zur
Visualisierung und Recherche von Geodaten
Geodaten und Datenbanken
Informationen der analogen Geodaten
sind auf eine Ebene,
die statische Karte begrenzt
Informationen der digitalen
Geodaten sind theoretisch
unbegrenzt als dynamische Karte
dargestellt und sind mit
Sachdaten verbunden
Geodaten und Datenbanken
Komplexität und Variabilität der Geodaten
verlangt eine Datenhaltung in Datenbanken
Geodaten im Jahre 2009
Fläche 44 km² (9,4 km x 4,7 km)
27 Themen (Ebenen)
4 komplexe Datenbanken
136 Polygone (geologische Flächen)
Geodaten und Datenbanken
Computerbasierte datenverarbeitende Technologien revolutionieren alle
gesellschaftlichen Bereiche
Es gibt enorm effiziente Techniken, informationstragende Daten
zu speichern,
zu transportieren
und in neue Daten zu transformieren.
Alle gesellschaftlichen Bereiche sind gezwungen, sich so umzugestalten, dass in ihnen
die computerbasierten datenverarbeitenden Technologien genutzt werden können.
Völlig zu Unrecht wird dieser technologische und ökonomische Großtrend als Weg zur
"Wissens- und Kommunikationsgesellschaft" gefeiert.
In Wahrheit handelt es sich nicht um Wege zur Wissensgesellschaft,
sondern erst einmal nur um die Zwänge einer Gesellschaft
computerbasierte datenverarbeitende Technologien in allen
gesellschaftlichen Bereichen durchzusetzen.
Geodaten und Datenbanken
Strukturierte Ablage von Geodaten ist notwendig …
… ABER welches Datenbankmodell ?
•Hierarchisches Datenbankmodell ?
Datenobjekte stehen in einer Eltern-KindBeziehungen zueinander.
Netzwerkdatenbankmodell ?
Datenobjekte werden miteinander in
Netzen verbunden.
•Relationale Datenbank ?
Die Daten werden zeilenweise in Tabellen
verwaltet. Es kann beliebige Beziehungen
zwischen Daten geben.
•Objektdatenbank ?
Beziehungen zwischen Datenobjekten
werden vom Datenbanksystem selbst
verwaltet. Objekte können Eigenschaften
und Daten von anderen Objekten erben.
„Fachleute“ als Datenbankdesigner
meine Daten
mein Problem
meine Lösung
Individualsicht - Nutzersicht
single-user Datenbanksystem
•viele alphanumerische Felder
•zu geringe Aufgliederung der
Felder
•Tabellen- und Feldnamen sind
nur dem Entwickler verständlich
… und wie sehen eigentlich die Daten aus ?
•Keine optimale
Tabellenverknüpfung und
Indizierung
„Fachleute“ als Datenbankdesigner
Tyisch für analoge Geodaten sind:
•Inkonsistenz:
Widersprüchlichkeit zwischen den Daten
•Inhomogenität:
Uneinheitlichkeit der Elemente einer
Menge
•Mehrdeutigkeit:
mehrere Bedeutungen eines Begriffes
oder Zeichens
• Redundanz:
Informationen in einer Informationsquelle
sind mehrfach vorhanden
Probleme mit Datenbankinhalten
Bergbau- und Rohstoffdatenbank
Teildatenbank Rohstoffe
Mehrdeutige Dateninhalte im
Feld „Nutzungskonflikte“
machen qualifizierte
Recherchen unmöglich
Bei nur 669 Datensätzen
erfolgte keine Evaluierung
der Dateninhalte !
Probleme mit Datenbankinhalten
Landesamt für Geologie und Bergwesen
Halle, den 16.04.2009
Bearbeitungsstand der Landesbohrdatenbank
Bearbeitungsstand: 05.03.2009
Erfasste Bohrungen:
190.855
Davon
Schichtdaten SEP1 insgesamt:
Schichtdaten SEP3 insgesamt:
1.511.178
163.534
Probleme mit Datenbankinhalten
Probleme mit Datenbankinhalten
Verschlüsselung mit SchichtenErfassungs-Programm (SEP 1)
+VT;
kgf-dc,ce,
bro4("q","fs",G:s,du:0.001),deu,ss,wl,ss
mm,bn(F:h,F:d),klfl("kao","ca","ch"),
Z:TZ(58.3-60.0,kao4-gr4,zg)
+VT-G(v);
kgm-kgg,ce
("fs","q",G:s),c4(duz:0.010.1,+Gp,^u,^s),bro4("q",duz:0.0010.002,ds-ml,"fs",duz:0.0010.005,F:hro,voe,duh:0.015),zt,+VT^b,ssmm(s),klv2,par,ss,klfl,"hm",^fs^gs-lag,zt,^u-lag
Probleme mit Datenbankinhalten
Inkonsistenz
Inhomogenität
Mehrdeutigkeit
Eine DV-technische
Überarbeitung ist
nur teilweise
möglich
Auflösung von zusammengefassten Schichten in Schicht und Unterschicht
Probleme mit Datenbankinhalten
SEP 3 ist kein Programm und
auch kein Dateiformat, sondern
die Beschreibung einer
Datenstruktur.
Auswertung ….?
Quo vadis Geodaten …
Auswege aus dem Datenchaos
multi-user Datenbanksystem
Umfangreiche Datenanalyse
Wer hat
Wer pflegt
Wer braucht
Wem nutzt
Maximale Datenintegration
Keine Mammutprojekte
sondern stufenweiser
Ausbau nach einem
Gesamtkonzept
•Neustrukturierung der Dateninhalte aus der
Perspektive der Datenrecherche
•Numerische Daten haben Vorrang vor
alphanumerischen Daten
•Kleinteilige Feldstrukturierungen
•Sinnvolle Auswahllisten
•Selbsterklärende Feld- und Tabellennamen
Take off in die schöne neue Geodatenwelt
Gegenseitige Information
Transparenz
Zusammenarbeit
Projektarbeit
Projektdiskussion
Datenanalyse
Datenevaluierung
Datenintegration
Datenbankentwicklung
Vielen Dank und gute Landung
Slide 16
Qualitätsanforderungen an Geodaten
von
Matthias Thomae
10. Zittauer Umweltsymposium 21.-22. April 2009 in Ostritz
1.
2.
3.
4.
5.
GLIEDERUNG
Bedeutung von Geodaten
Geodaten und Datenbanken
„Fachleute“ als Datenbankdesigner
Probleme mit Datenbankinhalten
Auswege aus dem Datenchaos
Bedeutung von Geodaten
… vor ca. 150 Jahren war das Wissen
über unsere Erde und der in und auf
ihr stattfindenden Prozesse
bescheiden
Geodaten gab es nicht flächendeckend,
wie die „weißen Flecken“ auf dem
Globus zeigen
Bibliotheksglobus, Berlin 1871
1871 veröffentlicht Darwin "The Descent of Man".
Bedeutung von Geodaten
Das Wissen ist in den letzten 150 Jahren exponentiell gewachsen
w issenschaftliche Veröffentlichungen
100
20000
90
18000
80
16000
70
14000
60
12000
Anzahl
Anzahl [Mio.]
Wissenschaftler
50
10000
40
8000
30
6000
20
4000
10
2000
0
0
1950
1850
1950
Jahr
2000
Jahr
2000
1880 kannte die Chemie 20 000 chemische Verbindungen, heute sind es ca. 17 Millionen
Bedeutung von Geodaten
Was sind eigentlich Geodaten ?
•Geodaten sind digitale Informationen, denen
eine bestimmte räumliche Lage zugewiesen
werden kann (Geoinformationen, Geobezug)
•Geodaten bestehen aus Geobasisdaten und
Geofachdaten, die aus unterschiedlichen
raumbezogenen Fachdatenbanken stammen
•Metadaten beschreiben die eigentlichen
räumlichen Daten hinsichtlich des Zeitbezugs
und der Datenquelle
•Geoinformationssystem dienen zur
Visualisierung und Recherche von Geodaten
Geodaten und Datenbanken
Informationen der analogen Geodaten
sind auf eine Ebene,
die statische Karte begrenzt
Informationen der digitalen
Geodaten sind theoretisch
unbegrenzt als dynamische Karte
dargestellt und sind mit
Sachdaten verbunden
Geodaten und Datenbanken
Komplexität und Variabilität der Geodaten
verlangt eine Datenhaltung in Datenbanken
Geodaten im Jahre 2009
Fläche 44 km² (9,4 km x 4,7 km)
27 Themen (Ebenen)
4 komplexe Datenbanken
136 Polygone (geologische Flächen)
Geodaten und Datenbanken
Computerbasierte datenverarbeitende Technologien revolutionieren alle
gesellschaftlichen Bereiche
Es gibt enorm effiziente Techniken, informationstragende Daten
zu speichern,
zu transportieren
und in neue Daten zu transformieren.
Alle gesellschaftlichen Bereiche sind gezwungen, sich so umzugestalten, dass in ihnen
die computerbasierten datenverarbeitenden Technologien genutzt werden können.
Völlig zu Unrecht wird dieser technologische und ökonomische Großtrend als Weg zur
"Wissens- und Kommunikationsgesellschaft" gefeiert.
In Wahrheit handelt es sich nicht um Wege zur Wissensgesellschaft,
sondern erst einmal nur um die Zwänge einer Gesellschaft
computerbasierte datenverarbeitende Technologien in allen
gesellschaftlichen Bereichen durchzusetzen.
Geodaten und Datenbanken
Strukturierte Ablage von Geodaten ist notwendig …
… ABER welches Datenbankmodell ?
•Hierarchisches Datenbankmodell ?
Datenobjekte stehen in einer Eltern-KindBeziehungen zueinander.
Netzwerkdatenbankmodell ?
Datenobjekte werden miteinander in
Netzen verbunden.
•Relationale Datenbank ?
Die Daten werden zeilenweise in Tabellen
verwaltet. Es kann beliebige Beziehungen
zwischen Daten geben.
•Objektdatenbank ?
Beziehungen zwischen Datenobjekten
werden vom Datenbanksystem selbst
verwaltet. Objekte können Eigenschaften
und Daten von anderen Objekten erben.
„Fachleute“ als Datenbankdesigner
meine Daten
mein Problem
meine Lösung
Individualsicht - Nutzersicht
single-user Datenbanksystem
•viele alphanumerische Felder
•zu geringe Aufgliederung der
Felder
•Tabellen- und Feldnamen sind
nur dem Entwickler verständlich
… und wie sehen eigentlich die Daten aus ?
•Keine optimale
Tabellenverknüpfung und
Indizierung
„Fachleute“ als Datenbankdesigner
Tyisch für analoge Geodaten sind:
•Inkonsistenz:
Widersprüchlichkeit zwischen den Daten
•Inhomogenität:
Uneinheitlichkeit der Elemente einer
Menge
•Mehrdeutigkeit:
mehrere Bedeutungen eines Begriffes
oder Zeichens
• Redundanz:
Informationen in einer Informationsquelle
sind mehrfach vorhanden
Probleme mit Datenbankinhalten
Bergbau- und Rohstoffdatenbank
Teildatenbank Rohstoffe
Mehrdeutige Dateninhalte im
Feld „Nutzungskonflikte“
machen qualifizierte
Recherchen unmöglich
Bei nur 669 Datensätzen
erfolgte keine Evaluierung
der Dateninhalte !
Probleme mit Datenbankinhalten
Landesamt für Geologie und Bergwesen
Halle, den 16.04.2009
Bearbeitungsstand der Landesbohrdatenbank
Bearbeitungsstand: 05.03.2009
Erfasste Bohrungen:
190.855
Davon
Schichtdaten SEP1 insgesamt:
Schichtdaten SEP3 insgesamt:
1.511.178
163.534
Probleme mit Datenbankinhalten
Probleme mit Datenbankinhalten
Verschlüsselung mit SchichtenErfassungs-Programm (SEP 1)
+VT;
kgf-dc,ce,
bro4("q","fs",G:s,du:0.001),deu,ss,wl,ss
mm,bn(F:h,F:d),klfl("kao","ca","ch"),
Z:TZ(58.3-60.0,kao4-gr4,zg)
+VT-G(v);
kgm-kgg,ce
("fs","q",G:s),c4(duz:0.010.1,+Gp,^u,^s),bro4("q",duz:0.0010.002,ds-ml,"fs",duz:0.0010.005,F:hro,voe,duh:0.015),zt,+VT^b,ssmm(s),klv2,par,ss,klfl,"hm",^fs^gs-lag,zt,^u-lag
Probleme mit Datenbankinhalten
Inkonsistenz
Inhomogenität
Mehrdeutigkeit
Eine DV-technische
Überarbeitung ist
nur teilweise
möglich
Auflösung von zusammengefassten Schichten in Schicht und Unterschicht
Probleme mit Datenbankinhalten
SEP 3 ist kein Programm und
auch kein Dateiformat, sondern
die Beschreibung einer
Datenstruktur.
Auswertung ….?
Quo vadis Geodaten …
Auswege aus dem Datenchaos
multi-user Datenbanksystem
Umfangreiche Datenanalyse
Wer hat
Wer pflegt
Wer braucht
Wem nutzt
Maximale Datenintegration
Keine Mammutprojekte
sondern stufenweiser
Ausbau nach einem
Gesamtkonzept
•Neustrukturierung der Dateninhalte aus der
Perspektive der Datenrecherche
•Numerische Daten haben Vorrang vor
alphanumerischen Daten
•Kleinteilige Feldstrukturierungen
•Sinnvolle Auswahllisten
•Selbsterklärende Feld- und Tabellennamen
Take off in die schöne neue Geodatenwelt
Gegenseitige Information
Transparenz
Zusammenarbeit
Projektarbeit
Projektdiskussion
Datenanalyse
Datenevaluierung
Datenintegration
Datenbankentwicklung
Vielen Dank und gute Landung
Slide 17
Qualitätsanforderungen an Geodaten
von
Matthias Thomae
10. Zittauer Umweltsymposium 21.-22. April 2009 in Ostritz
1.
2.
3.
4.
5.
GLIEDERUNG
Bedeutung von Geodaten
Geodaten und Datenbanken
„Fachleute“ als Datenbankdesigner
Probleme mit Datenbankinhalten
Auswege aus dem Datenchaos
Bedeutung von Geodaten
… vor ca. 150 Jahren war das Wissen
über unsere Erde und der in und auf
ihr stattfindenden Prozesse
bescheiden
Geodaten gab es nicht flächendeckend,
wie die „weißen Flecken“ auf dem
Globus zeigen
Bibliotheksglobus, Berlin 1871
1871 veröffentlicht Darwin "The Descent of Man".
Bedeutung von Geodaten
Das Wissen ist in den letzten 150 Jahren exponentiell gewachsen
w issenschaftliche Veröffentlichungen
100
20000
90
18000
80
16000
70
14000
60
12000
Anzahl
Anzahl [Mio.]
Wissenschaftler
50
10000
40
8000
30
6000
20
4000
10
2000
0
0
1950
1850
1950
Jahr
2000
Jahr
2000
1880 kannte die Chemie 20 000 chemische Verbindungen, heute sind es ca. 17 Millionen
Bedeutung von Geodaten
Was sind eigentlich Geodaten ?
•Geodaten sind digitale Informationen, denen
eine bestimmte räumliche Lage zugewiesen
werden kann (Geoinformationen, Geobezug)
•Geodaten bestehen aus Geobasisdaten und
Geofachdaten, die aus unterschiedlichen
raumbezogenen Fachdatenbanken stammen
•Metadaten beschreiben die eigentlichen
räumlichen Daten hinsichtlich des Zeitbezugs
und der Datenquelle
•Geoinformationssystem dienen zur
Visualisierung und Recherche von Geodaten
Geodaten und Datenbanken
Informationen der analogen Geodaten
sind auf eine Ebene,
die statische Karte begrenzt
Informationen der digitalen
Geodaten sind theoretisch
unbegrenzt als dynamische Karte
dargestellt und sind mit
Sachdaten verbunden
Geodaten und Datenbanken
Komplexität und Variabilität der Geodaten
verlangt eine Datenhaltung in Datenbanken
Geodaten im Jahre 2009
Fläche 44 km² (9,4 km x 4,7 km)
27 Themen (Ebenen)
4 komplexe Datenbanken
136 Polygone (geologische Flächen)
Geodaten und Datenbanken
Computerbasierte datenverarbeitende Technologien revolutionieren alle
gesellschaftlichen Bereiche
Es gibt enorm effiziente Techniken, informationstragende Daten
zu speichern,
zu transportieren
und in neue Daten zu transformieren.
Alle gesellschaftlichen Bereiche sind gezwungen, sich so umzugestalten, dass in ihnen
die computerbasierten datenverarbeitenden Technologien genutzt werden können.
Völlig zu Unrecht wird dieser technologische und ökonomische Großtrend als Weg zur
"Wissens- und Kommunikationsgesellschaft" gefeiert.
In Wahrheit handelt es sich nicht um Wege zur Wissensgesellschaft,
sondern erst einmal nur um die Zwänge einer Gesellschaft
computerbasierte datenverarbeitende Technologien in allen
gesellschaftlichen Bereichen durchzusetzen.
Geodaten und Datenbanken
Strukturierte Ablage von Geodaten ist notwendig …
… ABER welches Datenbankmodell ?
•Hierarchisches Datenbankmodell ?
Datenobjekte stehen in einer Eltern-KindBeziehungen zueinander.
Netzwerkdatenbankmodell ?
Datenobjekte werden miteinander in
Netzen verbunden.
•Relationale Datenbank ?
Die Daten werden zeilenweise in Tabellen
verwaltet. Es kann beliebige Beziehungen
zwischen Daten geben.
•Objektdatenbank ?
Beziehungen zwischen Datenobjekten
werden vom Datenbanksystem selbst
verwaltet. Objekte können Eigenschaften
und Daten von anderen Objekten erben.
„Fachleute“ als Datenbankdesigner
meine Daten
mein Problem
meine Lösung
Individualsicht - Nutzersicht
single-user Datenbanksystem
•viele alphanumerische Felder
•zu geringe Aufgliederung der
Felder
•Tabellen- und Feldnamen sind
nur dem Entwickler verständlich
… und wie sehen eigentlich die Daten aus ?
•Keine optimale
Tabellenverknüpfung und
Indizierung
„Fachleute“ als Datenbankdesigner
Tyisch für analoge Geodaten sind:
•Inkonsistenz:
Widersprüchlichkeit zwischen den Daten
•Inhomogenität:
Uneinheitlichkeit der Elemente einer
Menge
•Mehrdeutigkeit:
mehrere Bedeutungen eines Begriffes
oder Zeichens
• Redundanz:
Informationen in einer Informationsquelle
sind mehrfach vorhanden
Probleme mit Datenbankinhalten
Bergbau- und Rohstoffdatenbank
Teildatenbank Rohstoffe
Mehrdeutige Dateninhalte im
Feld „Nutzungskonflikte“
machen qualifizierte
Recherchen unmöglich
Bei nur 669 Datensätzen
erfolgte keine Evaluierung
der Dateninhalte !
Probleme mit Datenbankinhalten
Landesamt für Geologie und Bergwesen
Halle, den 16.04.2009
Bearbeitungsstand der Landesbohrdatenbank
Bearbeitungsstand: 05.03.2009
Erfasste Bohrungen:
190.855
Davon
Schichtdaten SEP1 insgesamt:
Schichtdaten SEP3 insgesamt:
1.511.178
163.534
Probleme mit Datenbankinhalten
Probleme mit Datenbankinhalten
Verschlüsselung mit SchichtenErfassungs-Programm (SEP 1)
+VT;
kgf-dc,ce,
bro4("q","fs",G:s,du:0.001),deu,ss,wl,ss
mm,bn(F:h,F:d),klfl("kao","ca","ch"),
Z:TZ(58.3-60.0,kao4-gr4,zg)
+VT-G(v);
kgm-kgg,ce
("fs","q",G:s),c4(duz:0.010.1,+Gp,^u,^s),bro4("q",duz:0.0010.002,ds-ml,"fs",duz:0.0010.005,F:hro,voe,duh:0.015),zt,+VT^b,ssmm(s),klv2,par,ss,klfl,"hm",^fs^gs-lag,zt,^u-lag
Probleme mit Datenbankinhalten
Inkonsistenz
Inhomogenität
Mehrdeutigkeit
Eine DV-technische
Überarbeitung ist
nur teilweise
möglich
Auflösung von zusammengefassten Schichten in Schicht und Unterschicht
Probleme mit Datenbankinhalten
SEP 3 ist kein Programm und
auch kein Dateiformat, sondern
die Beschreibung einer
Datenstruktur.
Auswertung ….?
Quo vadis Geodaten …
Auswege aus dem Datenchaos
multi-user Datenbanksystem
Umfangreiche Datenanalyse
Wer hat
Wer pflegt
Wer braucht
Wem nutzt
Maximale Datenintegration
Keine Mammutprojekte
sondern stufenweiser
Ausbau nach einem
Gesamtkonzept
•Neustrukturierung der Dateninhalte aus der
Perspektive der Datenrecherche
•Numerische Daten haben Vorrang vor
alphanumerischen Daten
•Kleinteilige Feldstrukturierungen
•Sinnvolle Auswahllisten
•Selbsterklärende Feld- und Tabellennamen
Take off in die schöne neue Geodatenwelt
Gegenseitige Information
Transparenz
Zusammenarbeit
Projektarbeit
Projektdiskussion
Datenanalyse
Datenevaluierung
Datenintegration
Datenbankentwicklung
Vielen Dank und gute Landung
Slide 18
Qualitätsanforderungen an Geodaten
von
Matthias Thomae
10. Zittauer Umweltsymposium 21.-22. April 2009 in Ostritz
1.
2.
3.
4.
5.
GLIEDERUNG
Bedeutung von Geodaten
Geodaten und Datenbanken
„Fachleute“ als Datenbankdesigner
Probleme mit Datenbankinhalten
Auswege aus dem Datenchaos
Bedeutung von Geodaten
… vor ca. 150 Jahren war das Wissen
über unsere Erde und der in und auf
ihr stattfindenden Prozesse
bescheiden
Geodaten gab es nicht flächendeckend,
wie die „weißen Flecken“ auf dem
Globus zeigen
Bibliotheksglobus, Berlin 1871
1871 veröffentlicht Darwin "The Descent of Man".
Bedeutung von Geodaten
Das Wissen ist in den letzten 150 Jahren exponentiell gewachsen
w issenschaftliche Veröffentlichungen
100
20000
90
18000
80
16000
70
14000
60
12000
Anzahl
Anzahl [Mio.]
Wissenschaftler
50
10000
40
8000
30
6000
20
4000
10
2000
0
0
1950
1850
1950
Jahr
2000
Jahr
2000
1880 kannte die Chemie 20 000 chemische Verbindungen, heute sind es ca. 17 Millionen
Bedeutung von Geodaten
Was sind eigentlich Geodaten ?
•Geodaten sind digitale Informationen, denen
eine bestimmte räumliche Lage zugewiesen
werden kann (Geoinformationen, Geobezug)
•Geodaten bestehen aus Geobasisdaten und
Geofachdaten, die aus unterschiedlichen
raumbezogenen Fachdatenbanken stammen
•Metadaten beschreiben die eigentlichen
räumlichen Daten hinsichtlich des Zeitbezugs
und der Datenquelle
•Geoinformationssystem dienen zur
Visualisierung und Recherche von Geodaten
Geodaten und Datenbanken
Informationen der analogen Geodaten
sind auf eine Ebene,
die statische Karte begrenzt
Informationen der digitalen
Geodaten sind theoretisch
unbegrenzt als dynamische Karte
dargestellt und sind mit
Sachdaten verbunden
Geodaten und Datenbanken
Komplexität und Variabilität der Geodaten
verlangt eine Datenhaltung in Datenbanken
Geodaten im Jahre 2009
Fläche 44 km² (9,4 km x 4,7 km)
27 Themen (Ebenen)
4 komplexe Datenbanken
136 Polygone (geologische Flächen)
Geodaten und Datenbanken
Computerbasierte datenverarbeitende Technologien revolutionieren alle
gesellschaftlichen Bereiche
Es gibt enorm effiziente Techniken, informationstragende Daten
zu speichern,
zu transportieren
und in neue Daten zu transformieren.
Alle gesellschaftlichen Bereiche sind gezwungen, sich so umzugestalten, dass in ihnen
die computerbasierten datenverarbeitenden Technologien genutzt werden können.
Völlig zu Unrecht wird dieser technologische und ökonomische Großtrend als Weg zur
"Wissens- und Kommunikationsgesellschaft" gefeiert.
In Wahrheit handelt es sich nicht um Wege zur Wissensgesellschaft,
sondern erst einmal nur um die Zwänge einer Gesellschaft
computerbasierte datenverarbeitende Technologien in allen
gesellschaftlichen Bereichen durchzusetzen.
Geodaten und Datenbanken
Strukturierte Ablage von Geodaten ist notwendig …
… ABER welches Datenbankmodell ?
•Hierarchisches Datenbankmodell ?
Datenobjekte stehen in einer Eltern-KindBeziehungen zueinander.
Netzwerkdatenbankmodell ?
Datenobjekte werden miteinander in
Netzen verbunden.
•Relationale Datenbank ?
Die Daten werden zeilenweise in Tabellen
verwaltet. Es kann beliebige Beziehungen
zwischen Daten geben.
•Objektdatenbank ?
Beziehungen zwischen Datenobjekten
werden vom Datenbanksystem selbst
verwaltet. Objekte können Eigenschaften
und Daten von anderen Objekten erben.
„Fachleute“ als Datenbankdesigner
meine Daten
mein Problem
meine Lösung
Individualsicht - Nutzersicht
single-user Datenbanksystem
•viele alphanumerische Felder
•zu geringe Aufgliederung der
Felder
•Tabellen- und Feldnamen sind
nur dem Entwickler verständlich
… und wie sehen eigentlich die Daten aus ?
•Keine optimale
Tabellenverknüpfung und
Indizierung
„Fachleute“ als Datenbankdesigner
Tyisch für analoge Geodaten sind:
•Inkonsistenz:
Widersprüchlichkeit zwischen den Daten
•Inhomogenität:
Uneinheitlichkeit der Elemente einer
Menge
•Mehrdeutigkeit:
mehrere Bedeutungen eines Begriffes
oder Zeichens
• Redundanz:
Informationen in einer Informationsquelle
sind mehrfach vorhanden
Probleme mit Datenbankinhalten
Bergbau- und Rohstoffdatenbank
Teildatenbank Rohstoffe
Mehrdeutige Dateninhalte im
Feld „Nutzungskonflikte“
machen qualifizierte
Recherchen unmöglich
Bei nur 669 Datensätzen
erfolgte keine Evaluierung
der Dateninhalte !
Probleme mit Datenbankinhalten
Landesamt für Geologie und Bergwesen
Halle, den 16.04.2009
Bearbeitungsstand der Landesbohrdatenbank
Bearbeitungsstand: 05.03.2009
Erfasste Bohrungen:
190.855
Davon
Schichtdaten SEP1 insgesamt:
Schichtdaten SEP3 insgesamt:
1.511.178
163.534
Probleme mit Datenbankinhalten
Probleme mit Datenbankinhalten
Verschlüsselung mit SchichtenErfassungs-Programm (SEP 1)
+VT;
kgf-dc,ce,
bro4("q","fs",G:s,du:0.001),deu,ss,wl,ss
mm,bn(F:h,F:d),klfl("kao","ca","ch"),
Z:TZ(58.3-60.0,kao4-gr4,zg)
+VT-G(v);
kgm-kgg,ce
("fs","q",G:s),c4(duz:0.010.1,+Gp,^u,^s),bro4("q",duz:0.0010.002,ds-ml,"fs",duz:0.0010.005,F:hro,voe,duh:0.015),zt,+VT^b,ssmm(s),klv2,par,ss,klfl,"hm",^fs^gs-lag,zt,^u-lag
Probleme mit Datenbankinhalten
Inkonsistenz
Inhomogenität
Mehrdeutigkeit
Eine DV-technische
Überarbeitung ist
nur teilweise
möglich
Auflösung von zusammengefassten Schichten in Schicht und Unterschicht
Probleme mit Datenbankinhalten
SEP 3 ist kein Programm und
auch kein Dateiformat, sondern
die Beschreibung einer
Datenstruktur.
Auswertung ….?
Quo vadis Geodaten …
Auswege aus dem Datenchaos
multi-user Datenbanksystem
Umfangreiche Datenanalyse
Wer hat
Wer pflegt
Wer braucht
Wem nutzt
Maximale Datenintegration
Keine Mammutprojekte
sondern stufenweiser
Ausbau nach einem
Gesamtkonzept
•Neustrukturierung der Dateninhalte aus der
Perspektive der Datenrecherche
•Numerische Daten haben Vorrang vor
alphanumerischen Daten
•Kleinteilige Feldstrukturierungen
•Sinnvolle Auswahllisten
•Selbsterklärende Feld- und Tabellennamen
Take off in die schöne neue Geodatenwelt
Gegenseitige Information
Transparenz
Zusammenarbeit
Projektarbeit
Projektdiskussion
Datenanalyse
Datenevaluierung
Datenintegration
Datenbankentwicklung
Vielen Dank und gute Landung
Slide 19
Qualitätsanforderungen an Geodaten
von
Matthias Thomae
10. Zittauer Umweltsymposium 21.-22. April 2009 in Ostritz
1.
2.
3.
4.
5.
GLIEDERUNG
Bedeutung von Geodaten
Geodaten und Datenbanken
„Fachleute“ als Datenbankdesigner
Probleme mit Datenbankinhalten
Auswege aus dem Datenchaos
Bedeutung von Geodaten
… vor ca. 150 Jahren war das Wissen
über unsere Erde und der in und auf
ihr stattfindenden Prozesse
bescheiden
Geodaten gab es nicht flächendeckend,
wie die „weißen Flecken“ auf dem
Globus zeigen
Bibliotheksglobus, Berlin 1871
1871 veröffentlicht Darwin "The Descent of Man".
Bedeutung von Geodaten
Das Wissen ist in den letzten 150 Jahren exponentiell gewachsen
w issenschaftliche Veröffentlichungen
100
20000
90
18000
80
16000
70
14000
60
12000
Anzahl
Anzahl [Mio.]
Wissenschaftler
50
10000
40
8000
30
6000
20
4000
10
2000
0
0
1950
1850
1950
Jahr
2000
Jahr
2000
1880 kannte die Chemie 20 000 chemische Verbindungen, heute sind es ca. 17 Millionen
Bedeutung von Geodaten
Was sind eigentlich Geodaten ?
•Geodaten sind digitale Informationen, denen
eine bestimmte räumliche Lage zugewiesen
werden kann (Geoinformationen, Geobezug)
•Geodaten bestehen aus Geobasisdaten und
Geofachdaten, die aus unterschiedlichen
raumbezogenen Fachdatenbanken stammen
•Metadaten beschreiben die eigentlichen
räumlichen Daten hinsichtlich des Zeitbezugs
und der Datenquelle
•Geoinformationssystem dienen zur
Visualisierung und Recherche von Geodaten
Geodaten und Datenbanken
Informationen der analogen Geodaten
sind auf eine Ebene,
die statische Karte begrenzt
Informationen der digitalen
Geodaten sind theoretisch
unbegrenzt als dynamische Karte
dargestellt und sind mit
Sachdaten verbunden
Geodaten und Datenbanken
Komplexität und Variabilität der Geodaten
verlangt eine Datenhaltung in Datenbanken
Geodaten im Jahre 2009
Fläche 44 km² (9,4 km x 4,7 km)
27 Themen (Ebenen)
4 komplexe Datenbanken
136 Polygone (geologische Flächen)
Geodaten und Datenbanken
Computerbasierte datenverarbeitende Technologien revolutionieren alle
gesellschaftlichen Bereiche
Es gibt enorm effiziente Techniken, informationstragende Daten
zu speichern,
zu transportieren
und in neue Daten zu transformieren.
Alle gesellschaftlichen Bereiche sind gezwungen, sich so umzugestalten, dass in ihnen
die computerbasierten datenverarbeitenden Technologien genutzt werden können.
Völlig zu Unrecht wird dieser technologische und ökonomische Großtrend als Weg zur
"Wissens- und Kommunikationsgesellschaft" gefeiert.
In Wahrheit handelt es sich nicht um Wege zur Wissensgesellschaft,
sondern erst einmal nur um die Zwänge einer Gesellschaft
computerbasierte datenverarbeitende Technologien in allen
gesellschaftlichen Bereichen durchzusetzen.
Geodaten und Datenbanken
Strukturierte Ablage von Geodaten ist notwendig …
… ABER welches Datenbankmodell ?
•Hierarchisches Datenbankmodell ?
Datenobjekte stehen in einer Eltern-KindBeziehungen zueinander.
Netzwerkdatenbankmodell ?
Datenobjekte werden miteinander in
Netzen verbunden.
•Relationale Datenbank ?
Die Daten werden zeilenweise in Tabellen
verwaltet. Es kann beliebige Beziehungen
zwischen Daten geben.
•Objektdatenbank ?
Beziehungen zwischen Datenobjekten
werden vom Datenbanksystem selbst
verwaltet. Objekte können Eigenschaften
und Daten von anderen Objekten erben.
„Fachleute“ als Datenbankdesigner
meine Daten
mein Problem
meine Lösung
Individualsicht - Nutzersicht
single-user Datenbanksystem
•viele alphanumerische Felder
•zu geringe Aufgliederung der
Felder
•Tabellen- und Feldnamen sind
nur dem Entwickler verständlich
… und wie sehen eigentlich die Daten aus ?
•Keine optimale
Tabellenverknüpfung und
Indizierung
„Fachleute“ als Datenbankdesigner
Tyisch für analoge Geodaten sind:
•Inkonsistenz:
Widersprüchlichkeit zwischen den Daten
•Inhomogenität:
Uneinheitlichkeit der Elemente einer
Menge
•Mehrdeutigkeit:
mehrere Bedeutungen eines Begriffes
oder Zeichens
• Redundanz:
Informationen in einer Informationsquelle
sind mehrfach vorhanden
Probleme mit Datenbankinhalten
Bergbau- und Rohstoffdatenbank
Teildatenbank Rohstoffe
Mehrdeutige Dateninhalte im
Feld „Nutzungskonflikte“
machen qualifizierte
Recherchen unmöglich
Bei nur 669 Datensätzen
erfolgte keine Evaluierung
der Dateninhalte !
Probleme mit Datenbankinhalten
Landesamt für Geologie und Bergwesen
Halle, den 16.04.2009
Bearbeitungsstand der Landesbohrdatenbank
Bearbeitungsstand: 05.03.2009
Erfasste Bohrungen:
190.855
Davon
Schichtdaten SEP1 insgesamt:
Schichtdaten SEP3 insgesamt:
1.511.178
163.534
Probleme mit Datenbankinhalten
Probleme mit Datenbankinhalten
Verschlüsselung mit SchichtenErfassungs-Programm (SEP 1)
+VT;
kgf-dc,ce,
bro4("q","fs",G:s,du:0.001),deu,ss,wl,ss
mm,bn(F:h,F:d),klfl("kao","ca","ch"),
Z:TZ(58.3-60.0,kao4-gr4,zg)
+VT-G(v);
kgm-kgg,ce
("fs","q",G:s),c4(duz:0.010.1,+Gp,^u,^s),bro4("q",duz:0.0010.002,ds-ml,"fs",duz:0.0010.005,F:hro,voe,duh:0.015),zt,+VT^b,ssmm(s),klv2,par,ss,klfl,"hm",^fs^gs-lag,zt,^u-lag
Probleme mit Datenbankinhalten
Inkonsistenz
Inhomogenität
Mehrdeutigkeit
Eine DV-technische
Überarbeitung ist
nur teilweise
möglich
Auflösung von zusammengefassten Schichten in Schicht und Unterschicht
Probleme mit Datenbankinhalten
SEP 3 ist kein Programm und
auch kein Dateiformat, sondern
die Beschreibung einer
Datenstruktur.
Auswertung ….?
Quo vadis Geodaten …
Auswege aus dem Datenchaos
multi-user Datenbanksystem
Umfangreiche Datenanalyse
Wer hat
Wer pflegt
Wer braucht
Wem nutzt
Maximale Datenintegration
Keine Mammutprojekte
sondern stufenweiser
Ausbau nach einem
Gesamtkonzept
•Neustrukturierung der Dateninhalte aus der
Perspektive der Datenrecherche
•Numerische Daten haben Vorrang vor
alphanumerischen Daten
•Kleinteilige Feldstrukturierungen
•Sinnvolle Auswahllisten
•Selbsterklärende Feld- und Tabellennamen
Take off in die schöne neue Geodatenwelt
Gegenseitige Information
Transparenz
Zusammenarbeit
Projektarbeit
Projektdiskussion
Datenanalyse
Datenevaluierung
Datenintegration
Datenbankentwicklung
Vielen Dank und gute Landung
Qualitätsanforderungen an Geodaten
von
Matthias Thomae
10. Zittauer Umweltsymposium 21.-22. April 2009 in Ostritz
1.
2.
3.
4.
5.
GLIEDERUNG
Bedeutung von Geodaten
Geodaten und Datenbanken
„Fachleute“ als Datenbankdesigner
Probleme mit Datenbankinhalten
Auswege aus dem Datenchaos
Bedeutung von Geodaten
… vor ca. 150 Jahren war das Wissen
über unsere Erde und der in und auf
ihr stattfindenden Prozesse
bescheiden
Geodaten gab es nicht flächendeckend,
wie die „weißen Flecken“ auf dem
Globus zeigen
Bibliotheksglobus, Berlin 1871
1871 veröffentlicht Darwin "The Descent of Man".
Bedeutung von Geodaten
Das Wissen ist in den letzten 150 Jahren exponentiell gewachsen
w issenschaftliche Veröffentlichungen
100
20000
90
18000
80
16000
70
14000
60
12000
Anzahl
Anzahl [Mio.]
Wissenschaftler
50
10000
40
8000
30
6000
20
4000
10
2000
0
0
1950
1850
1950
Jahr
2000
Jahr
2000
1880 kannte die Chemie 20 000 chemische Verbindungen, heute sind es ca. 17 Millionen
Bedeutung von Geodaten
Was sind eigentlich Geodaten ?
•Geodaten sind digitale Informationen, denen
eine bestimmte räumliche Lage zugewiesen
werden kann (Geoinformationen, Geobezug)
•Geodaten bestehen aus Geobasisdaten und
Geofachdaten, die aus unterschiedlichen
raumbezogenen Fachdatenbanken stammen
•Metadaten beschreiben die eigentlichen
räumlichen Daten hinsichtlich des Zeitbezugs
und der Datenquelle
•Geoinformationssystem dienen zur
Visualisierung und Recherche von Geodaten
Geodaten und Datenbanken
Informationen der analogen Geodaten
sind auf eine Ebene,
die statische Karte begrenzt
Informationen der digitalen
Geodaten sind theoretisch
unbegrenzt als dynamische Karte
dargestellt und sind mit
Sachdaten verbunden
Geodaten und Datenbanken
Komplexität und Variabilität der Geodaten
verlangt eine Datenhaltung in Datenbanken
Geodaten im Jahre 2009
Fläche 44 km² (9,4 km x 4,7 km)
27 Themen (Ebenen)
4 komplexe Datenbanken
136 Polygone (geologische Flächen)
Geodaten und Datenbanken
Computerbasierte datenverarbeitende Technologien revolutionieren alle
gesellschaftlichen Bereiche
Es gibt enorm effiziente Techniken, informationstragende Daten
zu speichern,
zu transportieren
und in neue Daten zu transformieren.
Alle gesellschaftlichen Bereiche sind gezwungen, sich so umzugestalten, dass in ihnen
die computerbasierten datenverarbeitenden Technologien genutzt werden können.
Völlig zu Unrecht wird dieser technologische und ökonomische Großtrend als Weg zur
"Wissens- und Kommunikationsgesellschaft" gefeiert.
In Wahrheit handelt es sich nicht um Wege zur Wissensgesellschaft,
sondern erst einmal nur um die Zwänge einer Gesellschaft
computerbasierte datenverarbeitende Technologien in allen
gesellschaftlichen Bereichen durchzusetzen.
Geodaten und Datenbanken
Strukturierte Ablage von Geodaten ist notwendig …
… ABER welches Datenbankmodell ?
•Hierarchisches Datenbankmodell ?
Datenobjekte stehen in einer Eltern-KindBeziehungen zueinander.
Netzwerkdatenbankmodell ?
Datenobjekte werden miteinander in
Netzen verbunden.
•Relationale Datenbank ?
Die Daten werden zeilenweise in Tabellen
verwaltet. Es kann beliebige Beziehungen
zwischen Daten geben.
•Objektdatenbank ?
Beziehungen zwischen Datenobjekten
werden vom Datenbanksystem selbst
verwaltet. Objekte können Eigenschaften
und Daten von anderen Objekten erben.
„Fachleute“ als Datenbankdesigner
meine Daten
mein Problem
meine Lösung
Individualsicht - Nutzersicht
single-user Datenbanksystem
•viele alphanumerische Felder
•zu geringe Aufgliederung der
Felder
•Tabellen- und Feldnamen sind
nur dem Entwickler verständlich
… und wie sehen eigentlich die Daten aus ?
•Keine optimale
Tabellenverknüpfung und
Indizierung
„Fachleute“ als Datenbankdesigner
Tyisch für analoge Geodaten sind:
•Inkonsistenz:
Widersprüchlichkeit zwischen den Daten
•Inhomogenität:
Uneinheitlichkeit der Elemente einer
Menge
•Mehrdeutigkeit:
mehrere Bedeutungen eines Begriffes
oder Zeichens
• Redundanz:
Informationen in einer Informationsquelle
sind mehrfach vorhanden
Probleme mit Datenbankinhalten
Bergbau- und Rohstoffdatenbank
Teildatenbank Rohstoffe
Mehrdeutige Dateninhalte im
Feld „Nutzungskonflikte“
machen qualifizierte
Recherchen unmöglich
Bei nur 669 Datensätzen
erfolgte keine Evaluierung
der Dateninhalte !
Probleme mit Datenbankinhalten
Landesamt für Geologie und Bergwesen
Halle, den 16.04.2009
Bearbeitungsstand der Landesbohrdatenbank
Bearbeitungsstand: 05.03.2009
Erfasste Bohrungen:
190.855
Davon
Schichtdaten SEP1 insgesamt:
Schichtdaten SEP3 insgesamt:
1.511.178
163.534
Probleme mit Datenbankinhalten
Probleme mit Datenbankinhalten
Verschlüsselung mit SchichtenErfassungs-Programm (SEP 1)
+VT;
kgf-dc,ce,
bro4("q","fs",G:s,du:0.001),deu,ss,wl,ss
mm,bn(F:h,F:d),klfl("kao","ca","ch"),
Z:TZ(58.3-60.0,kao4-gr4,zg)
+VT-G(v);
kgm-kgg,ce
("fs","q",G:s),c4(duz:0.010.1,+Gp,^u,^s),bro4("q",duz:0.0010.002,ds-ml,"fs",duz:0.0010.005,F:hro,voe,duh:0.015),zt,+VT^b,ssmm(s),klv2,par,ss,klfl,"hm",^fs^gs-lag,zt,^u-lag
Probleme mit Datenbankinhalten
Inkonsistenz
Inhomogenität
Mehrdeutigkeit
Eine DV-technische
Überarbeitung ist
nur teilweise
möglich
Auflösung von zusammengefassten Schichten in Schicht und Unterschicht
Probleme mit Datenbankinhalten
SEP 3 ist kein Programm und
auch kein Dateiformat, sondern
die Beschreibung einer
Datenstruktur.
Auswertung ….?
Quo vadis Geodaten …
Auswege aus dem Datenchaos
multi-user Datenbanksystem
Umfangreiche Datenanalyse
Wer hat
Wer pflegt
Wer braucht
Wem nutzt
Maximale Datenintegration
Keine Mammutprojekte
sondern stufenweiser
Ausbau nach einem
Gesamtkonzept
•Neustrukturierung der Dateninhalte aus der
Perspektive der Datenrecherche
•Numerische Daten haben Vorrang vor
alphanumerischen Daten
•Kleinteilige Feldstrukturierungen
•Sinnvolle Auswahllisten
•Selbsterklärende Feld- und Tabellennamen
Take off in die schöne neue Geodatenwelt
Gegenseitige Information
Transparenz
Zusammenarbeit
Projektarbeit
Projektdiskussion
Datenanalyse
Datenevaluierung
Datenintegration
Datenbankentwicklung
Vielen Dank und gute Landung
Slide 2
Qualitätsanforderungen an Geodaten
von
Matthias Thomae
10. Zittauer Umweltsymposium 21.-22. April 2009 in Ostritz
1.
2.
3.
4.
5.
GLIEDERUNG
Bedeutung von Geodaten
Geodaten und Datenbanken
„Fachleute“ als Datenbankdesigner
Probleme mit Datenbankinhalten
Auswege aus dem Datenchaos
Bedeutung von Geodaten
… vor ca. 150 Jahren war das Wissen
über unsere Erde und der in und auf
ihr stattfindenden Prozesse
bescheiden
Geodaten gab es nicht flächendeckend,
wie die „weißen Flecken“ auf dem
Globus zeigen
Bibliotheksglobus, Berlin 1871
1871 veröffentlicht Darwin "The Descent of Man".
Bedeutung von Geodaten
Das Wissen ist in den letzten 150 Jahren exponentiell gewachsen
w issenschaftliche Veröffentlichungen
100
20000
90
18000
80
16000
70
14000
60
12000
Anzahl
Anzahl [Mio.]
Wissenschaftler
50
10000
40
8000
30
6000
20
4000
10
2000
0
0
1950
1850
1950
Jahr
2000
Jahr
2000
1880 kannte die Chemie 20 000 chemische Verbindungen, heute sind es ca. 17 Millionen
Bedeutung von Geodaten
Was sind eigentlich Geodaten ?
•Geodaten sind digitale Informationen, denen
eine bestimmte räumliche Lage zugewiesen
werden kann (Geoinformationen, Geobezug)
•Geodaten bestehen aus Geobasisdaten und
Geofachdaten, die aus unterschiedlichen
raumbezogenen Fachdatenbanken stammen
•Metadaten beschreiben die eigentlichen
räumlichen Daten hinsichtlich des Zeitbezugs
und der Datenquelle
•Geoinformationssystem dienen zur
Visualisierung und Recherche von Geodaten
Geodaten und Datenbanken
Informationen der analogen Geodaten
sind auf eine Ebene,
die statische Karte begrenzt
Informationen der digitalen
Geodaten sind theoretisch
unbegrenzt als dynamische Karte
dargestellt und sind mit
Sachdaten verbunden
Geodaten und Datenbanken
Komplexität und Variabilität der Geodaten
verlangt eine Datenhaltung in Datenbanken
Geodaten im Jahre 2009
Fläche 44 km² (9,4 km x 4,7 km)
27 Themen (Ebenen)
4 komplexe Datenbanken
136 Polygone (geologische Flächen)
Geodaten und Datenbanken
Computerbasierte datenverarbeitende Technologien revolutionieren alle
gesellschaftlichen Bereiche
Es gibt enorm effiziente Techniken, informationstragende Daten
zu speichern,
zu transportieren
und in neue Daten zu transformieren.
Alle gesellschaftlichen Bereiche sind gezwungen, sich so umzugestalten, dass in ihnen
die computerbasierten datenverarbeitenden Technologien genutzt werden können.
Völlig zu Unrecht wird dieser technologische und ökonomische Großtrend als Weg zur
"Wissens- und Kommunikationsgesellschaft" gefeiert.
In Wahrheit handelt es sich nicht um Wege zur Wissensgesellschaft,
sondern erst einmal nur um die Zwänge einer Gesellschaft
computerbasierte datenverarbeitende Technologien in allen
gesellschaftlichen Bereichen durchzusetzen.
Geodaten und Datenbanken
Strukturierte Ablage von Geodaten ist notwendig …
… ABER welches Datenbankmodell ?
•Hierarchisches Datenbankmodell ?
Datenobjekte stehen in einer Eltern-KindBeziehungen zueinander.
Netzwerkdatenbankmodell ?
Datenobjekte werden miteinander in
Netzen verbunden.
•Relationale Datenbank ?
Die Daten werden zeilenweise in Tabellen
verwaltet. Es kann beliebige Beziehungen
zwischen Daten geben.
•Objektdatenbank ?
Beziehungen zwischen Datenobjekten
werden vom Datenbanksystem selbst
verwaltet. Objekte können Eigenschaften
und Daten von anderen Objekten erben.
„Fachleute“ als Datenbankdesigner
meine Daten
mein Problem
meine Lösung
Individualsicht - Nutzersicht
single-user Datenbanksystem
•viele alphanumerische Felder
•zu geringe Aufgliederung der
Felder
•Tabellen- und Feldnamen sind
nur dem Entwickler verständlich
… und wie sehen eigentlich die Daten aus ?
•Keine optimale
Tabellenverknüpfung und
Indizierung
„Fachleute“ als Datenbankdesigner
Tyisch für analoge Geodaten sind:
•Inkonsistenz:
Widersprüchlichkeit zwischen den Daten
•Inhomogenität:
Uneinheitlichkeit der Elemente einer
Menge
•Mehrdeutigkeit:
mehrere Bedeutungen eines Begriffes
oder Zeichens
• Redundanz:
Informationen in einer Informationsquelle
sind mehrfach vorhanden
Probleme mit Datenbankinhalten
Bergbau- und Rohstoffdatenbank
Teildatenbank Rohstoffe
Mehrdeutige Dateninhalte im
Feld „Nutzungskonflikte“
machen qualifizierte
Recherchen unmöglich
Bei nur 669 Datensätzen
erfolgte keine Evaluierung
der Dateninhalte !
Probleme mit Datenbankinhalten
Landesamt für Geologie und Bergwesen
Halle, den 16.04.2009
Bearbeitungsstand der Landesbohrdatenbank
Bearbeitungsstand: 05.03.2009
Erfasste Bohrungen:
190.855
Davon
Schichtdaten SEP1 insgesamt:
Schichtdaten SEP3 insgesamt:
1.511.178
163.534
Probleme mit Datenbankinhalten
Probleme mit Datenbankinhalten
Verschlüsselung mit SchichtenErfassungs-Programm (SEP 1)
+VT;
kgf-dc,ce,
bro4("q","fs",G:s,du:0.001),deu,ss,wl,ss
mm,bn(F:h,F:d),klfl("kao","ca","ch"),
Z:TZ(58.3-60.0,kao4-gr4,zg)
+VT-G(v);
kgm-kgg,ce
("fs","q",G:s),c4(duz:0.010.1,+Gp,^u,^s),bro4("q",duz:0.0010.002,ds-ml,"fs",duz:0.0010.005,F:hro,voe,duh:0.015),zt,+VT^b,ssmm(s),klv2,par,ss,klfl,"hm",^fs^gs-lag,zt,^u-lag
Probleme mit Datenbankinhalten
Inkonsistenz
Inhomogenität
Mehrdeutigkeit
Eine DV-technische
Überarbeitung ist
nur teilweise
möglich
Auflösung von zusammengefassten Schichten in Schicht und Unterschicht
Probleme mit Datenbankinhalten
SEP 3 ist kein Programm und
auch kein Dateiformat, sondern
die Beschreibung einer
Datenstruktur.
Auswertung ….?
Quo vadis Geodaten …
Auswege aus dem Datenchaos
multi-user Datenbanksystem
Umfangreiche Datenanalyse
Wer hat
Wer pflegt
Wer braucht
Wem nutzt
Maximale Datenintegration
Keine Mammutprojekte
sondern stufenweiser
Ausbau nach einem
Gesamtkonzept
•Neustrukturierung der Dateninhalte aus der
Perspektive der Datenrecherche
•Numerische Daten haben Vorrang vor
alphanumerischen Daten
•Kleinteilige Feldstrukturierungen
•Sinnvolle Auswahllisten
•Selbsterklärende Feld- und Tabellennamen
Take off in die schöne neue Geodatenwelt
Gegenseitige Information
Transparenz
Zusammenarbeit
Projektarbeit
Projektdiskussion
Datenanalyse
Datenevaluierung
Datenintegration
Datenbankentwicklung
Vielen Dank und gute Landung
Slide 3
Qualitätsanforderungen an Geodaten
von
Matthias Thomae
10. Zittauer Umweltsymposium 21.-22. April 2009 in Ostritz
1.
2.
3.
4.
5.
GLIEDERUNG
Bedeutung von Geodaten
Geodaten und Datenbanken
„Fachleute“ als Datenbankdesigner
Probleme mit Datenbankinhalten
Auswege aus dem Datenchaos
Bedeutung von Geodaten
… vor ca. 150 Jahren war das Wissen
über unsere Erde und der in und auf
ihr stattfindenden Prozesse
bescheiden
Geodaten gab es nicht flächendeckend,
wie die „weißen Flecken“ auf dem
Globus zeigen
Bibliotheksglobus, Berlin 1871
1871 veröffentlicht Darwin "The Descent of Man".
Bedeutung von Geodaten
Das Wissen ist in den letzten 150 Jahren exponentiell gewachsen
w issenschaftliche Veröffentlichungen
100
20000
90
18000
80
16000
70
14000
60
12000
Anzahl
Anzahl [Mio.]
Wissenschaftler
50
10000
40
8000
30
6000
20
4000
10
2000
0
0
1950
1850
1950
Jahr
2000
Jahr
2000
1880 kannte die Chemie 20 000 chemische Verbindungen, heute sind es ca. 17 Millionen
Bedeutung von Geodaten
Was sind eigentlich Geodaten ?
•Geodaten sind digitale Informationen, denen
eine bestimmte räumliche Lage zugewiesen
werden kann (Geoinformationen, Geobezug)
•Geodaten bestehen aus Geobasisdaten und
Geofachdaten, die aus unterschiedlichen
raumbezogenen Fachdatenbanken stammen
•Metadaten beschreiben die eigentlichen
räumlichen Daten hinsichtlich des Zeitbezugs
und der Datenquelle
•Geoinformationssystem dienen zur
Visualisierung und Recherche von Geodaten
Geodaten und Datenbanken
Informationen der analogen Geodaten
sind auf eine Ebene,
die statische Karte begrenzt
Informationen der digitalen
Geodaten sind theoretisch
unbegrenzt als dynamische Karte
dargestellt und sind mit
Sachdaten verbunden
Geodaten und Datenbanken
Komplexität und Variabilität der Geodaten
verlangt eine Datenhaltung in Datenbanken
Geodaten im Jahre 2009
Fläche 44 km² (9,4 km x 4,7 km)
27 Themen (Ebenen)
4 komplexe Datenbanken
136 Polygone (geologische Flächen)
Geodaten und Datenbanken
Computerbasierte datenverarbeitende Technologien revolutionieren alle
gesellschaftlichen Bereiche
Es gibt enorm effiziente Techniken, informationstragende Daten
zu speichern,
zu transportieren
und in neue Daten zu transformieren.
Alle gesellschaftlichen Bereiche sind gezwungen, sich so umzugestalten, dass in ihnen
die computerbasierten datenverarbeitenden Technologien genutzt werden können.
Völlig zu Unrecht wird dieser technologische und ökonomische Großtrend als Weg zur
"Wissens- und Kommunikationsgesellschaft" gefeiert.
In Wahrheit handelt es sich nicht um Wege zur Wissensgesellschaft,
sondern erst einmal nur um die Zwänge einer Gesellschaft
computerbasierte datenverarbeitende Technologien in allen
gesellschaftlichen Bereichen durchzusetzen.
Geodaten und Datenbanken
Strukturierte Ablage von Geodaten ist notwendig …
… ABER welches Datenbankmodell ?
•Hierarchisches Datenbankmodell ?
Datenobjekte stehen in einer Eltern-KindBeziehungen zueinander.
Netzwerkdatenbankmodell ?
Datenobjekte werden miteinander in
Netzen verbunden.
•Relationale Datenbank ?
Die Daten werden zeilenweise in Tabellen
verwaltet. Es kann beliebige Beziehungen
zwischen Daten geben.
•Objektdatenbank ?
Beziehungen zwischen Datenobjekten
werden vom Datenbanksystem selbst
verwaltet. Objekte können Eigenschaften
und Daten von anderen Objekten erben.
„Fachleute“ als Datenbankdesigner
meine Daten
mein Problem
meine Lösung
Individualsicht - Nutzersicht
single-user Datenbanksystem
•viele alphanumerische Felder
•zu geringe Aufgliederung der
Felder
•Tabellen- und Feldnamen sind
nur dem Entwickler verständlich
… und wie sehen eigentlich die Daten aus ?
•Keine optimale
Tabellenverknüpfung und
Indizierung
„Fachleute“ als Datenbankdesigner
Tyisch für analoge Geodaten sind:
•Inkonsistenz:
Widersprüchlichkeit zwischen den Daten
•Inhomogenität:
Uneinheitlichkeit der Elemente einer
Menge
•Mehrdeutigkeit:
mehrere Bedeutungen eines Begriffes
oder Zeichens
• Redundanz:
Informationen in einer Informationsquelle
sind mehrfach vorhanden
Probleme mit Datenbankinhalten
Bergbau- und Rohstoffdatenbank
Teildatenbank Rohstoffe
Mehrdeutige Dateninhalte im
Feld „Nutzungskonflikte“
machen qualifizierte
Recherchen unmöglich
Bei nur 669 Datensätzen
erfolgte keine Evaluierung
der Dateninhalte !
Probleme mit Datenbankinhalten
Landesamt für Geologie und Bergwesen
Halle, den 16.04.2009
Bearbeitungsstand der Landesbohrdatenbank
Bearbeitungsstand: 05.03.2009
Erfasste Bohrungen:
190.855
Davon
Schichtdaten SEP1 insgesamt:
Schichtdaten SEP3 insgesamt:
1.511.178
163.534
Probleme mit Datenbankinhalten
Probleme mit Datenbankinhalten
Verschlüsselung mit SchichtenErfassungs-Programm (SEP 1)
+VT;
kgf-dc,ce,
bro4("q","fs",G:s,du:0.001),deu,ss,wl,ss
mm,bn(F:h,F:d),klfl("kao","ca","ch"),
Z:TZ(58.3-60.0,kao4-gr4,zg)
+VT-G(v);
kgm-kgg,ce
("fs","q",G:s),c4(duz:0.010.1,+Gp,^u,^s),bro4("q",duz:0.0010.002,ds-ml,"fs",duz:0.0010.005,F:hro,voe,duh:0.015),zt,+VT^b,ssmm(s),klv2,par,ss,klfl,"hm",^fs^gs-lag,zt,^u-lag
Probleme mit Datenbankinhalten
Inkonsistenz
Inhomogenität
Mehrdeutigkeit
Eine DV-technische
Überarbeitung ist
nur teilweise
möglich
Auflösung von zusammengefassten Schichten in Schicht und Unterschicht
Probleme mit Datenbankinhalten
SEP 3 ist kein Programm und
auch kein Dateiformat, sondern
die Beschreibung einer
Datenstruktur.
Auswertung ….?
Quo vadis Geodaten …
Auswege aus dem Datenchaos
multi-user Datenbanksystem
Umfangreiche Datenanalyse
Wer hat
Wer pflegt
Wer braucht
Wem nutzt
Maximale Datenintegration
Keine Mammutprojekte
sondern stufenweiser
Ausbau nach einem
Gesamtkonzept
•Neustrukturierung der Dateninhalte aus der
Perspektive der Datenrecherche
•Numerische Daten haben Vorrang vor
alphanumerischen Daten
•Kleinteilige Feldstrukturierungen
•Sinnvolle Auswahllisten
•Selbsterklärende Feld- und Tabellennamen
Take off in die schöne neue Geodatenwelt
Gegenseitige Information
Transparenz
Zusammenarbeit
Projektarbeit
Projektdiskussion
Datenanalyse
Datenevaluierung
Datenintegration
Datenbankentwicklung
Vielen Dank und gute Landung
Slide 4
Qualitätsanforderungen an Geodaten
von
Matthias Thomae
10. Zittauer Umweltsymposium 21.-22. April 2009 in Ostritz
1.
2.
3.
4.
5.
GLIEDERUNG
Bedeutung von Geodaten
Geodaten und Datenbanken
„Fachleute“ als Datenbankdesigner
Probleme mit Datenbankinhalten
Auswege aus dem Datenchaos
Bedeutung von Geodaten
… vor ca. 150 Jahren war das Wissen
über unsere Erde und der in und auf
ihr stattfindenden Prozesse
bescheiden
Geodaten gab es nicht flächendeckend,
wie die „weißen Flecken“ auf dem
Globus zeigen
Bibliotheksglobus, Berlin 1871
1871 veröffentlicht Darwin "The Descent of Man".
Bedeutung von Geodaten
Das Wissen ist in den letzten 150 Jahren exponentiell gewachsen
w issenschaftliche Veröffentlichungen
100
20000
90
18000
80
16000
70
14000
60
12000
Anzahl
Anzahl [Mio.]
Wissenschaftler
50
10000
40
8000
30
6000
20
4000
10
2000
0
0
1950
1850
1950
Jahr
2000
Jahr
2000
1880 kannte die Chemie 20 000 chemische Verbindungen, heute sind es ca. 17 Millionen
Bedeutung von Geodaten
Was sind eigentlich Geodaten ?
•Geodaten sind digitale Informationen, denen
eine bestimmte räumliche Lage zugewiesen
werden kann (Geoinformationen, Geobezug)
•Geodaten bestehen aus Geobasisdaten und
Geofachdaten, die aus unterschiedlichen
raumbezogenen Fachdatenbanken stammen
•Metadaten beschreiben die eigentlichen
räumlichen Daten hinsichtlich des Zeitbezugs
und der Datenquelle
•Geoinformationssystem dienen zur
Visualisierung und Recherche von Geodaten
Geodaten und Datenbanken
Informationen der analogen Geodaten
sind auf eine Ebene,
die statische Karte begrenzt
Informationen der digitalen
Geodaten sind theoretisch
unbegrenzt als dynamische Karte
dargestellt und sind mit
Sachdaten verbunden
Geodaten und Datenbanken
Komplexität und Variabilität der Geodaten
verlangt eine Datenhaltung in Datenbanken
Geodaten im Jahre 2009
Fläche 44 km² (9,4 km x 4,7 km)
27 Themen (Ebenen)
4 komplexe Datenbanken
136 Polygone (geologische Flächen)
Geodaten und Datenbanken
Computerbasierte datenverarbeitende Technologien revolutionieren alle
gesellschaftlichen Bereiche
Es gibt enorm effiziente Techniken, informationstragende Daten
zu speichern,
zu transportieren
und in neue Daten zu transformieren.
Alle gesellschaftlichen Bereiche sind gezwungen, sich so umzugestalten, dass in ihnen
die computerbasierten datenverarbeitenden Technologien genutzt werden können.
Völlig zu Unrecht wird dieser technologische und ökonomische Großtrend als Weg zur
"Wissens- und Kommunikationsgesellschaft" gefeiert.
In Wahrheit handelt es sich nicht um Wege zur Wissensgesellschaft,
sondern erst einmal nur um die Zwänge einer Gesellschaft
computerbasierte datenverarbeitende Technologien in allen
gesellschaftlichen Bereichen durchzusetzen.
Geodaten und Datenbanken
Strukturierte Ablage von Geodaten ist notwendig …
… ABER welches Datenbankmodell ?
•Hierarchisches Datenbankmodell ?
Datenobjekte stehen in einer Eltern-KindBeziehungen zueinander.
Netzwerkdatenbankmodell ?
Datenobjekte werden miteinander in
Netzen verbunden.
•Relationale Datenbank ?
Die Daten werden zeilenweise in Tabellen
verwaltet. Es kann beliebige Beziehungen
zwischen Daten geben.
•Objektdatenbank ?
Beziehungen zwischen Datenobjekten
werden vom Datenbanksystem selbst
verwaltet. Objekte können Eigenschaften
und Daten von anderen Objekten erben.
„Fachleute“ als Datenbankdesigner
meine Daten
mein Problem
meine Lösung
Individualsicht - Nutzersicht
single-user Datenbanksystem
•viele alphanumerische Felder
•zu geringe Aufgliederung der
Felder
•Tabellen- und Feldnamen sind
nur dem Entwickler verständlich
… und wie sehen eigentlich die Daten aus ?
•Keine optimale
Tabellenverknüpfung und
Indizierung
„Fachleute“ als Datenbankdesigner
Tyisch für analoge Geodaten sind:
•Inkonsistenz:
Widersprüchlichkeit zwischen den Daten
•Inhomogenität:
Uneinheitlichkeit der Elemente einer
Menge
•Mehrdeutigkeit:
mehrere Bedeutungen eines Begriffes
oder Zeichens
• Redundanz:
Informationen in einer Informationsquelle
sind mehrfach vorhanden
Probleme mit Datenbankinhalten
Bergbau- und Rohstoffdatenbank
Teildatenbank Rohstoffe
Mehrdeutige Dateninhalte im
Feld „Nutzungskonflikte“
machen qualifizierte
Recherchen unmöglich
Bei nur 669 Datensätzen
erfolgte keine Evaluierung
der Dateninhalte !
Probleme mit Datenbankinhalten
Landesamt für Geologie und Bergwesen
Halle, den 16.04.2009
Bearbeitungsstand der Landesbohrdatenbank
Bearbeitungsstand: 05.03.2009
Erfasste Bohrungen:
190.855
Davon
Schichtdaten SEP1 insgesamt:
Schichtdaten SEP3 insgesamt:
1.511.178
163.534
Probleme mit Datenbankinhalten
Probleme mit Datenbankinhalten
Verschlüsselung mit SchichtenErfassungs-Programm (SEP 1)
+VT;
kgf-dc,ce,
bro4("q","fs",G:s,du:0.001),deu,ss,wl,ss
mm,bn(F:h,F:d),klfl("kao","ca","ch"),
Z:TZ(58.3-60.0,kao4-gr4,zg)
+VT-G(v);
kgm-kgg,ce
("fs","q",G:s),c4(duz:0.010.1,+Gp,^u,^s),bro4("q",duz:0.0010.002,ds-ml,"fs",duz:0.0010.005,F:hro,voe,duh:0.015),zt,+VT^b,ssmm(s),klv2,par,ss,klfl,"hm",^fs^gs-lag,zt,^u-lag
Probleme mit Datenbankinhalten
Inkonsistenz
Inhomogenität
Mehrdeutigkeit
Eine DV-technische
Überarbeitung ist
nur teilweise
möglich
Auflösung von zusammengefassten Schichten in Schicht und Unterschicht
Probleme mit Datenbankinhalten
SEP 3 ist kein Programm und
auch kein Dateiformat, sondern
die Beschreibung einer
Datenstruktur.
Auswertung ….?
Quo vadis Geodaten …
Auswege aus dem Datenchaos
multi-user Datenbanksystem
Umfangreiche Datenanalyse
Wer hat
Wer pflegt
Wer braucht
Wem nutzt
Maximale Datenintegration
Keine Mammutprojekte
sondern stufenweiser
Ausbau nach einem
Gesamtkonzept
•Neustrukturierung der Dateninhalte aus der
Perspektive der Datenrecherche
•Numerische Daten haben Vorrang vor
alphanumerischen Daten
•Kleinteilige Feldstrukturierungen
•Sinnvolle Auswahllisten
•Selbsterklärende Feld- und Tabellennamen
Take off in die schöne neue Geodatenwelt
Gegenseitige Information
Transparenz
Zusammenarbeit
Projektarbeit
Projektdiskussion
Datenanalyse
Datenevaluierung
Datenintegration
Datenbankentwicklung
Vielen Dank und gute Landung
Slide 5
Qualitätsanforderungen an Geodaten
von
Matthias Thomae
10. Zittauer Umweltsymposium 21.-22. April 2009 in Ostritz
1.
2.
3.
4.
5.
GLIEDERUNG
Bedeutung von Geodaten
Geodaten und Datenbanken
„Fachleute“ als Datenbankdesigner
Probleme mit Datenbankinhalten
Auswege aus dem Datenchaos
Bedeutung von Geodaten
… vor ca. 150 Jahren war das Wissen
über unsere Erde und der in und auf
ihr stattfindenden Prozesse
bescheiden
Geodaten gab es nicht flächendeckend,
wie die „weißen Flecken“ auf dem
Globus zeigen
Bibliotheksglobus, Berlin 1871
1871 veröffentlicht Darwin "The Descent of Man".
Bedeutung von Geodaten
Das Wissen ist in den letzten 150 Jahren exponentiell gewachsen
w issenschaftliche Veröffentlichungen
100
20000
90
18000
80
16000
70
14000
60
12000
Anzahl
Anzahl [Mio.]
Wissenschaftler
50
10000
40
8000
30
6000
20
4000
10
2000
0
0
1950
1850
1950
Jahr
2000
Jahr
2000
1880 kannte die Chemie 20 000 chemische Verbindungen, heute sind es ca. 17 Millionen
Bedeutung von Geodaten
Was sind eigentlich Geodaten ?
•Geodaten sind digitale Informationen, denen
eine bestimmte räumliche Lage zugewiesen
werden kann (Geoinformationen, Geobezug)
•Geodaten bestehen aus Geobasisdaten und
Geofachdaten, die aus unterschiedlichen
raumbezogenen Fachdatenbanken stammen
•Metadaten beschreiben die eigentlichen
räumlichen Daten hinsichtlich des Zeitbezugs
und der Datenquelle
•Geoinformationssystem dienen zur
Visualisierung und Recherche von Geodaten
Geodaten und Datenbanken
Informationen der analogen Geodaten
sind auf eine Ebene,
die statische Karte begrenzt
Informationen der digitalen
Geodaten sind theoretisch
unbegrenzt als dynamische Karte
dargestellt und sind mit
Sachdaten verbunden
Geodaten und Datenbanken
Komplexität und Variabilität der Geodaten
verlangt eine Datenhaltung in Datenbanken
Geodaten im Jahre 2009
Fläche 44 km² (9,4 km x 4,7 km)
27 Themen (Ebenen)
4 komplexe Datenbanken
136 Polygone (geologische Flächen)
Geodaten und Datenbanken
Computerbasierte datenverarbeitende Technologien revolutionieren alle
gesellschaftlichen Bereiche
Es gibt enorm effiziente Techniken, informationstragende Daten
zu speichern,
zu transportieren
und in neue Daten zu transformieren.
Alle gesellschaftlichen Bereiche sind gezwungen, sich so umzugestalten, dass in ihnen
die computerbasierten datenverarbeitenden Technologien genutzt werden können.
Völlig zu Unrecht wird dieser technologische und ökonomische Großtrend als Weg zur
"Wissens- und Kommunikationsgesellschaft" gefeiert.
In Wahrheit handelt es sich nicht um Wege zur Wissensgesellschaft,
sondern erst einmal nur um die Zwänge einer Gesellschaft
computerbasierte datenverarbeitende Technologien in allen
gesellschaftlichen Bereichen durchzusetzen.
Geodaten und Datenbanken
Strukturierte Ablage von Geodaten ist notwendig …
… ABER welches Datenbankmodell ?
•Hierarchisches Datenbankmodell ?
Datenobjekte stehen in einer Eltern-KindBeziehungen zueinander.
Netzwerkdatenbankmodell ?
Datenobjekte werden miteinander in
Netzen verbunden.
•Relationale Datenbank ?
Die Daten werden zeilenweise in Tabellen
verwaltet. Es kann beliebige Beziehungen
zwischen Daten geben.
•Objektdatenbank ?
Beziehungen zwischen Datenobjekten
werden vom Datenbanksystem selbst
verwaltet. Objekte können Eigenschaften
und Daten von anderen Objekten erben.
„Fachleute“ als Datenbankdesigner
meine Daten
mein Problem
meine Lösung
Individualsicht - Nutzersicht
single-user Datenbanksystem
•viele alphanumerische Felder
•zu geringe Aufgliederung der
Felder
•Tabellen- und Feldnamen sind
nur dem Entwickler verständlich
… und wie sehen eigentlich die Daten aus ?
•Keine optimale
Tabellenverknüpfung und
Indizierung
„Fachleute“ als Datenbankdesigner
Tyisch für analoge Geodaten sind:
•Inkonsistenz:
Widersprüchlichkeit zwischen den Daten
•Inhomogenität:
Uneinheitlichkeit der Elemente einer
Menge
•Mehrdeutigkeit:
mehrere Bedeutungen eines Begriffes
oder Zeichens
• Redundanz:
Informationen in einer Informationsquelle
sind mehrfach vorhanden
Probleme mit Datenbankinhalten
Bergbau- und Rohstoffdatenbank
Teildatenbank Rohstoffe
Mehrdeutige Dateninhalte im
Feld „Nutzungskonflikte“
machen qualifizierte
Recherchen unmöglich
Bei nur 669 Datensätzen
erfolgte keine Evaluierung
der Dateninhalte !
Probleme mit Datenbankinhalten
Landesamt für Geologie und Bergwesen
Halle, den 16.04.2009
Bearbeitungsstand der Landesbohrdatenbank
Bearbeitungsstand: 05.03.2009
Erfasste Bohrungen:
190.855
Davon
Schichtdaten SEP1 insgesamt:
Schichtdaten SEP3 insgesamt:
1.511.178
163.534
Probleme mit Datenbankinhalten
Probleme mit Datenbankinhalten
Verschlüsselung mit SchichtenErfassungs-Programm (SEP 1)
+VT;
kgf-dc,ce,
bro4("q","fs",G:s,du:0.001),deu,ss,wl,ss
mm,bn(F:h,F:d),klfl("kao","ca","ch"),
Z:TZ(58.3-60.0,kao4-gr4,zg)
+VT-G(v);
kgm-kgg,ce
("fs","q",G:s),c4(duz:0.010.1,+Gp,^u,^s),bro4("q",duz:0.0010.002,ds-ml,"fs",duz:0.0010.005,F:hro,voe,duh:0.015),zt,+VT^b,ssmm(s),klv2,par,ss,klfl,"hm",^fs^gs-lag,zt,^u-lag
Probleme mit Datenbankinhalten
Inkonsistenz
Inhomogenität
Mehrdeutigkeit
Eine DV-technische
Überarbeitung ist
nur teilweise
möglich
Auflösung von zusammengefassten Schichten in Schicht und Unterschicht
Probleme mit Datenbankinhalten
SEP 3 ist kein Programm und
auch kein Dateiformat, sondern
die Beschreibung einer
Datenstruktur.
Auswertung ….?
Quo vadis Geodaten …
Auswege aus dem Datenchaos
multi-user Datenbanksystem
Umfangreiche Datenanalyse
Wer hat
Wer pflegt
Wer braucht
Wem nutzt
Maximale Datenintegration
Keine Mammutprojekte
sondern stufenweiser
Ausbau nach einem
Gesamtkonzept
•Neustrukturierung der Dateninhalte aus der
Perspektive der Datenrecherche
•Numerische Daten haben Vorrang vor
alphanumerischen Daten
•Kleinteilige Feldstrukturierungen
•Sinnvolle Auswahllisten
•Selbsterklärende Feld- und Tabellennamen
Take off in die schöne neue Geodatenwelt
Gegenseitige Information
Transparenz
Zusammenarbeit
Projektarbeit
Projektdiskussion
Datenanalyse
Datenevaluierung
Datenintegration
Datenbankentwicklung
Vielen Dank und gute Landung
Slide 6
Qualitätsanforderungen an Geodaten
von
Matthias Thomae
10. Zittauer Umweltsymposium 21.-22. April 2009 in Ostritz
1.
2.
3.
4.
5.
GLIEDERUNG
Bedeutung von Geodaten
Geodaten und Datenbanken
„Fachleute“ als Datenbankdesigner
Probleme mit Datenbankinhalten
Auswege aus dem Datenchaos
Bedeutung von Geodaten
… vor ca. 150 Jahren war das Wissen
über unsere Erde und der in und auf
ihr stattfindenden Prozesse
bescheiden
Geodaten gab es nicht flächendeckend,
wie die „weißen Flecken“ auf dem
Globus zeigen
Bibliotheksglobus, Berlin 1871
1871 veröffentlicht Darwin "The Descent of Man".
Bedeutung von Geodaten
Das Wissen ist in den letzten 150 Jahren exponentiell gewachsen
w issenschaftliche Veröffentlichungen
100
20000
90
18000
80
16000
70
14000
60
12000
Anzahl
Anzahl [Mio.]
Wissenschaftler
50
10000
40
8000
30
6000
20
4000
10
2000
0
0
1950
1850
1950
Jahr
2000
Jahr
2000
1880 kannte die Chemie 20 000 chemische Verbindungen, heute sind es ca. 17 Millionen
Bedeutung von Geodaten
Was sind eigentlich Geodaten ?
•Geodaten sind digitale Informationen, denen
eine bestimmte räumliche Lage zugewiesen
werden kann (Geoinformationen, Geobezug)
•Geodaten bestehen aus Geobasisdaten und
Geofachdaten, die aus unterschiedlichen
raumbezogenen Fachdatenbanken stammen
•Metadaten beschreiben die eigentlichen
räumlichen Daten hinsichtlich des Zeitbezugs
und der Datenquelle
•Geoinformationssystem dienen zur
Visualisierung und Recherche von Geodaten
Geodaten und Datenbanken
Informationen der analogen Geodaten
sind auf eine Ebene,
die statische Karte begrenzt
Informationen der digitalen
Geodaten sind theoretisch
unbegrenzt als dynamische Karte
dargestellt und sind mit
Sachdaten verbunden
Geodaten und Datenbanken
Komplexität und Variabilität der Geodaten
verlangt eine Datenhaltung in Datenbanken
Geodaten im Jahre 2009
Fläche 44 km² (9,4 km x 4,7 km)
27 Themen (Ebenen)
4 komplexe Datenbanken
136 Polygone (geologische Flächen)
Geodaten und Datenbanken
Computerbasierte datenverarbeitende Technologien revolutionieren alle
gesellschaftlichen Bereiche
Es gibt enorm effiziente Techniken, informationstragende Daten
zu speichern,
zu transportieren
und in neue Daten zu transformieren.
Alle gesellschaftlichen Bereiche sind gezwungen, sich so umzugestalten, dass in ihnen
die computerbasierten datenverarbeitenden Technologien genutzt werden können.
Völlig zu Unrecht wird dieser technologische und ökonomische Großtrend als Weg zur
"Wissens- und Kommunikationsgesellschaft" gefeiert.
In Wahrheit handelt es sich nicht um Wege zur Wissensgesellschaft,
sondern erst einmal nur um die Zwänge einer Gesellschaft
computerbasierte datenverarbeitende Technologien in allen
gesellschaftlichen Bereichen durchzusetzen.
Geodaten und Datenbanken
Strukturierte Ablage von Geodaten ist notwendig …
… ABER welches Datenbankmodell ?
•Hierarchisches Datenbankmodell ?
Datenobjekte stehen in einer Eltern-KindBeziehungen zueinander.
Netzwerkdatenbankmodell ?
Datenobjekte werden miteinander in
Netzen verbunden.
•Relationale Datenbank ?
Die Daten werden zeilenweise in Tabellen
verwaltet. Es kann beliebige Beziehungen
zwischen Daten geben.
•Objektdatenbank ?
Beziehungen zwischen Datenobjekten
werden vom Datenbanksystem selbst
verwaltet. Objekte können Eigenschaften
und Daten von anderen Objekten erben.
„Fachleute“ als Datenbankdesigner
meine Daten
mein Problem
meine Lösung
Individualsicht - Nutzersicht
single-user Datenbanksystem
•viele alphanumerische Felder
•zu geringe Aufgliederung der
Felder
•Tabellen- und Feldnamen sind
nur dem Entwickler verständlich
… und wie sehen eigentlich die Daten aus ?
•Keine optimale
Tabellenverknüpfung und
Indizierung
„Fachleute“ als Datenbankdesigner
Tyisch für analoge Geodaten sind:
•Inkonsistenz:
Widersprüchlichkeit zwischen den Daten
•Inhomogenität:
Uneinheitlichkeit der Elemente einer
Menge
•Mehrdeutigkeit:
mehrere Bedeutungen eines Begriffes
oder Zeichens
• Redundanz:
Informationen in einer Informationsquelle
sind mehrfach vorhanden
Probleme mit Datenbankinhalten
Bergbau- und Rohstoffdatenbank
Teildatenbank Rohstoffe
Mehrdeutige Dateninhalte im
Feld „Nutzungskonflikte“
machen qualifizierte
Recherchen unmöglich
Bei nur 669 Datensätzen
erfolgte keine Evaluierung
der Dateninhalte !
Probleme mit Datenbankinhalten
Landesamt für Geologie und Bergwesen
Halle, den 16.04.2009
Bearbeitungsstand der Landesbohrdatenbank
Bearbeitungsstand: 05.03.2009
Erfasste Bohrungen:
190.855
Davon
Schichtdaten SEP1 insgesamt:
Schichtdaten SEP3 insgesamt:
1.511.178
163.534
Probleme mit Datenbankinhalten
Probleme mit Datenbankinhalten
Verschlüsselung mit SchichtenErfassungs-Programm (SEP 1)
+VT;
kgf-dc,ce,
bro4("q","fs",G:s,du:0.001),deu,ss,wl,ss
mm,bn(F:h,F:d),klfl("kao","ca","ch"),
Z:TZ(58.3-60.0,kao4-gr4,zg)
+VT-G(v);
kgm-kgg,ce
("fs","q",G:s),c4(duz:0.010.1,+Gp,^u,^s),bro4("q",duz:0.0010.002,ds-ml,"fs",duz:0.0010.005,F:hro,voe,duh:0.015),zt,+VT^b,ssmm(s),klv2,par,ss,klfl,"hm",^fs^gs-lag,zt,^u-lag
Probleme mit Datenbankinhalten
Inkonsistenz
Inhomogenität
Mehrdeutigkeit
Eine DV-technische
Überarbeitung ist
nur teilweise
möglich
Auflösung von zusammengefassten Schichten in Schicht und Unterschicht
Probleme mit Datenbankinhalten
SEP 3 ist kein Programm und
auch kein Dateiformat, sondern
die Beschreibung einer
Datenstruktur.
Auswertung ….?
Quo vadis Geodaten …
Auswege aus dem Datenchaos
multi-user Datenbanksystem
Umfangreiche Datenanalyse
Wer hat
Wer pflegt
Wer braucht
Wem nutzt
Maximale Datenintegration
Keine Mammutprojekte
sondern stufenweiser
Ausbau nach einem
Gesamtkonzept
•Neustrukturierung der Dateninhalte aus der
Perspektive der Datenrecherche
•Numerische Daten haben Vorrang vor
alphanumerischen Daten
•Kleinteilige Feldstrukturierungen
•Sinnvolle Auswahllisten
•Selbsterklärende Feld- und Tabellennamen
Take off in die schöne neue Geodatenwelt
Gegenseitige Information
Transparenz
Zusammenarbeit
Projektarbeit
Projektdiskussion
Datenanalyse
Datenevaluierung
Datenintegration
Datenbankentwicklung
Vielen Dank und gute Landung
Slide 7
Qualitätsanforderungen an Geodaten
von
Matthias Thomae
10. Zittauer Umweltsymposium 21.-22. April 2009 in Ostritz
1.
2.
3.
4.
5.
GLIEDERUNG
Bedeutung von Geodaten
Geodaten und Datenbanken
„Fachleute“ als Datenbankdesigner
Probleme mit Datenbankinhalten
Auswege aus dem Datenchaos
Bedeutung von Geodaten
… vor ca. 150 Jahren war das Wissen
über unsere Erde und der in und auf
ihr stattfindenden Prozesse
bescheiden
Geodaten gab es nicht flächendeckend,
wie die „weißen Flecken“ auf dem
Globus zeigen
Bibliotheksglobus, Berlin 1871
1871 veröffentlicht Darwin "The Descent of Man".
Bedeutung von Geodaten
Das Wissen ist in den letzten 150 Jahren exponentiell gewachsen
w issenschaftliche Veröffentlichungen
100
20000
90
18000
80
16000
70
14000
60
12000
Anzahl
Anzahl [Mio.]
Wissenschaftler
50
10000
40
8000
30
6000
20
4000
10
2000
0
0
1950
1850
1950
Jahr
2000
Jahr
2000
1880 kannte die Chemie 20 000 chemische Verbindungen, heute sind es ca. 17 Millionen
Bedeutung von Geodaten
Was sind eigentlich Geodaten ?
•Geodaten sind digitale Informationen, denen
eine bestimmte räumliche Lage zugewiesen
werden kann (Geoinformationen, Geobezug)
•Geodaten bestehen aus Geobasisdaten und
Geofachdaten, die aus unterschiedlichen
raumbezogenen Fachdatenbanken stammen
•Metadaten beschreiben die eigentlichen
räumlichen Daten hinsichtlich des Zeitbezugs
und der Datenquelle
•Geoinformationssystem dienen zur
Visualisierung und Recherche von Geodaten
Geodaten und Datenbanken
Informationen der analogen Geodaten
sind auf eine Ebene,
die statische Karte begrenzt
Informationen der digitalen
Geodaten sind theoretisch
unbegrenzt als dynamische Karte
dargestellt und sind mit
Sachdaten verbunden
Geodaten und Datenbanken
Komplexität und Variabilität der Geodaten
verlangt eine Datenhaltung in Datenbanken
Geodaten im Jahre 2009
Fläche 44 km² (9,4 km x 4,7 km)
27 Themen (Ebenen)
4 komplexe Datenbanken
136 Polygone (geologische Flächen)
Geodaten und Datenbanken
Computerbasierte datenverarbeitende Technologien revolutionieren alle
gesellschaftlichen Bereiche
Es gibt enorm effiziente Techniken, informationstragende Daten
zu speichern,
zu transportieren
und in neue Daten zu transformieren.
Alle gesellschaftlichen Bereiche sind gezwungen, sich so umzugestalten, dass in ihnen
die computerbasierten datenverarbeitenden Technologien genutzt werden können.
Völlig zu Unrecht wird dieser technologische und ökonomische Großtrend als Weg zur
"Wissens- und Kommunikationsgesellschaft" gefeiert.
In Wahrheit handelt es sich nicht um Wege zur Wissensgesellschaft,
sondern erst einmal nur um die Zwänge einer Gesellschaft
computerbasierte datenverarbeitende Technologien in allen
gesellschaftlichen Bereichen durchzusetzen.
Geodaten und Datenbanken
Strukturierte Ablage von Geodaten ist notwendig …
… ABER welches Datenbankmodell ?
•Hierarchisches Datenbankmodell ?
Datenobjekte stehen in einer Eltern-KindBeziehungen zueinander.
Netzwerkdatenbankmodell ?
Datenobjekte werden miteinander in
Netzen verbunden.
•Relationale Datenbank ?
Die Daten werden zeilenweise in Tabellen
verwaltet. Es kann beliebige Beziehungen
zwischen Daten geben.
•Objektdatenbank ?
Beziehungen zwischen Datenobjekten
werden vom Datenbanksystem selbst
verwaltet. Objekte können Eigenschaften
und Daten von anderen Objekten erben.
„Fachleute“ als Datenbankdesigner
meine Daten
mein Problem
meine Lösung
Individualsicht - Nutzersicht
single-user Datenbanksystem
•viele alphanumerische Felder
•zu geringe Aufgliederung der
Felder
•Tabellen- und Feldnamen sind
nur dem Entwickler verständlich
… und wie sehen eigentlich die Daten aus ?
•Keine optimale
Tabellenverknüpfung und
Indizierung
„Fachleute“ als Datenbankdesigner
Tyisch für analoge Geodaten sind:
•Inkonsistenz:
Widersprüchlichkeit zwischen den Daten
•Inhomogenität:
Uneinheitlichkeit der Elemente einer
Menge
•Mehrdeutigkeit:
mehrere Bedeutungen eines Begriffes
oder Zeichens
• Redundanz:
Informationen in einer Informationsquelle
sind mehrfach vorhanden
Probleme mit Datenbankinhalten
Bergbau- und Rohstoffdatenbank
Teildatenbank Rohstoffe
Mehrdeutige Dateninhalte im
Feld „Nutzungskonflikte“
machen qualifizierte
Recherchen unmöglich
Bei nur 669 Datensätzen
erfolgte keine Evaluierung
der Dateninhalte !
Probleme mit Datenbankinhalten
Landesamt für Geologie und Bergwesen
Halle, den 16.04.2009
Bearbeitungsstand der Landesbohrdatenbank
Bearbeitungsstand: 05.03.2009
Erfasste Bohrungen:
190.855
Davon
Schichtdaten SEP1 insgesamt:
Schichtdaten SEP3 insgesamt:
1.511.178
163.534
Probleme mit Datenbankinhalten
Probleme mit Datenbankinhalten
Verschlüsselung mit SchichtenErfassungs-Programm (SEP 1)
+VT;
kgf-dc,ce,
bro4("q","fs",G:s,du:0.001),deu,ss,wl,ss
mm,bn(F:h,F:d),klfl("kao","ca","ch"),
Z:TZ(58.3-60.0,kao4-gr4,zg)
+VT-G(v);
kgm-kgg,ce
("fs","q",G:s),c4(duz:0.010.1,+Gp,^u,^s),bro4("q",duz:0.0010.002,ds-ml,"fs",duz:0.0010.005,F:hro,voe,duh:0.015),zt,+VT^b,ssmm(s),klv2,par,ss,klfl,"hm",^fs^gs-lag,zt,^u-lag
Probleme mit Datenbankinhalten
Inkonsistenz
Inhomogenität
Mehrdeutigkeit
Eine DV-technische
Überarbeitung ist
nur teilweise
möglich
Auflösung von zusammengefassten Schichten in Schicht und Unterschicht
Probleme mit Datenbankinhalten
SEP 3 ist kein Programm und
auch kein Dateiformat, sondern
die Beschreibung einer
Datenstruktur.
Auswertung ….?
Quo vadis Geodaten …
Auswege aus dem Datenchaos
multi-user Datenbanksystem
Umfangreiche Datenanalyse
Wer hat
Wer pflegt
Wer braucht
Wem nutzt
Maximale Datenintegration
Keine Mammutprojekte
sondern stufenweiser
Ausbau nach einem
Gesamtkonzept
•Neustrukturierung der Dateninhalte aus der
Perspektive der Datenrecherche
•Numerische Daten haben Vorrang vor
alphanumerischen Daten
•Kleinteilige Feldstrukturierungen
•Sinnvolle Auswahllisten
•Selbsterklärende Feld- und Tabellennamen
Take off in die schöne neue Geodatenwelt
Gegenseitige Information
Transparenz
Zusammenarbeit
Projektarbeit
Projektdiskussion
Datenanalyse
Datenevaluierung
Datenintegration
Datenbankentwicklung
Vielen Dank und gute Landung
Slide 8
Qualitätsanforderungen an Geodaten
von
Matthias Thomae
10. Zittauer Umweltsymposium 21.-22. April 2009 in Ostritz
1.
2.
3.
4.
5.
GLIEDERUNG
Bedeutung von Geodaten
Geodaten und Datenbanken
„Fachleute“ als Datenbankdesigner
Probleme mit Datenbankinhalten
Auswege aus dem Datenchaos
Bedeutung von Geodaten
… vor ca. 150 Jahren war das Wissen
über unsere Erde und der in und auf
ihr stattfindenden Prozesse
bescheiden
Geodaten gab es nicht flächendeckend,
wie die „weißen Flecken“ auf dem
Globus zeigen
Bibliotheksglobus, Berlin 1871
1871 veröffentlicht Darwin "The Descent of Man".
Bedeutung von Geodaten
Das Wissen ist in den letzten 150 Jahren exponentiell gewachsen
w issenschaftliche Veröffentlichungen
100
20000
90
18000
80
16000
70
14000
60
12000
Anzahl
Anzahl [Mio.]
Wissenschaftler
50
10000
40
8000
30
6000
20
4000
10
2000
0
0
1950
1850
1950
Jahr
2000
Jahr
2000
1880 kannte die Chemie 20 000 chemische Verbindungen, heute sind es ca. 17 Millionen
Bedeutung von Geodaten
Was sind eigentlich Geodaten ?
•Geodaten sind digitale Informationen, denen
eine bestimmte räumliche Lage zugewiesen
werden kann (Geoinformationen, Geobezug)
•Geodaten bestehen aus Geobasisdaten und
Geofachdaten, die aus unterschiedlichen
raumbezogenen Fachdatenbanken stammen
•Metadaten beschreiben die eigentlichen
räumlichen Daten hinsichtlich des Zeitbezugs
und der Datenquelle
•Geoinformationssystem dienen zur
Visualisierung und Recherche von Geodaten
Geodaten und Datenbanken
Informationen der analogen Geodaten
sind auf eine Ebene,
die statische Karte begrenzt
Informationen der digitalen
Geodaten sind theoretisch
unbegrenzt als dynamische Karte
dargestellt und sind mit
Sachdaten verbunden
Geodaten und Datenbanken
Komplexität und Variabilität der Geodaten
verlangt eine Datenhaltung in Datenbanken
Geodaten im Jahre 2009
Fläche 44 km² (9,4 km x 4,7 km)
27 Themen (Ebenen)
4 komplexe Datenbanken
136 Polygone (geologische Flächen)
Geodaten und Datenbanken
Computerbasierte datenverarbeitende Technologien revolutionieren alle
gesellschaftlichen Bereiche
Es gibt enorm effiziente Techniken, informationstragende Daten
zu speichern,
zu transportieren
und in neue Daten zu transformieren.
Alle gesellschaftlichen Bereiche sind gezwungen, sich so umzugestalten, dass in ihnen
die computerbasierten datenverarbeitenden Technologien genutzt werden können.
Völlig zu Unrecht wird dieser technologische und ökonomische Großtrend als Weg zur
"Wissens- und Kommunikationsgesellschaft" gefeiert.
In Wahrheit handelt es sich nicht um Wege zur Wissensgesellschaft,
sondern erst einmal nur um die Zwänge einer Gesellschaft
computerbasierte datenverarbeitende Technologien in allen
gesellschaftlichen Bereichen durchzusetzen.
Geodaten und Datenbanken
Strukturierte Ablage von Geodaten ist notwendig …
… ABER welches Datenbankmodell ?
•Hierarchisches Datenbankmodell ?
Datenobjekte stehen in einer Eltern-KindBeziehungen zueinander.
Netzwerkdatenbankmodell ?
Datenobjekte werden miteinander in
Netzen verbunden.
•Relationale Datenbank ?
Die Daten werden zeilenweise in Tabellen
verwaltet. Es kann beliebige Beziehungen
zwischen Daten geben.
•Objektdatenbank ?
Beziehungen zwischen Datenobjekten
werden vom Datenbanksystem selbst
verwaltet. Objekte können Eigenschaften
und Daten von anderen Objekten erben.
„Fachleute“ als Datenbankdesigner
meine Daten
mein Problem
meine Lösung
Individualsicht - Nutzersicht
single-user Datenbanksystem
•viele alphanumerische Felder
•zu geringe Aufgliederung der
Felder
•Tabellen- und Feldnamen sind
nur dem Entwickler verständlich
… und wie sehen eigentlich die Daten aus ?
•Keine optimale
Tabellenverknüpfung und
Indizierung
„Fachleute“ als Datenbankdesigner
Tyisch für analoge Geodaten sind:
•Inkonsistenz:
Widersprüchlichkeit zwischen den Daten
•Inhomogenität:
Uneinheitlichkeit der Elemente einer
Menge
•Mehrdeutigkeit:
mehrere Bedeutungen eines Begriffes
oder Zeichens
• Redundanz:
Informationen in einer Informationsquelle
sind mehrfach vorhanden
Probleme mit Datenbankinhalten
Bergbau- und Rohstoffdatenbank
Teildatenbank Rohstoffe
Mehrdeutige Dateninhalte im
Feld „Nutzungskonflikte“
machen qualifizierte
Recherchen unmöglich
Bei nur 669 Datensätzen
erfolgte keine Evaluierung
der Dateninhalte !
Probleme mit Datenbankinhalten
Landesamt für Geologie und Bergwesen
Halle, den 16.04.2009
Bearbeitungsstand der Landesbohrdatenbank
Bearbeitungsstand: 05.03.2009
Erfasste Bohrungen:
190.855
Davon
Schichtdaten SEP1 insgesamt:
Schichtdaten SEP3 insgesamt:
1.511.178
163.534
Probleme mit Datenbankinhalten
Probleme mit Datenbankinhalten
Verschlüsselung mit SchichtenErfassungs-Programm (SEP 1)
+VT;
kgf-dc,ce,
bro4("q","fs",G:s,du:0.001),deu,ss,wl,ss
mm,bn(F:h,F:d),klfl("kao","ca","ch"),
Z:TZ(58.3-60.0,kao4-gr4,zg)
+VT-G(v);
kgm-kgg,ce
("fs","q",G:s),c4(duz:0.010.1,+Gp,^u,^s),bro4("q",duz:0.0010.002,ds-ml,"fs",duz:0.0010.005,F:hro,voe,duh:0.015),zt,+VT^b,ssmm(s),klv2,par,ss,klfl,"hm",^fs^gs-lag,zt,^u-lag
Probleme mit Datenbankinhalten
Inkonsistenz
Inhomogenität
Mehrdeutigkeit
Eine DV-technische
Überarbeitung ist
nur teilweise
möglich
Auflösung von zusammengefassten Schichten in Schicht und Unterschicht
Probleme mit Datenbankinhalten
SEP 3 ist kein Programm und
auch kein Dateiformat, sondern
die Beschreibung einer
Datenstruktur.
Auswertung ….?
Quo vadis Geodaten …
Auswege aus dem Datenchaos
multi-user Datenbanksystem
Umfangreiche Datenanalyse
Wer hat
Wer pflegt
Wer braucht
Wem nutzt
Maximale Datenintegration
Keine Mammutprojekte
sondern stufenweiser
Ausbau nach einem
Gesamtkonzept
•Neustrukturierung der Dateninhalte aus der
Perspektive der Datenrecherche
•Numerische Daten haben Vorrang vor
alphanumerischen Daten
•Kleinteilige Feldstrukturierungen
•Sinnvolle Auswahllisten
•Selbsterklärende Feld- und Tabellennamen
Take off in die schöne neue Geodatenwelt
Gegenseitige Information
Transparenz
Zusammenarbeit
Projektarbeit
Projektdiskussion
Datenanalyse
Datenevaluierung
Datenintegration
Datenbankentwicklung
Vielen Dank und gute Landung
Slide 9
Qualitätsanforderungen an Geodaten
von
Matthias Thomae
10. Zittauer Umweltsymposium 21.-22. April 2009 in Ostritz
1.
2.
3.
4.
5.
GLIEDERUNG
Bedeutung von Geodaten
Geodaten und Datenbanken
„Fachleute“ als Datenbankdesigner
Probleme mit Datenbankinhalten
Auswege aus dem Datenchaos
Bedeutung von Geodaten
… vor ca. 150 Jahren war das Wissen
über unsere Erde und der in und auf
ihr stattfindenden Prozesse
bescheiden
Geodaten gab es nicht flächendeckend,
wie die „weißen Flecken“ auf dem
Globus zeigen
Bibliotheksglobus, Berlin 1871
1871 veröffentlicht Darwin "The Descent of Man".
Bedeutung von Geodaten
Das Wissen ist in den letzten 150 Jahren exponentiell gewachsen
w issenschaftliche Veröffentlichungen
100
20000
90
18000
80
16000
70
14000
60
12000
Anzahl
Anzahl [Mio.]
Wissenschaftler
50
10000
40
8000
30
6000
20
4000
10
2000
0
0
1950
1850
1950
Jahr
2000
Jahr
2000
1880 kannte die Chemie 20 000 chemische Verbindungen, heute sind es ca. 17 Millionen
Bedeutung von Geodaten
Was sind eigentlich Geodaten ?
•Geodaten sind digitale Informationen, denen
eine bestimmte räumliche Lage zugewiesen
werden kann (Geoinformationen, Geobezug)
•Geodaten bestehen aus Geobasisdaten und
Geofachdaten, die aus unterschiedlichen
raumbezogenen Fachdatenbanken stammen
•Metadaten beschreiben die eigentlichen
räumlichen Daten hinsichtlich des Zeitbezugs
und der Datenquelle
•Geoinformationssystem dienen zur
Visualisierung und Recherche von Geodaten
Geodaten und Datenbanken
Informationen der analogen Geodaten
sind auf eine Ebene,
die statische Karte begrenzt
Informationen der digitalen
Geodaten sind theoretisch
unbegrenzt als dynamische Karte
dargestellt und sind mit
Sachdaten verbunden
Geodaten und Datenbanken
Komplexität und Variabilität der Geodaten
verlangt eine Datenhaltung in Datenbanken
Geodaten im Jahre 2009
Fläche 44 km² (9,4 km x 4,7 km)
27 Themen (Ebenen)
4 komplexe Datenbanken
136 Polygone (geologische Flächen)
Geodaten und Datenbanken
Computerbasierte datenverarbeitende Technologien revolutionieren alle
gesellschaftlichen Bereiche
Es gibt enorm effiziente Techniken, informationstragende Daten
zu speichern,
zu transportieren
und in neue Daten zu transformieren.
Alle gesellschaftlichen Bereiche sind gezwungen, sich so umzugestalten, dass in ihnen
die computerbasierten datenverarbeitenden Technologien genutzt werden können.
Völlig zu Unrecht wird dieser technologische und ökonomische Großtrend als Weg zur
"Wissens- und Kommunikationsgesellschaft" gefeiert.
In Wahrheit handelt es sich nicht um Wege zur Wissensgesellschaft,
sondern erst einmal nur um die Zwänge einer Gesellschaft
computerbasierte datenverarbeitende Technologien in allen
gesellschaftlichen Bereichen durchzusetzen.
Geodaten und Datenbanken
Strukturierte Ablage von Geodaten ist notwendig …
… ABER welches Datenbankmodell ?
•Hierarchisches Datenbankmodell ?
Datenobjekte stehen in einer Eltern-KindBeziehungen zueinander.
Netzwerkdatenbankmodell ?
Datenobjekte werden miteinander in
Netzen verbunden.
•Relationale Datenbank ?
Die Daten werden zeilenweise in Tabellen
verwaltet. Es kann beliebige Beziehungen
zwischen Daten geben.
•Objektdatenbank ?
Beziehungen zwischen Datenobjekten
werden vom Datenbanksystem selbst
verwaltet. Objekte können Eigenschaften
und Daten von anderen Objekten erben.
„Fachleute“ als Datenbankdesigner
meine Daten
mein Problem
meine Lösung
Individualsicht - Nutzersicht
single-user Datenbanksystem
•viele alphanumerische Felder
•zu geringe Aufgliederung der
Felder
•Tabellen- und Feldnamen sind
nur dem Entwickler verständlich
… und wie sehen eigentlich die Daten aus ?
•Keine optimale
Tabellenverknüpfung und
Indizierung
„Fachleute“ als Datenbankdesigner
Tyisch für analoge Geodaten sind:
•Inkonsistenz:
Widersprüchlichkeit zwischen den Daten
•Inhomogenität:
Uneinheitlichkeit der Elemente einer
Menge
•Mehrdeutigkeit:
mehrere Bedeutungen eines Begriffes
oder Zeichens
• Redundanz:
Informationen in einer Informationsquelle
sind mehrfach vorhanden
Probleme mit Datenbankinhalten
Bergbau- und Rohstoffdatenbank
Teildatenbank Rohstoffe
Mehrdeutige Dateninhalte im
Feld „Nutzungskonflikte“
machen qualifizierte
Recherchen unmöglich
Bei nur 669 Datensätzen
erfolgte keine Evaluierung
der Dateninhalte !
Probleme mit Datenbankinhalten
Landesamt für Geologie und Bergwesen
Halle, den 16.04.2009
Bearbeitungsstand der Landesbohrdatenbank
Bearbeitungsstand: 05.03.2009
Erfasste Bohrungen:
190.855
Davon
Schichtdaten SEP1 insgesamt:
Schichtdaten SEP3 insgesamt:
1.511.178
163.534
Probleme mit Datenbankinhalten
Probleme mit Datenbankinhalten
Verschlüsselung mit SchichtenErfassungs-Programm (SEP 1)
+VT;
kgf-dc,ce,
bro4("q","fs",G:s,du:0.001),deu,ss,wl,ss
mm,bn(F:h,F:d),klfl("kao","ca","ch"),
Z:TZ(58.3-60.0,kao4-gr4,zg)
+VT-G(v);
kgm-kgg,ce
("fs","q",G:s),c4(duz:0.010.1,+Gp,^u,^s),bro4("q",duz:0.0010.002,ds-ml,"fs",duz:0.0010.005,F:hro,voe,duh:0.015),zt,+VT^b,ssmm(s),klv2,par,ss,klfl,"hm",^fs^gs-lag,zt,^u-lag
Probleme mit Datenbankinhalten
Inkonsistenz
Inhomogenität
Mehrdeutigkeit
Eine DV-technische
Überarbeitung ist
nur teilweise
möglich
Auflösung von zusammengefassten Schichten in Schicht und Unterschicht
Probleme mit Datenbankinhalten
SEP 3 ist kein Programm und
auch kein Dateiformat, sondern
die Beschreibung einer
Datenstruktur.
Auswertung ….?
Quo vadis Geodaten …
Auswege aus dem Datenchaos
multi-user Datenbanksystem
Umfangreiche Datenanalyse
Wer hat
Wer pflegt
Wer braucht
Wem nutzt
Maximale Datenintegration
Keine Mammutprojekte
sondern stufenweiser
Ausbau nach einem
Gesamtkonzept
•Neustrukturierung der Dateninhalte aus der
Perspektive der Datenrecherche
•Numerische Daten haben Vorrang vor
alphanumerischen Daten
•Kleinteilige Feldstrukturierungen
•Sinnvolle Auswahllisten
•Selbsterklärende Feld- und Tabellennamen
Take off in die schöne neue Geodatenwelt
Gegenseitige Information
Transparenz
Zusammenarbeit
Projektarbeit
Projektdiskussion
Datenanalyse
Datenevaluierung
Datenintegration
Datenbankentwicklung
Vielen Dank und gute Landung
Slide 10
Qualitätsanforderungen an Geodaten
von
Matthias Thomae
10. Zittauer Umweltsymposium 21.-22. April 2009 in Ostritz
1.
2.
3.
4.
5.
GLIEDERUNG
Bedeutung von Geodaten
Geodaten und Datenbanken
„Fachleute“ als Datenbankdesigner
Probleme mit Datenbankinhalten
Auswege aus dem Datenchaos
Bedeutung von Geodaten
… vor ca. 150 Jahren war das Wissen
über unsere Erde und der in und auf
ihr stattfindenden Prozesse
bescheiden
Geodaten gab es nicht flächendeckend,
wie die „weißen Flecken“ auf dem
Globus zeigen
Bibliotheksglobus, Berlin 1871
1871 veröffentlicht Darwin "The Descent of Man".
Bedeutung von Geodaten
Das Wissen ist in den letzten 150 Jahren exponentiell gewachsen
w issenschaftliche Veröffentlichungen
100
20000
90
18000
80
16000
70
14000
60
12000
Anzahl
Anzahl [Mio.]
Wissenschaftler
50
10000
40
8000
30
6000
20
4000
10
2000
0
0
1950
1850
1950
Jahr
2000
Jahr
2000
1880 kannte die Chemie 20 000 chemische Verbindungen, heute sind es ca. 17 Millionen
Bedeutung von Geodaten
Was sind eigentlich Geodaten ?
•Geodaten sind digitale Informationen, denen
eine bestimmte räumliche Lage zugewiesen
werden kann (Geoinformationen, Geobezug)
•Geodaten bestehen aus Geobasisdaten und
Geofachdaten, die aus unterschiedlichen
raumbezogenen Fachdatenbanken stammen
•Metadaten beschreiben die eigentlichen
räumlichen Daten hinsichtlich des Zeitbezugs
und der Datenquelle
•Geoinformationssystem dienen zur
Visualisierung und Recherche von Geodaten
Geodaten und Datenbanken
Informationen der analogen Geodaten
sind auf eine Ebene,
die statische Karte begrenzt
Informationen der digitalen
Geodaten sind theoretisch
unbegrenzt als dynamische Karte
dargestellt und sind mit
Sachdaten verbunden
Geodaten und Datenbanken
Komplexität und Variabilität der Geodaten
verlangt eine Datenhaltung in Datenbanken
Geodaten im Jahre 2009
Fläche 44 km² (9,4 km x 4,7 km)
27 Themen (Ebenen)
4 komplexe Datenbanken
136 Polygone (geologische Flächen)
Geodaten und Datenbanken
Computerbasierte datenverarbeitende Technologien revolutionieren alle
gesellschaftlichen Bereiche
Es gibt enorm effiziente Techniken, informationstragende Daten
zu speichern,
zu transportieren
und in neue Daten zu transformieren.
Alle gesellschaftlichen Bereiche sind gezwungen, sich so umzugestalten, dass in ihnen
die computerbasierten datenverarbeitenden Technologien genutzt werden können.
Völlig zu Unrecht wird dieser technologische und ökonomische Großtrend als Weg zur
"Wissens- und Kommunikationsgesellschaft" gefeiert.
In Wahrheit handelt es sich nicht um Wege zur Wissensgesellschaft,
sondern erst einmal nur um die Zwänge einer Gesellschaft
computerbasierte datenverarbeitende Technologien in allen
gesellschaftlichen Bereichen durchzusetzen.
Geodaten und Datenbanken
Strukturierte Ablage von Geodaten ist notwendig …
… ABER welches Datenbankmodell ?
•Hierarchisches Datenbankmodell ?
Datenobjekte stehen in einer Eltern-KindBeziehungen zueinander.
Netzwerkdatenbankmodell ?
Datenobjekte werden miteinander in
Netzen verbunden.
•Relationale Datenbank ?
Die Daten werden zeilenweise in Tabellen
verwaltet. Es kann beliebige Beziehungen
zwischen Daten geben.
•Objektdatenbank ?
Beziehungen zwischen Datenobjekten
werden vom Datenbanksystem selbst
verwaltet. Objekte können Eigenschaften
und Daten von anderen Objekten erben.
„Fachleute“ als Datenbankdesigner
meine Daten
mein Problem
meine Lösung
Individualsicht - Nutzersicht
single-user Datenbanksystem
•viele alphanumerische Felder
•zu geringe Aufgliederung der
Felder
•Tabellen- und Feldnamen sind
nur dem Entwickler verständlich
… und wie sehen eigentlich die Daten aus ?
•Keine optimale
Tabellenverknüpfung und
Indizierung
„Fachleute“ als Datenbankdesigner
Tyisch für analoge Geodaten sind:
•Inkonsistenz:
Widersprüchlichkeit zwischen den Daten
•Inhomogenität:
Uneinheitlichkeit der Elemente einer
Menge
•Mehrdeutigkeit:
mehrere Bedeutungen eines Begriffes
oder Zeichens
• Redundanz:
Informationen in einer Informationsquelle
sind mehrfach vorhanden
Probleme mit Datenbankinhalten
Bergbau- und Rohstoffdatenbank
Teildatenbank Rohstoffe
Mehrdeutige Dateninhalte im
Feld „Nutzungskonflikte“
machen qualifizierte
Recherchen unmöglich
Bei nur 669 Datensätzen
erfolgte keine Evaluierung
der Dateninhalte !
Probleme mit Datenbankinhalten
Landesamt für Geologie und Bergwesen
Halle, den 16.04.2009
Bearbeitungsstand der Landesbohrdatenbank
Bearbeitungsstand: 05.03.2009
Erfasste Bohrungen:
190.855
Davon
Schichtdaten SEP1 insgesamt:
Schichtdaten SEP3 insgesamt:
1.511.178
163.534
Probleme mit Datenbankinhalten
Probleme mit Datenbankinhalten
Verschlüsselung mit SchichtenErfassungs-Programm (SEP 1)
+VT;
kgf-dc,ce,
bro4("q","fs",G:s,du:0.001),deu,ss,wl,ss
mm,bn(F:h,F:d),klfl("kao","ca","ch"),
Z:TZ(58.3-60.0,kao4-gr4,zg)
+VT-G(v);
kgm-kgg,ce
("fs","q",G:s),c4(duz:0.010.1,+Gp,^u,^s),bro4("q",duz:0.0010.002,ds-ml,"fs",duz:0.0010.005,F:hro,voe,duh:0.015),zt,+VT^b,ssmm(s),klv2,par,ss,klfl,"hm",^fs^gs-lag,zt,^u-lag
Probleme mit Datenbankinhalten
Inkonsistenz
Inhomogenität
Mehrdeutigkeit
Eine DV-technische
Überarbeitung ist
nur teilweise
möglich
Auflösung von zusammengefassten Schichten in Schicht und Unterschicht
Probleme mit Datenbankinhalten
SEP 3 ist kein Programm und
auch kein Dateiformat, sondern
die Beschreibung einer
Datenstruktur.
Auswertung ….?
Quo vadis Geodaten …
Auswege aus dem Datenchaos
multi-user Datenbanksystem
Umfangreiche Datenanalyse
Wer hat
Wer pflegt
Wer braucht
Wem nutzt
Maximale Datenintegration
Keine Mammutprojekte
sondern stufenweiser
Ausbau nach einem
Gesamtkonzept
•Neustrukturierung der Dateninhalte aus der
Perspektive der Datenrecherche
•Numerische Daten haben Vorrang vor
alphanumerischen Daten
•Kleinteilige Feldstrukturierungen
•Sinnvolle Auswahllisten
•Selbsterklärende Feld- und Tabellennamen
Take off in die schöne neue Geodatenwelt
Gegenseitige Information
Transparenz
Zusammenarbeit
Projektarbeit
Projektdiskussion
Datenanalyse
Datenevaluierung
Datenintegration
Datenbankentwicklung
Vielen Dank und gute Landung
Slide 11
Qualitätsanforderungen an Geodaten
von
Matthias Thomae
10. Zittauer Umweltsymposium 21.-22. April 2009 in Ostritz
1.
2.
3.
4.
5.
GLIEDERUNG
Bedeutung von Geodaten
Geodaten und Datenbanken
„Fachleute“ als Datenbankdesigner
Probleme mit Datenbankinhalten
Auswege aus dem Datenchaos
Bedeutung von Geodaten
… vor ca. 150 Jahren war das Wissen
über unsere Erde und der in und auf
ihr stattfindenden Prozesse
bescheiden
Geodaten gab es nicht flächendeckend,
wie die „weißen Flecken“ auf dem
Globus zeigen
Bibliotheksglobus, Berlin 1871
1871 veröffentlicht Darwin "The Descent of Man".
Bedeutung von Geodaten
Das Wissen ist in den letzten 150 Jahren exponentiell gewachsen
w issenschaftliche Veröffentlichungen
100
20000
90
18000
80
16000
70
14000
60
12000
Anzahl
Anzahl [Mio.]
Wissenschaftler
50
10000
40
8000
30
6000
20
4000
10
2000
0
0
1950
1850
1950
Jahr
2000
Jahr
2000
1880 kannte die Chemie 20 000 chemische Verbindungen, heute sind es ca. 17 Millionen
Bedeutung von Geodaten
Was sind eigentlich Geodaten ?
•Geodaten sind digitale Informationen, denen
eine bestimmte räumliche Lage zugewiesen
werden kann (Geoinformationen, Geobezug)
•Geodaten bestehen aus Geobasisdaten und
Geofachdaten, die aus unterschiedlichen
raumbezogenen Fachdatenbanken stammen
•Metadaten beschreiben die eigentlichen
räumlichen Daten hinsichtlich des Zeitbezugs
und der Datenquelle
•Geoinformationssystem dienen zur
Visualisierung und Recherche von Geodaten
Geodaten und Datenbanken
Informationen der analogen Geodaten
sind auf eine Ebene,
die statische Karte begrenzt
Informationen der digitalen
Geodaten sind theoretisch
unbegrenzt als dynamische Karte
dargestellt und sind mit
Sachdaten verbunden
Geodaten und Datenbanken
Komplexität und Variabilität der Geodaten
verlangt eine Datenhaltung in Datenbanken
Geodaten im Jahre 2009
Fläche 44 km² (9,4 km x 4,7 km)
27 Themen (Ebenen)
4 komplexe Datenbanken
136 Polygone (geologische Flächen)
Geodaten und Datenbanken
Computerbasierte datenverarbeitende Technologien revolutionieren alle
gesellschaftlichen Bereiche
Es gibt enorm effiziente Techniken, informationstragende Daten
zu speichern,
zu transportieren
und in neue Daten zu transformieren.
Alle gesellschaftlichen Bereiche sind gezwungen, sich so umzugestalten, dass in ihnen
die computerbasierten datenverarbeitenden Technologien genutzt werden können.
Völlig zu Unrecht wird dieser technologische und ökonomische Großtrend als Weg zur
"Wissens- und Kommunikationsgesellschaft" gefeiert.
In Wahrheit handelt es sich nicht um Wege zur Wissensgesellschaft,
sondern erst einmal nur um die Zwänge einer Gesellschaft
computerbasierte datenverarbeitende Technologien in allen
gesellschaftlichen Bereichen durchzusetzen.
Geodaten und Datenbanken
Strukturierte Ablage von Geodaten ist notwendig …
… ABER welches Datenbankmodell ?
•Hierarchisches Datenbankmodell ?
Datenobjekte stehen in einer Eltern-KindBeziehungen zueinander.
Netzwerkdatenbankmodell ?
Datenobjekte werden miteinander in
Netzen verbunden.
•Relationale Datenbank ?
Die Daten werden zeilenweise in Tabellen
verwaltet. Es kann beliebige Beziehungen
zwischen Daten geben.
•Objektdatenbank ?
Beziehungen zwischen Datenobjekten
werden vom Datenbanksystem selbst
verwaltet. Objekte können Eigenschaften
und Daten von anderen Objekten erben.
„Fachleute“ als Datenbankdesigner
meine Daten
mein Problem
meine Lösung
Individualsicht - Nutzersicht
single-user Datenbanksystem
•viele alphanumerische Felder
•zu geringe Aufgliederung der
Felder
•Tabellen- und Feldnamen sind
nur dem Entwickler verständlich
… und wie sehen eigentlich die Daten aus ?
•Keine optimale
Tabellenverknüpfung und
Indizierung
„Fachleute“ als Datenbankdesigner
Tyisch für analoge Geodaten sind:
•Inkonsistenz:
Widersprüchlichkeit zwischen den Daten
•Inhomogenität:
Uneinheitlichkeit der Elemente einer
Menge
•Mehrdeutigkeit:
mehrere Bedeutungen eines Begriffes
oder Zeichens
• Redundanz:
Informationen in einer Informationsquelle
sind mehrfach vorhanden
Probleme mit Datenbankinhalten
Bergbau- und Rohstoffdatenbank
Teildatenbank Rohstoffe
Mehrdeutige Dateninhalte im
Feld „Nutzungskonflikte“
machen qualifizierte
Recherchen unmöglich
Bei nur 669 Datensätzen
erfolgte keine Evaluierung
der Dateninhalte !
Probleme mit Datenbankinhalten
Landesamt für Geologie und Bergwesen
Halle, den 16.04.2009
Bearbeitungsstand der Landesbohrdatenbank
Bearbeitungsstand: 05.03.2009
Erfasste Bohrungen:
190.855
Davon
Schichtdaten SEP1 insgesamt:
Schichtdaten SEP3 insgesamt:
1.511.178
163.534
Probleme mit Datenbankinhalten
Probleme mit Datenbankinhalten
Verschlüsselung mit SchichtenErfassungs-Programm (SEP 1)
+VT;
kgf-dc,ce,
bro4("q","fs",G:s,du:0.001),deu,ss,wl,ss
mm,bn(F:h,F:d),klfl("kao","ca","ch"),
Z:TZ(58.3-60.0,kao4-gr4,zg)
+VT-G(v);
kgm-kgg,ce
("fs","q",G:s),c4(duz:0.010.1,+Gp,^u,^s),bro4("q",duz:0.0010.002,ds-ml,"fs",duz:0.0010.005,F:hro,voe,duh:0.015),zt,+VT^b,ssmm(s),klv2,par,ss,klfl,"hm",^fs^gs-lag,zt,^u-lag
Probleme mit Datenbankinhalten
Inkonsistenz
Inhomogenität
Mehrdeutigkeit
Eine DV-technische
Überarbeitung ist
nur teilweise
möglich
Auflösung von zusammengefassten Schichten in Schicht und Unterschicht
Probleme mit Datenbankinhalten
SEP 3 ist kein Programm und
auch kein Dateiformat, sondern
die Beschreibung einer
Datenstruktur.
Auswertung ….?
Quo vadis Geodaten …
Auswege aus dem Datenchaos
multi-user Datenbanksystem
Umfangreiche Datenanalyse
Wer hat
Wer pflegt
Wer braucht
Wem nutzt
Maximale Datenintegration
Keine Mammutprojekte
sondern stufenweiser
Ausbau nach einem
Gesamtkonzept
•Neustrukturierung der Dateninhalte aus der
Perspektive der Datenrecherche
•Numerische Daten haben Vorrang vor
alphanumerischen Daten
•Kleinteilige Feldstrukturierungen
•Sinnvolle Auswahllisten
•Selbsterklärende Feld- und Tabellennamen
Take off in die schöne neue Geodatenwelt
Gegenseitige Information
Transparenz
Zusammenarbeit
Projektarbeit
Projektdiskussion
Datenanalyse
Datenevaluierung
Datenintegration
Datenbankentwicklung
Vielen Dank und gute Landung
Slide 12
Qualitätsanforderungen an Geodaten
von
Matthias Thomae
10. Zittauer Umweltsymposium 21.-22. April 2009 in Ostritz
1.
2.
3.
4.
5.
GLIEDERUNG
Bedeutung von Geodaten
Geodaten und Datenbanken
„Fachleute“ als Datenbankdesigner
Probleme mit Datenbankinhalten
Auswege aus dem Datenchaos
Bedeutung von Geodaten
… vor ca. 150 Jahren war das Wissen
über unsere Erde und der in und auf
ihr stattfindenden Prozesse
bescheiden
Geodaten gab es nicht flächendeckend,
wie die „weißen Flecken“ auf dem
Globus zeigen
Bibliotheksglobus, Berlin 1871
1871 veröffentlicht Darwin "The Descent of Man".
Bedeutung von Geodaten
Das Wissen ist in den letzten 150 Jahren exponentiell gewachsen
w issenschaftliche Veröffentlichungen
100
20000
90
18000
80
16000
70
14000
60
12000
Anzahl
Anzahl [Mio.]
Wissenschaftler
50
10000
40
8000
30
6000
20
4000
10
2000
0
0
1950
1850
1950
Jahr
2000
Jahr
2000
1880 kannte die Chemie 20 000 chemische Verbindungen, heute sind es ca. 17 Millionen
Bedeutung von Geodaten
Was sind eigentlich Geodaten ?
•Geodaten sind digitale Informationen, denen
eine bestimmte räumliche Lage zugewiesen
werden kann (Geoinformationen, Geobezug)
•Geodaten bestehen aus Geobasisdaten und
Geofachdaten, die aus unterschiedlichen
raumbezogenen Fachdatenbanken stammen
•Metadaten beschreiben die eigentlichen
räumlichen Daten hinsichtlich des Zeitbezugs
und der Datenquelle
•Geoinformationssystem dienen zur
Visualisierung und Recherche von Geodaten
Geodaten und Datenbanken
Informationen der analogen Geodaten
sind auf eine Ebene,
die statische Karte begrenzt
Informationen der digitalen
Geodaten sind theoretisch
unbegrenzt als dynamische Karte
dargestellt und sind mit
Sachdaten verbunden
Geodaten und Datenbanken
Komplexität und Variabilität der Geodaten
verlangt eine Datenhaltung in Datenbanken
Geodaten im Jahre 2009
Fläche 44 km² (9,4 km x 4,7 km)
27 Themen (Ebenen)
4 komplexe Datenbanken
136 Polygone (geologische Flächen)
Geodaten und Datenbanken
Computerbasierte datenverarbeitende Technologien revolutionieren alle
gesellschaftlichen Bereiche
Es gibt enorm effiziente Techniken, informationstragende Daten
zu speichern,
zu transportieren
und in neue Daten zu transformieren.
Alle gesellschaftlichen Bereiche sind gezwungen, sich so umzugestalten, dass in ihnen
die computerbasierten datenverarbeitenden Technologien genutzt werden können.
Völlig zu Unrecht wird dieser technologische und ökonomische Großtrend als Weg zur
"Wissens- und Kommunikationsgesellschaft" gefeiert.
In Wahrheit handelt es sich nicht um Wege zur Wissensgesellschaft,
sondern erst einmal nur um die Zwänge einer Gesellschaft
computerbasierte datenverarbeitende Technologien in allen
gesellschaftlichen Bereichen durchzusetzen.
Geodaten und Datenbanken
Strukturierte Ablage von Geodaten ist notwendig …
… ABER welches Datenbankmodell ?
•Hierarchisches Datenbankmodell ?
Datenobjekte stehen in einer Eltern-KindBeziehungen zueinander.
Netzwerkdatenbankmodell ?
Datenobjekte werden miteinander in
Netzen verbunden.
•Relationale Datenbank ?
Die Daten werden zeilenweise in Tabellen
verwaltet. Es kann beliebige Beziehungen
zwischen Daten geben.
•Objektdatenbank ?
Beziehungen zwischen Datenobjekten
werden vom Datenbanksystem selbst
verwaltet. Objekte können Eigenschaften
und Daten von anderen Objekten erben.
„Fachleute“ als Datenbankdesigner
meine Daten
mein Problem
meine Lösung
Individualsicht - Nutzersicht
single-user Datenbanksystem
•viele alphanumerische Felder
•zu geringe Aufgliederung der
Felder
•Tabellen- und Feldnamen sind
nur dem Entwickler verständlich
… und wie sehen eigentlich die Daten aus ?
•Keine optimale
Tabellenverknüpfung und
Indizierung
„Fachleute“ als Datenbankdesigner
Tyisch für analoge Geodaten sind:
•Inkonsistenz:
Widersprüchlichkeit zwischen den Daten
•Inhomogenität:
Uneinheitlichkeit der Elemente einer
Menge
•Mehrdeutigkeit:
mehrere Bedeutungen eines Begriffes
oder Zeichens
• Redundanz:
Informationen in einer Informationsquelle
sind mehrfach vorhanden
Probleme mit Datenbankinhalten
Bergbau- und Rohstoffdatenbank
Teildatenbank Rohstoffe
Mehrdeutige Dateninhalte im
Feld „Nutzungskonflikte“
machen qualifizierte
Recherchen unmöglich
Bei nur 669 Datensätzen
erfolgte keine Evaluierung
der Dateninhalte !
Probleme mit Datenbankinhalten
Landesamt für Geologie und Bergwesen
Halle, den 16.04.2009
Bearbeitungsstand der Landesbohrdatenbank
Bearbeitungsstand: 05.03.2009
Erfasste Bohrungen:
190.855
Davon
Schichtdaten SEP1 insgesamt:
Schichtdaten SEP3 insgesamt:
1.511.178
163.534
Probleme mit Datenbankinhalten
Probleme mit Datenbankinhalten
Verschlüsselung mit SchichtenErfassungs-Programm (SEP 1)
+VT;
kgf-dc,ce,
bro4("q","fs",G:s,du:0.001),deu,ss,wl,ss
mm,bn(F:h,F:d),klfl("kao","ca","ch"),
Z:TZ(58.3-60.0,kao4-gr4,zg)
+VT-G(v);
kgm-kgg,ce
("fs","q",G:s),c4(duz:0.010.1,+Gp,^u,^s),bro4("q",duz:0.0010.002,ds-ml,"fs",duz:0.0010.005,F:hro,voe,duh:0.015),zt,+VT^b,ssmm(s),klv2,par,ss,klfl,"hm",^fs^gs-lag,zt,^u-lag
Probleme mit Datenbankinhalten
Inkonsistenz
Inhomogenität
Mehrdeutigkeit
Eine DV-technische
Überarbeitung ist
nur teilweise
möglich
Auflösung von zusammengefassten Schichten in Schicht und Unterschicht
Probleme mit Datenbankinhalten
SEP 3 ist kein Programm und
auch kein Dateiformat, sondern
die Beschreibung einer
Datenstruktur.
Auswertung ….?
Quo vadis Geodaten …
Auswege aus dem Datenchaos
multi-user Datenbanksystem
Umfangreiche Datenanalyse
Wer hat
Wer pflegt
Wer braucht
Wem nutzt
Maximale Datenintegration
Keine Mammutprojekte
sondern stufenweiser
Ausbau nach einem
Gesamtkonzept
•Neustrukturierung der Dateninhalte aus der
Perspektive der Datenrecherche
•Numerische Daten haben Vorrang vor
alphanumerischen Daten
•Kleinteilige Feldstrukturierungen
•Sinnvolle Auswahllisten
•Selbsterklärende Feld- und Tabellennamen
Take off in die schöne neue Geodatenwelt
Gegenseitige Information
Transparenz
Zusammenarbeit
Projektarbeit
Projektdiskussion
Datenanalyse
Datenevaluierung
Datenintegration
Datenbankentwicklung
Vielen Dank und gute Landung
Slide 13
Qualitätsanforderungen an Geodaten
von
Matthias Thomae
10. Zittauer Umweltsymposium 21.-22. April 2009 in Ostritz
1.
2.
3.
4.
5.
GLIEDERUNG
Bedeutung von Geodaten
Geodaten und Datenbanken
„Fachleute“ als Datenbankdesigner
Probleme mit Datenbankinhalten
Auswege aus dem Datenchaos
Bedeutung von Geodaten
… vor ca. 150 Jahren war das Wissen
über unsere Erde und der in und auf
ihr stattfindenden Prozesse
bescheiden
Geodaten gab es nicht flächendeckend,
wie die „weißen Flecken“ auf dem
Globus zeigen
Bibliotheksglobus, Berlin 1871
1871 veröffentlicht Darwin "The Descent of Man".
Bedeutung von Geodaten
Das Wissen ist in den letzten 150 Jahren exponentiell gewachsen
w issenschaftliche Veröffentlichungen
100
20000
90
18000
80
16000
70
14000
60
12000
Anzahl
Anzahl [Mio.]
Wissenschaftler
50
10000
40
8000
30
6000
20
4000
10
2000
0
0
1950
1850
1950
Jahr
2000
Jahr
2000
1880 kannte die Chemie 20 000 chemische Verbindungen, heute sind es ca. 17 Millionen
Bedeutung von Geodaten
Was sind eigentlich Geodaten ?
•Geodaten sind digitale Informationen, denen
eine bestimmte räumliche Lage zugewiesen
werden kann (Geoinformationen, Geobezug)
•Geodaten bestehen aus Geobasisdaten und
Geofachdaten, die aus unterschiedlichen
raumbezogenen Fachdatenbanken stammen
•Metadaten beschreiben die eigentlichen
räumlichen Daten hinsichtlich des Zeitbezugs
und der Datenquelle
•Geoinformationssystem dienen zur
Visualisierung und Recherche von Geodaten
Geodaten und Datenbanken
Informationen der analogen Geodaten
sind auf eine Ebene,
die statische Karte begrenzt
Informationen der digitalen
Geodaten sind theoretisch
unbegrenzt als dynamische Karte
dargestellt und sind mit
Sachdaten verbunden
Geodaten und Datenbanken
Komplexität und Variabilität der Geodaten
verlangt eine Datenhaltung in Datenbanken
Geodaten im Jahre 2009
Fläche 44 km² (9,4 km x 4,7 km)
27 Themen (Ebenen)
4 komplexe Datenbanken
136 Polygone (geologische Flächen)
Geodaten und Datenbanken
Computerbasierte datenverarbeitende Technologien revolutionieren alle
gesellschaftlichen Bereiche
Es gibt enorm effiziente Techniken, informationstragende Daten
zu speichern,
zu transportieren
und in neue Daten zu transformieren.
Alle gesellschaftlichen Bereiche sind gezwungen, sich so umzugestalten, dass in ihnen
die computerbasierten datenverarbeitenden Technologien genutzt werden können.
Völlig zu Unrecht wird dieser technologische und ökonomische Großtrend als Weg zur
"Wissens- und Kommunikationsgesellschaft" gefeiert.
In Wahrheit handelt es sich nicht um Wege zur Wissensgesellschaft,
sondern erst einmal nur um die Zwänge einer Gesellschaft
computerbasierte datenverarbeitende Technologien in allen
gesellschaftlichen Bereichen durchzusetzen.
Geodaten und Datenbanken
Strukturierte Ablage von Geodaten ist notwendig …
… ABER welches Datenbankmodell ?
•Hierarchisches Datenbankmodell ?
Datenobjekte stehen in einer Eltern-KindBeziehungen zueinander.
Netzwerkdatenbankmodell ?
Datenobjekte werden miteinander in
Netzen verbunden.
•Relationale Datenbank ?
Die Daten werden zeilenweise in Tabellen
verwaltet. Es kann beliebige Beziehungen
zwischen Daten geben.
•Objektdatenbank ?
Beziehungen zwischen Datenobjekten
werden vom Datenbanksystem selbst
verwaltet. Objekte können Eigenschaften
und Daten von anderen Objekten erben.
„Fachleute“ als Datenbankdesigner
meine Daten
mein Problem
meine Lösung
Individualsicht - Nutzersicht
single-user Datenbanksystem
•viele alphanumerische Felder
•zu geringe Aufgliederung der
Felder
•Tabellen- und Feldnamen sind
nur dem Entwickler verständlich
… und wie sehen eigentlich die Daten aus ?
•Keine optimale
Tabellenverknüpfung und
Indizierung
„Fachleute“ als Datenbankdesigner
Tyisch für analoge Geodaten sind:
•Inkonsistenz:
Widersprüchlichkeit zwischen den Daten
•Inhomogenität:
Uneinheitlichkeit der Elemente einer
Menge
•Mehrdeutigkeit:
mehrere Bedeutungen eines Begriffes
oder Zeichens
• Redundanz:
Informationen in einer Informationsquelle
sind mehrfach vorhanden
Probleme mit Datenbankinhalten
Bergbau- und Rohstoffdatenbank
Teildatenbank Rohstoffe
Mehrdeutige Dateninhalte im
Feld „Nutzungskonflikte“
machen qualifizierte
Recherchen unmöglich
Bei nur 669 Datensätzen
erfolgte keine Evaluierung
der Dateninhalte !
Probleme mit Datenbankinhalten
Landesamt für Geologie und Bergwesen
Halle, den 16.04.2009
Bearbeitungsstand der Landesbohrdatenbank
Bearbeitungsstand: 05.03.2009
Erfasste Bohrungen:
190.855
Davon
Schichtdaten SEP1 insgesamt:
Schichtdaten SEP3 insgesamt:
1.511.178
163.534
Probleme mit Datenbankinhalten
Probleme mit Datenbankinhalten
Verschlüsselung mit SchichtenErfassungs-Programm (SEP 1)
+VT;
kgf-dc,ce,
bro4("q","fs",G:s,du:0.001),deu,ss,wl,ss
mm,bn(F:h,F:d),klfl("kao","ca","ch"),
Z:TZ(58.3-60.0,kao4-gr4,zg)
+VT-G(v);
kgm-kgg,ce
("fs","q",G:s),c4(duz:0.010.1,+Gp,^u,^s),bro4("q",duz:0.0010.002,ds-ml,"fs",duz:0.0010.005,F:hro,voe,duh:0.015),zt,+VT^b,ssmm(s),klv2,par,ss,klfl,"hm",^fs^gs-lag,zt,^u-lag
Probleme mit Datenbankinhalten
Inkonsistenz
Inhomogenität
Mehrdeutigkeit
Eine DV-technische
Überarbeitung ist
nur teilweise
möglich
Auflösung von zusammengefassten Schichten in Schicht und Unterschicht
Probleme mit Datenbankinhalten
SEP 3 ist kein Programm und
auch kein Dateiformat, sondern
die Beschreibung einer
Datenstruktur.
Auswertung ….?
Quo vadis Geodaten …
Auswege aus dem Datenchaos
multi-user Datenbanksystem
Umfangreiche Datenanalyse
Wer hat
Wer pflegt
Wer braucht
Wem nutzt
Maximale Datenintegration
Keine Mammutprojekte
sondern stufenweiser
Ausbau nach einem
Gesamtkonzept
•Neustrukturierung der Dateninhalte aus der
Perspektive der Datenrecherche
•Numerische Daten haben Vorrang vor
alphanumerischen Daten
•Kleinteilige Feldstrukturierungen
•Sinnvolle Auswahllisten
•Selbsterklärende Feld- und Tabellennamen
Take off in die schöne neue Geodatenwelt
Gegenseitige Information
Transparenz
Zusammenarbeit
Projektarbeit
Projektdiskussion
Datenanalyse
Datenevaluierung
Datenintegration
Datenbankentwicklung
Vielen Dank und gute Landung
Slide 14
Qualitätsanforderungen an Geodaten
von
Matthias Thomae
10. Zittauer Umweltsymposium 21.-22. April 2009 in Ostritz
1.
2.
3.
4.
5.
GLIEDERUNG
Bedeutung von Geodaten
Geodaten und Datenbanken
„Fachleute“ als Datenbankdesigner
Probleme mit Datenbankinhalten
Auswege aus dem Datenchaos
Bedeutung von Geodaten
… vor ca. 150 Jahren war das Wissen
über unsere Erde und der in und auf
ihr stattfindenden Prozesse
bescheiden
Geodaten gab es nicht flächendeckend,
wie die „weißen Flecken“ auf dem
Globus zeigen
Bibliotheksglobus, Berlin 1871
1871 veröffentlicht Darwin "The Descent of Man".
Bedeutung von Geodaten
Das Wissen ist in den letzten 150 Jahren exponentiell gewachsen
w issenschaftliche Veröffentlichungen
100
20000
90
18000
80
16000
70
14000
60
12000
Anzahl
Anzahl [Mio.]
Wissenschaftler
50
10000
40
8000
30
6000
20
4000
10
2000
0
0
1950
1850
1950
Jahr
2000
Jahr
2000
1880 kannte die Chemie 20 000 chemische Verbindungen, heute sind es ca. 17 Millionen
Bedeutung von Geodaten
Was sind eigentlich Geodaten ?
•Geodaten sind digitale Informationen, denen
eine bestimmte räumliche Lage zugewiesen
werden kann (Geoinformationen, Geobezug)
•Geodaten bestehen aus Geobasisdaten und
Geofachdaten, die aus unterschiedlichen
raumbezogenen Fachdatenbanken stammen
•Metadaten beschreiben die eigentlichen
räumlichen Daten hinsichtlich des Zeitbezugs
und der Datenquelle
•Geoinformationssystem dienen zur
Visualisierung und Recherche von Geodaten
Geodaten und Datenbanken
Informationen der analogen Geodaten
sind auf eine Ebene,
die statische Karte begrenzt
Informationen der digitalen
Geodaten sind theoretisch
unbegrenzt als dynamische Karte
dargestellt und sind mit
Sachdaten verbunden
Geodaten und Datenbanken
Komplexität und Variabilität der Geodaten
verlangt eine Datenhaltung in Datenbanken
Geodaten im Jahre 2009
Fläche 44 km² (9,4 km x 4,7 km)
27 Themen (Ebenen)
4 komplexe Datenbanken
136 Polygone (geologische Flächen)
Geodaten und Datenbanken
Computerbasierte datenverarbeitende Technologien revolutionieren alle
gesellschaftlichen Bereiche
Es gibt enorm effiziente Techniken, informationstragende Daten
zu speichern,
zu transportieren
und in neue Daten zu transformieren.
Alle gesellschaftlichen Bereiche sind gezwungen, sich so umzugestalten, dass in ihnen
die computerbasierten datenverarbeitenden Technologien genutzt werden können.
Völlig zu Unrecht wird dieser technologische und ökonomische Großtrend als Weg zur
"Wissens- und Kommunikationsgesellschaft" gefeiert.
In Wahrheit handelt es sich nicht um Wege zur Wissensgesellschaft,
sondern erst einmal nur um die Zwänge einer Gesellschaft
computerbasierte datenverarbeitende Technologien in allen
gesellschaftlichen Bereichen durchzusetzen.
Geodaten und Datenbanken
Strukturierte Ablage von Geodaten ist notwendig …
… ABER welches Datenbankmodell ?
•Hierarchisches Datenbankmodell ?
Datenobjekte stehen in einer Eltern-KindBeziehungen zueinander.
Netzwerkdatenbankmodell ?
Datenobjekte werden miteinander in
Netzen verbunden.
•Relationale Datenbank ?
Die Daten werden zeilenweise in Tabellen
verwaltet. Es kann beliebige Beziehungen
zwischen Daten geben.
•Objektdatenbank ?
Beziehungen zwischen Datenobjekten
werden vom Datenbanksystem selbst
verwaltet. Objekte können Eigenschaften
und Daten von anderen Objekten erben.
„Fachleute“ als Datenbankdesigner
meine Daten
mein Problem
meine Lösung
Individualsicht - Nutzersicht
single-user Datenbanksystem
•viele alphanumerische Felder
•zu geringe Aufgliederung der
Felder
•Tabellen- und Feldnamen sind
nur dem Entwickler verständlich
… und wie sehen eigentlich die Daten aus ?
•Keine optimale
Tabellenverknüpfung und
Indizierung
„Fachleute“ als Datenbankdesigner
Tyisch für analoge Geodaten sind:
•Inkonsistenz:
Widersprüchlichkeit zwischen den Daten
•Inhomogenität:
Uneinheitlichkeit der Elemente einer
Menge
•Mehrdeutigkeit:
mehrere Bedeutungen eines Begriffes
oder Zeichens
• Redundanz:
Informationen in einer Informationsquelle
sind mehrfach vorhanden
Probleme mit Datenbankinhalten
Bergbau- und Rohstoffdatenbank
Teildatenbank Rohstoffe
Mehrdeutige Dateninhalte im
Feld „Nutzungskonflikte“
machen qualifizierte
Recherchen unmöglich
Bei nur 669 Datensätzen
erfolgte keine Evaluierung
der Dateninhalte !
Probleme mit Datenbankinhalten
Landesamt für Geologie und Bergwesen
Halle, den 16.04.2009
Bearbeitungsstand der Landesbohrdatenbank
Bearbeitungsstand: 05.03.2009
Erfasste Bohrungen:
190.855
Davon
Schichtdaten SEP1 insgesamt:
Schichtdaten SEP3 insgesamt:
1.511.178
163.534
Probleme mit Datenbankinhalten
Probleme mit Datenbankinhalten
Verschlüsselung mit SchichtenErfassungs-Programm (SEP 1)
+VT;
kgf-dc,ce,
bro4("q","fs",G:s,du:0.001),deu,ss,wl,ss
mm,bn(F:h,F:d),klfl("kao","ca","ch"),
Z:TZ(58.3-60.0,kao4-gr4,zg)
+VT-G(v);
kgm-kgg,ce
("fs","q",G:s),c4(duz:0.010.1,+Gp,^u,^s),bro4("q",duz:0.0010.002,ds-ml,"fs",duz:0.0010.005,F:hro,voe,duh:0.015),zt,+VT^b,ssmm(s),klv2,par,ss,klfl,"hm",^fs^gs-lag,zt,^u-lag
Probleme mit Datenbankinhalten
Inkonsistenz
Inhomogenität
Mehrdeutigkeit
Eine DV-technische
Überarbeitung ist
nur teilweise
möglich
Auflösung von zusammengefassten Schichten in Schicht und Unterschicht
Probleme mit Datenbankinhalten
SEP 3 ist kein Programm und
auch kein Dateiformat, sondern
die Beschreibung einer
Datenstruktur.
Auswertung ….?
Quo vadis Geodaten …
Auswege aus dem Datenchaos
multi-user Datenbanksystem
Umfangreiche Datenanalyse
Wer hat
Wer pflegt
Wer braucht
Wem nutzt
Maximale Datenintegration
Keine Mammutprojekte
sondern stufenweiser
Ausbau nach einem
Gesamtkonzept
•Neustrukturierung der Dateninhalte aus der
Perspektive der Datenrecherche
•Numerische Daten haben Vorrang vor
alphanumerischen Daten
•Kleinteilige Feldstrukturierungen
•Sinnvolle Auswahllisten
•Selbsterklärende Feld- und Tabellennamen
Take off in die schöne neue Geodatenwelt
Gegenseitige Information
Transparenz
Zusammenarbeit
Projektarbeit
Projektdiskussion
Datenanalyse
Datenevaluierung
Datenintegration
Datenbankentwicklung
Vielen Dank und gute Landung
Slide 15
Qualitätsanforderungen an Geodaten
von
Matthias Thomae
10. Zittauer Umweltsymposium 21.-22. April 2009 in Ostritz
1.
2.
3.
4.
5.
GLIEDERUNG
Bedeutung von Geodaten
Geodaten und Datenbanken
„Fachleute“ als Datenbankdesigner
Probleme mit Datenbankinhalten
Auswege aus dem Datenchaos
Bedeutung von Geodaten
… vor ca. 150 Jahren war das Wissen
über unsere Erde und der in und auf
ihr stattfindenden Prozesse
bescheiden
Geodaten gab es nicht flächendeckend,
wie die „weißen Flecken“ auf dem
Globus zeigen
Bibliotheksglobus, Berlin 1871
1871 veröffentlicht Darwin "The Descent of Man".
Bedeutung von Geodaten
Das Wissen ist in den letzten 150 Jahren exponentiell gewachsen
w issenschaftliche Veröffentlichungen
100
20000
90
18000
80
16000
70
14000
60
12000
Anzahl
Anzahl [Mio.]
Wissenschaftler
50
10000
40
8000
30
6000
20
4000
10
2000
0
0
1950
1850
1950
Jahr
2000
Jahr
2000
1880 kannte die Chemie 20 000 chemische Verbindungen, heute sind es ca. 17 Millionen
Bedeutung von Geodaten
Was sind eigentlich Geodaten ?
•Geodaten sind digitale Informationen, denen
eine bestimmte räumliche Lage zugewiesen
werden kann (Geoinformationen, Geobezug)
•Geodaten bestehen aus Geobasisdaten und
Geofachdaten, die aus unterschiedlichen
raumbezogenen Fachdatenbanken stammen
•Metadaten beschreiben die eigentlichen
räumlichen Daten hinsichtlich des Zeitbezugs
und der Datenquelle
•Geoinformationssystem dienen zur
Visualisierung und Recherche von Geodaten
Geodaten und Datenbanken
Informationen der analogen Geodaten
sind auf eine Ebene,
die statische Karte begrenzt
Informationen der digitalen
Geodaten sind theoretisch
unbegrenzt als dynamische Karte
dargestellt und sind mit
Sachdaten verbunden
Geodaten und Datenbanken
Komplexität und Variabilität der Geodaten
verlangt eine Datenhaltung in Datenbanken
Geodaten im Jahre 2009
Fläche 44 km² (9,4 km x 4,7 km)
27 Themen (Ebenen)
4 komplexe Datenbanken
136 Polygone (geologische Flächen)
Geodaten und Datenbanken
Computerbasierte datenverarbeitende Technologien revolutionieren alle
gesellschaftlichen Bereiche
Es gibt enorm effiziente Techniken, informationstragende Daten
zu speichern,
zu transportieren
und in neue Daten zu transformieren.
Alle gesellschaftlichen Bereiche sind gezwungen, sich so umzugestalten, dass in ihnen
die computerbasierten datenverarbeitenden Technologien genutzt werden können.
Völlig zu Unrecht wird dieser technologische und ökonomische Großtrend als Weg zur
"Wissens- und Kommunikationsgesellschaft" gefeiert.
In Wahrheit handelt es sich nicht um Wege zur Wissensgesellschaft,
sondern erst einmal nur um die Zwänge einer Gesellschaft
computerbasierte datenverarbeitende Technologien in allen
gesellschaftlichen Bereichen durchzusetzen.
Geodaten und Datenbanken
Strukturierte Ablage von Geodaten ist notwendig …
… ABER welches Datenbankmodell ?
•Hierarchisches Datenbankmodell ?
Datenobjekte stehen in einer Eltern-KindBeziehungen zueinander.
Netzwerkdatenbankmodell ?
Datenobjekte werden miteinander in
Netzen verbunden.
•Relationale Datenbank ?
Die Daten werden zeilenweise in Tabellen
verwaltet. Es kann beliebige Beziehungen
zwischen Daten geben.
•Objektdatenbank ?
Beziehungen zwischen Datenobjekten
werden vom Datenbanksystem selbst
verwaltet. Objekte können Eigenschaften
und Daten von anderen Objekten erben.
„Fachleute“ als Datenbankdesigner
meine Daten
mein Problem
meine Lösung
Individualsicht - Nutzersicht
single-user Datenbanksystem
•viele alphanumerische Felder
•zu geringe Aufgliederung der
Felder
•Tabellen- und Feldnamen sind
nur dem Entwickler verständlich
… und wie sehen eigentlich die Daten aus ?
•Keine optimale
Tabellenverknüpfung und
Indizierung
„Fachleute“ als Datenbankdesigner
Tyisch für analoge Geodaten sind:
•Inkonsistenz:
Widersprüchlichkeit zwischen den Daten
•Inhomogenität:
Uneinheitlichkeit der Elemente einer
Menge
•Mehrdeutigkeit:
mehrere Bedeutungen eines Begriffes
oder Zeichens
• Redundanz:
Informationen in einer Informationsquelle
sind mehrfach vorhanden
Probleme mit Datenbankinhalten
Bergbau- und Rohstoffdatenbank
Teildatenbank Rohstoffe
Mehrdeutige Dateninhalte im
Feld „Nutzungskonflikte“
machen qualifizierte
Recherchen unmöglich
Bei nur 669 Datensätzen
erfolgte keine Evaluierung
der Dateninhalte !
Probleme mit Datenbankinhalten
Landesamt für Geologie und Bergwesen
Halle, den 16.04.2009
Bearbeitungsstand der Landesbohrdatenbank
Bearbeitungsstand: 05.03.2009
Erfasste Bohrungen:
190.855
Davon
Schichtdaten SEP1 insgesamt:
Schichtdaten SEP3 insgesamt:
1.511.178
163.534
Probleme mit Datenbankinhalten
Probleme mit Datenbankinhalten
Verschlüsselung mit SchichtenErfassungs-Programm (SEP 1)
+VT;
kgf-dc,ce,
bro4("q","fs",G:s,du:0.001),deu,ss,wl,ss
mm,bn(F:h,F:d),klfl("kao","ca","ch"),
Z:TZ(58.3-60.0,kao4-gr4,zg)
+VT-G(v);
kgm-kgg,ce
("fs","q",G:s),c4(duz:0.010.1,+Gp,^u,^s),bro4("q",duz:0.0010.002,ds-ml,"fs",duz:0.0010.005,F:hro,voe,duh:0.015),zt,+VT^b,ssmm(s),klv2,par,ss,klfl,"hm",^fs^gs-lag,zt,^u-lag
Probleme mit Datenbankinhalten
Inkonsistenz
Inhomogenität
Mehrdeutigkeit
Eine DV-technische
Überarbeitung ist
nur teilweise
möglich
Auflösung von zusammengefassten Schichten in Schicht und Unterschicht
Probleme mit Datenbankinhalten
SEP 3 ist kein Programm und
auch kein Dateiformat, sondern
die Beschreibung einer
Datenstruktur.
Auswertung ….?
Quo vadis Geodaten …
Auswege aus dem Datenchaos
multi-user Datenbanksystem
Umfangreiche Datenanalyse
Wer hat
Wer pflegt
Wer braucht
Wem nutzt
Maximale Datenintegration
Keine Mammutprojekte
sondern stufenweiser
Ausbau nach einem
Gesamtkonzept
•Neustrukturierung der Dateninhalte aus der
Perspektive der Datenrecherche
•Numerische Daten haben Vorrang vor
alphanumerischen Daten
•Kleinteilige Feldstrukturierungen
•Sinnvolle Auswahllisten
•Selbsterklärende Feld- und Tabellennamen
Take off in die schöne neue Geodatenwelt
Gegenseitige Information
Transparenz
Zusammenarbeit
Projektarbeit
Projektdiskussion
Datenanalyse
Datenevaluierung
Datenintegration
Datenbankentwicklung
Vielen Dank und gute Landung
Slide 16
Qualitätsanforderungen an Geodaten
von
Matthias Thomae
10. Zittauer Umweltsymposium 21.-22. April 2009 in Ostritz
1.
2.
3.
4.
5.
GLIEDERUNG
Bedeutung von Geodaten
Geodaten und Datenbanken
„Fachleute“ als Datenbankdesigner
Probleme mit Datenbankinhalten
Auswege aus dem Datenchaos
Bedeutung von Geodaten
… vor ca. 150 Jahren war das Wissen
über unsere Erde und der in und auf
ihr stattfindenden Prozesse
bescheiden
Geodaten gab es nicht flächendeckend,
wie die „weißen Flecken“ auf dem
Globus zeigen
Bibliotheksglobus, Berlin 1871
1871 veröffentlicht Darwin "The Descent of Man".
Bedeutung von Geodaten
Das Wissen ist in den letzten 150 Jahren exponentiell gewachsen
w issenschaftliche Veröffentlichungen
100
20000
90
18000
80
16000
70
14000
60
12000
Anzahl
Anzahl [Mio.]
Wissenschaftler
50
10000
40
8000
30
6000
20
4000
10
2000
0
0
1950
1850
1950
Jahr
2000
Jahr
2000
1880 kannte die Chemie 20 000 chemische Verbindungen, heute sind es ca. 17 Millionen
Bedeutung von Geodaten
Was sind eigentlich Geodaten ?
•Geodaten sind digitale Informationen, denen
eine bestimmte räumliche Lage zugewiesen
werden kann (Geoinformationen, Geobezug)
•Geodaten bestehen aus Geobasisdaten und
Geofachdaten, die aus unterschiedlichen
raumbezogenen Fachdatenbanken stammen
•Metadaten beschreiben die eigentlichen
räumlichen Daten hinsichtlich des Zeitbezugs
und der Datenquelle
•Geoinformationssystem dienen zur
Visualisierung und Recherche von Geodaten
Geodaten und Datenbanken
Informationen der analogen Geodaten
sind auf eine Ebene,
die statische Karte begrenzt
Informationen der digitalen
Geodaten sind theoretisch
unbegrenzt als dynamische Karte
dargestellt und sind mit
Sachdaten verbunden
Geodaten und Datenbanken
Komplexität und Variabilität der Geodaten
verlangt eine Datenhaltung in Datenbanken
Geodaten im Jahre 2009
Fläche 44 km² (9,4 km x 4,7 km)
27 Themen (Ebenen)
4 komplexe Datenbanken
136 Polygone (geologische Flächen)
Geodaten und Datenbanken
Computerbasierte datenverarbeitende Technologien revolutionieren alle
gesellschaftlichen Bereiche
Es gibt enorm effiziente Techniken, informationstragende Daten
zu speichern,
zu transportieren
und in neue Daten zu transformieren.
Alle gesellschaftlichen Bereiche sind gezwungen, sich so umzugestalten, dass in ihnen
die computerbasierten datenverarbeitenden Technologien genutzt werden können.
Völlig zu Unrecht wird dieser technologische und ökonomische Großtrend als Weg zur
"Wissens- und Kommunikationsgesellschaft" gefeiert.
In Wahrheit handelt es sich nicht um Wege zur Wissensgesellschaft,
sondern erst einmal nur um die Zwänge einer Gesellschaft
computerbasierte datenverarbeitende Technologien in allen
gesellschaftlichen Bereichen durchzusetzen.
Geodaten und Datenbanken
Strukturierte Ablage von Geodaten ist notwendig …
… ABER welches Datenbankmodell ?
•Hierarchisches Datenbankmodell ?
Datenobjekte stehen in einer Eltern-KindBeziehungen zueinander.
Netzwerkdatenbankmodell ?
Datenobjekte werden miteinander in
Netzen verbunden.
•Relationale Datenbank ?
Die Daten werden zeilenweise in Tabellen
verwaltet. Es kann beliebige Beziehungen
zwischen Daten geben.
•Objektdatenbank ?
Beziehungen zwischen Datenobjekten
werden vom Datenbanksystem selbst
verwaltet. Objekte können Eigenschaften
und Daten von anderen Objekten erben.
„Fachleute“ als Datenbankdesigner
meine Daten
mein Problem
meine Lösung
Individualsicht - Nutzersicht
single-user Datenbanksystem
•viele alphanumerische Felder
•zu geringe Aufgliederung der
Felder
•Tabellen- und Feldnamen sind
nur dem Entwickler verständlich
… und wie sehen eigentlich die Daten aus ?
•Keine optimale
Tabellenverknüpfung und
Indizierung
„Fachleute“ als Datenbankdesigner
Tyisch für analoge Geodaten sind:
•Inkonsistenz:
Widersprüchlichkeit zwischen den Daten
•Inhomogenität:
Uneinheitlichkeit der Elemente einer
Menge
•Mehrdeutigkeit:
mehrere Bedeutungen eines Begriffes
oder Zeichens
• Redundanz:
Informationen in einer Informationsquelle
sind mehrfach vorhanden
Probleme mit Datenbankinhalten
Bergbau- und Rohstoffdatenbank
Teildatenbank Rohstoffe
Mehrdeutige Dateninhalte im
Feld „Nutzungskonflikte“
machen qualifizierte
Recherchen unmöglich
Bei nur 669 Datensätzen
erfolgte keine Evaluierung
der Dateninhalte !
Probleme mit Datenbankinhalten
Landesamt für Geologie und Bergwesen
Halle, den 16.04.2009
Bearbeitungsstand der Landesbohrdatenbank
Bearbeitungsstand: 05.03.2009
Erfasste Bohrungen:
190.855
Davon
Schichtdaten SEP1 insgesamt:
Schichtdaten SEP3 insgesamt:
1.511.178
163.534
Probleme mit Datenbankinhalten
Probleme mit Datenbankinhalten
Verschlüsselung mit SchichtenErfassungs-Programm (SEP 1)
+VT;
kgf-dc,ce,
bro4("q","fs",G:s,du:0.001),deu,ss,wl,ss
mm,bn(F:h,F:d),klfl("kao","ca","ch"),
Z:TZ(58.3-60.0,kao4-gr4,zg)
+VT-G(v);
kgm-kgg,ce
("fs","q",G:s),c4(duz:0.010.1,+Gp,^u,^s),bro4("q",duz:0.0010.002,ds-ml,"fs",duz:0.0010.005,F:hro,voe,duh:0.015),zt,+VT^b,ssmm(s),klv2,par,ss,klfl,"hm",^fs^gs-lag,zt,^u-lag
Probleme mit Datenbankinhalten
Inkonsistenz
Inhomogenität
Mehrdeutigkeit
Eine DV-technische
Überarbeitung ist
nur teilweise
möglich
Auflösung von zusammengefassten Schichten in Schicht und Unterschicht
Probleme mit Datenbankinhalten
SEP 3 ist kein Programm und
auch kein Dateiformat, sondern
die Beschreibung einer
Datenstruktur.
Auswertung ….?
Quo vadis Geodaten …
Auswege aus dem Datenchaos
multi-user Datenbanksystem
Umfangreiche Datenanalyse
Wer hat
Wer pflegt
Wer braucht
Wem nutzt
Maximale Datenintegration
Keine Mammutprojekte
sondern stufenweiser
Ausbau nach einem
Gesamtkonzept
•Neustrukturierung der Dateninhalte aus der
Perspektive der Datenrecherche
•Numerische Daten haben Vorrang vor
alphanumerischen Daten
•Kleinteilige Feldstrukturierungen
•Sinnvolle Auswahllisten
•Selbsterklärende Feld- und Tabellennamen
Take off in die schöne neue Geodatenwelt
Gegenseitige Information
Transparenz
Zusammenarbeit
Projektarbeit
Projektdiskussion
Datenanalyse
Datenevaluierung
Datenintegration
Datenbankentwicklung
Vielen Dank und gute Landung
Slide 17
Qualitätsanforderungen an Geodaten
von
Matthias Thomae
10. Zittauer Umweltsymposium 21.-22. April 2009 in Ostritz
1.
2.
3.
4.
5.
GLIEDERUNG
Bedeutung von Geodaten
Geodaten und Datenbanken
„Fachleute“ als Datenbankdesigner
Probleme mit Datenbankinhalten
Auswege aus dem Datenchaos
Bedeutung von Geodaten
… vor ca. 150 Jahren war das Wissen
über unsere Erde und der in und auf
ihr stattfindenden Prozesse
bescheiden
Geodaten gab es nicht flächendeckend,
wie die „weißen Flecken“ auf dem
Globus zeigen
Bibliotheksglobus, Berlin 1871
1871 veröffentlicht Darwin "The Descent of Man".
Bedeutung von Geodaten
Das Wissen ist in den letzten 150 Jahren exponentiell gewachsen
w issenschaftliche Veröffentlichungen
100
20000
90
18000
80
16000
70
14000
60
12000
Anzahl
Anzahl [Mio.]
Wissenschaftler
50
10000
40
8000
30
6000
20
4000
10
2000
0
0
1950
1850
1950
Jahr
2000
Jahr
2000
1880 kannte die Chemie 20 000 chemische Verbindungen, heute sind es ca. 17 Millionen
Bedeutung von Geodaten
Was sind eigentlich Geodaten ?
•Geodaten sind digitale Informationen, denen
eine bestimmte räumliche Lage zugewiesen
werden kann (Geoinformationen, Geobezug)
•Geodaten bestehen aus Geobasisdaten und
Geofachdaten, die aus unterschiedlichen
raumbezogenen Fachdatenbanken stammen
•Metadaten beschreiben die eigentlichen
räumlichen Daten hinsichtlich des Zeitbezugs
und der Datenquelle
•Geoinformationssystem dienen zur
Visualisierung und Recherche von Geodaten
Geodaten und Datenbanken
Informationen der analogen Geodaten
sind auf eine Ebene,
die statische Karte begrenzt
Informationen der digitalen
Geodaten sind theoretisch
unbegrenzt als dynamische Karte
dargestellt und sind mit
Sachdaten verbunden
Geodaten und Datenbanken
Komplexität und Variabilität der Geodaten
verlangt eine Datenhaltung in Datenbanken
Geodaten im Jahre 2009
Fläche 44 km² (9,4 km x 4,7 km)
27 Themen (Ebenen)
4 komplexe Datenbanken
136 Polygone (geologische Flächen)
Geodaten und Datenbanken
Computerbasierte datenverarbeitende Technologien revolutionieren alle
gesellschaftlichen Bereiche
Es gibt enorm effiziente Techniken, informationstragende Daten
zu speichern,
zu transportieren
und in neue Daten zu transformieren.
Alle gesellschaftlichen Bereiche sind gezwungen, sich so umzugestalten, dass in ihnen
die computerbasierten datenverarbeitenden Technologien genutzt werden können.
Völlig zu Unrecht wird dieser technologische und ökonomische Großtrend als Weg zur
"Wissens- und Kommunikationsgesellschaft" gefeiert.
In Wahrheit handelt es sich nicht um Wege zur Wissensgesellschaft,
sondern erst einmal nur um die Zwänge einer Gesellschaft
computerbasierte datenverarbeitende Technologien in allen
gesellschaftlichen Bereichen durchzusetzen.
Geodaten und Datenbanken
Strukturierte Ablage von Geodaten ist notwendig …
… ABER welches Datenbankmodell ?
•Hierarchisches Datenbankmodell ?
Datenobjekte stehen in einer Eltern-KindBeziehungen zueinander.
Netzwerkdatenbankmodell ?
Datenobjekte werden miteinander in
Netzen verbunden.
•Relationale Datenbank ?
Die Daten werden zeilenweise in Tabellen
verwaltet. Es kann beliebige Beziehungen
zwischen Daten geben.
•Objektdatenbank ?
Beziehungen zwischen Datenobjekten
werden vom Datenbanksystem selbst
verwaltet. Objekte können Eigenschaften
und Daten von anderen Objekten erben.
„Fachleute“ als Datenbankdesigner
meine Daten
mein Problem
meine Lösung
Individualsicht - Nutzersicht
single-user Datenbanksystem
•viele alphanumerische Felder
•zu geringe Aufgliederung der
Felder
•Tabellen- und Feldnamen sind
nur dem Entwickler verständlich
… und wie sehen eigentlich die Daten aus ?
•Keine optimale
Tabellenverknüpfung und
Indizierung
„Fachleute“ als Datenbankdesigner
Tyisch für analoge Geodaten sind:
•Inkonsistenz:
Widersprüchlichkeit zwischen den Daten
•Inhomogenität:
Uneinheitlichkeit der Elemente einer
Menge
•Mehrdeutigkeit:
mehrere Bedeutungen eines Begriffes
oder Zeichens
• Redundanz:
Informationen in einer Informationsquelle
sind mehrfach vorhanden
Probleme mit Datenbankinhalten
Bergbau- und Rohstoffdatenbank
Teildatenbank Rohstoffe
Mehrdeutige Dateninhalte im
Feld „Nutzungskonflikte“
machen qualifizierte
Recherchen unmöglich
Bei nur 669 Datensätzen
erfolgte keine Evaluierung
der Dateninhalte !
Probleme mit Datenbankinhalten
Landesamt für Geologie und Bergwesen
Halle, den 16.04.2009
Bearbeitungsstand der Landesbohrdatenbank
Bearbeitungsstand: 05.03.2009
Erfasste Bohrungen:
190.855
Davon
Schichtdaten SEP1 insgesamt:
Schichtdaten SEP3 insgesamt:
1.511.178
163.534
Probleme mit Datenbankinhalten
Probleme mit Datenbankinhalten
Verschlüsselung mit SchichtenErfassungs-Programm (SEP 1)
+VT;
kgf-dc,ce,
bro4("q","fs",G:s,du:0.001),deu,ss,wl,ss
mm,bn(F:h,F:d),klfl("kao","ca","ch"),
Z:TZ(58.3-60.0,kao4-gr4,zg)
+VT-G(v);
kgm-kgg,ce
("fs","q",G:s),c4(duz:0.010.1,+Gp,^u,^s),bro4("q",duz:0.0010.002,ds-ml,"fs",duz:0.0010.005,F:hro,voe,duh:0.015),zt,+VT^b,ssmm(s),klv2,par,ss,klfl,"hm",^fs^gs-lag,zt,^u-lag
Probleme mit Datenbankinhalten
Inkonsistenz
Inhomogenität
Mehrdeutigkeit
Eine DV-technische
Überarbeitung ist
nur teilweise
möglich
Auflösung von zusammengefassten Schichten in Schicht und Unterschicht
Probleme mit Datenbankinhalten
SEP 3 ist kein Programm und
auch kein Dateiformat, sondern
die Beschreibung einer
Datenstruktur.
Auswertung ….?
Quo vadis Geodaten …
Auswege aus dem Datenchaos
multi-user Datenbanksystem
Umfangreiche Datenanalyse
Wer hat
Wer pflegt
Wer braucht
Wem nutzt
Maximale Datenintegration
Keine Mammutprojekte
sondern stufenweiser
Ausbau nach einem
Gesamtkonzept
•Neustrukturierung der Dateninhalte aus der
Perspektive der Datenrecherche
•Numerische Daten haben Vorrang vor
alphanumerischen Daten
•Kleinteilige Feldstrukturierungen
•Sinnvolle Auswahllisten
•Selbsterklärende Feld- und Tabellennamen
Take off in die schöne neue Geodatenwelt
Gegenseitige Information
Transparenz
Zusammenarbeit
Projektarbeit
Projektdiskussion
Datenanalyse
Datenevaluierung
Datenintegration
Datenbankentwicklung
Vielen Dank und gute Landung
Slide 18
Qualitätsanforderungen an Geodaten
von
Matthias Thomae
10. Zittauer Umweltsymposium 21.-22. April 2009 in Ostritz
1.
2.
3.
4.
5.
GLIEDERUNG
Bedeutung von Geodaten
Geodaten und Datenbanken
„Fachleute“ als Datenbankdesigner
Probleme mit Datenbankinhalten
Auswege aus dem Datenchaos
Bedeutung von Geodaten
… vor ca. 150 Jahren war das Wissen
über unsere Erde und der in und auf
ihr stattfindenden Prozesse
bescheiden
Geodaten gab es nicht flächendeckend,
wie die „weißen Flecken“ auf dem
Globus zeigen
Bibliotheksglobus, Berlin 1871
1871 veröffentlicht Darwin "The Descent of Man".
Bedeutung von Geodaten
Das Wissen ist in den letzten 150 Jahren exponentiell gewachsen
w issenschaftliche Veröffentlichungen
100
20000
90
18000
80
16000
70
14000
60
12000
Anzahl
Anzahl [Mio.]
Wissenschaftler
50
10000
40
8000
30
6000
20
4000
10
2000
0
0
1950
1850
1950
Jahr
2000
Jahr
2000
1880 kannte die Chemie 20 000 chemische Verbindungen, heute sind es ca. 17 Millionen
Bedeutung von Geodaten
Was sind eigentlich Geodaten ?
•Geodaten sind digitale Informationen, denen
eine bestimmte räumliche Lage zugewiesen
werden kann (Geoinformationen, Geobezug)
•Geodaten bestehen aus Geobasisdaten und
Geofachdaten, die aus unterschiedlichen
raumbezogenen Fachdatenbanken stammen
•Metadaten beschreiben die eigentlichen
räumlichen Daten hinsichtlich des Zeitbezugs
und der Datenquelle
•Geoinformationssystem dienen zur
Visualisierung und Recherche von Geodaten
Geodaten und Datenbanken
Informationen der analogen Geodaten
sind auf eine Ebene,
die statische Karte begrenzt
Informationen der digitalen
Geodaten sind theoretisch
unbegrenzt als dynamische Karte
dargestellt und sind mit
Sachdaten verbunden
Geodaten und Datenbanken
Komplexität und Variabilität der Geodaten
verlangt eine Datenhaltung in Datenbanken
Geodaten im Jahre 2009
Fläche 44 km² (9,4 km x 4,7 km)
27 Themen (Ebenen)
4 komplexe Datenbanken
136 Polygone (geologische Flächen)
Geodaten und Datenbanken
Computerbasierte datenverarbeitende Technologien revolutionieren alle
gesellschaftlichen Bereiche
Es gibt enorm effiziente Techniken, informationstragende Daten
zu speichern,
zu transportieren
und in neue Daten zu transformieren.
Alle gesellschaftlichen Bereiche sind gezwungen, sich so umzugestalten, dass in ihnen
die computerbasierten datenverarbeitenden Technologien genutzt werden können.
Völlig zu Unrecht wird dieser technologische und ökonomische Großtrend als Weg zur
"Wissens- und Kommunikationsgesellschaft" gefeiert.
In Wahrheit handelt es sich nicht um Wege zur Wissensgesellschaft,
sondern erst einmal nur um die Zwänge einer Gesellschaft
computerbasierte datenverarbeitende Technologien in allen
gesellschaftlichen Bereichen durchzusetzen.
Geodaten und Datenbanken
Strukturierte Ablage von Geodaten ist notwendig …
… ABER welches Datenbankmodell ?
•Hierarchisches Datenbankmodell ?
Datenobjekte stehen in einer Eltern-KindBeziehungen zueinander.
Netzwerkdatenbankmodell ?
Datenobjekte werden miteinander in
Netzen verbunden.
•Relationale Datenbank ?
Die Daten werden zeilenweise in Tabellen
verwaltet. Es kann beliebige Beziehungen
zwischen Daten geben.
•Objektdatenbank ?
Beziehungen zwischen Datenobjekten
werden vom Datenbanksystem selbst
verwaltet. Objekte können Eigenschaften
und Daten von anderen Objekten erben.
„Fachleute“ als Datenbankdesigner
meine Daten
mein Problem
meine Lösung
Individualsicht - Nutzersicht
single-user Datenbanksystem
•viele alphanumerische Felder
•zu geringe Aufgliederung der
Felder
•Tabellen- und Feldnamen sind
nur dem Entwickler verständlich
… und wie sehen eigentlich die Daten aus ?
•Keine optimale
Tabellenverknüpfung und
Indizierung
„Fachleute“ als Datenbankdesigner
Tyisch für analoge Geodaten sind:
•Inkonsistenz:
Widersprüchlichkeit zwischen den Daten
•Inhomogenität:
Uneinheitlichkeit der Elemente einer
Menge
•Mehrdeutigkeit:
mehrere Bedeutungen eines Begriffes
oder Zeichens
• Redundanz:
Informationen in einer Informationsquelle
sind mehrfach vorhanden
Probleme mit Datenbankinhalten
Bergbau- und Rohstoffdatenbank
Teildatenbank Rohstoffe
Mehrdeutige Dateninhalte im
Feld „Nutzungskonflikte“
machen qualifizierte
Recherchen unmöglich
Bei nur 669 Datensätzen
erfolgte keine Evaluierung
der Dateninhalte !
Probleme mit Datenbankinhalten
Landesamt für Geologie und Bergwesen
Halle, den 16.04.2009
Bearbeitungsstand der Landesbohrdatenbank
Bearbeitungsstand: 05.03.2009
Erfasste Bohrungen:
190.855
Davon
Schichtdaten SEP1 insgesamt:
Schichtdaten SEP3 insgesamt:
1.511.178
163.534
Probleme mit Datenbankinhalten
Probleme mit Datenbankinhalten
Verschlüsselung mit SchichtenErfassungs-Programm (SEP 1)
+VT;
kgf-dc,ce,
bro4("q","fs",G:s,du:0.001),deu,ss,wl,ss
mm,bn(F:h,F:d),klfl("kao","ca","ch"),
Z:TZ(58.3-60.0,kao4-gr4,zg)
+VT-G(v);
kgm-kgg,ce
("fs","q",G:s),c4(duz:0.010.1,+Gp,^u,^s),bro4("q",duz:0.0010.002,ds-ml,"fs",duz:0.0010.005,F:hro,voe,duh:0.015),zt,+VT^b,ssmm(s),klv2,par,ss,klfl,"hm",^fs^gs-lag,zt,^u-lag
Probleme mit Datenbankinhalten
Inkonsistenz
Inhomogenität
Mehrdeutigkeit
Eine DV-technische
Überarbeitung ist
nur teilweise
möglich
Auflösung von zusammengefassten Schichten in Schicht und Unterschicht
Probleme mit Datenbankinhalten
SEP 3 ist kein Programm und
auch kein Dateiformat, sondern
die Beschreibung einer
Datenstruktur.
Auswertung ….?
Quo vadis Geodaten …
Auswege aus dem Datenchaos
multi-user Datenbanksystem
Umfangreiche Datenanalyse
Wer hat
Wer pflegt
Wer braucht
Wem nutzt
Maximale Datenintegration
Keine Mammutprojekte
sondern stufenweiser
Ausbau nach einem
Gesamtkonzept
•Neustrukturierung der Dateninhalte aus der
Perspektive der Datenrecherche
•Numerische Daten haben Vorrang vor
alphanumerischen Daten
•Kleinteilige Feldstrukturierungen
•Sinnvolle Auswahllisten
•Selbsterklärende Feld- und Tabellennamen
Take off in die schöne neue Geodatenwelt
Gegenseitige Information
Transparenz
Zusammenarbeit
Projektarbeit
Projektdiskussion
Datenanalyse
Datenevaluierung
Datenintegration
Datenbankentwicklung
Vielen Dank und gute Landung
Slide 19
Qualitätsanforderungen an Geodaten
von
Matthias Thomae
10. Zittauer Umweltsymposium 21.-22. April 2009 in Ostritz
1.
2.
3.
4.
5.
GLIEDERUNG
Bedeutung von Geodaten
Geodaten und Datenbanken
„Fachleute“ als Datenbankdesigner
Probleme mit Datenbankinhalten
Auswege aus dem Datenchaos
Bedeutung von Geodaten
… vor ca. 150 Jahren war das Wissen
über unsere Erde und der in und auf
ihr stattfindenden Prozesse
bescheiden
Geodaten gab es nicht flächendeckend,
wie die „weißen Flecken“ auf dem
Globus zeigen
Bibliotheksglobus, Berlin 1871
1871 veröffentlicht Darwin "The Descent of Man".
Bedeutung von Geodaten
Das Wissen ist in den letzten 150 Jahren exponentiell gewachsen
w issenschaftliche Veröffentlichungen
100
20000
90
18000
80
16000
70
14000
60
12000
Anzahl
Anzahl [Mio.]
Wissenschaftler
50
10000
40
8000
30
6000
20
4000
10
2000
0
0
1950
1850
1950
Jahr
2000
Jahr
2000
1880 kannte die Chemie 20 000 chemische Verbindungen, heute sind es ca. 17 Millionen
Bedeutung von Geodaten
Was sind eigentlich Geodaten ?
•Geodaten sind digitale Informationen, denen
eine bestimmte räumliche Lage zugewiesen
werden kann (Geoinformationen, Geobezug)
•Geodaten bestehen aus Geobasisdaten und
Geofachdaten, die aus unterschiedlichen
raumbezogenen Fachdatenbanken stammen
•Metadaten beschreiben die eigentlichen
räumlichen Daten hinsichtlich des Zeitbezugs
und der Datenquelle
•Geoinformationssystem dienen zur
Visualisierung und Recherche von Geodaten
Geodaten und Datenbanken
Informationen der analogen Geodaten
sind auf eine Ebene,
die statische Karte begrenzt
Informationen der digitalen
Geodaten sind theoretisch
unbegrenzt als dynamische Karte
dargestellt und sind mit
Sachdaten verbunden
Geodaten und Datenbanken
Komplexität und Variabilität der Geodaten
verlangt eine Datenhaltung in Datenbanken
Geodaten im Jahre 2009
Fläche 44 km² (9,4 km x 4,7 km)
27 Themen (Ebenen)
4 komplexe Datenbanken
136 Polygone (geologische Flächen)
Geodaten und Datenbanken
Computerbasierte datenverarbeitende Technologien revolutionieren alle
gesellschaftlichen Bereiche
Es gibt enorm effiziente Techniken, informationstragende Daten
zu speichern,
zu transportieren
und in neue Daten zu transformieren.
Alle gesellschaftlichen Bereiche sind gezwungen, sich so umzugestalten, dass in ihnen
die computerbasierten datenverarbeitenden Technologien genutzt werden können.
Völlig zu Unrecht wird dieser technologische und ökonomische Großtrend als Weg zur
"Wissens- und Kommunikationsgesellschaft" gefeiert.
In Wahrheit handelt es sich nicht um Wege zur Wissensgesellschaft,
sondern erst einmal nur um die Zwänge einer Gesellschaft
computerbasierte datenverarbeitende Technologien in allen
gesellschaftlichen Bereichen durchzusetzen.
Geodaten und Datenbanken
Strukturierte Ablage von Geodaten ist notwendig …
… ABER welches Datenbankmodell ?
•Hierarchisches Datenbankmodell ?
Datenobjekte stehen in einer Eltern-KindBeziehungen zueinander.
Netzwerkdatenbankmodell ?
Datenobjekte werden miteinander in
Netzen verbunden.
•Relationale Datenbank ?
Die Daten werden zeilenweise in Tabellen
verwaltet. Es kann beliebige Beziehungen
zwischen Daten geben.
•Objektdatenbank ?
Beziehungen zwischen Datenobjekten
werden vom Datenbanksystem selbst
verwaltet. Objekte können Eigenschaften
und Daten von anderen Objekten erben.
„Fachleute“ als Datenbankdesigner
meine Daten
mein Problem
meine Lösung
Individualsicht - Nutzersicht
single-user Datenbanksystem
•viele alphanumerische Felder
•zu geringe Aufgliederung der
Felder
•Tabellen- und Feldnamen sind
nur dem Entwickler verständlich
… und wie sehen eigentlich die Daten aus ?
•Keine optimale
Tabellenverknüpfung und
Indizierung
„Fachleute“ als Datenbankdesigner
Tyisch für analoge Geodaten sind:
•Inkonsistenz:
Widersprüchlichkeit zwischen den Daten
•Inhomogenität:
Uneinheitlichkeit der Elemente einer
Menge
•Mehrdeutigkeit:
mehrere Bedeutungen eines Begriffes
oder Zeichens
• Redundanz:
Informationen in einer Informationsquelle
sind mehrfach vorhanden
Probleme mit Datenbankinhalten
Bergbau- und Rohstoffdatenbank
Teildatenbank Rohstoffe
Mehrdeutige Dateninhalte im
Feld „Nutzungskonflikte“
machen qualifizierte
Recherchen unmöglich
Bei nur 669 Datensätzen
erfolgte keine Evaluierung
der Dateninhalte !
Probleme mit Datenbankinhalten
Landesamt für Geologie und Bergwesen
Halle, den 16.04.2009
Bearbeitungsstand der Landesbohrdatenbank
Bearbeitungsstand: 05.03.2009
Erfasste Bohrungen:
190.855
Davon
Schichtdaten SEP1 insgesamt:
Schichtdaten SEP3 insgesamt:
1.511.178
163.534
Probleme mit Datenbankinhalten
Probleme mit Datenbankinhalten
Verschlüsselung mit SchichtenErfassungs-Programm (SEP 1)
+VT;
kgf-dc,ce,
bro4("q","fs",G:s,du:0.001),deu,ss,wl,ss
mm,bn(F:h,F:d),klfl("kao","ca","ch"),
Z:TZ(58.3-60.0,kao4-gr4,zg)
+VT-G(v);
kgm-kgg,ce
("fs","q",G:s),c4(duz:0.010.1,+Gp,^u,^s),bro4("q",duz:0.0010.002,ds-ml,"fs",duz:0.0010.005,F:hro,voe,duh:0.015),zt,+VT^b,ssmm(s),klv2,par,ss,klfl,"hm",^fs^gs-lag,zt,^u-lag
Probleme mit Datenbankinhalten
Inkonsistenz
Inhomogenität
Mehrdeutigkeit
Eine DV-technische
Überarbeitung ist
nur teilweise
möglich
Auflösung von zusammengefassten Schichten in Schicht und Unterschicht
Probleme mit Datenbankinhalten
SEP 3 ist kein Programm und
auch kein Dateiformat, sondern
die Beschreibung einer
Datenstruktur.
Auswertung ….?
Quo vadis Geodaten …
Auswege aus dem Datenchaos
multi-user Datenbanksystem
Umfangreiche Datenanalyse
Wer hat
Wer pflegt
Wer braucht
Wem nutzt
Maximale Datenintegration
Keine Mammutprojekte
sondern stufenweiser
Ausbau nach einem
Gesamtkonzept
•Neustrukturierung der Dateninhalte aus der
Perspektive der Datenrecherche
•Numerische Daten haben Vorrang vor
alphanumerischen Daten
•Kleinteilige Feldstrukturierungen
•Sinnvolle Auswahllisten
•Selbsterklärende Feld- und Tabellennamen
Take off in die schöne neue Geodatenwelt
Gegenseitige Information
Transparenz
Zusammenarbeit
Projektarbeit
Projektdiskussion
Datenanalyse
Datenevaluierung
Datenintegration
Datenbankentwicklung
Vielen Dank und gute Landung