GEOSTATYSTYKA I ANALIZA PRZESTRZENNA Wykład dla III roku Geografii specjalność - geoinformacja

Download Report

Transcript GEOSTATYSTYKA I ANALIZA PRZESTRZENNA Wykład dla III roku Geografii specjalność - geoinformacja

GEOSTATYSTYKA
I ANALIZA PRZESTRZENNA
Wykład dla III roku Geografii
specjalność - geoinformacja
Alfred Stach
Instytut Geoekologii i Geoinformacji
Wydział Nauk Geograficznych i Geologicznych UAM
Zarys treści
• Klasyczna statystyka, a struktura
otaczającej nas rzeczywistości
• Miejsce Geostatystyki w Statystyce
Przestrzeni (spatial statistics): definicje i
klasyfikacje
• Estymacja i Symulacja – dwie podejścia do
zmierzenia się z problemem ograniczonej
wiedzy o otaczającym nas środowisku.
• Przykłady zastosowań Geostatystyki
Podstawa
klasycznej
statystyki =
Niezależność
obserwacji - co
oznacza, że
wyniki kolejnych
prób są w 100%
losowe
Geograficzne Prawo Toblera (1970)
„Everything is related to
everything else, but near things
are more related than distant
things"
Obiekty, które w przestrzeni
i/lub czasie ze sobą sąsiadują
są zazwyczaj bardziej podobne
od znajdujących się od siebie
dalej.
Konsekwencja – próbkowanie
(obserwacje/ pomiary) w
przestrzeni i w czasie może nie
mieć charakteru losowego.
Znajomość współrzędnych
obiektu/punktu zbadanego może
pomagać w bardziej precyzyjnym
szacowaniu cech leżących w
pobliżu obiektów nie zbadanych.
Dekompozycja
serii
pomiarowej
Składowa
deterministyczna
trend
cykle
autokorelacja
szum
Składowa losowa
Analiza przestrzenna
Analiza przestrzenna (ang. spatial analysis)
to systematyczne wykorzystywanie
lokalizacji geograficznej interesujących
obiektów jako ważnej zmiennej do opisu,
analizy i prognozowania.
Zazwyczaj, choć nie jest konieczne, analiza
taka uwzględnia również cechy (parametry)
tych obiektów. Możliwość wykonywania
prostych i wyrafinowanych analiz
przestrzennych jest jednym z najważniejszych
cech GIS. Analizy te mogą być
przeprowadzane na różnym poziomie
złożoności.
David J. Unwin,
Encyclopedia of
Geographic Information
Science
Karen K. Kemp (red.),
SAGE Publications, 2008,
392-396
Statystyka przestrzenna
Statystyka przestrzenna (ang. spatial
statistics) składa się z szerokiego zakresu procedur
manipulacji i wizualizacji danych, jak i metod
kartograficznych, statystycznych, jakościowych i
teoretycznych. Jest ona pewnym podzbiorem
analitycznych możliwości GIS, a służy do
opisu i modelowania rozkładów
przestrzennych, struktur, procesów i relacji.
Mimo, że niektóre z metod statystyki przestrzeni są oparte o
podobne założenia, a nawet używane są w podobnym celu jak
tradycyjne, nieprzestrzenne, metody statystyczne, to jednak
wyróżnia się ona ze względu na szereg narzędzi utworzonych
specjalnie do wykorzystania z danymi geograficznymi.
Statystyka przestrzeni wykorzystuje bowiem relacje
powierzchni, kształtu, długości, bliskości, orientacji,
sąsiedztwa itp. bezpośrednio w algorytmach obliczeniowych.
Lauren M. Scott
Arthur Getis,
Encyclopedia of
Geographic Information
Science
Karen K. Kemp (red.),
SAGE Publications, 2008,
436-440
Statystyka przestrzeni –
spatial statistics
Zbiór metod analiz danych
pomiarowych/obserwacyjnych, które
oprócz cech obiektów uwzględniają ich
lokalizację w przestrzeni i/lub w czasie
Zarys treści
• Klasyczna statystyka, a struktura otaczającej
nas rzeczywistości
• Miejsce Geostatystyki w Statystyce
Przestrzeni (spatial statistics): definicje
i klasyfikacje
• Estymacja i Symulacja – dwie podejścia do
zmierzenia się z problemem ograniczonej
wiedzy o otaczającym nas środowisku.
• Przykłady zastosowań Geostatystyki
Podział Statystyki Przestrzeni
ze względu na obiekt analizy
Statystyka przestrzeni
Spatial Statistics
Cechy obiektów
Narzędzia
Wystąpienia osobników roślin i
zwierząt, przypadki przęstępst,
chorób itp.
Rozkład, skupienia, gęstość,
statystyki najbliższego sąsiada,
prawdopodobieństwo wystąpienia
itp.
CrimeStat
Network Analysis
Sieci rzeczne, układy dendrytyczne
(np. korzeniowe), sieci drogowe,
wodociągowe, elektryczne, itp.
Kształt, hierachizacja, dostępność,
przepustowość, propagacja
zaburzeń
Statystyka siatek
Sieci krystaliczne, fotografie
cyfrowe (skany) itp.
Autokorelacja, cykliczność,
tekstura itp.
2W: pojezierza, płaty typów gleb,
zbiorowisk roślinnych, elementy
rzeźby, jednostki administracyjne
itp.; 3W: pokłady skalne, poziomy
glebowe; dane 2W+T
Rozkład wielkości, kształtu,
orientacji, sąsiedztwo, typu cechy,
natężenia cechy
Fragstats
MCK
Ciągłe cechy fizyczne/chemiczne:
temperatura powietrza, pH gleby,
mineralizacja kruszcu
Autokorelacja, estymacja
punktowa, obszarowa i bryłowa,
rozkład statystyczny,
prawdopodobieństwa wart. ekstr.
itp.
SGeMS
Variowin
Dziedzina
Statystyka punktów
Point Statistics
Statystyka sieci
Obiekt analizy
Grid (Lattice) Statistics
Statystyka obiektów
Patch Analysis, Object Data
Analysis
Statystyka pól
(2W / 3W / 4W)
Geostatistics
Co to jest geostatystyka?
(Goovaerts 1997 zmienione)
• Zbiór narzędzi statystycznych
uwzględniających w analizie danych ich
przestrzenną i czasową lokalizację, a
opartych o teorię funkcji losowych.
• Cztery funkcje geostatystyki:
– Identyfikacja i modelowanie struktury
przestrzennej/czasowej zjawiska
– Estymacja (szacowanie wartości parametru w
nieopróbowanym miejscu i/lub momencie czasu)
– Symulacja (generowanie alternatywnych obrazów
(realizacji), które honorują wyniki pomiarów i strukturę
przestrzenną/czasową zjawiska),
– Optymalizacja próbkowania/sieci pomiarowej minimalizująca
koszty przy maksymalizacji ilości i dokładności informacji
Interpretacja założeń
teoretycznych!
• W geostatystyce traktujemy wyniki pomiarów
jako odbicie realizacji funkcji losowych.
• Prawdopodobieństwa nie istnieją obiektywnie
w Naturze, tylko w naszych modelach ją
opisujących. Natura jest deterministyczna, nie
losowa.
• Używamy modeli stochastycznych bo są
analitycznie użyteczne – są furtką wyjścia w
sytuacji naszej bezradności wobec
skomplikowania przyrody
Zarys treści
• Klasyczna statystyka, a struktura otaczającej
nas rzeczywistości
• Miejsce Geostatystyki w Statystyce
Przestrzeni (spatial statistics): definicje i
klasyfikacje
• Estymacja i Symulacja – dwie podejścia
do zmierzenia się z problemem
ograniczonej wiedzy o otaczającym nas
środowisku.
• Przykłady zastosowań Geostatystyki
Przykład na początek:
kabel telekomunikacyjny
na dnie cieśniny gibraltarskiej (Alfaro 1979)
0
Głębokość [m]
-50
-100
symulacja
-150
-200
dane
zdna:
sondowań
interpolowany
profil dna
(kriging):
945 m
m
rzeczywisty
1182
symulowany
profil
1154
-250
0 0
200
200
400
Odległość [m]
600
600
800800
Zarys treści
• Klasyczna statystyka, a struktura otaczającej
nas rzeczywistości
• Miejsce Geostatystyki w Statystyce
Przestrzeni (spatial statistics): definicje i
klasyfikacje
• Estymacja i Symulacja – dwie podejścia do
zmierzenia się z problemem ograniczonej
wiedzy o otaczającym nas środowisku.
• Przykłady zastosowań Geostatystyki
Typowe zastosowania geostatystyki
•
•
•
•
•
•
•
•
•
•
Identyfikacja struktury zmienności przestrzennej i/lub czasowej jakiejś
cechy (zjawiska)
Szacunek wartości jakiejś cechy ilościowej w nieopróbowanym punkcie
w przestrzeni i/lub momencie czasu
Szacunek wartości średniej jakiejś cechy ilościowej dla określonej
powierzchni i/lub okresu czasu
Ocena błędu szacunku wartości punktowej i/lub obszarowej cechy
ilościowej
Szacunek wartości ekstremalnych cechy możliwych w danym punkcie,
czy obszarze
Prawdopodobieństwo przynależności danego punktu lub obszaru do
określonej kategorii
Prawdopodobieństwo przekroczenia w danym punkcie lub obszarze
wartości progowej cechy ilościowej
Filtrowanie składowych przestrzennych i/lub czasowych cechy
(zjawiska); separacja tzw. „szumu” (składowej losowej)
Optymalizacja próbkowania i/lub sieci monitorigowych
Inne
Przykład zastosowań
Spatial Interpolation
Comparison (SIC-97)
Alfred Stach
Instytut Badań Czwartorzędu i Geoekologii UAM
Problem:
• Opady atmosferyczne są głównym zjawiskiem
powodującym „wypadanie” z atmosfery i depozycję
na powierzchni terenu różnego typu zanieczyszczeń,
w tym także radioaktywnych
• Sieć punktowych pomiarów opadów atmosferycznych
jest znacznie gęstsza od sieci pomiarów
zanieczyszczeń
• Szybka i wiarygodna ocena obszarowa opadów w
trakcie przemieszania się chmury zanieczyszczeń
(przykład Czernobyla) umożliwia identyfikację
obszarów potencjalnego skażenia, i natychmiastowe
podjęcie stosownych działań
• Interpolacja dobowych wartości opadów jest ze
względu na ich nieciągłość i silne uzależnienie od
warunków lokalnych (a w tym topografii terenu)
bardzo trudna i obarczona dużymi błędami.
Cel:
• Przetestowanie na jednym zbiorze
danych opadowych estymacji
przestrzennych wykonanych za pomocą
różnych metod interpolacyjnych pod
kątem:
– dokładności,
– przydatności do rutynowych ocen zagrożeń
skażeniami (szybkość obliczeń, stopień
komplikacji procedury, możliwość
automatyzacji).
Dane:
• Uczestnicy SIC-97 otrzymali:
– Dane sum dobowych opadów (wyrażone w
jednostkach 1/10 mm) z 8 maja 1986 roku ze
100 punktów pomiarowych zlokalizowanych na
obszarze Szwajcarii. Zostały one losowo
wybrane ze zbioru 467 punktów.
– Współrzędne lokalizacji pozostałych 367
punktów.
– Cyfrowy model rzeźby terenu (DEM) o
rozdzielczości 11 km, wraz z przebiegiem
granicy Szwajcarii definiującej obszar analizy.
Dane pomiarowe (symbole proporcjonalne do
wysokości opadów) ze 100 punktów na tle
Cyfrowego Modelu Rzeźby (DEM)
Charakterystyka statystyczna 100
podstawowych pomiarów
Zadanie:
• Dokonać na podstawie 100 podanych danych
szacunków opadów w 367 pozostałych punktach.
Opisać szczegółowo metodykę obliczeń.
• Podać charakterystyki jakości uzyskanych estymacji:
– minimum, maksimum, średnią, medianę i odchylenie
standardowe 367 estymowanych sum opadów,
– pierwiastek średniego błędu kwadratowego,
– stopień dewiacji (obciążenia) błędów,
– średnie względne i absolutne błędy,
– korelację błędów,
– Wykres korelacji wartości estymowanych z rzeczywistymi,
• Wskazać lokalizację punktów pomiarowych z 10
największych i 10 najmniejszych sumami opadu.
• Wykonać mapę izarytmiczną z izoliniami estymowanych
wartości.
Dane pomiarowe (symbole proporcjonalne do
wysokości opadów) i lokalizacja punktów
estymacji
Charakterystyka statystyczna 367
pomiarów, które miały zostać oszacowane
Charakterystyka statystyczna wszystkich
467 pomiarów
Przykład rozkładu błędów jednej z
estymacji wykonanych w ramach SIC-97
Przykłady interpolacji opadów z 8 maja 1986
roku na terenie Szwajcarii wykonanych
w ramach SIC-97
Podsumowanie:
• Wybór metody estymacji zależy od:
– charakteru danych pomiarowych,
– zagęszczenia i rozkładu przestrzennego
punktów pomiarowych,
– skali zróżnicowania przestrzennego
analizowanej zmiennej,
– wstępnych założeń co do natury
analizowanego zjawiska,
– celu opracowania (opis, kwantyfikacja,
identyfikacja ekstremów itp.),
– pożądanego poziomu dokładności,
– pracochłonności obliczeń,
– wiedzy i doświadczenia badacza.
Podsumowanie:
• W SIC-97 wzięło udział 48
uczestników.
• W końcowym zestawieniu
uwzględniono 22 prace spełniające
wszystkie wymogi regulaminowe.
• Uczestnicy SIC-97 zastosowali 36
(!!!) różnych metod interpolacyjnych
do rozwiązania postawionego przed
nimi problemu.
Podsumowanie:
Zastosowana metoda
Geostatystyka: kriging i symulacje
Sztuczne Sieci Neuronowe (ANN)
Funkcje sklejane (spline)
Funkcje na bazie radialnej (RBF)
Kernel
Estymacje na oko (ręczna interpolacja)
Odwrotnej wagi odległości (IDW)
Mieszane: kriging i ANN
Wielomiany
Maksymalnej entropii
Funkcje oparte na logice rozmytej
Całość
14
6
5
2
1
1
2
1
1
1
2
Finał
8
3
2
1
1
1
1
1
1
1
2
Podsumowanie:
Ocena
na oko
Podsumowanie:
Ocena
na oko
Podsumowanie:
• Najlepszą metodą interpolacji w SIC-97 okazała
się multiquadratic RBF (Radial Basis Function)
• Niewiele gorsze okazały się różne
geostatystyczne metody estymacji, które
dominowały ilościowo w całej porównywanej
stawce. Metody geostatystyczne jako grupa
okazały się generalnie bardzo dobre lub dobre
• Nie zawsze stosowanie wyrafinowanych metod
numerycznych daje wyniki lepsze niż ocena na
oko dokonana przez eksperta. Zasadnicze różnice
widoczne są dopiero przy bardzo dużej ilości
danych, których człowiek nie jest w stanie
ogarnąć.
Źródło:
DUBOIS, G., MALCZEWSKI, J., M. DE
CORT, M., (eds.) 2003: Mapping
radioactivity in the environment.
Spatial Interpolation Comparison
97. European Commision, Joint
Research Centre, EUR 20667 EN, 1-268.
Przykład zastosowań
Budowa tunelu pod
Kanałem La Manche
Alfred Stach
Instytut Badań Czwartorzędu i Geoekologii UAM
TUNEL
Najważniejsze dane:
• Lokalizacja: Folkestone, Anglia, i Sangatte,
Francja
• Data zakończenia budowy: 1994
• Koszt: 21 miliardów dolarów
• Długość: ok. 49,9 km
• Przeznaczenie: transport kolejowy
• Charakter: podwodny
• Materiał konstrukcyjny: stal, beton
• Budowniczy: firma Transmanche Link
Engineering
Geostatystyka a Tunel –
przykład idealny praktycznych zastosowań:
• Waga problemu proporcjonalna do
kosztów budowy – czyli ponad 21 mld.
dolarów
• Zagadnienie stosunkowo łatwe do
zrozumienia
• Rzadka możliwość porównania
geostatystycznych estymacji z
rzeczywistością
Usytuowanie Tunelu na tle przekroju
geologicznej dna Kanału
(1) najkorzystniejszą geotechnicznie
warstwą jest cenomański margiel
kredowy (Chalk Marl) zbudowany z
miękkich, homogenicznych i raczej dla
wody nieprzepuszczalnych skał,
(2) jest on przykryty szarą kredą (Grey
Chalk) – bardzo porowatą warstwą
mocno spękanych skał,
(3) podłoże stanowił Gault (Gault Clay) o
bardzo niekorzystnych właściwościach
geotechnicznych.
Podstawowe ograniczenia techniczne i
geologiczne, które musieli uwzględniać
budowniczowie Tunelu
• Na planowanej trasie tunelu nie można było, ze względu na
niebezpieczeństwo zalania wodą morską, wykonywać wierceń
• Tunel musiał znajdować się na głębokości co najmniej 20 m
poniżej dna morskiego, aby zachowana została mechaniczna
wytrzymałość skał nad nim leżących
• Tunel nie można było, ze względu na konstrukcję maszyn
wiertniczych, wiercić poniżej 100 m pod poziomem dna
morskiego
• Uskoki znajdujące się na trasie Tunelu powinny być
przecinane pod kątem jak najbardziej zbliżonym do prostego
• Spadki i krzywizna Tunelu nie mogły przekraczać ograniczeń
narzucanych przez szybką kolej
• I warunek najważniejszy – Tunel musiał być wywiercony w
skałach margla kredowego (Chalk Marl)
PROBLEM!
Jak na dystansie 50 km wywiercić 9
metrowe otwory w środku warstwy
skalnej o miąższości 30 m, która na
domiar złego nie zalega horyzontalnie i
jest poprzecinana uskokami, przy braku
precyzyjnych informacji geologicznych i
geodezyjnych?
Dane jakimi dysponowali specjaliści
od estymacji geostatystycznych
• 1500 km ciągłych (pomiary co 3 m) profili
batymetrycznych i sejsmicznych
refleksyjnych, a w tym:
– 5 podłużnych profili sejsmicznych, co 25 m po
stronie francuskiej, i co 250 m po stronie
angielskiej,
– 83 poprzeczne profile sejsmiczne wykonywane w
różnych odstępach od 250 do 1000 m.
• 10 profili wierceń wykonanych w pobliżu trasy
planowanego Tunelu w roku 1986
• 90 profili starszych wierceń z tego obszaru
Podstawowy problem interpretacji
danych z profilowań sejsmicznych
• Prędkość rozchodzenia się fal sejsmicznych jest
uzależniona od szeregu właściwości fizycznych skał
• Właściwości te w strefie budowy Tunelu były bardzo
zmienne zarówno w poziomie, jak i w pionie
• Przy interpretacji posługiwano się średnimi
wartościami prędkości fal dla poszczególnych typów
skał
Tak więc ocena głębokości zalegania
poszczególnych warstw skalnych była
obarczona zmiennym i nie znanym
błędem
Mapa izolinii (w m poniżej poziomu morza)
szacowanego stropu zalegania iłu Gault po
stronie francuskiej Kanału La Manche
Mapa izolinii (w m) błędu oceny głębokości
zalegania stropu iłu Gault po stronie francuskiej
Kanału La Manche
Oszacowany metodą krigingu przekrój
podłużny wzdłuż południowej części
Tunelu (przewyższenie skali pionowej 20 )
Nowe dane uzyskane
w trakcie budowy
• W trakcie wiercenia tunelu serwisowego
wykonano 85 podwójnych sondowań
głębokości zalegania stropu iłu Gault
• Wykonano je w celu oceny dokładności
estymacji, i w razie potrzeby – rewizji
modelu geometrii tunelu, gdyby błędy
były zbyt duże i zagroziły
bezpieczeństwu budowy
Strona
francuska
(13 km)
Strona
angielska
(15 km)
54
31
Minimalna różnica
-5,00 m
-7,00 m
Maksymalna różnica
+3,90 m
+8,00 m
Średnia różnica
+0,48 m
+1,70 m
Odchylenie standardowe różnic
2,02 m
3,40 m
Odchylenie standardowe krigingu
2,85 m
2,55
Ilość par wierceń
Oszacowana
ufność estymacji
geostatystycznej
w porównaniu z
rzeczywistą
rzędną stropu iłu
Gault
Wielkość i źródła błędów
• Po angielskiej stronie porównanie szacowanej
wielkości błędów z rzeczywistością wykazuje dobrą
zgodność dla pierwszych 20 otworów.
• Przy kolejnych 10 pojawia się systematyczny błąd
(średnia różnica 5,6 m)
• Przyczyny tych błędów:
– strefa gdzie gęstość profili sejsmicznych i wierceń była
najniższa,
– pomiędzy marglem kredowym, a iłem Gault pojawiła się
cienka (3,5 m) warstwa kredy Tourtia, o odmiennej
prędkości przewodzenia fal sejsmicznych,
– dodatkowe błędy kalibracji prędkości fal sejsmicznych
związane z niedokładnościami lokalizacji starych (z lat 196465) wierceń geofizycznych w strefie o dużym upadzie warstw
Wielkość i źródła błędów
• Po stronie francuskiej błędy oceny mieściły się w
założonych granicach. Wynikało to z większej ilości
wyjściowych danych geologicznych, a także
uwzględnienia w opracowaniu geostatystycznym
braku precyzji ich lokalizacji
• Pomiary wykonywane w czasie budowy Tunelu
wykazały dobrą zgodność modelu geostatystycznego
z rzeczywistością. Różnice były konsekwencją
systematycznych błędów danych geologicznych w
miejscach rzadko opróbowanych
• Główny cel opracowania – uniknięcie penetracji iłu
Gault przez maszyny wiertnicze – został osiągnięty.
Po stronie francuskiej nie wystąpiło to ani razu, po
angielskiej – dwukrotnie, lecz było to przewidziane.
Oficjalne otwarcie Tunelu
6 maja 1994 roku
Źródło:
Chilès, J.-P., Delfiner, P., 1999:
Geostatistics. Modeling spatial
uncertainty. J. Wiley, 1-695. (str. 215224)