Transcript Análise Espacial de Áreas: Regressão
Análise Espacial de Áreas:
Regressão
Análise Espacial de Dados Geográficos SER-303 Novembro/2005 (Flávia Feitosa)
Análise de Regressão
Descreve ou estima uma variável dependente (Y) a partir de seu relacionamento com variáveis independentes (X) Ex: Y = aX + b Objetivos Determinar como (e se) duas ou mais variáveis se relacionam.
Descrever como as variáveis se relacionam (função).
Prever valores futuros da variável dependente (Y).
Regressão Linear Simples
Y i =
0 +
1 X i +
i
Y i
0
é o valor da variável dependente na
i
ésima observação; e
1
são parâmetros;
X i
é uma constante conhecida; é o valor da variável independente na
i
ésima observação;
i
i
é um termo de erro aleatório com distribuição normal, média zero e e variância constante
j
2
(
E
(
i
)=0 e
2
(
i
)=
2
) são não correlacionados (independentes) para
i
j
Y
Modelo de Regressão Linear
Variável Dependente Intercepto Populacional Inclinação Populacional
Y i =
0 +
1 X i +
i
Variável Independente Erro Aleatório
0 Y i
i
1
Coeficiente angular
Y
= E(
Y
) =
0 +
1 X Ŷ
i i =b 0 +b =Y i -Ŷ i 1 X i
Modelo estimado Resíduo
X
Regressão Linear Múltipla
Y i =
0 +
1 X i1 +
2 X i2 +…+
p X ip +
i
Y i
é o valor da variável dependente na
i
ésima observação
0, …,
p
são parâmetros
X i1 ,…,X ip
são os valores das variáveis independentes na observação
i
ésima
i
i
é um termo de erro aleatório com distribuição normal, média zero e e variância constante
j
2
(
E
(
i
)=0 e
2
(
i
)=
2
) são não correlacionados (independentes) para
i
j
Coeficiente de Determinação
Análise de Variância
SQTo = SQReg + SQRes (Y i Y ) 2 ( ˆ i Y ) 2 (Y i ˆ i ) 2
Coeficiente de determinação:
R 2 =SQReg/SQTo Proporção da variância total de Y que é “explicada” pela equação de regressão.
Varia entre 0 e 1 Quanto mais próximo de 1, melhor o ajuste do modelo.
Análise da Aptidão do Modelo
Análise dos Resíduos – Verificar:
Se função de regressão é linear 0 Não Linearidade X
Análise da Aptidão do Modelo
Análise dos Resíduos – Verificar:
Se os erros possuem variância constante (homocedasticidade) Variância Não Constante 0 X
Análise da Aptidão do Modelo
Análise dos Resíduos – Verificar:
Se os erros são independentes 0 Erros Correlacionados X
Análise da Aptidão do Modelo
Análise dos Resíduos – Verificar:
A presença de outliers Gráfico dos Resíduos 1 0,8 0,6 0,4 0,2 0 150 -0,2 -0,4 155 160 165 170 175
X
180 185
Análise da Aptidão do Modelo
Análise dos Resíduos – Verificar:
Se erros são normalmente distribuídos
Análise da Aptidão do Modelo
Análise dos Resíduos – Modelo Adequado:
0 X
Análise da Aptidão do Modelo
Análise dos Resíduos : DADOS ESPACIAIS
Hipótese de independência das observações em geral é Falsa
Dependência Espacial
Efeitos Espaciais Se existir forte tendência ou correlação espacial, os resultados serão influenciados, apresentando associação estatística onde não existe (e vice-versa).
Como verificar? Medir a autocorrelação espacial dos resíduos da regressão (Índice de Moran dos resíduos)
Exemplo
São José dos Campos
Crescimento Populacional 91-00 X Densidade Populacional 91 Índice de Moran sobre mapa de resíduos I=0,45 Testes de pseudo significância indicam autocorrelação espacial
Regressão Espacial
Autocorrelação espacial constatada!
E agora?
Modelos de regressão que incorporam efeitos espaciais:
Globais
: utilizam um correlação espacial único parâmetro para capturar a estrutura de
Locais:
parâmetros variam continuamente no espaço
Modelos com Efeitos Espaciais Globais
Suposição: É possível capturar a estrutura de correlação espacial num único parâmetro (adicionado ao modelo de regressão).
Alternativas:
Spatial Lag Models:
dependente Y.
atribuem a autocorrelação espacial à variável
Spatial Error Models:
atribuem a autocorrelação ao erro.
Spatial Lag Model
Suposição a variável y i depende dos valores da variável dependente nas áreas vizinhas a i: Y = WY + X + = medida de correlação espacial = 0, se autocorrelação é nula W = matriz de proximidade espacial
Spatial Error Model
Efeitos espaciais são um ruído Y = X + = W + ξ W = erro com efeitos espaciais = medida de correlação espacial
ξ
= componente do erro com variância constante e não correlacionada.
Spatial Lag Model X Spatial Error Model
Motivações diferentes, porém próximos em termos formais. Premissa: processo espacial analisado é estacionário e pode ser capturado em um único parâmetro. Porém isto nem sempre é verdade!
Verificar se padões diversos de associação espacial estão presentes. Indicadores Locais de Autocorrelação Espacial
Indicadores Locais de Variabilidade Espacial distribuição dos valores de correlação local para o índice de exclusão
% Exclusão Não significantes p = 0.05 [ 95% (1,96
) ] p = 0.01 [ 99% (2,54
) ] p = 0.001 [ 99,9% (3,2
) ]
Modelos com Efeitos Espaciais Locais
Modelos de Regressão com Efeitos Espaciais
Discretos
variações espaciais modeladas de maneira discreta.
Regimes espaciais Modelos de Regressão com Efeitos Espaciais
Contínuos
variações espaciais modeladas de forma contínua, com parâmetros variando no espaço.
“
Geographically Weighted Regression”
– GWR.
Regimes Espaciais
Regionalizações da área de estudo Diferentes tipos de variabilidade espacial Métricas: Diagrama de espalhamento e índices locais e globais Ex: Regimes espaciais para índice de exclusão
Regimes Espaciais x Regiões Administrativas
Impacto de Regimes Espaciais
Análise de Regressão Idosos = f ( Domicílios Sem Esgoto) Regressão Linear R 2 = 0,35 Regressão Espacial Regiões Adm (R 2 = 0,72) Regimes Espaciais (R 2 = 0,83) Para dados socioeconômicos: modelo de regimes espaciais tende a apresentar resultados melhores que os de regressão simples ou de regressão espacial com efeitos globais.
GWR
– geographically weighted regression
Ajusta um modelo de regressão a cada ponto observado, ponderando todas as demais observações como função da distância deste ponto. Y(s) = (s)X + Y(s): variável que representa o processo no ponto s.
(s): parâmetros estimados no ponto s.
GWR
– geographically weighted regression
Os parâmetros podem ser apresentados visualmente para identificar como se comportam espacialmente os relacionamentos entre as variáveis. Ex: Crescimento Pop. (dependente) X Densidade Pop. (independente)
GWR
– geographically weighted regression
Ex: Crescimento Pop. (dependente) X Densidade Pop. (independente) Mapa de resíduos (I = 0,04) :
Softwares
GeoDa
Índice de Moran, LISA maps, Regressão Clássica e Espacial (Spatial Lag & Spatial Error)
SPRING e Terraview
Índice de Moran, LISA maps
SpaceStat
Regressão Clássica e Espacial (Spatial Lag & Spatial Error)
R, aRT + TerraView
Regressão Clássica, Espacial (Spatial Lag & Spatial Error) e GWR
GWR 3.0
Regressão Clássica e Espacial (GWR)