Análise Espacial de Áreas: Regressão

Download Report

Transcript Análise Espacial de Áreas: Regressão

Análise Espacial de Áreas:

Regressão

Análise Espacial de Dados Geográficos SER-303 Novembro/2005 (Flávia Feitosa)

Análise de Regressão

 Descreve ou estima uma variável dependente (Y) a partir de seu relacionamento com variáveis independentes (X)  Ex: Y = aX + b  Objetivos  Determinar como (e se) duas ou mais variáveis se relacionam.

  Descrever como as variáveis se relacionam (função).

Prever valores futuros da variável dependente (Y).

Regressão Linear Simples

Y i =

0 +

1 X i +

i

Y i

0

é o valor da variável dependente na

i

ésima observação; e 

1

são parâmetros;

X i

é uma constante conhecida; é o valor da variável independente na

i

ésima observação; 

i

i

é um termo de erro aleatório com distribuição normal, média zero e e variância constante 

j

2

(

E

( 

i

)=0 e 

2

( 

i

)= 

2

) são não correlacionados (independentes) para

i

j

Y

Modelo de Regressão Linear

Variável Dependente Intercepto Populacional Inclinação Populacional

Y i =

0 +

1 X i +

i

Variável Independente Erro Aleatório

 0 Y i 

i

1

Coeficiente angular 

Y

= E(

Y

) = 

0 +

1 X Ŷ

i i =b 0 +b =Y i -Ŷ i 1 X i

Modelo estimado Resíduo

X

Regressão Linear Múltipla

Y i =

0 +

1 X i1 +

2 X i2 +…+

p X ip +

i

Y i

é o valor da variável dependente na

i

ésima observação 

0, …,

p

são parâmetros

X i1 ,…,X ip

são os valores das variáveis independentes na observação

i

ésima 

i

i

é um termo de erro aleatório com distribuição normal, média zero e e variância constante 

j

2

(

E

( 

i

)=0 e 

2

( 

i

)= 

2

) são não correlacionados (independentes) para

i

j

Coeficiente de Determinação

Análise de Variância

SQTo = SQReg + SQRes  (Y i  Y ) 2   ( ˆ i  Y ) 2   (Y i  ˆ i ) 2 

Coeficiente de determinação:

R 2 =SQReg/SQTo  Proporção da variância total de Y que é “explicada” pela equação de regressão.

  Varia entre 0 e 1 Quanto mais próximo de 1, melhor o ajuste do modelo.

Análise da Aptidão do Modelo

Análise dos Resíduos – Verificar:

 Se função de regressão é linear 0 Não Linearidade X

Análise da Aptidão do Modelo

Análise dos Resíduos – Verificar:

 Se os erros possuem variância constante (homocedasticidade) Variância Não Constante 0 X

Análise da Aptidão do Modelo

Análise dos Resíduos – Verificar:

 Se os erros são independentes 0 Erros Correlacionados X

Análise da Aptidão do Modelo

Análise dos Resíduos – Verificar:

 A presença de outliers Gráfico dos Resíduos 1 0,8 0,6 0,4 0,2 0 150 -0,2 -0,4 155 160 165 170 175

X

180 185

Análise da Aptidão do Modelo

Análise dos Resíduos – Verificar:

 Se erros são normalmente distribuídos

Análise da Aptidão do Modelo

Análise dos Resíduos – Modelo Adequado:

0 X

Análise da Aptidão do Modelo

Análise dos Resíduos : DADOS ESPACIAIS

 Hipótese de independência das observações em geral é Falsa

Dependência Espacial

  Efeitos Espaciais  Se existir forte tendência ou correlação espacial, os resultados serão influenciados, apresentando associação estatística onde não existe (e vice-versa).

 Como verificar?  Medir a autocorrelação espacial dos resíduos da regressão (Índice de Moran dos resíduos)

Exemplo

São José dos Campos

Crescimento Populacional 91-00 X Densidade Populacional 91  Índice de Moran sobre mapa de resíduos I=0,45  Testes de pseudo significância indicam autocorrelação espacial

Regressão Espacial

 Autocorrelação espacial constatada!

E agora?

 Modelos de regressão que incorporam efeitos espaciais:  

Globais

: utilizam um correlação espacial único parâmetro para capturar a estrutura de

Locais:

parâmetros variam continuamente no espaço

Modelos com Efeitos Espaciais Globais

 Suposição:  É possível capturar a estrutura de correlação espacial num único parâmetro (adicionado ao modelo de regressão).

 Alternativas:  

Spatial Lag Models:

dependente Y.

atribuem a autocorrelação espacial à variável

Spatial Error Models:

atribuem a autocorrelação ao erro.

Spatial Lag Model

 Suposição  a variável y i depende dos valores da variável dependente nas áreas vizinhas a i: Y =  WY + X  +     = medida de correlação espacial  = 0, se autocorrelação é nula  W = matriz de proximidade espacial

Spatial Error Model

 Efeitos espaciais são um ruído Y = X  +   =  W  + ξ  W  = erro com efeitos espaciais    = medida de correlação espacial

ξ

= componente do erro com variância constante e não correlacionada.

Spatial Lag Model X Spatial Error Model

 Motivações diferentes, porém próximos em termos formais.  Premissa: processo espacial analisado é estacionário e pode ser capturado em um único parâmetro.  Porém isto nem sempre é verdade!

 Verificar se padões diversos de associação espacial estão presentes.  Indicadores Locais de Autocorrelação Espacial

Indicadores Locais de Variabilidade Espacial  distribuição dos valores de correlação local para o índice de exclusão

% Exclusão Não significantes p = 0.05 [ 95% (1,96

) ] p = 0.01 [ 99% (2,54

) ] p = 0.001 [ 99,9% (3,2

) ]

Modelos com Efeitos Espaciais Locais

 Modelos de  Regressão com Efeitos Espaciais

Discretos

variações espaciais modeladas de maneira discreta.

 Regimes espaciais  Modelos de Regressão com Efeitos Espaciais

Contínuos

  variações espaciais modeladas de forma contínua, com parâmetros variando no espaço.

Geographically Weighted Regression”

– GWR.

Regimes Espaciais

 Regionalizações da área de estudo  Diferentes tipos de variabilidade espacial  Métricas: Diagrama de espalhamento e índices locais e globais  Ex: Regimes espaciais para índice de exclusão

Regimes Espaciais x Regiões Administrativas

Impacto de Regimes Espaciais

 Análise de Regressão  Idosos = f ( Domicílios Sem Esgoto)  Regressão Linear  R 2 = 0,35  Regressão Espacial  Regiões Adm (R 2 = 0,72)  Regimes Espaciais (R 2 = 0,83)  Para dados socioeconômicos:  modelo de regimes espaciais tende a apresentar resultados melhores que os de regressão simples ou de regressão espacial com efeitos globais.

GWR

geographically weighted regression

 Ajusta um modelo de regressão a cada ponto observado, ponderando todas as demais observações como função da distância deste ponto. Y(s) =  (s)X +  Y(s): variável que representa o processo no ponto s.

 (s): parâmetros estimados no ponto s.

GWR

geographically weighted regression

  Os parâmetros podem ser apresentados visualmente para identificar como se comportam espacialmente os relacionamentos entre as variáveis. Ex: Crescimento Pop. (dependente) X Densidade Pop. (independente)

GWR

geographically weighted regression

  Ex: Crescimento Pop. (dependente) X Densidade Pop. (independente) Mapa de resíduos (I = 0,04) :

Softwares

GeoDa

 Índice de Moran, LISA maps, Regressão Clássica e Espacial (Spatial Lag & Spatial Error) 

SPRING e Terraview

 Índice de Moran, LISA maps 

SpaceStat

 Regressão Clássica e Espacial (Spatial Lag & Spatial Error) 

R, aRT + TerraView

 Regressão Clássica, Espacial (Spatial Lag & Spatial Error) e GWR 

GWR 3.0

 Regressão Clássica e Espacial (GWR)