Aula 4 - Danielle Carusi Machado

Download Report

Transcript Aula 4 - Danielle Carusi Machado

Aula 7
Introdução ao Stata
Análise de especificação
10 de maio de 2013
Regressão Linear: comparação de
modelos
• Coeficiente de determinação: R2 não ajustado
• Quando elevamos o numero de regressores na
equação, o valor do R2 não ajustado se eleva - um
modelo com maior número de variáveis independentes
é melhor do que um modelo com menor número de
variáveis independentes.
• Esta conclusão pode ser espúria porque podemos estar
adicionando variáveis sem sentido (non sense) ao
modelo restrito.
• Qualquer variável acrescentada (mesmo que non
sense) estará elevando o valor do R2 não ajustado.
Regressão Linear: comparação de
modelos
• R2 ajustado: não afetado pelo numero de
variáveis.
• A adição do regressor eleva o R2 não ajustado
apenas quando este é linearmente
independente em relação às colunas previas
da matriz X. Ou seja, não existe problema de
multicolinearidade.
• Ajuste do modelo
Source |
SS
df
MS
-------------+-----------------------------Model | 1264.72124
7 180.674463
Residual | 4260.16814 2947 1.44559489
-------------+-----------------------------Total | 5524.88938 2954 1.87030785
Number of obs =
F( 7, 2947)
Prob > F
R-squared
Adj R-squared
Root MSE
2955
= 124.98
= 0.0000
= 0.2289
= 0.2271
= 1.2023
-----------------------------------------------------------------------------ltotexp |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------suppins |
.2556428
.0462264
5.53
0.000
.1650034
.3462821
phylim |
.3020598
.0569709
5.30
0.000
.190353
.4137666
actlim |
.3560054
.0621118
5.73
0.000
.2342185
.4777923
totchr |
.3758201
.0184227
20.40
0.000
.3396974
.4119429
age |
.0038016
.0036561
1.04
0.299
-.0033672
.0109705
female | -.0843275
.0455442
-1.85
0.064
-.1736292
.0049741
income |
.0025498
.0010194
2.50
0.012
.000551
.0045486
_cons |
6.703737
.27676
24.22
0.000
6.161075
7.2464
-----------------------------------------------------------------------------.
Modelos aninhados e não aninhados
• Modelos nested (aninhados): as variáveis
independentes do primeiro modelo formam um
subconjunto das variáveis independentes do primeiro
modelo.
• Modelos não nested (não aninhados): os parâmetros (e
variáveis) do primeiro modelo não estão contidos no
conjunto de parâmetros (e variáveis) do segundo
modelo (e vice-versa).
• Em suma, modelos nested são aqueles que podem ser
obtidos a partir da simples inclusão de variáveis no
primeiro modelo para obter o seguinte modelo.
aninhado
Não
aninhado
Comparação de modelos
• Modelos não aninhados (abordagem não
estatística):
– olhar coeficiente de determinação e R2 ajustado:
saem do lado esquerdo da saída da regressão.
– Olhar os valores dos critérios: AIC (Akaike), BIC
(Critério Bayesiano ou Schwarz ).
– Consideram o ajuste e a parcimônia.
Comando no Stata:
estat ic
Comando ic
stat ic
Model
Obs
ll(null)
ll(model)
df
AIC
BIC
reg2
143180
-186936.9
-178443
6
356898
356957.2
Note:
N=Obs used in calculating BIC; see [R] BIC note
• O grau para o qual o modelo ajustado melhora em relação ao
modelo nulo na explicação da variável dependente é medido
pelo maior valor (em termos absolutos) do ll(model) em
comparação com o ll(null).
• BIC
• AIC
Comparação de modelos
• Abordagem Estatística: testes de comparação
modelos restrito e irrestrito (distância de
Wald).
Sobreespecificação do modelo
• Inclusão de variáveis irrelevantes no modelo
de regressão.
• Não altera o fato de que os estimadores dos
parâmetros das variáveis relevantes
continuam sendo não viesados.
• Pode causar efeitos indesejáveis nas variâncias
dos estimadores OLS.
• Diferente de subespecificação do modelo
(omissão de variáveis relevantes!)
Multicolinearidade
• Multicolinearidade perfeita: um dos regressores é
uma combinação linear de outros regressores –
impede solução do MQO.
• Quase multicolinearidade: o ajuste da regressão
pode ser bom mas os coeficientes podem ter
erros padrões muito altos, sinais ou magnitudes
incorretas.
• Teste vif (variance influence factor): quando um
regressor não é ortogonal a outros regressores a
variância do respectivo parâmetro fica
inflacionada.
. estat vif
Variable
VIF
1/VIF
homem
chefe
urbano
metropole
branca
1.09
1.08
1.07
1.06
1.01
0.919974
0.926821
0.934089
0.946200
0.993499
Mean VIF
1.06
• O maior vif não pode ser maior que 10