Aula 2 - Danielle Carusi Machado

Download Report

Transcript Aula 2 - Danielle Carusi Machado

Aula 3
17 de setembro de 2013
Agrupamento independente de
cortes transversais
Cortes transversais agrupados
• Alguns conjuntos de dados têm características de corte
transversal e de séries de tempo.
• Um mesmo conjunto de variáveis é coletado em diferentes
períodos do tempo, em distintas amostras aleatórias de
uma mesma população (Censo Demográfico, Pesquisa
Nacional por Amostra de Domicílios –PNAD).
• Agrupar cortes transversais de diferentes anos é eficaz para
analisar os efeitos de uma política pública.
• O ideal é coletar dados de anos anteriores e posteriores a
uma importante mudança de política governamental.
Cortes transversais agrupados
• Aumenta o tamanho da amostra, a análise de corte
transversal agrupada é importante para estimar como
uma relação fundamental mudou ao longo do tempo.
• Observações amostrais são coletadas de forma
independente.
• Eliminação da correlação nos erros entre diferentes
observações.
• Intercepto deve diferir entre períodos de tempo
diferentes – variáveis dummies para todos anos menos
um (ano base)
Exemplo
• Conjunto de dados sobre os preços da
moradia em 1993 e 1995 nos Estados Unidos
Exemplos de banco de dados com
cortes transversais agrupados
• Pesquisa Nacional por amostra de domicílios
do IBGE (podemos agrupar vários anos):
• A PNAD é uma pesquisa anual por amostragem probabilística de
domicílios, realizada em todo o território nacional exclusive a
área rural da região Norte.
• A PNAD adota um plano amostral estratificado e conglomerado
com um, dois ou três estágios de seleção, dependendo do
estrato.
Exemplos de banco de dados com
cortes transversais agrupados
• Pesquisa Nacional por amostra de domicílios do
IBGE (podemos agrupar vários anos):
• Amostra da PNAD é feita em 3 estágios de seleção (municípios, setores
censitários e domicílios).
• Estratificação das unidades de 1º estágio e com probabilidades de
seleção proporcionais ao tamanho para os municípios e setores.
• Os domicílios são selecionados com probabilidades iguais dentro dos
setores.
• Fração de amostragem: probabilidade de um domicílio pertencer à
amostra.
Modelo de dados agrupados
• As informações são agrupadas em um único
banco de dados.
• O modelo pode ser escrito da seguinte forma:
y i   0   1 ano i   2 x i  ...  u i
• Termo constante
• Variáveis explicativas
Fertilidade feminina ao longo do
tempo
• Arquivo: fertil1.gdt
• Modelo que estima o número total de
nascimentos por mulheres.
Modelo 2: MQO,
usando as
observações 1-1129
Variável dependente:
kids
Coeficiente
Erro Padrão
razão-t
p-valor
const
-7,74246
3,05177
-2,5370
0,01132
**
educ
-0,128427
0,0183486
-6,9993
<0,00001
***
age
0,532135
0,138386
3,8453
0,00013
***
agesq
-0,005804
0,00156428
-3,7103
0,00022
***
black
1,07566
0,173536
6,1985
<0,00001
***
east
0,217324
0,132788
1,6366
0,10199
northcen
0,363114
0,120897
3,0035
0,00273
west
0,197603
0,166913
1,1839
0,23672
farm
-0,0525575
0,14719
-0,3571
0,72111
othrural
-0,162854
0,175442
-0,9282
0,35348
town
0,0843532
0,124531
0,6774
0,49831
smcity
0,211879
0,160296
1,3218
0,18651
y74
0,268183
0,172716
1,5527
0,12077
y76
-0,0973795
0,179046
-0,5439
0,58663
y78
-0,0686665
0,181684
-0,3779
0,70554
y80
-0,0713053
0,182771
-0,3901
0,69651
y82
-0,522484
0,172436
-3,0300
0,00250
***
0,00183
***
y84
Média var. dependente
Soma resíd. quadrados
R-quadrado
F(17, 1111)
Log da verossimilhança
Critério de Schwarz
-0,545166
2,743136
2685,898
0,129512
9,723282
-2091,224
4308,972
0,174516
-3,1239
D.P. var. dependente
1,653899
E.P. da regressão
1,554847
R-quadrado ajustado
0,116192
P-valor(F)
2,42e-24
Critério de Akaike
4218,448
Critério Hannan-Quinn
4252,650
***