Regressão - Erudito FEA-USP

Download Report

Transcript Regressão - Erudito FEA-USP

análise dos estimadores
resumo




significado
erro padrão
estimação de intervalo
teste de hipótese


teste t
teste F (ANOVA)
2
Regressão Linear Simples - Exemplo
Coleta
de
Dados:
obs. banco pccrédito
1
1
0,26
2
2
0,15
3
3
0,28
4
4
0,15
5
5
0,30
6
7
0,20
7
15
0,13
8
22
0,20
9
23
0,24
10
24
0,24
11
38
0,26
12
51
0,12
13
65
0,27
14
87
0,12
pctvm
0,10
0,22
0,09
0,24
0,15
0,31
0,62
0,18
0,22
0,11
0,13
0,31
0,29
0,38
3
Análise da Regressão
REGRESSÃO DE PCCRÉDITO (Y) SOBRE PCTVM (X)
Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superiores Inferior 90,0% Superior 90,0%
Interseção
0,2825
0,0260 10,862 0,0000
0,2258
0,3391
0,2361
0,3288
pctvm
-0,3109
0,0949 -3,278 0,0066
(0,5176)
(0,1043)
(0,4800)
(0,1419)
4
Regressão Linear Simples
crédito/ativo x tvm/ativos
0,70
0,60
tvm/ativo
0,50
0,40
0,30
0,20
0,10
0,00
0,10
0,12
0,14
0,16
0,18
0,20
crédito/ativo
0,22
0,24
0,26
0,28
0,30
5
Modelo de Regressão Linear
tvm/ativos x crédito/ativos
0,30
0,28
0,26
0,24
pccrédito
0,22
0,20
0,18
0,16
0,14
0,12
0,10
0,00
0,10
0,20
0,30
0,40
pctvm
0,50
0,60
0,70
6
Resultado do Modelo de Regressão
REGRESSÃO DE PCCRÉDITO (Y) SOBRE PCTVM (X)
Quais os valores dos estimadores?
Interseção
pctvm
Coeficientes
0,2825
-0,3109
7
Análise dos Estimadores
.
REGRESSÃO DE PCCRÉDITO (Y) SOBRE PCTVM (X)
Os estimadores a e b da equação:
 são estatisticamente significativos?
 são estatisticamente diferentes de zero?
yc = a + b.xi
yc = 0,2825 – 0,3109xi
8
Análise da Regressão
Erro padrão do coeficiente angular
Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superiores Inferior 90,0% Superior 90,0%
Interseção
0,2825
0,0260 10,862 0,0000
0,2258
0,3391
0,2361
0,3288
pctvm
-0,3109
0,0949 -3,278 0,0066
(0,5176)
(0,1043)
(0,4800)
(0,1419)
9
Analisando os estimadores
.
Erro Padrão do Coeficiente a – Sa
Sa  Se
2
1 X

n Sxx
10
Analisando os estimadores
Erro Padrão do Coeficiente b – Sb
Sb 
Se
Sxx
11
Estimando Intervalos
onde:
B = Parâmetro angular esperado da população
b = Coeficiente angular estimado pela regressão
Sb = Erro padrão da estimativa do coeficiente angular
t = distribuição de student
α = nível de confiança desejado
12
Testando a significância do estimador
Teste de hipótese
O parâmetro populacional está contido no
intervalo amostral?
3 formas de testar – sempre utilizando a distribuição t
1) Através do Intervalo de Confiança
2) Através do Nível de Significância
3) Através da probabilidade estimada (p-value)
13
Testando o coeficiente b
 Será que o modelo de regressão linear obtido
é útil para projetar valores de y?
 A hipótese nula estabelece que as variáveis x
e y da população não são relacionadas, isto é,
Inclinação de FRP = 0.

H0: B = 0

H 1: B  0
14
Análise da Regressão
Teste
t para o coeficiente angular B
Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superiores Inferior 90,0% Superior 90,0%
Interseção
0,2825
0,0260 10,862 0,0000
0,2258
0,3391
0,2361
0,3288
pctvm
-0,3109
0,0949 -3,278 0,0066
(0,5176)
(0,1043)
(0,4800)
(0,1419)
Teste de hipóteses:
H0 : B = 0 variáveis PCTVM e PCCRÉDITO não são relacionadas.
H1 : B ≠ 0 variáveis PCTVM E PCCRÉDITO são relacionadas.
15
Testando o coeficiente b
. Teste pelo nível de significância
 O teste consiste em comparar o t calculado com o t
crítico a um dado nível de significância
 cálculo de t =
b-B
Sb
 Como não se conhece o parâmetro, faz-se B = 0
 = então, t calculado =
b
Sb
 Se t calculado > t crítico: rejeita H0 e b é válido ≠ 0
 Se t calculado < t crítico: aceita H0 e b não é válido = 016
Testando o coeficiente b


Com o Intervalo de Confiança: Se o Intervalo
estimado contiver o valor hipotético de B,
aceita H0, que será, estatisticamente
igual a zero.
Com o P-VALUE: Se a
probabilidade estimada for maior
que α, aceita H0.
17
Testando o coeficiente b
Intervalo de Confiança
4,5%
4,0%
3,5%
3,0%
2,5%
2,0%
1,5%
Limite
crítico
Intervalo de
confiança
Zona de
Rejeição
1,0%
0,5%
0,0%
5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
18
Análise da Regressão
Valor p (p-value)
Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superiores Inferior 90,0% Superior 90,0%
Interseção
0,2825
0,0260 10,862 0,0000
0,2258
0,3391
0,2361
0,3288
pctvm
-0,3109
0,0949 -3,278 0,0066
(0,5176)
(0,1043)
(0,4800)
(0,1419)
Consiste em comparar valor p calculado (p-value) com o nível de
significância requerido pelo pesquisador/consultor
Caso o p-value seja menor que o nível de significância previamente
estabelecido:
Rejeita-se H0: B é válido, ou seja, diferente de zero
19
Estimando Intervalos
Intervalo de Confiança do coeficiente b
 Estima-se o intervalo de variação de b em torno do
parâmetro populacional B
 Utiliza-se a distribuição t , que é a distribuição z
ajustada para (n – k) graus de liberdade
b t  Sb  B  b  t  Sb
2
2
20
Análise da Regressão
Intervalo de confiança
Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superiores Inferior 90,0% Superior 90,0%
Interseção
0,2825
0,0260 10,862 0,0000
0,2258
0,3391
0,2361
0,3288
pctvm
-0,3109
0,0949 -3,278 0,0066
(0,5176)
(0,1043)
(0,4800)
(0,1419)
Consiste em identificar se o valor 0 (zero) pertence ao
intervalo de confiança.
Caso pertença, não se rejeita H0, ou seja, B não é diferente
de zero.
21
Testando a equação da reta
 Testa a hipótese de que nenhum dos estimadores tenha
significado
 É utilizada a distribuição F
 O teste consiste em comparar o F calculado com o

F crítico
 Se F calculado > F crítico: rejeita H0 e a regressão é
válida
 Se F calculado < F crítico: aceita H0 e rejeita a regressão
22
Testando a equação da reta

A distribuição F representa uma análise de
variância (ANOVA)


Quanto maior, mais adequada a reta
Em regressão simples, F = t2
Variação Explicada
F
Variação não Explicada
23
Testando a equação da reta
.
n
2

(y
–
y)
c
i=1
F=
K-1
(k – 1) graus de
liberdade
n
2

(y
–
y
)
i
c
i=1
n-k
(n – k) graus de
liberdade
Onde:
n = nº de observações da amostra
k = nº de amostras /nº de variáveis
24
Estatísticas ANOVA


gl: graus de liberdade para a distribuição F
SQ: soma dos quadrados dos desvios


MQ: média dos quadrados dos desvios (SQ/gl)




da regressão e dos resíduos
MQ da regressão = variância explicada
MQ dos resíduos = variância não explicada
F: MQ da regressão / MQ dos resíduos
F de significação: p-value da estatística F
25
Análise de Regressão

Análise da Variância

Notar que F = t2
ANOVA
gl
Regressão
Resíduo
Total
SQ
MQ
F
F de significação
1 4.029053 4.029053 7.5247854
0.017827567
12 6.425251 0.535438
13 10.4543
26
Análise de Dados - Regressão (Excel)


Ferramentas  Análise de dados  Regressão
Caixa de diálogo:






Intervalo Y de entrada: selecionar
Intervalo X de entrada: selecionar
Constante é zero: selecionar quando se quiser que a reta passe
pela origem (a=0)
Rótulos: marcar quando a seleção dos dados anteriores
contiver o título da coluna
Nível de confiança: informar o nível de significância (0,05;
0,025; etc.)
Opções de saída: indicar a célula onde se deseja a resposta
27