Presentación de PowerPoint

Download Report

Transcript Presentación de PowerPoint

REGRESION LINEAL III
Mario Briones L.
MV, MSc
2005
Gráfico de residuales de la
regresión

El gráfico de residuales de una
regresión se obtiene ubicando en un
plano de coordenas los valores de la
variable independiente (en el eje X)
y la magnitud de la desviación que
existe entre cada punto observado y
la línea de regresión, con respecto al
eje Y.
Ejemplo, osos grises
Variable X 1 Gráfico de los residuales
100
Residuos
50
0
-50
34
44
54
64
-100
-150
Variable X 1
74
84
Objetivo del examen del
gráfico de residuales:


El gráfico de residuales permite apreciar
más claramente la “adecuación” del
modelo lineal a los datos.
Si la relación “real” entre las dos
variables es lineal, entonces los puntos
aparecen distribuidos homogéneamente
alrededor del valor cero de Y, sin ningún
patrón reconocible.

La presencia de patrones de
distribución de los puntos de
residuales pueden indicar que el
supuesto de linearidad no se
sostiene
Ejemplo

Precio de huevos en USA según peso
grado
LL
L
M
MS
S
SS
peso grs
73
67
61
55
49
43
precio promedio 92-94 (centavos/unidad)
13.36
13.55
11.92
9.1
7.4
4.83
Regresión

Se observa un alto valor del
coeficiente de determinación
precio (cents)
20
y = 0.3044x - 7.6274
R2 = 0.9434
15
10
5
0
40
50
60
peso (grs)
70
80
Gráfico de residuales

Se observa una distribución desuniforme
alrededor de cero
Variable X 1 Gráfico de los residuales
1.5
Residuos
1
0.5
0
-0.5 0
20
40
-1
-1.5
Variable X 1
60
80
Gasto militar
Análisis de residuales y
adecuación del modelo
800
700
600
500
400
300
200
100
0
y = 0.0191x + 41.857
R2 = 0.4174
0
5000
10000
15000
Ingreso per cápita
20000
25000
Resumen
Estadísticas de la regresión
Coeficiente de correlación múltiple
0.64604099
Coeficiente de determinación R^2
0.41736896
R^2 ajustado
0.4065795
Error típico
136.153868
Observaciones
56
ANÁLISIS DE VARIANZA
Regresión
Residuos
Total
Intercepción
ING_CAP
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF
Valor crítico de F
1 717100.891 717100.891 38.6830132 7.5658E-08
54 1001045.29 18537.8757
55 1718146.18
Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%
41.8569756 24.8379283 1.68520398 0.09772057 -7.94011553 91.6540667
0.01905844 0.00306427 6.21956696 7.5658E-08 0.01291494 0.02520194
Gráfico de residuales
ING_CAP Gráfico de los residuales
800
Residuos
600
400
200
0
-200
0
5000
10000
15000
-400
ING_CAP
20000
25000
Gráfico de probabilidad
normal
Gráfico de probabilidad normal
GAST_MIL
800
600
400
200
0
0
20
40
60
Muestra percentil
80
100
120
Residuales estandarizados
20
21
22
23
24
25
26
27
28
29
30
31
32
33
191.570963
46.2387577
77.3725481
49.038212
45.1719604
44.2915393
48.4114564
83.1072474
54.2103627
46.3978347
132.156909
45.7029287
48.3441601
67.0646249
81.2032301
-43.7387577
682.627452
-25.7703023
-42.7992419
-34.154865
-39.217908
30.247183
-44.3552902
-42.4737841
508.355912
-36.8567749
-25.5494003
0.73652233
0.60190477
-0.32420591
5.05985686
-0.19101787
-0.31724191
-0.25316698
-0.2906959
0.22420197
-0.32877585
-0.31482951
3.76809948
-0.27319441
-0.18938047
0.00545934
Gráfico de los datos
transformados
3
2.5
2
1.5
1
0.5
0
0
1
2
3
4
5
Regresión
Resumen
Estadísticas de la regresión
Coeficiente de correlación múltiple 0.89602746
Coeficiente de determinación R^2
0.80286521
R^2 ajustado
0.79907416
Error típico
0.28865576
Observaciones
54
ANÁLISIS DE VARIANZA
Regresión
Residuos
Total
Intercepción
log_cap
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF
Valor crítico de F
1 17.6458731 17.6458731 211.778909 5.6418E-20
52 4.33275156 0.08332215
53 21.9786246
Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%
-1.33192219 0.21441509 -6.21188643 8.8964E-08 -1.76217725 -0.90166713
0.90534999 0.06221214 14.5526255 5.6418E-20 0.78051228
1.0301877
Gráfico de residuales
Residuos
log_cap Gráfico de los residuales
0.8
0.6
0.4
0.2
0
-0.2 0
-0.4
-0.6
-0.8
1
2
3
log_cap
4
5
Gráfico de probabilidad
normal
Gráfico de probabilidad normal
3
log_mil
2.5
2
1.5
1
0.5
0
0
20
40
60
Muestra percentil
80
100
120
Intervalo de predicción para
un valor individual de Y



Dado un valor fijo X, el intervalo de
confianza para un valor individual es:
^
Y
1
n( X  X )
 ta / 2 Se 1  
2
2
n n(  X )  (  X )
2
Donde ta/2 es el valor de t para los grados
de libertad de la regresión y la mitad del
valor de alfa decidido para el intervalo
Ejemplo, osos grises
De acuerdo con los datos del último
ejercicio, con un b0= -351.66 y b1=
9.65, para una medición de largo
corporal de 71 pulgadas, el valor
predicho de peso es de 334 lbs.
 La construcción de un intervalo de
confianza de 95% para este valor
predicho dará una idea de la
confiabilidad de esta predicción

Ejemplo, osos grises
1
8(71 64.6)
 (2.447)(66.6) 1  
2
8 8(34525.7)  516.5)
2

= 176

Por lo tanto, para un valor de X de 71
pulgadas el intervalo de confianza de
95% para la predición de peso de 334 lbs
es 334176 libras, es decir, desde 158 a
510 libras.
Intervalo de confianza de 95 % para los valores
estimados de peso de osos grises, a partir de la
medición de largo corporal
600
peso en lbs
400
200
0
-200
34
44
54
64
74
Y predicho
-400
largo en pulgadas
lím inferior
lim superior
Intervalo de predicción para
la pendiente de la recta

b1
 ta / 2
Se
( X )
X  n
2
2
Ejemplo, osos grises




b1  2.447
66.6
(516.5)
34525.7 
8
2
b1= 4.91
El intervalo de confianza de 95% para la
pendiente de esta regresión es 9.66 
4.91.
El intervalo va de 4.91 a 14.41 y no
incluye el cero
Intervalo de confianza de 95%
para la línea de regresión (Systat)
500
PESO
400
300
200
100
0
30
40
50
60
LARGO
70
80
Regresión lineal múltiple

Una ecuación de regresión lineal
múltiple expresa una relación lineal
entre una variable dependiente y
dos o más variables independienes
(X1, X2, ...Xk)
Notación




^
Y= b0+b1X1+b2X2+...bkXk
k= número de variables independientes o
predictoras
b0= valor de Y cuando todas las variables
predictoras son cero (el estimador es b0)
b1, b2..bk= son los valores de los
coeficientes de las variables
independientes (los estimadores son b1,
b2..bk)