Multicolinealidad perfecta

Download Report

Transcript Multicolinealidad perfecta

PROBLEMAS
ECONOMETRICOS
MULTICOLINEALIDAD: Existe una estrecha relación
entre las variables exógenas incluidas en el
modelo.
Violación del supuestos de Rango Completo de la Matriz de X’s
ˆ  ( X `X )
1
X `Y
La Mutlicolinealidad es esencialmente un fenómeno muestral …..
No tiene solución estadística.
TIPOS DE MULTICOLINEALIDAD
Y
Y
Y
X3
X2
Baja
No existe
Moderada
Y
X
3
Alta
X3
X2
Y
Y
X2
X3
X2
X2
X3
X2 X3
Muy alta
Perfecta
Multicolinealidad Perfecta:
Aparece cuando existe una
relación lineal perfecta
entre
las
variables
explicativas.
Y
X2 X3
Y
Multicolinealidad perfecta
X2 X3
Yi   0   1 X 1 i   2 X 2 i   i
X 1i  3 X 2 i
Yi   0   1 3 X 2 i   2 X 2 i   i
Yi   0  ( 3  1   2 ) X 2 i   i
Yi   0   X 2 i   i



Hay que recordar que los coeficientes ß miden los
efectos de la variable cuando ésta cambia y los otros
términos
quedan
constantes.
Cuando
hay
multicolinealidad perfecta, el otro término no puede
permanecer constante. De ahí la imposibilidad de
calcular ß
En este caso la estimación no puede ser llevada a
cabo, ya que los efectos individuales de las variables
no se pueden separar.
los Estimadores MCO siguen siendo estimadores
MELI a pesar de la presencia del problema de
Multicolinealidad
Y
X2
X
3
En este caso la estimación se puede
llevar a cabo, ya que los efectos
individuales de las variables
se
pueden separar. En estos casos es
conveniente utilizar las variables
estandarizadas para obtener mejores
estimadores.
¿Por qué ocurre la multicolinealidad?
•La escasa variabilidad a lo largo de la muestra de alguna de las
variables explicativas
•El método de recolección de información empleado
•Restricciones sobre el modelo o en la población que es objeto de
muestreo
• Mala Especificación del modelo
• Uso de un modelo sobredeterminado
1) Estimadores MELI con varianzas, errores estándar
covarianzas muy grandes
infinito
var
5.26
1.33
r
0.5
0.8 1.00
y
2) Intervalos de confianzas grandes
a) Incrementa la probabilidad de cometer el ERROR TIPO
II “ACEPTAR UNA HIPOTESIS NULA SIENDO FALSA”
b) Pruebas “t” no significativas
3) Parámetros sensibles a los cambios
Tabla 2
Tabla 1
Y
X2
X3
1
2
4
2
0
2
3
4
12
4
6
0
5
8
16
Y
Yi = 1.1939 + 0.4463X2i + 0.0030X3i
t = (1.5431) (2.4151) (0.0358)
R= 0.8101
r23= 0.5523
cov= -0.00868
X2
X3
1
2
4
2
0
2
3
4
0
4
6
12
5
8
16
Yi= 1.2108 + 0.4014X2i + 0.0270X3i
t = (1.6187) (1.4752) (0.2158)
R= 0.8143 r23= 0.8285
cov= -0.0282
NOTA
En todos o en la mayoría de los modelos económicos, las
variables exógenas presentan cierto grado de relación lineal
entre ellas. De no se así siempre se podrían estimar modelos
simples, por que cuando entre dos variables no hay relación
introducirlas juntas o separadas es lo mismo.
1. DIAGNOSTICO PRELIMINAR
2. COEFICIENTES DE CORRELACION ALTOS
3. CORRELACIONES PARCIALES
4. REGRESIONES AUXILIARES
5. MAPA DE BUNCH
6. VALOR DEL DETERMINANTE (X´X)
7. FACTOR DE INFLACION DE LA VARIANZA
8 .INDICE DE CONDICIÓN- NUMERO DE CONDICIÓN
1. DIAGNOSTICO PRELIMINAR
Coeficientes de determinación altos, F significativos y t
insignificantes, errores estándar altos
2. COEFICIENTES DE CORRELACION ALTOS
Coeficientes de correlación mayores a 80 indicador de Multicolinealidad severa. Matriz
de correlación.
3. CORRELACIONES PARCIALES
Consiste en realizar regresiones parciales de la variable dependiente con cada una de
las variables exógenas y analizar el valor del coeficiente de determinación.
4. REGRESIONES AUXILIARES
Consiste en realizar regresiones parciales entre las variables exógenas y analizar los
coeficientes de determinación y las F (Ho: Xi es colineal con el resto de las variables
exógenas)
5. MAPA DE BUNCH
Realizar regresiones agregando las variables independientes una a una. Cambios la
significancia estadística, en los signos y valores de los parámetros, en el coeficiente de
determinación.
6. VALOR DEL DETERMINANTE (X´X)
Valor del determinante (X´X) igual o cercano a cero. Mientras mas cercano este a
cero el problema es mas grave. NOTA: Deben estandarizarse y centralizarse las
variables exógenas.
7. FACTOR DE INFLACION DE LA VARIANZA
FIV 
FIV mayor a 10: alta colinealidad
1
(1  r
2
t
)
FIV mayor a 5: Multicolienalidad severa
FIV mayor a 1: Multicolinelidad moderada
8 .INDICE DE CONDICIÓN- NUMERO DE CONDICIÓN
Estos criterios se derivan de los valores propios de la matriz X`X.
K= Auto valor son las raíces características de un polinomio
que hace estable al sistema
K=
máximo valor propio
mínimo valor propio
Si k esta ente 100 y 1000 hay multicolinealidad moderada
Si k es mayor a 1000 hay multicolinealidad severa
IC 
máximo

k
mínimo
IC= El índice de condición
mide la sensibilidad de los
estimadores ante pequeños
cambios en los datos
Si IC estas entre 10 y 30 hay
multicolinealidad moderada.
Si IC es mayor a 30 hay
Multicolinealidad severa
1. INFORMACION A PRIORI
2. COMBINACIÓN DE INFORMACION
3.ELIMINACION DE VARIABLES
4. TRANSFORMACIÓN DE VARIABLES
5. MODELO EN PRIMERA DIFERENCIA
6. DATOS NUEVOS – DATOS ADICIONALES
1. INFORMACION A PRIORI
Yi   1   2 X 2i   3 X 3i   i
 3  0 . 10  2
Y i   1   2 X 2 i  0 . 10  2 X 3 i   i
2. COMBINACIÓN DE INFORMACION
Combinación de información de corte transversal y de series de tiempo
3.ELIMINACION DE VARIABLES
Eliminación de una(s) variable (s) exógena, pero evitando el sesgo de especificación
4. TRANSFORMACIÓN DE VARIABLES
Yt   1   2 ln X 2 t   3 ln X 3 t   t
5. MODELO EN PRIMERA DIFERENCIA
Yt   1   2 X 2t   3 X 3t   t
Y t 1   1   2 X 2 ,t 1   3 X 3 ,t  1   t  1
Y t  Y t  1   2  X 2 t  X 2 ,t 1    3  X 3 t  X 3 ,t  1    t
6. DATOS NUEVOS – DATOS ADICIONALES
Consumo de
Café
T
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Q
10
11
12
10
10
12
17
10
11
21
10
12
11
11
16
15
17
18
19
20
Ingreso
Precio del
Café
Y
120000
125000
132000
141000
142000
143000
144000
150000
165000
170000
172000
175000
180000
181000
180000
182000
183000
185000
190000
190000
PC
95
100
102
101
101
102
99
121
120
117
140
130
117
118
99
101
100
99
98
97
Precio de la
Leche
PL
86
89
89
88
88
89
87
98
98
97
107
106
97
98
87
88
88
88
87
86
Es imposible separar el efecto separado del precio del
café y de la leche sobre la cantidad consumida de café.
Los errores estándar de los coeficientes son muy
grandes, que nos pueden llevar a aceptar hipótesis
nulas falsas o rechazar otras que son ciertas.