Modelo de regresión múltiple

Download Report

Transcript Modelo de regresión múltiple

ECONOMETRIA
MODELO DE REGRESIÓN MÚLTIPLE
Mtro. Horacio Catalán Alonso
Sean X1i, X2i,...,XKi, Yi para i = 1,2...,N que denotan
una muestra de N observaciones para k+1 variables
y se define una ecuación lineal:
(1)
yi  1 x1i  2 x2i  ... k xki  ui
1, 2, ..., k son parámetros fijos y desconocidos que
miden la combinación lineal de las varaibles
ui es el término de error
La teoría de la econometría ha desarrollado
diferentes enfoques sobre la modelación, que
dependen de los supuestos estadísticos del modelo
de regresión múltiple
Supuestos del enfoque clásico
 El enfoque clásico asume que las variables
explicativas (X’s) son fijas, es decir no son
estocásticas, por lo tanto se tiene pleno control sobre
ellas
 Este supuesto se mantiene considerando que las
variables
X’s
son
resultado
de
muestras
independientes. En el caso de datos de sección
cruzada cada observación es independiente por lo
que se pueden tratar como regresores fijos
Supuesto 1. E(ui) = 0, para todo i = 1,...N. El término
aleatorio tiene esperanza igual a cero para todas las
observaciones. Este supuesto implica que en
promedio la relación entre Y y las X’s es
exactamente lineal, aunque las realizaciones
particulares de los ui's pueden ser distintas de cero
Supuesto 2. Var(ui) = σ2; i = 1,...,N. La varianza del
término aleatorio es constante para todas las
observaciones. Esto se conoce como supuesto de
homoscedasticidad
Supuesto 3. Cov(ui,uj) = 0, para todo i≠j. Las
covarianzas del término aleatorio entre dos
observaciones distintas son iguales a cero. Si las
observaciones se encuentran ordenadas a lo largo
del tiempo esto implica que la correlación entre los
términos aleatorios correspondientes a distintos
periodos es nula. En este caso el supuesto se
conoce como de no autocorrelación o no
correlación serial
Supuesto 4. Los vectores formados con las
observaciones de las variables explicativas (X’s) son
no estocásticos y linealmente independientes. Esto
ultimo implica que ningun vector de observaciones de
las variables explicativas puede ser obtenido como
una combinacion lineal de los restantes vectores
Propiedades estadísticas del modelo (enfoque clásico)
E (u t )  0
media cero
Var (u t )  E (u )  
2
t
2
Varianza constante
Cov(u t i u t  j )  0,  i  j
E (Xtut )  0
No existe correlación
entre los términos de
error
Las variables explicativas no estocástica. Es decir no
tiene propiedades estadísticas
Método de
ordinarios
estimación:
mínimos
cuadrados
min u' u   Y  Xβ ' Y  Xβ 

β  X' X X' Y
1
El método de mínimos cuadrados ordinarios garantiza
estimadores insesgados
Pero no garantiza estimadores eficientes depende de la
varianza de los errores
Representación matricial
Y  Xβ  u t
Donde Y representa un vector columna de Nx1 que
contiene a la variable dependiente
Xt es una matriz nxn que incluye a las variables
exógenas
Ut es un vector columna de nx1 que representa al
término de error
 es un vector columna de nx1 que contiene
losparámetros a estimar
yt   1 x1i  ...   k xki  ui
Representación matricial
 y1 
 x11 
 xk1   u1 
         ...         
k
  1 
  
 y N 
 x1N 
 xkN  u N 
Econometría
Modelo de Regresión Múltiple
y  X  u
donde
y  ( y1 , y2 ..., y N )´
Horacio Catalán Alonso
Econometría
 X 11
X   
 X 1N
X 21

X 2N
X K1 


 X KN 

  ( 1 ,  2 ,..., K )´
u  (u1 , u2 ,...,uN )
Horacio Catalán Alonso
TallerEconometría
de Econometría
Regresores no estocásticos
X no son variables aleatorias: Es un matriz de
valores constantes respecto a la distribución de
probabilidad de Y
1)
y  X  u
y es la única variable aleatoria
u captura los elementos no contemplados en el
modelo. (es un error de medida sobre la variable y)
Horacio Catalán Alonso
TallerEconometría
de Econometría
El componente sistemático se reduce a:
2) E ( y)  X
3)
y  E ( y)  u
El componente no sistemático se define como:
4) u  y  E ( y)
5) E (u)  E ( y  E ( y))  0
Spanos (1986)
Horacio Catalán Alonso
TallerEconometría
de Econometría
El método de mínimos cuadrados ordinarios
garantiza (bajo los supuestos 1.i, 1.ii, 1.iii, y 1.iv)
estimadores insesgados y eficientes.
Los estimadores de mínimos cuadrados ordinarios
se define como el valor que minimiza la suma de
errores al cuadrado.
ˆ  min s( )
N
s(  )   u
i 1
2
i
Horacio Catalán Alonso
TallerEconometría
de Econometría
 u1 
u 
2 

6) s (  )  u´u  u1 , u 2 ,...,u N 
  
 
u N 
7) s(  )  ( y  X )´(y  X )
 y´ y  2 y´ X   ´ X ´ X
La expresión 7 define la distancia entre Y y X
8)...y´ y  2 y´X  ´X ´X  || y  X ||
2
Horacio Catalán Alonso
TallerEconometría
de Econometría
La estimación de MCO define
aproximación lineal a y usando X.
la
mejor
Bajo el principio de la distancia se podría definir
un estimador de la mínima distancia (MD).
N
| y
i 1
i
 Xi |
Horacio Catalán Alonso
TallerEconometría
de Econometría
A partir de la función
s(  )  ( y  X )´(y  X )
Se obtiene la derivada con respecto a 
Horacio Catalán Alonso
TallerEconometría
de Econometría
Nota: sea
g ( x)  f ( x)h( x)
dg(x)
 f ´(x) h( x)  h´(x) f ( x)
dx
ds(  )
 2 X ´ y  2 X ´ X  0
d
Horacio Catalán Alonso
TallerEconometría
de Econometría
X´X  X´y
ˆ  ( X ´X )1 X ´y
d 2 s(  )
 2 X ´X
2
d
Dado que ran(x) = K , la matriz X´X es definida
positiva
Horacio Catalán Alonso
TallerEconometría
de Econometría
Estimador
ˆ  ( X ´X )1 X ´ y
El valor estimado de y
ˆ  Xˆ

Los errores estimados
uˆ  y  Xˆ
y  Xˆ  uˆ
Horacio Catalán Alonso
TallerEconometría
de Econometría
Del estimador
ˆ  ( X ´X )1 X ´ y
X ´ y  X ´Xˆ  0
X ´(y  Xˆ )  0
X ´uˆ  0
El estimador de MCO permite que las variables X
sean ortogonales a los errores
Horacio Catalán Alonso
TallerEconometría
de Econometría
1
ˆ
1)   ( X ´X ) X ´ y
Del estimador de MCO se obtiene que al multiplicar
por X
2)
1
ˆ
X  X ( X ´X ) X ´ y
Se define la matriz
1
P  X ( X ´X ) X ´
Horacio Catalán Alonso
Econometría
3)
Xˆ  PY
4)
5)
uˆ  y  Xˆ
uˆ  ( I  P ) y
6)
7)
uˆ  I  X ( X ´ X ) 1 X ´ y
uˆ  MY


Horacio Catalán Alonso
Econometría
Dado que X es fijo (X´X)-1X´ es interpretada como
una función lineal que mapea (proyecta) cualquier
vector N-dimensional del espacio (Y) en un vector
en K-dimensional espacio ()
1
( X ´X ) X ´:  
N
K
La matriz P  X ( X ´X ) 1 X ´
matriz de proyección
se define como la
Horacio Catalán Alonso
TallerEconometría
de Econometría
s(y)
y
u=MY
s(x)
X=PY
Horacio Catalán Alonso
Econometría
1) P  X ( X ´ X ) 1 X ´
1
2) M  I  X ( X ´ X ) X ´
3) Xˆ  PY
4) uˆ  MY
Las matrices de proyección definen al modelo de
regresión lineal múltiple como:
5) Y  PY  MY  Xˆ  uˆ
Horacio Catalán Alonso
TallerEconometría
de Econometría
Ambas matrices descomponen al vector Y de
dimensión N, en 2 componentes ortogonales. La
partición en un espacio de dimensión K definido
por P y en un espacio de N-K dimensión definido
por M
Horacio Catalán Alonso
Econometría
Ajuste del modelo de Regresión.
El modelo general
1) Y  Xˆ  uˆ
Se define
2) Y ´Y  ( Xˆ  uˆ )´(Xˆ  uˆ )
3) Y ´Y  ( ˆ´ X ´uˆ´)(Xˆ  uˆ )
Y ´Y  ˆ´ X ´ Xˆ  uˆ´ Xˆ  uˆ´uˆ
Horacio Catalán Alonso
Econometría
Bajo el supuesto
uˆ´ X  0
4) Y´Y  ˆ´X ´Xˆ  uˆ´uˆ
Horacio Catalán Alonso
Econometría
4)
Y´Y  ˆ´X ´Xˆ  uˆ´uˆ
Suma total
de
cuadrados
Suma de
regresores
al cuadrado
Suma de
errores al
cuadrado
Horacio Catalán Alonso
Econometría
Suma de regresores al cuadrado
coeficient e de determinac ión 
Suma total de cuadrados
2
ˆ
ˆ

´
X
´
X

||
PY
||
2
5) R 2 


cos
( )
2
Y ´Y
|| Y ||
De (4)
5)
uˆ´uˆ
R  1
Y ´Y
2
 es el ángulo entre Y y el espacio generado por X
Horacio Catalán Alonso
ECONOMETRIA
MODELO DE REGRESIÓN MÚLTIPLE
Mtro. Horacio Catalán Alonso