Presentación de PowerPoint - Por una Asociación Proactiva e

Download Report

Transcript Presentación de PowerPoint - Por una Asociación Proactiva e

El uso de VARCCE en el estudio de los
determinantes de flujos internacionales de capital
e inversión extranjera de cartera. El caso de
México
Seminario CONAC-ITAM
Alejandro Islas
Departamento de Estadística-ITAM
Vectores Autorregresivos
La forma estructural y la forma reducida
“Contrario a los modelos que sólo capturan relaciones de
asociación estadística, un modelo estructural representa relaciones
de causalidad. Una ecuación estructural puede obtenerse de un
modelo económico, o ésta puede obtenerse de un razonamiento
informal. Algunas veces el modelo estructural se puede estimar
directamente. En otras ocasiones debemos combinar supuestos
adicionales acerca de otras variables con manipulaciones
algebraicas para obtener un modelo estimable.”
Goldberger, A. S (1972), Structural Equation Methods in the Social
Sciences, Econometrica 40, 979-1001
y1t  b10  b12 y 2 t   11 y1t 1   12 y 2 t 1  
y 2 t  b 20  b 21 y1t   21 y1t 1   22 y 2 t 1  
1t
2t
(1)
(2)
Las ecuaciones (1) y (2) constituyen un VAR de primer orden,
pues sólo hay un rezago. Nótese que existen variables
endógenas contemporáneas que se encuentran a la derecha del
signo igual. Por tanto, a fin de establecer el sistema como una
forma reducida es necesario eliminar el efecto contemporáneo de
y1t sobre y2t y viceversa. Para ello se puede utilizar el álgebra
matricial:
 b 12   y 1t   b 10 
1

     
1   y 2 t   b 20 
  b 12
  11

  21
 12   y 1t 1 



 22   y 2 t 1   


y2t 
y1 t
Otra forma de plantear el sistema anterior sería:
B y t   0   1 y t 1  
t
(3)
donde:
 1
B
  b 21
 b12 
,
1 
 y1t 
yt  
 , 0
 y 2t 
 b10 
  11  12 
   , 1  
,

 b 20 
  21  22 
  y 1t 
t   
 y 2 t 
La multiplicación por
en la forma reducida:
B  1 nos
permite obtener el vector autorregresivo
Y t   0   1 Y t 1  e t
donde

0
 B 1  0
(5)
1

 1 B 1
(6)
1

et
B t
(7)
(4)
y1t   10   11 y1t 1   12 y 2 t  2  e1t
(8)
y 2 t   20   21 y1t 1   22 y 2 t  2  e 2 t
(9)
A fin de distinguir entre el sistema representado por las
ecuaciones (1) y (2) y el sistema representado por (8) y 9); se
puede denominar al primero como VAR estructural y al segundo
como VAR en forma reducida.
VAR(p)
y t   0   1 y t 1   2 y t  2  ...   p y t  p  e t
Estimación
El método de estimación de los parámetros involucrados en el
vector autorregresivo es el de Máxima Verosimilitud.
Supongamos que contamos con (T+k) observaciones de cada
una de las n-variables. Al igual que en el caso univariado, la
idea es condicionar en la k primeras observaciones (X-k+1,Xk+2,…,X0)
y lograr la estimación con las últimas T
observaciones (X1,X2,…,XT). El objetivo es formar la función
de verosimilitud condicional
f
X T , X T 1 ,..., X 1| X 0 , X
1 ,...,
X
 k 1
( X T , X T 1 ,..., X 1 | X 0 , X
y maximizar con respecto a Θ , donde
  { 0 ,  1 ,...,  p ,  }
1
,..., X
 k 1
;)
Tamaño del rezago
Además de la inclusión de las variables apropiadas, en un
VAR se debe elegir la determinación del tamaño del rezago en
cada ecuación. En tal determinación la precisión es
importante. Por un lado un tamaño excesivo de los rezagos
puede llevar a un desperdicio de grados de libertad. Por otro,
si el citado tamaño es muy pequeño se puede cometer un
problema de especificación que traería como consecuencia la
autocorrelación de los residuales dentro de cada ecuación.
Por tal motivo se deben elaborar pruebas para determinar el
tamaño óptimo de los rezagos.
H 0 : k  k0
H 1 : k1  k 0
T
Sea
ˆ 0 


e t ( k 0 ) [ e t ( k 0 )]
t 1
'
,
T
Entonces
ˆ ', 
ˆ 0)  
l 0 (
Tn
ln( 2  ) 
T
2
2
ln | 
1
0
| 
Tn
2
Ahora bajo la alternativa tenemos que
ˆ ', 
ˆ 1)  
l1 (
Tn
2
ln( 2  ) 
T
2
ln |  11 | 
Tn
2
Por lo tanto
T
T
1
1 
ˆ
ˆ
2 (l1 (  ' , 
ˆ 1)  l 0 (  ' , 
ˆ 0 ))  2  ln |  1 |  ln |  0 | 
2
2

 1 
 1 

  T ln 
 T ln 
ˆ 1|
ˆ 0 |
|
|
  T ln | 
ˆ 1 |  T ln | 
ˆ0|
 T ln | 
ˆ 0 |  ln | 
ˆ 1 | ~  n 2 ( k 1  k 0 )
2
Sims (1980)
( T  c ) ln 
ˆ 0  ln 
ˆ 1 ~ 
donde
c  1  n k1
2
n
2
( k1 k 0 )
AIC  (T ) log   2 ( N )
SBC  (T ) log   ( N ) log (T )
donde: Σ es el determinante de la matriz varianza covarianza de los
residuales
N = número total de parámetros estimados en todas las ecuaciones.
En relación al número total de parámetros se puede señalar que N =
n2k + n. Este total correspondería a un sistema simétrico donde el
número de variables endógenas (n) es igual al número de regresores
y donde cada ecuación tiene un intercepto. El criterio de selección es
elegir el número de rezagos que sea consistente con el menor AIC o
SBC.
Función de Respuesta al Impulso
La función de impulso respuesta es un artificio que ayuda a
comprender las propiedades dinámicas del VAR. La pregunta de
interés es sencilla y directa:
¿Cómo afecta una innovación unitaria a una serie, ahora y después?
Ejemplo:




y t1   10   11  12   y 1t 1  e1t 
   






y t 2   20   21  22   y 2 t 1  e 2 t 
tenemos




y t1   y 1    11
    

y t 2   y 2  k  0  21
 12 

 22 
k



e1t  k 
e 2 t  k 
Esta ecuación expresa a y1t y y2t en términos de e1t y e2t. La idea es
que queden expresadas en términos de 1t y 2t
de (7) tenemos
et  B



1
εt


1
1
e1t   

  1t

b
12





e 2 t   (1  b12 b 21)    b 21 1   2 t



entonces





y t1   y 1  
   11
1

   

y t 2   y 2   (1  b b )  k 0  21
12 21 

ahora, sea
por lo tanto,


k  





21  
 12 

 22 
 b12
(1  b12 b )  b 21 1
k
1
1
k
1
- b 12

  b 21 1






  1t  k

  2 t  k







y t1   y 1    11 (k)
    

y t 2   y 2  k  0  21 (k)
 12 (k) 


(
k
)
22


 1t  k

 2 t  k



de manera más compacta

yt      k  tk
(10)
k 0
NOTA: ij(0) multiplicadores de impacto o de corto plazo.
Por ejemplo,el coeficiente 12(0) es el impacto instantáneo de un
cambio unitario en 2t sobre y1t . De la misma manera, los coeficientes
11(1) y 12(1) representan la respuesta un periodo después ante un
cambio unitario en 1t-1 y 2t-1 sobre y1t respectivamente
Entonces, después de n periodos, la suma acumulada de los efectos
de 2t sobre y1t esta dada por:
n

ij
(k )
k 0
Permitiendo que n tienda a infinito se obtienen los multiplicadores
de largo plazo.
Bajo el supuesto que y1t y y2t son estacionarias, se tiene que cumplir
que para todo i y j


2
ij
(k )  
k 0
Los cuatro coeficientes 11(k), 12(k), 21(k) y 22(k) se llaman
funciones de respuesta al impulso.
Si b21 = 0 (descomponsición de Choleski)
e1t   1t  b12  2 t
e2t   2t
Descomposición de la Varianza
Otra forma de caracterizar la dinámica asociada con los vectores
autorregresivos, muy relacionada con la función de impulso
respuesta, es la descomposición de la varianza. Este método tiene un
vínculo inmediato con los pronósticos; permite contestar a “¿cuánto
de la varianza del error de pronóstico a n etapas de la variable yi se
explica con innovaciones a la variable yj, para n =1, 2,3, ...?
Sí a partir de (10) realizamos el pronóstico condicional de yt+1, el
error de pronóstico seria igual a:

y t 1      k  t 1 k
entonces
k 0

E t ( y t  1)      k  t  1  k
k 1
por lo tanto
y t  1  E t ( y t  1)   0  t  1
de manera general:

ytn      k  tnk
k 0
entonces

E t ( y tn)      k  tnk
k n
por lo tanto
n 1
y tn  E t ( y tn) 

k 0
k
 tnk
Retomando el ejemplo del VAR(1) con dos variables y
concentrándonos en el error de pronóstico a n etapas de la variable
y1t, tenemos:
y 1t  n  E t ( y 1t  n )   11 ( 0 )  1t  n   11 (1)  1t  n 1  ...   11 ( n  1)  1t 1
  12 ( 0 )  2 t  n   12 (1)  2 t  n 1  ...   12 ( n  1)  2 t 1
por lo tanto, la varianza del error de pronóstico de y1t a n etapas es:

2
y1t
(n)  
2

2
y1t
y2t


2
11
2
12
( 0 )   11 (1)  ...   11 ( n  1)
2
2

( 0 )   12 (1)  ...   12 ( n  1)
2
2

Obsérvese que es posible descomponer la varianza del error de
pronóstico a n etapas en dos componentes, una por cada una de las
innovaciones

2
y1t

( 0 )   11 (1)  ...   11 ( n  1)
11
2
2


2
y2t

2
2
y1t

2

2
2
y1t
innovaciones en 1t
(n)
( 0 )   12 (1)  ...   12 ( n  1)
12
2
proporción debido a
(n)

proporción debido a
innovaciones en 2t
Si los “choques” a 2t no explican la varianza del error de pronóstico
de y1t en todo el horizonte del pronóstico, podríamos concluir que la
variable y1t es exógeno. En tales circunstancias, la variable y1t
evolucionara de manera independiente a los “choques “ de 2t en y2t.
En el otro extremo, pudiera darse el caso en el que los “choques”
de 2t explicaran toda la varianza del error del pronóstico de y1t en
todo el horizonte del pronóstico, en tal caso, diríamos que y1t es
enteramente endógena.
Estacionariedad y Cointegración
La teoría económica sugiere relaciones de equilibrio que son
funciones estacionarias de las variables originales. Es decir, los
desequilibrios son transitorios y, por tanto, estacionarios.
Además, la teoría económica postula comportamientos no
estacionarios para distintas variables, tales como, los precios de
activos, los tipos de interés, etc.
Todo ello, junto con la posibilidad de la aparición de relaciones
espurias al regresar dos o más variables integradas que son
independientes una de la otra, condujo a la práctica habitual de
transformar las variables en estacionarias siguiendo la estrategia
propuesta por Box-Jenkins
Definición de cointegración:
Las componentes de un vector Yt(nx1) se dice que están cointegradas
de órdenes d y b, y se denota por Yt~CI(d,b), si:
a) Todas las componentes de Yt son integrables del mismo orden d,
I(d)
b) Existe un vector , no nulo, talque ’Yt = zt~I(d-b), con b>0. Al
vector  se le denomina vector de cointegración.
El caso más comúnmente considerado es aquel en que d=b=1, es
decir, que todos los elementos de Yt sean I(1) y zt sea I(0),
estacionario.
En el caso de que  exista no será único. Basta multiplicar el vector
por un escalar diferente de cero para obtener un nuevo vector de
cointegración. No obstante, el número de vectores de cointegración
linealmente independientes que puede haber entre n variables
integradas del mismo orden es n-1.
Como se ha visto, los choques aleatorios tienen un efecto
permanente sobre las variables integradas. Pues bien, el que exista
una relación de cointegración entre un conjunto de variables
significa que las perturbaciones tienen un efecto temporal sobre
dicha relación, ’Yt, mientras que tienen un efecto permanente
sobre las variables individuales.
Mecanismos de Corrección del Error y el Teorema de
representación de Granger
Un modelo de Mecanismo de Corrección de Errores (MCE)
combina variables en niveles y en primeras diferencias. Las
relaciones establecidas entre las variables en niveles (relaciones de
largo plazo) actúan como un servomecanismo que interviene en la
relación entre las variables diferenciadas (cambios de las variables)
para retomar la relación a su nivel de equilibrio a largo plazo.
De manera formal, un vector Yt(nx1) admite una representación
MCE si se puede expresar de la siguiente manera:
 ( L )  y t    y t 1  e t
Donde es un vector de perturvaciones estacionarias; (L) es una
matriz de (nxn) polinómica en el operador de retrasos que satisface:
(0)=In y que (1) tiene todos los elementos finitos, finalmente
0
La relación formal entre este tipo de modelo y la relación de
cointegración la establece el Teorema de Reprecentación de
Granger
• Si un vector Yt(nx1) es C(1,1), existe un MCE válido para
representar el proceso generador de los datos.
•Si el proceso generador de los datos de un conjunto de variables
admite una representacón de MCE, éstas están cointegradas.
Procedimiento máximo verosímil de Johansen
El procedimiento máximo verosímil de Johansen tiene una serie de
ventajas frente al procedimiento de Engle y Granger, como son el
contrastar simultáneamente el orden de integración de la variables y
la presencia de relaciones de cointegración entre ellas; estimar
todos los vectores de cointegración, sin imponer a priori que
únicamente hay uno; y no verse afectado por la endogeneidad de
las variables implicadas en la relación de cointergración.
p 1
 yt   0 

i
 y t  i   y t 1  
t
(11)
i 1
La matriz , de orden (nxn), contiene la información sobre la
relación a largo plazo entre las variables, llamándose también
matriz de impactos. La expresión (11) es la de un MCE en forma
matricial.
Debe notarse que para que la expresión (11) esté equilibrada es
necesario que  y t-1 sea I(0), lo que implica que la matriz  recoge
las relaciones de cointegración.
Dado el rango de , rango() = r
Contrastes para determinar el rango de 
El número de vectores de cointegración puede ser obtenido a partir
de verificar la significancia de las raíces características de  .
Recuerde que el rango de una matriz es igual al número de sus raíces
características diferentes de cero. Suponga que se conoce la matriz
 y que se ordenan sus n raíces características de la siguiente manera
1> 2>... >n. Si las variables de vector yt no están cointegradas, el
rango de  es cero y todas sus raíces características serían iguales a
cero.
 0 ( r ) :   '
 0 ( r ) : hay como máximo r vectores de cointegrac ión
 a ( n ) : hay n vectores de cointegrac ión
n


 traza ( r )  T  ln 1  ˆ i 
i  r 1
donde ˆ i
Es el valor estimado de la raíz característica obtenido
de la matriz estimada 
T es el número de observaciones
Un estadístico alternativo para contratar
 0 ( r ) : el número de vectores de cointegrac ión es r
 a ( r  1) : el número de vectores de cointegrac ión es r  1
es:
 max ( r , r  1)  T ln 1  ˆ r 1 


Los valores críticos de ambos estadísticos se encuentran en
Johansen (1988). Debe señalarse que la distribución de los
estadísticos depende del número de relaciones de cointegración,
por lo que los valores críticos varían en función del número de
éstas.
Pozos Márquez, J.M., Islas-Camargo A., Venegas F. “Corrientes internacionales
de capital e inversión extranjera de cartera. El caso de México, 1989-1999” El
trimestre Económico. Octubre-Diciembre de 2003, Vol. LXX(4). No. 280, 791,
833.
La inversión extranjera de cartera se define como toda inversión que se realiza en
títulos gubernamentales (Mercado de dinero) y en acciones (Mercado de capital),
particularmente de corto plazo
Con el propósito de explicar el comportamiento de la IEC en México, se
consideran tanto factores externos como internos, los cuales se incorporarán al
VARCCE. Entre los factores de carácter externo, se consideran las tasas de interés
de corto y largo plazo de los Estados Unidos, así como la rentabilidad del índice
accionario Dow Jones (RDJ). Mientras que los factores de carácter interno están
dados por las tasas de interés de corto y mediano plazo de México, la rentabilidad
en dólares del mercado accionario mexicano (RBMV), así como un indicador de
riesgo país (RP).
La inversión de cartera en México tiene dos vertientes principales:
• El mercado de dinero y el mercado de capitales.
• El comportamiento del primero se explica por la tasa de interés
• y el del segundo por el rendimiento de un índice accionario.
Ambos mercados están altamente influenciados por los diferenciales de tasas de
interés y de rentabilidad bursátil. Por lo que respecta a las tasas de interés de
corto plazo, en ambos casos, se consideran:
a) la tasa de interés del papel comercial a 1 mes; b) la tasa de interés de las
aceptaciones bancarias a 3 meses; y c) las tasas de interés de los T-bills y Cetes
a 3 meses.
En cuanto a las tasas de interés de mediano y largo plazo, en el caso de México
--por no existir una tasa de mayor plazo para todo el periodo analizado-- se
considera la tasa de interés de los certificados de depósito a plazo fijo, 9 meses,
mientras que en el caso de los Estados Unidos se utiliza la tasa de interés de
largo plazo de los bonos del Departamento del Tesoro, 30 años.
Rentabilidad de los índices accionarios IPC y Dow Jones.
En lo que sigue, la variable RBMV representa la rentabilidad, en términos de
dólares, del mercado mexicano de capitales expresada como variación
porcentual mensual. Asimismo, nos referiremos a la rentabililidad del índice
Dow Jones, RDJ, como la rentabilidad bursátil de los Estados Unidos,
también calculado como variación porcentual mensual.
Indicador de riesgo país para México:
El indicador riesgo país que se utilizará aquí es la diferencia entre el
rendimiento de los Cetes, en términos de dólares, y los T-bills a tres meses
(Leiderman y Thorne, 1996, y Venegas-Martínez, 2000). Desde el inicio del
periodo, este indicador sigue una tendencia descendente hasta finales del año
1994. Este comportamiento muestra que durante dicho periodo su
disminución corresponde al proceso de estabilización económica que vivió el
país. No obstante, con el estallido de la crisis, el riesgo país se disparó
bruscamente y aunque de 1996 a 1998 éste tendió a disminuir, al final del
periodo registró nuevamente un repunte. Un alto nivel de riesgo país refleja
un alto premio al riesgo.
Pruebas Dickey-Fuller de Raíz Unitaria
Variables
CPE
CPM
IEC
RBMV
RDJ
RP
Estadístico ( ) Estadístico ( ) Parámetros en la
regresión
-1.92351 (12)
Sin tendencia, sin
constante
-2.69854 (12)
Sin tendencia, sin
constante
-1.93967 (12)
Sin tendencia, sin
constante
2.51233 (12)
Sin tendencia, con
constante
1.97053 (6)
Sin tendencia, con
constante
-1.93187 (6)
Sin tendencia, con
constante
Prueba de cointegración de Johansen
 T  n (1  λ )
Valores propios H 0 : rango  p
0.461
r = 0*
207.06
r  1 *
0.344
129.20
r  2 *
0.313
76.01
r  3
0.137
28.64
r  4
0.053
9.99
r  5
0.024
3.09
*Rechazo de H0 al 1% de significancia
j
j
λ
traza
( 0 . 90 )
111.37
83.93
60.42
40.83
24.73
12.73
Vectores de cointegración estimados y sus coeficientes de ajuste
Vectores de cointegración normalizados (β)
IEC
CPE
CPM
RBMV
RDJ
1.000
-0.912
1.906
2.182
-1.439
0.204
-0.481
0.621
1.000
-1.757
-0.212
1.228
-12.111
2.741
3.803
Coeficientes de ajuste (α)
-0.275
-0.019
-0.182
0.027
0.008
(-4.223) (-0.944) (-0.530) (3.370) (2.581)
-1.013
-0.010
0.174
-0.104
0.011
(-5.277) (-0.164) (2.127) (-4.402) (1.233)
-0.025
0.000
0.013
-0.009
0.000
(-0.639) (-0.020) (0.804) (-1.957) (-0.245)
Estadística t en paréntesis
H 0 :
2 j
 0 , para j  1,2,3.
CP E es débilmente
exógena
 ( 3 )  0.85 valor - p  0.84
2
RP
-0.033
-0.067
1.000
-2.152
(-6.760)
2.125
(2.266)
-0.393
(-2.087)
Matriz de efectos contemporáneos
1

0

 b 31

 b 41
 b 51

0
0
0
1
0
0
b 32
1
0
b 42
b 43
1
b 52
b 53
b 54
0

0

0

0
1 
 e 1CPM
t
 RP
e2t
 e RBMV
3t

RDJ
e4t
 IEC
e5t

 ε 1CPM

t

 RP 

ε 2t 
 =  RBMV 
ε 3t



RDJ

ε 4t 

 IEC 

 ε 5t 
Descomposición de la varianza de la IEC en México.
Mese
s
1
2
3
4
5
6
7
8
9
10
11
12
CPM
4.848
7.008
8.032
8.524
8.513
8.657
8.658
8.674
8.674
8.677
8.677
8.678
RP
2.056
13.143
14.376
14.241
14.152
14.367
14.372
14.377
14.377
14.380
14.380
14.381
RBMV
86.628
65.913
64.410
63.833
63.886
63.551
63.533
63.509
63.510
63.502
63.502
63.502
RDJ
0.969
9.750
9.178
9.261
9.205
9.203
9.214
9.209
9.209
9.209
9.209
9.209
IEC
5.499
4.186
4.004
4.141
4.243
4.222
4.223
4.229
4.231
4.231
4.231
4.232
Función de Impulso-Respuesta de la IEC
0
.
4
0
.
2
-
0
.
0
-
0
.
2
-
0
.
4
-
0
.
6
-
0
.
8
-
1
.
0
0
2
4
6
8
1
0
1
2
1
4
1
6
1
8
2
0
2
2