Econometría (ICI-383) - Departamento de Informática

Download Report

Transcript Econometría (ICI-383) - Departamento de Informática

Econometría
Profesor : Héctor Allende O.
Departamento de Informática
Universidad Técnica Federico Santa María
Estructura del Curso
1.- Introducción.
2.- Modelos de Regresión Múltiple
3.- Construcción de Modelos de Regresión
4.- Verificación de Supuestos: Linealidad,
Normalidad, Homocedasticidad, Independencia
5.- Contraste de Hipótesis y Estimación.
6.- Modelos Estadísticos de Series de Tiempo:
Suavizamiento Exponencial, ARIMA,
7.- ANN: modelos de Regresión libre, Series de
Tiempo
8. Aplicaciones
DATOS
MODELOS
HECHOS
TEORÍAS
FENÓMENOS
INTUICIONES
Problema real
Planteamiento del problema
Objetos y medios
Modelos Estadísticos
(Cálculo de probabilidades)
Recolección de información muestral
(Técnicas de muestreo ; diseño de experimentos)
Depuración de los datos
(Análisis de datos)
Estimación de los parámetros
(Teoría de la estimación)
Contrastes de Simplificación
(Contrastes de hipótesis)
Crítica y Diagnosis del Modelo
(Análisis de datos)
Nuevo Conocimiento
Previsiones
Decisiones
Dos ejemplos de modelos cuantitativos
PREGUNTA
Cómo diseñar un equipo de
mantenimiento
Cómo aumentar el
rendimiento de un proceso
MODELO
Variables:
- Número de averías (x1)
- Tiempo reparación (x2)
Hipótesis: las averías
•Se producen
independientemente
•La probabilidad de no avería
disminuye exponencialmente
con el tiempo
Hipótesis:tiempo reparación
•Depende de muchos
pequeños factores
Variables:
- Rendimiento en % (y)
- Temperatura x1
- Concentración x2
Hipótesis:
•El rendimiento aumenta en
promedio linealmente con la
temperatura y la
concentración
•Para valores fijos de x1 y x2
el rendimiento varía
aleatoriamente alrededor de
su valor medio
RECOLECCIÓN
DE
INFORMACIÓN
Muestreo de máquinas para
estudiar sus averías y tiempo
de reparación
Diseño de un experimento
que se varíen x1 y x2 y se
mida y
ESTIMACIÓN
PARÁMETROS
Estimar:
•  , tasa media de averías
•  , tiempo medio de
reparación
•  , variabilidad en el
tiempo de reparación
Estimar:
• El efecto de la temperatura
(b) y el de la concentración
(c) sobre el rendimiento
•Variabilidad experimental
CONTRASTES
DE SIMPLIFICACIÓN
¿Tienen todos los tipos de
máquinas el mismo  ?
¿Los tipos de averías, el
mismo  y  ?
¿Es el efecto de la
temperatura y concentración
idéntico (b=c ) ?
CRÍTICA DEL
MODELO
¿Es cierta la independencia
entre las averías?
¿Son la variabilidad de x1 y
x2 en la muestra consistentes
con las hipótesis ?
¿Es la relación entre y
(x1 , x2) lineal?
¿Es la variabilidad de y para
x1, x2 fijos, independ. de los
valores concretos de x1, x2 ?
¿ Qué es la Econometría ?
 Disciplina que se ocupa del análisis cuantitativo de
fenómenos económicos:Teoría Económica, Economía
Matemática y el Modelado Estadístico de datos
Modelo Keynesiano del Consumo
Modelo de Klein
Modelo de Cuentas Nacionales
Modelo de producción Cobb-Douglas
Rol de la econometría : Proporcionar métodos
para estudiar y medir las relaciones de las variables
económicas (teoría v/s la realidad)
Aplicaciones de los modelos
Econométricos
 Ciencias de la Ingeniería
 Ciencias Económicas
Ciencias Naturales
Ciencias Médicas
 Ciencias políticas y sociales
Modelo Keynesiano de Consumo
t
0
1 t
t
C    Y U
Yt  Ct  I t
donde:
Ct 
Yt 
It 
Ut 
(Fu Consumo)
(Fu Ingreso)
Gasto de Consumo
Ingresos
Gasto de Inversión (Ahorro)
Perturbación Aleatoria
Modelo de Klein (I)
Fu Consumo
Ct  0  1Pt   2 Wt  Wt  3 Pt 1  1t
Fu Inversión
I t   4  5 Pt  6 Pt 1  7 Kt 1   2t
Demanda Trabajo
Wt  8  9 Yt  Tt  Wt  10 Yt 1  Tt 1  Wt1   11t   3t
Identidades
Yt  Tt  Ct  I t  Gt
Yt  Wt  Wt  Pt
Kt  Kt 1  I t
C : Gasto de Consumo
K : Existencia Capital
I : Gasto de Inversión
W : Nómina Sector Privado
G : Gasto de Gobierno
W´ : Nómina Sector Público
T : Impuesto
t : Tiempo
Y : Ingreso descontado impuesto
P : Ganancias
1 ,  2 ,  3 :
Perturbaciones estocásticas
Relaciones Funcionales (Típicas)
Modelos Estructurales (Metamodelos)
a) MODELO LINEAL
Estocástico
Y   0  1 X  
b) MODELO CUADRATICO
Y  0  1 X  2 X 2  3 X1 X 2  4 X 22  
c) MODELO EXPONENCIAL
1
2
Y   0 X1 X 2  
d) etc.
Formulación de Modelos
E1: Conocimiento profundo del fenómeno : Observación cuidadosa y
identificación de posibles elementos relevantes. (variables)
E2: Estado del Arte : Revisar los postulados teoricos existentes, formular
hipótesis.(nuevo conociemiento.
E3: Determinar los Pocos Vitales : Pareto, causalidad.
E4: Validación : Probar con Datos Empíricos, Hipótesis.
Sepamos buscar como quien espera encontrar y encontrar
como quien espera buscar
Teoría Económica
Formulación de Hipótesis
Información
previa
Datos
Análisis Explorativode Datos (DM)
Modelo Econométrico
Estimación de Parámetros
Contraste de Hipótesis
Validación de Modelo
CLASES DE MODELOS: Función, Estructura,
Referencia del Tiempo, Referencia de la
Incertidumbre, Generalidad
•
•
•
•
•
Descriptivos, Explicativos, Predictívos
Icónicos, Analógicos, Simbólicos
Estáticos, Dinámicos
Determinísticos, Probabilísticos, de Juego
Generales, Especializados
Descriptivos
Estáticos
Dinámicos
y= +u
(Primera parte)
y =  +  yt-1 + ut
(Quinta parte)
y= + x+u
(Tercera y cuarta
parte)
y= + x+
 yt-1 + ut
(Quinta parte)
Extrapolativos
Explicativos
DATA MINING
Y
Métodos Estadísticos
Cuantitativos
Knowledge Discovery in
Data Bases (KDD)
“Es un proceso de identificación de patrones
válidos, innovativos, potencialmente útiles,
no explícitos y comprensibles a partir de los
datos”.
KDD
Etapas del KDD :
1. Selección de Datos
2. Depuración
3. Enriquecimiento
4. Codificación
5. Data Mining
6. Reportes
KDD
Information Requirement
Data Selection
Data Bases
Cleaning:
Domain consistency
De-duplication
 Outliers detection
Feedback
Enrichment
External Data
Coding
Data Mining
 Association
 Clustering
 Classification
 Regression
Reporting
Action
Data Mining (DM)
“Etapa de reconocimiento de patrones, a través de
algoritmos automáticos o semiautomáticos de
grandes bases de datos con el objeto de apoyar a la
toma de decisiones dentro de una organización”.
DM permite construir
algoritmos automáticos
modelos
mediante
SM permite construir modelos orientado por un
experto.
DM v/s SM
•
•
•
•
•
•
Capacidad o poder predictivo
Manejabilidad
Perfomance
legibilidad
Rapidez
Tamano
Algoritmos en DM
•Existen diversos algoritmos en Data Mining los que se
pueden clasificar:
•Estadísticos
•Machine Learning
• Redes Neuronales etc.
•Actividades de Data Mining:
•Preparación de los datos
•Aplicación de algoritmos de DM
•Análisis de datos
DM
•Algoritmos de DM:
• Estadísticos
-Clustering
-Clasificación
-Regresión
-Pronósticos
Aplicaciones
•Energía: Apoyo a la toma de decisiones en plantas energía
eléctrica (centro de despacho de cargas)
•Medicina: Mejora de diagnósticos y asignación de
tratamientos en base a reconocimiento de patrones.
•Marketing: información demográfica y sistemas de
información geográficos, patrones de compra, segmentación de
mercados.
•Finanzas: predicción de valores y riesgo en el mercado de
opciones.
Superficies de Respuesta y Metamodelos
• Una superficie de respuesta: Es un gráfico de la variable
respuesta como una función de varias variables (factores).
• Un metamodelo: Es una representación algebraica, con los
factores como variables independientes (determinísticas o
estocásticas) y la variable respuesta como variable
dependiente. La que representa una aproximación de la
superficie de respuesta.
• Metamodelos típicos usado en muchas aplicaciones son:
• a) Regresión multiple
• b) Markovianos
• c) ANN
Meta-modelos
• A través de un metamodelo la metodología de
superficie de respuesta (RSM) trata de encontrar
la respuesta óptima de un conjunto de factores.
• La Experimentación con un metamodelo es
comúnmente un método de adquirir información
• Un proceso de diseño de experimento asume un
particular forma funcional o estructura dentro del
metamodelo (Lineal model, Quadratic model, etc).
E[C ( P, T )]  B0  B1P  B2T  B12 PT
Conceptos de Análisis de Regresión
• Los métodos de Regresión son usados para
determinar la mejor relación funcional entre las
variables.
• Supongamos que la relación funcional puede ser
representada por:
E(Y) = f (X1, ..., Xp / B1, ..., BE)
donde E(Y) es el valor esperado de la variable de
respuesta Y; los X1, ..., Xp son factores; y los
B1, ..., BE son los parámetros de la forma funcional;
E(Y) = B1 + B2 X1 + B3 X2 + B4 X1 X2+……
Conceptos de Análisis de Regresión
• La observación de un valor de la respuesta Y, para
un conjunto de X ’s, es asumida como una variable
aleatoria dada por:
Y = f (X1, ..., Xp/B1, ..., BE) + u
Donde u , es una variable aleatoria con media
igual a 0 y varianza  u 2 . Los valores de B1,...,BE
son obtenidos por algún método de estimación
conveniente ( LS, M, GM etc.).
Métodos en Superficie de Respuesta
• La metodología de superficie de respuesta
(Response surface methodology RSM) involucra
una combinación de metamodelos (i.e., regresión
lineal y no lineal) y procedimientos secuenciales
de optimización (iterative optimization).
Modelo Estadístico (Lineal)
y   0  1 x  u
x , y son variables independiente y dependiente
respectivamente. Además “u” una variable
estadística que representa el error.
Los parámetros 0 y 1 pueden ser estimados a partir
de los datos {(xi , yi)}i=1,...,n mediante método de
mínimos cuadrados.
Sea ;
ei  yi  yˆ i  yi  ˆ 0  ˆ1 xi
Entonces
Modelo de Regresión simple
ij
0 1 i ij
Y     x u
Hipótesis Estructural
i  1,2,....d ; j  1,2,.....ni
yij , uij v.a.
0 , 1 parámetros
xi
Variable de control
Supuestos:
uij
Perturbación Aleatoria, con esperranza nula,
variancia constante, distribuida normalmente con
independencia
Consecuencias de los supuestos
ij i
a)..E (Y / x )   0  1 X i
b).V (Y / x )   2
ij i
ij i
c) f (Y / x ), Dist. Normalmente
n
n
min  eij  min  ( yij   0  1 xi ) 2
 0 1
2
 0 1
i 1
i 1
n
SC E   ei
2
i 1
ˆ1 
SC xy
SC x
n
SC x   ( xi  x )
i 1
ˆ 0  y  ˆ1 x
n
2
SC xy   ( xi  x )( yi  y )
i 1
n
VNE   ei
i 1
2
Distribución de los Parámetros mínimo cuadráticos
^
0  N (
0
, V (  0 ))
^
1  N (  ,V ( 
1
1
))
Ejemplo de Regresión Simple
t
V(t)
0
30
20
1
60
40
20
2
46
3
32
26
4
10
14
12
5
4
8
6
17
V(t)
25
40
46
29
12
6
17
Sea xt = sen t
Luego
yt = V(t)
y(t) = a + b xt + ut
min Q(a, b)  min  ( yt  a  bxt )
a ,b
a ,b
t
2
aˆ  y  bˆ x  25,3
cov(
x
,
y
)
bˆ 
 20
2
Sx
 ( y  yˆ )
S y  1276
2
t
2
t
 22,45
% de Ajuste del Modelo =
eˆ

1
Sy
t
2
2
 0,98 100%  98%