Análisis de series de tiempo

Download Report

Transcript Análisis de series de tiempo

MODELOS DE PRONOSTICOS

Análisis de series de tiempo

Segundo semestre 2012

Medición del error en el pronóstico

Y t

valor de una serie de tiempo en el periodo t Y

ˆ

t

valor del pronóstico para Y t Error del pronóstico o residual

:

e t

Y t

Y t

ˆ

Medición del error en el pronóstico

 El error correspondiente a cualquier pronóstico es la diferencia entre el valor observado en la serie de tiempo y el pronóstico.

 La mayoría de los métodos implica promediar alguna función del error.  El error de pronóstico puede ser positivo o negativo dependiendo si el pronóstico es demasiado alto o demasiado bajo.

 Una medida de la precisión de los pronósticos es la suma de los errores.

Medición del error en el pronóstico

El problema es que si se suman los errores al ser unos positivos y otros negativos se cancelarán.

 Puede evitarse esto tomando los valores absolutos o elevando al cuadrado cada uno de los errores, antes de sumarlos y promediarlos.

 Algunos métodos son:

Desviación absoluta de la media

:

DAM

t n

  1

Y t

Y

ˆ

t n

Medición del error en el pronóstico

Error medio cuadrado

:

EMC

t n

  1 

Y t n

Y

ˆ

t

 2 Este método penaliza los errores mayores ya que eleva cada uno al cuadrado.

 Se usa en casos que se prefiere una técnica que produzca errores moderados a otra que generalmente tenga errores pequeños pero ocasionalmente arroje algunos muy grandes.

Medición del error en el pronóstico

En ocasiones es más útil calcular los errores en porcentajes y no en cantidades.

 El porcentaje del error medio absoluto (PEMA) se calcula encontrando el error absoluto en cada periodo, dividiendo éste entre el valor real observado para ese periodo y después promediando estos errores absolutos de porcentaje.

Y t

Y t

ˆ

PEMA

t n

  1

Y t n

Medición del error en el pronóstico

 El PEMA indica qué tan grande son los errores comparados con los valores reales de la serie.

 Se puede utilizar el PEMA para comparar la precisión de la misma u otra técnica sobre dos series completamente diferentes.

 A veces resulta necesario determinar si un método de pronóstico está sesgado (pronóstico consistentemente alto o bajo).

 Para esto se utiliza el porcentaje medio de error (PME).

Medición del error en el pronóstico

 El PME se calcula encontrando el error en cada periodo, dividiendo éste entre el valor real de ese periodo y promediando después estos porcentajes de error.

PME

t n

  1 

Y t n

Y t Y

ˆ   Si un método de pronóstico no está sesgado el PME dará un porcentaje cercano a cero.

Medición del error en el pronóstico

 Si el resultado es un porcentaje negativo grande el método de pronóstico está sobrestimando en forma consistente.

 Si el resultado es un porcentaje positivo grande el método de pronóstico está subestimando en forma consistente.

 Es realista esperar que una técnica produzca errores relativamente pequeños.

 Las mediciones de precisión de un pronóstico se podrían utilizar para buscar una técnica óptima.

Medición del error en el pronóstico

 La tabla siguiente muestra el nº de clientes diarios que requieren trabajos de reparación y un pronóstico de estos datos.

 La técnica de pronóstico utiliza el nº de clientes atendidos en el periodo anterior como el pronóstico del periodo actual.

Medición del error en el pronóstico

Periodo (t)

1 2 3 4 5 6 7 8 9

Datos

Y t 58 54 60 55 62 62 65 63 70

Pronóstico

Y

ˆ

t 58 54 60 55 62 62 65 63 Total

Error

Y t

Y t

ˆ

-4 6 -5 7 0 3 -2 7 12

Medición del error en el pronóstico

    DAM=4,3 EMC=23.5

PEMA=6,95% PME=2,03%  El DAM indica que cada pronóstico está desviado en un promedio de 4.3 clientes.  El EMC y el PEMA se compararán con cualquier otro método de pronóstico.

 El PME indica que la técnica no está desviada ya que su valor es cercana a cero.

Medición del error en el pronóstico

Uno de los requerimientos básicos de una técnica de pronóstico es que de un patrón de residuos que sea aleatorio.

 Esto se puede probar mediante un correlograma de los residuos.

 Otro requerimiento es que los residuos tengan una distribución aproximadamente normal.

 Esto se puede probar mediante un histograma de los residuos.

Series de tiempo

 Recordemos que una serie de tiempo es un conjunto de observaciones de un cierto fenómeno tomadas en tiempos específicos, generalmente a intervalos iguales.

 Una serie de tiempo se define por medio de los valores de una variable “Y” observada en periodos de tiempo iguales “t”.

Series de tiempo

 Ejemplo, la siguiente tabla muestra la producción anual (en millones de unidades) durante 12 años de una compañía.

Series de tiempo

Año

1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008

Periodo t

1 2 3 4 5 6 7 8 9 10 11 12

Producción Y t

2 3 5 9 12 16 13 10 17 14 22 24

Series de tiempo

30 25 20 15 10 5 0 1996 1998

Producción anual compañía, 1997 - 2008

2000 2002

Años

2004 2006 2008 2010

A nálisis de series de tiempo

El análisis de las series de tiempo consiste en una descripción de los movimientos componentes presentes.

 Equivale a investigar los factores T, C, E e I y suele llamarse descomposición de series de tiempo, en sus movimientos componentes básicos.

 Un modelo de series de tiempo puede expresarse como alguna combinación de estos 4 componentes.

Modelos de series de tiempo

 En general, se supone que una serie de tiempo contiene sus componentes en forma aditiva o en forma multiplicativa.

  Modelo aditivo: supone que el valor de los datos originales Y, es la suma de los 4 componentes.

Y

T

C

E

I

Modelo multiplicativo: supone que el valor de los datos originales Y, es el producto de los 4 componentes.

Y

T

C

E

I

Modelos de series de tiempo

 En el modelo aditivo los datos se expresan en las unidades originales y el valor de una componente no afecta los valores de otros componentes.

 En el modelo multiplicativo sólo la componente de tendencia se expresa en unidades originales, las componente estacionales y cíclicas se expresan en números relativos o porcentajes, además hay una dependencia mutua.

 Por ejemplo, una producción de Y=37.800 unidades (pares) de zapatos de una empresa de calzado en el año 2006 se puede descomponer en

Modelos de series de tiempo

T=40.000 unidades  C=100% no existe efecto por el ciclo del negocio  E=105% la producción de calzado tiene una variación estacional de +5% para ese año  I=90% por algunas fuerzas no conocidas el número de zapatos producidos sufre una variación irregular de -10% en ese año  Entonces 37 .

800  40 .

000  1 , 00  1 , 05  0 , 90

Modelos de series de tiempo

 El modelo multiplicativo es el que se usa más a menudo ya que caracteriza a la mayoría de las series de tiempo económicas o de negocios.

 Trataremos con ese modelo para separar las componentes que influyen en los valores de la serie de tiempo.

Análisis de tendencia

El análisis de tendencia es el procedimiento mediante el cual se determina la dirección del movimiento de la serie de tiempo a largo plazo.

 El comportamiento general de una variable, con frecuencia puede analizarse mejor observando su tendencia a largo plazo.

 Se supone que existe una tendencia que puede ser ascendente, descendente o constante.

 Lo primero que se debe decidir es si la tendencia es una línea recta o una curva.

Análisis de tendencia

 La estimación de la tendencia se puede realizar por los siguientes métodos.

   Método de mano libre Método de los semipromedios Método de los mínimos cuadrados

1.

Método de mano libre: consiste en trazar una recta o curva de tendencia mirando la gráfica, depende demasiado del juicio personal.

Análisis de tendencia

2.

Método de los semipromedios: consiste en separar los datos en 2 partes (de preferencia iguales) se calcula la media de cada parte y se ajusta una línea de tendencia que pase por las 2 medias.

 Suele conducir a resultados pobres cuando se utiliza en forma indiscriminada, sólo es aplicable cuando la tendencia es lineal.

Análisis de tendencia

3.

Método de los mínimos cuadrados: de los modelos de tendencia de las serie de tiempo el más utilizado es la línea recta.

  Si Y representa los valores de la tendencia y X los periodos de tiempo, la recta de tendencia es:

Y

a y b se obtienen por el método de los mínimos cuadrados

b

  

XY X

2 

nXY

nX

2

a bX

Análisis de tendencia

 En el ejemplo anterior la ecuación de tendencia lineal obtenida por el método de mínimos cuadrados es

Y

 

X

Producción anual compañía

30 25 20 15 10 5 0 0 2 4 6

X

8 10 12 14

Series de tiempo

Año

1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008

Periodo (X)

1 2 3 4 5 6 7 8 9 10 11 12

Producción (Y)

2 3 5 9 12 16 13 10 17 14 22 24

estimada  

2,5 4,3 6,0 7,8 9,6 11,4 13,1 14,9 16,7 18,5 20,2 22,0

Variaciones cíclicas

 Los datos anuales contienen sólo 2 componentes: la tendencia y el ciclo.  Las variaciones estacionales son cambios mensuales o trimestrales que no se revelan en los datos anuales.  Las variaciones irregulares tienen efectos positivos y negativos en periodos cortos y tienden a compensarse en el curso de un año.  Por esta razón cuando los datos son anuales, se pueden aislar los ciclos.

Variaciones cíclicas

  Suponiendo un modelo multiplicativo y dividiendo por los valores de la tendencia:

Y Y t

T

C

Al multiplicar por 100 se obtienen porcentajes (índice cíclico), una medida de 100% indica ausencia de efectos cíclicos.  En el ejemplo se determinó el componente cíclico de los valores de la serie utilizando la tendencia lineal.

Variaciones cíclicas

Año

1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008

Producción (Y)

2 3 5 9 12 16 13 10 17 14 22 24

Tendencia  

2,5 4,3 6,0 7,8 9,6 11,4 13,1 14,9 16,7 18,5 20,2 22,0

Indices cíclicos Desviacio  /

T

 100 nes (%)

80 -20 69,8 -30,2 83,3 115,4 125 140,4 99,2 67,1 101,8 75,7 108,9 109,1 -16,7 15,4 25 40,4 -0,8 -32,9 1,8 -24,3 8,9 9,1

Variaciones cíclicas

Indices cíclicos

160,0 140,0 120,0 100,0 80,0 60,0 40,0 20,0 0,0 0 2 4 6

Años

8 10 12 14

Series de tiempo

 Si la serie de tiempo está bien descrita por la tendencia, estacionalidad y los ciclos, la variación residual deberá ser aleatoria.

 Los componentes de una serie se combinan en forma:

F

T

S

C

R F T S C R

Pronóstico de demanda (en unidades o en $) Nivel de tendencia (en unidades o en $) Indice de estacionalidad Indice cíclico Indice residual

Series de tiempo

En la práctica, con frecuencia el modelo se reduce sólo a los componentes de tendencia y estacionalidad.

 Esto se hace porque un modelo bien especificado posee un valor de índice residual (R) de 1 y esto no afecta el pronóstico.

 Se puede tratar el índice cíclico (C) igual a 1 ya que, por lo general, el modelo se actualiza cuando se dispone de nueva información.

 La variación cíclica tiende a compensarse con la actualización.

Series de tiempo

 La tendencia puede determinarse por algún promedio móvil o por regresión.

 El método de mínimos cuadrados minimiza las diferencias cuadráticas entre la información real y la curva de tendencia.  Una línea de tendencia tiene la forma

T

a

bt

 Donde t es el periodo de tiempo, y T es el nivel de demanda promedio o tendencia.  a y b vienen dadas por

Series de tiempo

b

 

D t

 (

t t

) 2  

N N t

(

D

2 )(

t

) Donde

N D t D t a

D

b t

Es el número de observaciones Demanda real en el tiempo t Demanda promedio para los N periodos Promedio de t en los N periodos

Series de tiempo

 El componente de estacionalidad está representado por un índice que cambia para cada periodo que se pronostica. 

S t T t

Este índice es una razón de la demanda real por la demanda promedio.

S t

D t T t

Indice de estacionalidad en el tiempo t Valor de tendencia

 

Series de tiempo

El pronóstico viene dado por

F t

T t

S t

L

Donde

F t

Demanda pronosticada en el tiempo t

L

Número de periodos en el ciclo estacional  Ejemplo. Un fabricante de ropa debe decidir sobre cantidades de compra. Se especifican 5 estaciones del año verano, otoño, invierno, festividades y primavera. Se requiere un pronóstico para 3 estaciones adelante.

Series de tiempo

de venta Periodo de tiempo (t)

Verano 1 Otoño Invierno Festividades Primavera Verano Otoño Invierno Festividades Primavera Verano Otoño 8 9 10 11 12 2 3 4 5 6 7 Invierno Festividades Primavera 13 14 15

Ventas (Dt)

$ 9458 11542 14489 15754 17269 11514 12623 16086 18098 21030 12788 16072 ?

?

?

Descomposición clásica

Descomposición clásica

Descomposición clásica

Descomposición clásica

Descomposición clásica

Evaluación del método de pronóstico

Pasos para evaluar una técnica de pronóstico 1.

Elegir un método de pronóstico con base en la intuición y patrón de los datos.

2.

Se dividen los datos en 2 conjuntos, uno de creación del modelo y otro de prueba.

3.

Crear el modelo con el primer conjunto de datos.

4.

Utilizar el modelo para pronosticar el segundo conj. de datos y evaluar el error de pronóstico 5.

Elegir la técnica, modificarla o elegir otra técnica.