Тестирование сезонной корректировки с помощью Demetra+ Довнар Ольга Александровна Национальный статистический комитет, Республика Беларусь Проверка первоначального динамического ряда В настоящем отчете представлены результаты сезонной корректировки временного ряда индекса.

Download Report

Transcript Тестирование сезонной корректировки с помощью Demetra+ Довнар Ольга Александровна Национальный статистический комитет, Республика Беларусь Проверка первоначального динамического ряда В настоящем отчете представлены результаты сезонной корректировки временного ряда индекса.

Тестирование сезонной корректировки с помощью Demetra+

Довнар Ольга Александровна Национальный статистический комитет , Республика Беларусь

Проверка первоначального динамического ряда

В настоящем отчете представлены результаты сезонной корректировки временного ряда

индекса промышленного производства Республики Беларусь

    

Выводы о качестве исходных данных

Исходный временной ряд представляет собой помесячные индексы промышленного производства к базисному 2005 году Длительность временного ряда составляет 72 наблюдения (1.2005-12.2010) В 2011 году в статистической практике Республики Беларусь осуществлен переход на классификатор ОКЭД (МСОК/ISIC Ред.3) на предыдущем классификаторе ОКОНХ.

. В связи с этим настоящий временной ряд индексов промышленного производства по ОКЭД был получен не на основе обработки первичных данных, а путем пересчета по структуре ранее существовавшего ряда помесячных индексов, базировавшихся Качество полученных таким образом рядов Белстат считает не достаточно точным, однако вполне удовлетворительным для статистического анализа, так как доля данных, относящихся к промышленности по ОКОНХ составляет 98% в объеме промышленного производства по ОКЭД. По мере поступления новых наблюдений, базирующихся на ОКЭД, качество временного ряда будет улучшаться.

Hаличие сезонности в исходном ряду

Рис. 1

В первоначальном временном ряду присутствует сезонный фактор, о чем свидетельствует наличие спектральных пиков на сезонных частотах, и частотах календарных дней.

Подход и предикторы

 

Был использован подход TRAMO/SEATS Выбрана собственная спецификация TramoSeatsSpec-1:

Опции Трансформация – Функция Календарь Пасха Автоматическое моделирование ARIMA Отклоняющиеся значения Значение Auto holidays of Belarus, td2 No True True

Предварительная корректировка

Интервал оценки:

[1-2005 : 12-2010] 

Выбрано логарифмическое преобразование.

Календарные эффекты (

2 переменные: рабочие дни, високосный год

). Эффекта Пасхи

нет

.

Тип применяемой модели

-

ARIMA model [(0,1,1)(0,1,1)].

.

Отклоняющиеся значения:

выявлено

одно отклоняющееся значение в ноябре 2008 г.

График результатов

Рис. 2

Сезонная составляющая не потеряна в нерегулярности

Разложение

Основная модель ARIMA временного ряда индексов промышленного производства Республики Беларусь: (1-0,34В) ( 1 - 0,25 B 12 )a t , σ 2 = 1, декомпозирована на три подмодели:  Трендовая модель: ( 1 + 0,1B - 0,9B 2 )a p,t.

, σ 2  Сезонная модель: 0,74B 6 + +0,47B 7 = 0,0334 (1 + 1,43B + 1,51B + 0,24B 8 + 0,03B 9 2 + 1,45 B 3 + 0,11B 10 + 1,25B - 0,40B 11 )a s,t 4 + 1,01B , σ 2 5 + = 0,1476  Нерегулярная: белый шум (0; 0,1954).

Дисперсия сезонных и трендовых составляющих ниже, чем нерегулярной составляющей. Значит, получены устойчивые трендовые и сезонные составляющие .

Основная диагностика качества

Диагностика и результат Summary Good basic checks:

definition: Good (0,000) annual totals: Good (0,003)

Объяснение

В целом хорошее качество сезонной корректировки, значит подобрана адекватная модель разложения Разложение соблюдает математическую зависимость всех составляющих.

Годовые итоговые значения первоначального ряда и скорректированного на сезонность совпадают

visual spectral analysis

spectral seas peaks: Good spectral td peaks: Good Friedman statistic = 8,7207 , P-value= 0.000

. Kruskall-Wallis st. = 47,1172, P-value= 0.000

В исходном ряду визульно присутствуют сезонные пики и пики рабочих дней В исходном ряду присутствуют стабильные сезонные колебания на уровне значимости 1%.

regarima residuals

normality: Good (0,461 ) independence: Good (0,873 ) spectral td peaks: Uncertain (0,088) spectral seas peaks: Uncertain (0,024) Остатки распределены нормально, случайны, независимы. Неопределенность визуальной оценки спектральных сезонных пиков и пиков операционных дней в остатках (возможно присутствие сезонности и календарных эффектов в остатках)

residual seasonality

on sa: Good (0,978) on sa (last 3 years): Good (0,994) on irregular: Good (1,000) Отсутствуют сезонные эффекты в ряду, скорректированном на сезонность, в том числе в течение последних 3-х лет, а также в ряду нерегулярной компоненты.

Residual seasonality test

No evidence of residual seasonality in the entire series at the 10 per cent level: F=0,3231 No evidence of residual seasonality in the last 3 years at the 10 per cent level: F=0,2228

outliers

number of outliers: Good (0,014) Отсутствуют показания остаточных сезонных колебаний во всем ряду на 10%-ном уровне значимости.

Есть отклоняющиеся значения, но их количество не критическое

seats

seas variance: Good (0,374) irregular variance: Good (0,323) seas/irr cross-correlation: Good (0, 113) Тренд, сезонная и нерегулярная составляющая независимы (некоррелированы).

Проверка на скользящий сезонный фактор

Рис. 3

Стабильность модели

Сезонно скорректированный ряд (SA) Тренд (Trend)

Рис. 4 Рис. 5

Mean=0,3792 rmse=0.6888 Mean=0,3792 rmse=0.6888

January February March April May June -0.009

1.211

1.259

-0.249

0.113

0.794

July August September October November December 0.380

0.831

0.509

-0.363

-0.385

January February March April May June 0.222

1.167

1.976

-0.196

-0.077

1.042

July August September October November December 0.369

1.128

1.138

-0.517

-0.697

На графиках сезонно скорректированного ряда (SA, рис. 4) и Тренда (рис. 5) видно, что обновления несущественны. Модель можно считать стабильной, так как разности между первой и последней оценкой не превышают 3%. Имеется одна величина на графике Тренда, превосходящая критический предел ( март 2010=1,976 ).

Распределение остатков

Рис. 7

По результатам тестирования остатки распределяются как независимые, случайные, нормальные. Испытания на нелинейность не показывают нелинейность в виде трендов.

Остаточный сезонный фактор

Рис. 6

Можно предположить, что не имеется никаких показателей остаточных сезонных колебаний в остатках. Однако имеется по одной спектральной вершине на небольшой сезонной частоте и на частоте операционных дней, что может означать использование не самых лучших фильтров для их удаления.

Некоторые проблематичные результаты

1.

2.

3.

Как подключить национальный календарь праздников при применении встроенных спецификаций? Кривая графика сезонности визуально не имеет четкой структуры (рис. 8). Как правильно это интерпретировать? При использовании модели ARIMA (0, 1, 0)(1, 0, 0) на графике появлялась лиловая линия (рис. 9). Что она означает?

4. Что означает отсутствие графика в авторегрессионном спектре спектрального анализа остатков (residuals)? Является ли существенной проблемой наличие небольших спектральных вершин на периодограмме? (Рис. 6, слайд 11).

Рис. 8 Рис. 9

Некоторые проблематичные результаты (продолжение)

5.

Как правильно интерпретировать ситуацию, когда дисперсия нерегулярной составляющей ниже, чем тренда и сезонной при применении модели ARIMA (0,1,0)(1, 0, 0)?

trend. Innovation variance = 0,0821 seasonal. Innovation variance = 0,1989 irregular. Innovation variance =

0,0971 6.

Является ли проблемой наличие предположительной автокорреляции в сезонно скорректированном ряду на лаге 6 при применении модели ARIMA (0,1,1)(0, 1, 1).

Autocorrelation function seasonal :

Lag 6 Component 0,1167 Estimator -0,6202 Estimate -0,2898 PValue

0,0490 7.

Можно ли считать приемлемыми результаты теста Ljung-Box and Box-Pierce tests на наличие сезонности в остатках на лагах 24 и 36 при применении ARIMA (0,1,0)(1, 0, 0 ), либо это означает использование не совсем подходящей модели?

Lag 24 36 Autocorrelation 0,1918 -0,1103 Standard deviation 0,1187 0,1187 Ljung-Box test 4,9482 6,7510 P-Value

0,0261 0,0342