TURKISH STATISTICAL INSTITUTE TurkStat Практика предварительной обработки сезонной корректировки, включая календарную регулировку Неджметтин Алпай Кочак Семинар ЕЭК ООН по краткосрочной статистике и корректировке сезонных колебаний 14-17 марта 2011

Download Report

Transcript TURKISH STATISTICAL INSTITUTE TurkStat Практика предварительной обработки сезонной корректировки, включая календарную регулировку Неджметтин Алпай Кочак Семинар ЕЭК ООН по краткосрочной статистике и корректировке сезонных колебаний 14-17 марта 2011

TURKISH STATISTICAL INSTITUTE
TurkStat
Практика предварительной
обработки сезонной корректировки,
включая календарную регулировку
Неджметтин Алпай Кочак
Семинар ЕЭК ООН по краткосрочной статистике и
корректировке сезонных колебаний
14-17 марта 2011 г.
Астана, Казахстан
06.11.2015
1
TURKISH STATISTICAL INSTITUTE
Введение
TurkStat
• Корректировка на сезонные колебания – это
статистический метод, нацеленный на удаление
сезонной (и календарной) составляющей из
динамического ряда.
• Лежащая в основе этого идея заключается в том,
что динамический ряд состоит из
ненаблюдаемых составляющих, таких как тренд,
цикл, сезонность, нерегулярность
• Сезонная составляющая не позволяет проводить
краткосрочный анализ, таким образом, он
удаляется из исходного динамического ряда для
того, чтобы облегчить аналитикам мониторинг и
интерпретацию экономических процессов
06.11.2015
2
TURKISH STATISTICAL INSTITUTE
TurkStat
Первый шаг: график динамического ряда
Каждый динамический ряд может быть представлен в виде графика
времени для визуального отображения того, присутствует ли сезонная
составляющая (в некоторых случаях этого недостаточно!)
Пример: Индекс промышленного производства –
Всего по Казахстану :
Период: янв. 2000-окт.2010 г.г.
06.11.2015
3
TURKISH STATISTICAL INSTITUTE
TurkStat
Первый шаг: график динамического ряда
Сезонный график – это особая форма линейчатого графика, в котором
строятся отдельные кривые по каждому сезону с ежемесячной или
ежеквартальной периодичностью данных.
Пример: Индекс промышленного производства –
Всего по Казахстану :
Период: янв. 2000-окт.2010 г.г.
TURKISH STATISTICAL INSTITUTE
TurkStat
Ненаблюдаемые составляющие
TurkStat
TURKISH STATISTICAL INSTITUTE
Схема разложения
• Динамический
ряд yt может
быть разложен
следующим
образом
•
Динамический ряд yt может
быть разложен следующим
образом
Yt = TCt×St×εt
log(Yt)=log(TCt)+log(St)+log(εt)
Yt = TCt +St+εt
Аддитивная
модель
Мультипликативная модель
TURKISH STATISTICAL INSTITUTE
TurkStat
Модель REG-ARIMA
• Модель REG-ARIMA – это удобный способ
представления динамического ряда с
детерминированными и стохастическими эффектами.
Дано: наблюдаемый динамический ряд zt , выраженный
как
zt = ytβ+xt
Φ(B)δ(B)xt=θ(B)at,
•где
•β – это вектор коэффициентов регрессии
•yt обозначает переменные n регрессии
•B - лаговый оператор (Bkyt = yt-k )
•Φ(B), δ(B) и θ(B) – финитные многочлены в B
• at понимается как нормально независимо-идентично
распределенный (НИРР) белый шум (0,σa2)
TURKISH STATISTICAL INSTITUTE
TurkStat
Переменные регрессии
• Переменные регрессии фиксируют
детерминированные составляющие динамического
ряда. В динамических рядах воздействие может быть
разного типа:
– Календарный эффект
•
•
•
•
Влияние операционных дней
Эффект Пасхи
Влияние високосного года
Праздничные дни
– Переменные внезапных изменений,
сформированные программой
– Переменные регрессии, вводимые пользователем
– Отклоняющиеся значения
TURKISH STATISTICAL INSTITUTE
TurkStat
Модель ARIMA
• Предварительная корректировка, основанная на модели,
определяет и устанавливает модель ARIMA на
линеаризованные динамические ряды (без детерминированных
эффектов). Модель ARIMA состоит из трех элементов:
– Стационарный элемент AR (многочлен Φ(B))
– Нестационарный элемент AR(многочлен δ(B))
– Обратимый элемент MA (многочлен θ(B))
• Для сезонных динамических рядов многочлены представлены
как:
• Φ(B) = (1+ Φ1B + … + ΦpBp)(1+ Φ1Bs + …+ ΦPBs×P)
• δ(B) = (1-B)d(1-Bs)D
• θ(B) = (1+ θ1B + … + θpBp)(1+ θ1Bs + …+ θPBs×P)
• Сезонная модель ARIMA определяется порядком её
многочленов: (p;d;q)(P;D;Q)
TURKISH STATISTICAL INSTITUTE
TurkStat
TRAMO / Reg-ARIMA
• Программа для оценки, прогнозирования и
интерполяции регрессионных моделей с
отсутствующими показателями и ошибками
ARIMA с возможными несколькими типами
отклоняющихся значений
• Программа предназначена для работы с
ежемесячными данными или данными с еще
меньшей частотностью (ежеквартальными,
полугодовыми, за 4 месяца, за 2 месяца, за год)
• Проводит предварительное испытание для того,
чтобы выбрать между логарифмическим
преобразованием и его отсутствием
TURKISH STATISTICAL INSTITUTE
TurkStat
TRAMO / Reg-ARIMA
• Определяет модель ARIMA с помощью
процесса Автоматической
идентификации модели (АИМ)
• Интерполирует отсутствующие данные
• Обнаруживает отклоняющиеся
значения
• Оценивает модель REG-Arima
• Составляет прогнозы
TURKISH STATISTICAL INSTITUTE
TurkStat
Автоматическое определение
модели
• Модель ARIMA может автоматически определяться программой
• Два шага
– Получает порядок вычисления разностей
– Максимальный порядок ∆2 ∆s
– Получает мультипликативную стационарную модель ARMA
•
0<=(p;q)<=3
•
0 <=(ps;qs )<=1
• Выбирается посредством Байесовского информационного
критерия, больше поддерживает сбалансированную модель
(схожие порядки частей AR и MA)
• В противном случае она может быть введена пользователем
(параметры P,D,Q, BP,BD, BQ)
• Работает вместе с Автоматической идентификацией и
корректировкой отклоняющихся значений (АИКОЗ)
TURKISH STATISTICAL INSTITUTE
TurkStat
Отклоняющиеся значения
• Представляют собой воздействие некоторых
событий на динамический ряд (новые
нормативно-правовые акты, крупная
политическая или экономическая реформа,
забастовка, стихийное бедствие). Три
возможные формы отклоняющихся значений:
– аддитивные отклоняющиеся значения (АОЗ)
– Смещение уровня (СУ)
– Кратковременные изменения (КИ)
TurkStat
TURKISH STATISTICAL INSTITUTE
Отклоняющиеся значения
Аддитивные
отклоняющиеся
значения
Янв98
Янв99
Янв00
Кратковременные
изменения
Янв01
Янв02
Янв03
Смещение
уровня
Янв04
Янв05
Янв06
TURKISH STATISTICAL INSTITUTE
TurkStat
Календарный эффект
• Календарные корректировки устраняют то несезонное
календарное воздействие на динамический ряд, по
которому имеется статистическое доказательство и
экономическое объяснение. Имеется 4 возможности в
динамических рядах:
– Операционные дни (рабочие/нерабочие, 6 предикторов)
– Государственные и скользящие праздники (указываются
пользователем)
– Високосный год (Динамический ряд в отношении X-12-ARIMA)
– Пасха
• Предварительная проверка на наличие этих воздействий.
• Если операционные дни значительны, добавление
переменной праздничных дней значительно улучшает
результаты!
TURKISH STATISTICAL INSTITUTE
TurkStat
Календарный эффект
Операционные дни
Пасха
Високосный год
TurkStat
Корректировка на
операционные/рабочие дни
TURKISH STATISTICAL INSTITUTE
• Направлена на динамический ряд, не зависящий от
длительности и количества дней
– Длительность месяца, количество рабочих дней и выходных,
количество рабочих дней в неделе (понедельник/пятница)
• Рекомендуется проводить корректировку
динамического ряда на рабочие или операционные
дни с подобными влияниями
– При их отсутствии предикторы не должны применяться
• Необходимо составлять, вести и обновлять
государственные календари!
– Исторический список официальных праздников, включая
информацию об оплачиваемых праздничных днях
TURKISH STATISTICAL INSTITUTE
TurkStat
Корректировка на скользящие
праздничные дни
• Данные дни распределяются неравномерно в
течение года
• Корректировка на обнаруженные скользящие
праздничные дни в динамическом ряду
– Не удаляются стандартными фильтрами
– При их отсутствии предикторы не должны применяться
• Данные колебания частично могут быть вызваны
сезонными влияниями:
– Католическая Пасха, например, чаще выпадает на
апрель, чем на март
• Так как сезонное влияние может быть
зафиксировано фильтрами корректировки на
сезонные колебания, оно не должно удаляться
во время календарной корректировки
TurkStat
TURKISH STATISTICAL INSTITUTE
Наглядный пример предикторов
государственных календарей
РелигиозОфиц.
ные
(установ- (скользяленные) щие)
праздни- праздКолики, за
ники, за
чество
искл.
искл.
Количест- воскрес- воскрес- воскрес- Рабочие
во дней ных дней ных дней ных дней дни
Средний
Среднее
предиктор
кол-во
скорректирабочих
рованных
дней
рабочих
(1975-2015) дней
янв.97
31
4
1
0
26
25.14
0.86
фев.97
28
4
0
2
22
23.76
-1.76
мар.97
31
5
0
0
26
26.00
0.00
апр.97
30
4
1
3
22
24.36
-2.36
май.97
31
4
1
0
26
25.14
0.86
июн.97
30
5
0
0
25
25.24
-0.24
июл.97
31
4
0
0
27
25.98
1.02
TURKISH STATISTICAL INSTITUTE
TurkStat
Исходный динамический ряд в
сравнении с лианизированным
ИПП
Лианизированный дин. ряд TRAMO