Transcript лек-7

Гетероскедастичность и
автокоррелированность
случайного члена
(патология МНК)
Гетероскедастичность и ее
последствия
• Гомоскедастичность – дисперсия Var(ui)
одинакова для всех наблюдений (т.е.
одинаковый разброс).
• Важность гомоскедастичности:
– коэффициенты регрессии имеют наименьшую
дисперсию среди несмещенных оценок
– при нарушении гомоскедастичности оценки
стандартных ошибок коэффициентов регрессии
неверны
Обнаружение
гетероскедастичности
• Тест ранговой корреляции Спирмена
– абсолютные величины остатков и значения x коррелированы
– Коэффициент ранговой корреляции
rxe  1 
6 D
2
i
n ( n  1)
2
где Di – разность между рангом x и рангом остатка e
Теорема Если коэффициент корреляции для генеральной
совокупности равен нулю, то тестовая статистика rxe  n  1
имеет нормальное распределение N(0,1).
Замечание В множественной регрессии проверка гипотезы
выполняется с использованием любой переменной.
Пример. Государственные расходы на образование (EE), валовый
внутренний продукт (ВВП), и численность населения (P)
BBP(млрд$)
EE
P(млн)
EE/P ($)
BBP/P ($)
EE/BBP (%)
Бразилия
8,92
249,72
123,03
73
2030
4%
Германия
38,6
815
61,56
627
13239
5%
Гонконг
0,67
27,56
5,07
132
5436
2%
Израиль
1,81
20,94
3,87
468
5411
9%
Испания
4,79
211,78
37,43
128
5658
2%
Люксембург
0,34
5,67
0,36
944
15750
6%
Мексика
5,46
186,33
67,4
81
2765
3%
Норвегия
4,9
57,71
4,09
1198
14110
8%
Саудовская Аравия
6,4
115,97
8,37
765
13855
6%
0,32
11,13
2,39
134
4657
3%
США
181,3
2586
227,6
797
11362
7%
Франция
33,59
655,29
53,71
625
12201
5%
Швеция
11,22
124,15
8,31
1350
14940
9%
Япония
61,6
1040,45
116,78
527
8909
6%
Сингапур
BBP(млрд$)
Люксембург
Ранг
abs(e)
Ранг
D
D^2
5,67
1
4,09
6
-5
25
Сингапур
11,13
2
3,70
4
-2
4
Израиль
20,94
3
4,52
7
-4
16
Гонконг
27,56
4
2,92
2
2
4
Норвегия
57,71
5
5,09
8
-3
9
Саудовская Аравия
115,97
6
2,61
1
5
25
Швеция
124,15
7
6,87
11
-4
16
Мексика
186,33
8
3,15
3
5
25
Испания
211,78
9
5,56
10
-1
1
Бразилия
249,72
10
4,03
5
5
25
Франция
655,29
11
7,10
12
-1
1
815
12
13,02
14
-2
4
1040,45
13
5,45
9
4
16
2586
14
8,51
13
1
1
Германия
Япония
США
r=
тестовая статистика
0,6220
2,24
172
Обнаружение гетероскедастичности
(продолжение)
• Тест Голфелда-Квандта
Предположения:
1) стандартное отклонение  распределения ui пропорционально
i
значению x в этом наблюдении
2) случайный член распределен нормально
3) в случайном члене отсутствует автокорреляция
Алгоритм:
наблюдения упорядочиваются по величине
средние (n-2n/) отбрасываются
для первых n/ и для последних n/ оценивается регрессия
RSS2/RSS1 имеет F-распределение с (n-n/ -2p):2 и
(n-n/ -2p):2 степенями свободы
Условия применимости:
(n- n/ ):2>k,
если n=30, то n/ порядка 11
если n=60, то n/ порядка 22
Обобщенный МНК
• Пусть

 K
2
i
2
2
i
• Модель примет вид
y i     xi  K i u i
• Перейдем к модели
yi
Ki


Ki

xi
Ki
 ui
• Или
y      x   u 
•
(*)
• где
новая переменная
• Теорема Уравнение (*) дает более эффективные
оценки, чем исходное уравнение.
• Замечание В ОМНК минимизируется взвешенная
сумма квадратов
1
2
S   2 ( y i  a  bx i )
Ki

• Проблема: нам неизвестны Ki
• Возможные пути решения:
–

приблизительно пропорционально x в парной регрессии
или одной из переменных в множественной регрессии
Пример Пусть y-издержки производства, x1 - объем
продукции, x2 – основные производственные фонды, x3
– численность работников
• Модель издержек производства с объемными факторами
y=a+b1x1+b2x2+... b3x3+U
1) Если предположим, что  i пропорциональна квадрату
численности работников x3, то получим в качестве результативного
признака затраты на одного работника, а в качестве факторов
показатели:
производительность труда,
фондовооруженность труда.
Модель:
2
y
x3
 b3  b1
x1
x3
 b2
x2
x3
u
2) Если предположим, что  i пропорциональна квадрату объема
производства x1, то получим в качестве результативного признака
затраты на единицу (или на 1 рубль) продукциии, а в качестве
факторов показатели:
фондоемкость продукции,
трудоемкость продукции.
Модель:
2
y
x1
 b1  b 2
x2
x1
 b3
x3
x1
u