Transcript лек-4

Множественная регрессия
и корреляция
1
Спецификация модели
• Уравнение множественной регрессии
y  a  b1 x1  b2 x2  ... bp x p  
• Цель множественной регрессии:
– Построить модель с большим числом факторов,
определив влияние каждого из них в отдельности, а
также совокупное их воздействие на моделируемый
фактор.
• Спецификация модели включает в себя два
круга вопросов:
- отбор факторов;
- выбор вида уравнения регрессии.
2
1 Отбор факторов
• Требования к включаемым факторам:
– количественно измеримы;
– не должны находиться в точной функциональной связи или
быть сильно коррелированы.
• Пример
• y - себестоимость единицы продукции
• x – заработная плата работника
• z – производительность труда
rxz  0,95
y  22600 5x  10z  
3
Два этапа отбора факторов:
– исходя из сущности проблемы;
– на основе корреляционной матрицы и t - статистики
параметров регрессии
1) Проверка парной корреляции.
Принцип исключения факторов:
– Если две переменные явно коллинеарны
( rxi x j  0,7 ), то
одну из них исключаем.
– Включаем фактор, имеющий наименьшую тесноту связи с
другими факторами
2) Оценка мультиколлинеарности факторов (когда более, чем
два фактора связаны между собой линейной зависимостью):
– Проверка гипотезы H0: R  (rx x )  1,
i j
R – матрица коэффициентов корреляции.
Чем ближе к 1 определитель матрицы межфакторной корреляции, тем
меньше мультиколлинеарность факторов
4
Пути преодоления сильной
межфакторной корреляции
• Исключение одного или нескольких факторов
• Преобразование факторов для уменьшения
корреляции между ними
– Переход к первым разностям
– Переход к линейным комбинациям (метод главных
компонент)
• Переход к совмещенным уравнениям
регрессии
• Переход к уравнениям приведенной формы
5
Пример
• Дана матрица парных коэффициентов корреляции
зависимости : y  f ( x, z, u)
y
x
z
u
y
1
0,8
0,7
0,6
x
z
u
0,8 0,7 0,6
1 0,8 0,5
0,8 1 0,2
0,5 0,2 1
6
2 Выбор формы уравнения
регрессии
• Линейная регрессия
y  a  b1x1  b2 x2  ... bp x p  
• Линеаризуемые регрессии
– Степенная регрессия
y  ax x ...x 
b1 b2
1 2
bp
p
– Экспоненциальная регрессия
ye
a b1x1 b2 x2 ...bp x p 
– Гиперболическая регрессия
1
y
a  b1 x1  b2 x2  ...bp x p  
7
Оценка параметров уравнения
множественной регрессии
• Метод:
– а) метод наименьших квадратов (МНК)
– б) метод наименьших квадратов (МНК) для
стандартизованного уравнения
• Схема: решение системы нормальных
уравнений
8
Метод наименьших квадратов для
уравнения в обычном масштабе
• Модель

y  a  b1 x1  b2 x2  ... bp x p  
• Система нормальных уравнений
 y  na  b  x
1
 yx
1
1
 b2  x2  ...  bp  x p
 a  x1  b1  x  b2  x1 x2  ...bp  x p x1
2
1
………………………………………
 yx
p
 a  x p  b1  x1 x p  b2  x2 x p  ...bp  x
9
2
p
МНК для уравнения регрессии в
стандартизованном масштабе
• Модель

t xi 
t y  1t x1  2t x2  ...  pt x p  
xi  xi
x
i
ty 
y y
y
• Система нормальных уравнений
ryx1  1  2rx1x2  3rx1x3  ...  p rx1x p
ryx  1rx x  2  3rx x  ...  p rx x
2
2 1
2 3
………………………………………..
2 p
ryxp  1rx p x1  2rx p x2  3rx p x3  ... p
10
Пример
• y –издержки производства
• x1- основные производственные фонды
• x2- численность занятых в производстве
y  200 1,2x1  1,1x2  
• В стандартизованном виде
t y  0,5t x1  0,8t x2
11
Переход от стандартизованного уравнения к
обычному
• Связь между «чистыми» и «стандартизованными»
коэффициентами регрессии
y
bi   i
.
x
i
a  y  b1 x1  b2 x2  ...  bp x p .
• Достоинство стандартизованных коэффициентов
регрессии
– Использование при отсеве факторов – из модели исключаются
факторы с наименьшим значением
i
12
Частные уравнения регрессии
• Частное уравнение регрессии связывает результативный фактор
с фактором xi при фиксировании остальных экзогенных
переменных на среднем уровне
y x x , x ,...,x
i
1
2
i 1 , xi 1 ,...,x p
 f ( xi )
• Вид частного уравнения регрессии
yx x , x ,...,x
i
1
2
i 1 , xi 1 ,...,x p
 a  b1 x1  b2 x2  ...  bi 1 xi 1  bi xi 
 bi 1 xi 1  ...  bp x p  
13
• Или
yxi x1 , x2 ,...,xi1 , xi1 ,...,x p  Ai  bi xi
• где
Ai  a  b1 x1  ...  bi 1 xi 1  bi 1 xi 1  ...  bp x p
• Частный коэффициент эластичности
Эyx  bi
i
xi
yxi x1 , x2 ,...,xi1 , xi1 ,...,x p
14
Пример
• По ряду регионов величина импорта y на определенный
товар относительно отечественного производства x1,
изменения запасов x2 и потребления на внутреннем
рынке х3 задается уравнением

y  66,028 0,135x1  0,476x2  0,343x3
y  31,5
x1  245,7
x2  3,7
x3  182,5

yx1x2 , x3  a  b1x1  b2 x2  b3 x3  1,669 0,135x1
yx2 x1 , x3  a  b1x1  b2 x2  b3 x3  29,739 0,476x2
yx3 x1 , x2  a  b1x1  b2 x2  b3 x3  31,097 0,343x3
15
Частные коэффициенты эластичности
Если, например, x1  160,2; x2  4,0;
коэффициенты эластичности составят
Эy x  b1
1
Эyx  b2
2
Эyx  b3
3
x1
yx1x2 , x3
x2
yx2 x1 , x3
x3
y x3 x1 , x2
x3  190,5 , то частные
160,2
 0,135
 1,084
 1,669 0,135160,2
4,0
 0,476
 0,06
29,739 0,476 4,0
190,5
 0,343
 1,908
 31,097 0,343190,5
16
Средние по совокупности эластичности
Эy x
x1
245,7
 b1
 0,135
 1,053
y x1
31,5
Эy x
x2
3,7
 b2
 0,476
 0,056
y x2
31,5
1
2
Эy x
3
x3
182,5
 b3
 0,343
 1,987
yx3
31,5
17