Лекция № 3 множественная регрессия и корреляция. • Уравнение множественной регрессии y  a  b1 x1  b 2 x 2  ...

Transcript Лекция № 3 множественная регрессия и корреляция. • Уравнение множественной регрессии y  a  b1 x1  b 2 x 2  ...

Slide 1

Лекция № 3

множественная
регрессия и
корреляция.

• Уравнение множественной регрессии

y  a  b1 x1  b 2 x 2  ...  b p x p  



Основная
регрессии

цель

множественной

– построить модель с большим числом
факторов, определив при этом влияние
каждого из них в отдельности, а также
совокупное
их
воздействие
на
моделируемый показатель.

например
• Современная потребительская функция
чаще всего рассматривается как модель
вида
С  f ( y, P, M , Z ) ,

•
•
•
•
•

С – потребление;
у – доход;
P – цена,
M – наличные деньги;
Z – ликвидные активы;



Построение
уравнения
множественной
регрессии
начинается с решения вопроса о
спецификации модели.

Условия включения факторов при
построении множественной регрессии.
• 1. факторы должны быть
количественно измеримы.

• 2. Факторы не должны быть
интеркоррелированы.

• Если между факторами существует высокая
корреляция, то параметры уравнения
регрессии оказываются
неинтерпретируемыми.

• Пусть в уравнении

y  a  b1 х 1  b 2  х 2

r x1 x 2  0 .

Если же rx 1 x 2  1
то b 1 , b 2 нельзя интерпретировать как
показатели раздельного влияния x 1 и x 2
на у .

Пример.
• Рассмотрим регрессию себестоимости:
единицы
продукции
(руб.,у)
от
заработной платы работника (руб.,x) и
производительности его труда (единиц в
час, z ):
y  22600  5  x  10  z

•

r xz

= 0,95

Отбор факторов при построении
множественной регрессии.

• 2 этапа отбора факторов:
– факторы подбираются исходя из сущности проблемы;
– на основе корреляционной матрицы производится
исключение части факторов
• 1) проверка парной корреляции,
• 2) оценка мультиколлинеарности факторов:
– Проверка гипотезы H0: Det R=1

Пути преодоления сильной
межфакторной корреляции
• Исключение одного или нескольких факторов
• Преобразование факторов для уменьшения
корреляции между ними
– Переход к первым разностям
– Переход к линейным комбинациям (метод главных
компонент)

• Переход к совмещенным уравнениям
регрессии
• Переход к уравнениям приведенной формы

• Предпочтение отдается не фактору,
более тесно связанному с
результатом, а тому фактору,
который при достаточной тесной
связи с результатом имеет
наименьшую тесноту связи с
другими факторами.

• Пусть,
например,
при
изучении
зависимости
матрица парных
коэффициентов корреляции оказалась
следующей:

y

y

x

z

v

1

x

0,8

1

z
v

0,7

0,8

1

0,6

0,5

0,2

1

пример
y

y

x

z

v

1

x

0,3

1

z
v

0,7

0,75

1

0,6

0,5

0,8

1

• Для оценки мультиколлинеарности
факторов
может
использоваться
определитель
матрицы
парных
коэффициентов
корреляции между
факторами.

• Если бы факторы не коррелировали между
собой, то матрица парных коэффициентов
корреляции была бы единичной матрицей т.е.
rx

1 x1

rx

Det R  r x

1x2

rx

1 x3

2 x1

rx

rx

2 x2

rx

3 x2

rx

2 x3

rx

3 x3

3 x1

1

0

0

 0

1

0  1,

0

0

1

• Если же, наоборот, между факторами
существует полная линейная
зависимость и все коэффициенты
корреляции равны единице, то
определитель такой матрицы равен
нулю:
1

1

1

Det R  1

1

1  0.

1

1

1

• Таким образом,

• чем ближе к нулю определитель
матрицы межфакторной корреляции,
тем сильнее мультиколлинеарность
факторов и ненадежнее результаты
множественной регрессии.

• Через коэффициенты множественной
детерминации можно найти
переменные, ответственные за
мультиколлинеарность факторов.

• Сравнивая между собой
коэффициенты множественной
детерминации факторов

R

2
x1 x2 , x3 ... x p

;R

2
x2 x1x3 ... x p

;

• оставляем в уравнении факторы с
минимальной величиной
коэффициента множественной
детерминации.

• При дополнительном включении в
регрессию р+1 фактора коэффициент
детерминации должен возрастать, а
остаточная дисперсия уменьшаться;
R

2
p 1

R

2
p

и S p2 1  S p2 .

• Пусть для регрессии, включающих пять
факторов, коэффициент детерминации
составил 0,857
включение шестого фактора дало
коэффициент детерминации
0,855,

вряд ли целесообразно дополнительно
включать в модель этот фактор.

Оценка параметров уравнения
множественной регрессии
• Метод:
– а) метод наименьших квадратов (МНК)
– б) метод наименьших квадратов (МНК) для
стандартизованного уравнения

• В линейной множественной регрессии


y x  a  b1  x 1  b 2  x 2  ...  b p  x p

параметры при переменной x называются
коэффициентами «чистой» регрессии.
Они характеризуют среднее изменение
результата с изменением соответствующего
фактора на единицу при неизменном
значении других факторов, закрепленном на
среднем уровне.

• уравнение регрессии в стандартизованном
виде:

t y  1 t x   2 t x    b p t x
1

2

p

Где t y , y x ,  , t x
переменные
1

t xi 

xi  xi

x

-стандартизованные

p

ty 

,

i

y y



y

Свойства:

t y  t xi  0,
 t   t  1;
y

x

 i -стандартизованные коэффициенты

регрессии.

• Стандартизованные коэффициенты регрессии
показывают, на сколько % изменится в среднем
результат, если соответствующий фактор xi
изменится на 1 % при неизменном среднем
уровне других факторов.

• Стандартизованные коэффициенты регрессии i
сравнимы между собой.
• Связь между «чистыми» и
«стандартизованными» коэффициентами
регрессии

bi   i



y

x

i

• Пример. Пусть функция издержек
производства y(тыс. руб.)
характеризуется уравнением вида
y  200  1, 2  x1  1,1  x 2  

• x1 - основные производственные
фонды(тыс.руб.)
• х2 - численность занятых в
производстве(чел.)

• уравнение регрессии в стандартизованном
виде выглядит так
t y  0 , 5  t x 1  0 ,8  t x 2 .

• Вывод:

• Достоинство стандартизованных
коэффициентов регрессии:
использовать при отсеве факторов – из
модели исключаются факторы с
наименьшим значением  j

Slide 2

Лекция № 3

множественная
регрессия и
корреляция.

• Уравнение множественной регрессии

y  a  b1 x1  b 2 x 2  ...  b p x p  



Основная
регрессии

цель

множественной

– построить модель с большим числом
факторов, определив при этом влияние
каждого из них в отдельности, а также
совокупное
их
воздействие
на
моделируемый показатель.

например
• Современная потребительская функция
чаще всего рассматривается как модель
вида
С  f ( y, P, M , Z ) ,

•
•
•
•
•

С – потребление;
у – доход;
P – цена,
M – наличные деньги;
Z – ликвидные активы;



Построение
уравнения
множественной
регрессии
начинается с решения вопроса о
спецификации модели.

Условия включения факторов при
построении множественной регрессии.
• 1. факторы должны быть
количественно измеримы.

• 2. Факторы не должны быть
интеркоррелированы.

• Если между факторами существует высокая
корреляция, то параметры уравнения
регрессии оказываются
неинтерпретируемыми.

• Пусть в уравнении

y  a  b1 х 1  b 2  х 2

r x1 x 2  0 .

Если же rx 1 x 2  1
то b 1 , b 2 нельзя интерпретировать как
показатели раздельного влияния x 1 и x 2
на у .

Пример.
• Рассмотрим регрессию себестоимости:
единицы
продукции
(руб.,у)
от
заработной платы работника (руб.,x) и
производительности его труда (единиц в
час, z ):
y  22600  5  x  10  z

•

r xz

= 0,95

Отбор факторов при построении
множественной регрессии.

• 2 этапа отбора факторов:
– факторы подбираются исходя из сущности проблемы;
– на основе корреляционной матрицы производится
исключение части факторов
• 1) проверка парной корреляции,
• 2) оценка мультиколлинеарности факторов:
– Проверка гипотезы H0: Det R=1

Пути преодоления сильной
межфакторной корреляции
• Исключение одного или нескольких факторов
• Преобразование факторов для уменьшения
корреляции между ними
– Переход к первым разностям
– Переход к линейным комбинациям (метод главных
компонент)

• Переход к совмещенным уравнениям
регрессии
• Переход к уравнениям приведенной формы

• Предпочтение отдается не фактору,
более тесно связанному с
результатом, а тому фактору,
который при достаточной тесной
связи с результатом имеет
наименьшую тесноту связи с
другими факторами.

• Пусть,
например,
при
изучении
зависимости
матрица парных
коэффициентов корреляции оказалась
следующей:

y

y

x

z

v

1

x

0,8

1

z
v

0,7

0,8

1

0,6

0,5

0,2

1

пример
y

y

x

z

v

1

x

0,3

1

z
v

0,7

0,75

1

0,6

0,5

0,8

1

• Для оценки мультиколлинеарности
факторов
может
использоваться
определитель
матрицы
парных
коэффициентов
корреляции между
факторами.

• Если бы факторы не коррелировали между
собой, то матрица парных коэффициентов
корреляции была бы единичной матрицей т.е.
rx

1 x1

rx

Det R  r x

1x2

rx

1 x3

2 x1

rx

rx

2 x2

rx

3 x2

rx

2 x3

rx

3 x3

3 x1

1

0

0

 0

1

0  1,

0

0

1

• Если же, наоборот, между факторами
существует полная линейная
зависимость и все коэффициенты
корреляции равны единице, то
определитель такой матрицы равен
нулю:
1

1

1

Det R  1

1

1  0.

1

1

1

• Таким образом,

• чем ближе к нулю определитель
матрицы межфакторной корреляции,
тем сильнее мультиколлинеарность
факторов и ненадежнее результаты
множественной регрессии.

• Через коэффициенты множественной
детерминации можно найти
переменные, ответственные за
мультиколлинеарность факторов.

• Сравнивая между собой
коэффициенты множественной
детерминации факторов

R

2
x1 x2 , x3 ... x p

;R

2
x2 x1x3 ... x p

;

• оставляем в уравнении факторы с
минимальной величиной
коэффициента множественной
детерминации.

• При дополнительном включении в
регрессию р+1 фактора коэффициент
детерминации должен возрастать, а
остаточная дисперсия уменьшаться;
R

2
p 1

R

2
p

и S p2 1  S p2 .

• Пусть для регрессии, включающих пять
факторов, коэффициент детерминации
составил 0,857
включение шестого фактора дало
коэффициент детерминации
0,855,

вряд ли целесообразно дополнительно
включать в модель этот фактор.

Оценка параметров уравнения
множественной регрессии
• Метод:
– а) метод наименьших квадратов (МНК)
– б) метод наименьших квадратов (МНК) для
стандартизованного уравнения

• В линейной множественной регрессии


y x  a  b1  x 1  b 2  x 2  ...  b p  x p

параметры при переменной x называются
коэффициентами «чистой» регрессии.
Они характеризуют среднее изменение
результата с изменением соответствующего
фактора на единицу при неизменном
значении других факторов, закрепленном на
среднем уровне.

• уравнение регрессии в стандартизованном
виде:

t y  1 t x   2 t x    b p t x
1

2

p

Где t y , y x ,  , t x
переменные
1

t xi 

xi  xi

x

-стандартизованные

p

ty 

,

i

y y



y

Свойства:

t y  t xi  0,
 t   t  1;
y

x

 i -стандартизованные коэффициенты

регрессии.

• Стандартизованные коэффициенты регрессии
показывают, на сколько % изменится в среднем
результат, если соответствующий фактор xi
изменится на 1 % при неизменном среднем
уровне других факторов.

• Стандартизованные коэффициенты регрессии i
сравнимы между собой.
• Связь между «чистыми» и
«стандартизованными» коэффициентами
регрессии

bi   i



y

x

i

• Пример. Пусть функция издержек
производства y(тыс. руб.)
характеризуется уравнением вида
y  200  1, 2  x1  1,1  x 2  

• x1 - основные производственные
фонды(тыс.руб.)
• х2 - численность занятых в
производстве(чел.)

• уравнение регрессии в стандартизованном
виде выглядит так
t y  0 , 5  t x 1  0 ,8  t x 2 .

• Вывод:

• Достоинство стандартизованных
коэффициентов регрессии:
использовать при отсеве факторов – из
модели исключаются факторы с
наименьшим значением  j

Slide 3

Лекция № 3

множественная
регрессия и
корреляция.

• Уравнение множественной регрессии

y  a  b1 x1  b 2 x 2  ...  b p x p  



Основная
регрессии

цель

множественной

– построить модель с большим числом
факторов, определив при этом влияние
каждого из них в отдельности, а также
совокупное
их
воздействие
на
моделируемый показатель.

например
• Современная потребительская функция
чаще всего рассматривается как модель
вида
С  f ( y, P, M , Z ) ,

•
•
•
•
•

С – потребление;
у – доход;
P – цена,
M – наличные деньги;
Z – ликвидные активы;



Построение
уравнения
множественной
регрессии
начинается с решения вопроса о
спецификации модели.

Условия включения факторов при
построении множественной регрессии.
• 1. факторы должны быть
количественно измеримы.

• 2. Факторы не должны быть
интеркоррелированы.

• Если между факторами существует высокая
корреляция, то параметры уравнения
регрессии оказываются
неинтерпретируемыми.

• Пусть в уравнении

y  a  b1 х 1  b 2  х 2

r x1 x 2  0 .

Если же rx 1 x 2  1
то b 1 , b 2 нельзя интерпретировать как
показатели раздельного влияния x 1 и x 2
на у .

Пример.
• Рассмотрим регрессию себестоимости:
единицы
продукции
(руб.,у)
от
заработной платы работника (руб.,x) и
производительности его труда (единиц в
час, z ):
y  22600  5  x  10  z

•

r xz

= 0,95

Отбор факторов при построении
множественной регрессии.

• 2 этапа отбора факторов:
– факторы подбираются исходя из сущности проблемы;
– на основе корреляционной матрицы производится
исключение части факторов
• 1) проверка парной корреляции,
• 2) оценка мультиколлинеарности факторов:
– Проверка гипотезы H0: Det R=1

Пути преодоления сильной
межфакторной корреляции
• Исключение одного или нескольких факторов
• Преобразование факторов для уменьшения
корреляции между ними
– Переход к первым разностям
– Переход к линейным комбинациям (метод главных
компонент)

• Переход к совмещенным уравнениям
регрессии
• Переход к уравнениям приведенной формы

• Предпочтение отдается не фактору,
более тесно связанному с
результатом, а тому фактору,
который при достаточной тесной
связи с результатом имеет
наименьшую тесноту связи с
другими факторами.

• Пусть,
например,
при
изучении
зависимости
матрица парных
коэффициентов корреляции оказалась
следующей:

y

y

x

z

v

1

x

0,8

1

z
v

0,7

0,8

1

0,6

0,5

0,2

1

пример
y

y

x

z

v

1

x

0,3

1

z
v

0,7

0,75

1

0,6

0,5

0,8

1

• Для оценки мультиколлинеарности
факторов
может
использоваться
определитель
матрицы
парных
коэффициентов
корреляции между
факторами.

• Если бы факторы не коррелировали между
собой, то матрица парных коэффициентов
корреляции была бы единичной матрицей т.е.
rx

1 x1

rx

Det R  r x

1x2

rx

1 x3

2 x1

rx

rx

2 x2

rx

3 x2

rx

2 x3

rx

3 x3

3 x1

1

0

0

 0

1

0  1,

0

0

1

• Если же, наоборот, между факторами
существует полная линейная
зависимость и все коэффициенты
корреляции равны единице, то
определитель такой матрицы равен
нулю:
1

1

1

Det R  1

1

1  0.

1

1

1

• Таким образом,

• чем ближе к нулю определитель
матрицы межфакторной корреляции,
тем сильнее мультиколлинеарность
факторов и ненадежнее результаты
множественной регрессии.

• Через коэффициенты множественной
детерминации можно найти
переменные, ответственные за
мультиколлинеарность факторов.

• Сравнивая между собой
коэффициенты множественной
детерминации факторов

R

2
x1 x2 , x3 ... x p

;R

2
x2 x1x3 ... x p

;

• оставляем в уравнении факторы с
минимальной величиной
коэффициента множественной
детерминации.

• При дополнительном включении в
регрессию р+1 фактора коэффициент
детерминации должен возрастать, а
остаточная дисперсия уменьшаться;
R

2
p 1

R

2
p

и S p2 1  S p2 .

• Пусть для регрессии, включающих пять
факторов, коэффициент детерминации
составил 0,857
включение шестого фактора дало
коэффициент детерминации
0,855,

вряд ли целесообразно дополнительно
включать в модель этот фактор.

Оценка параметров уравнения
множественной регрессии
• Метод:
– а) метод наименьших квадратов (МНК)
– б) метод наименьших квадратов (МНК) для
стандартизованного уравнения

• В линейной множественной регрессии


y x  a  b1  x 1  b 2  x 2  ...  b p  x p

параметры при переменной x называются
коэффициентами «чистой» регрессии.
Они характеризуют среднее изменение
результата с изменением соответствующего
фактора на единицу при неизменном
значении других факторов, закрепленном на
среднем уровне.

• уравнение регрессии в стандартизованном
виде:

t y  1 t x   2 t x    b p t x
1

2

p

Где t y , y x ,  , t x
переменные
1

t xi 

xi  xi

x

-стандартизованные

p

ty 

,

i

y y



y

Свойства:

t y  t xi  0,
 t   t  1;
y

x

 i -стандартизованные коэффициенты

регрессии.

• Стандартизованные коэффициенты регрессии
показывают, на сколько % изменится в среднем
результат, если соответствующий фактор xi
изменится на 1 % при неизменном среднем
уровне других факторов.

• Стандартизованные коэффициенты регрессии i
сравнимы между собой.
• Связь между «чистыми» и
«стандартизованными» коэффициентами
регрессии

bi   i



y

x

i

• Пример. Пусть функция издержек
производства y(тыс. руб.)
характеризуется уравнением вида
y  200  1, 2  x1  1,1  x 2  

• x1 - основные производственные
фонды(тыс.руб.)
• х2 - численность занятых в
производстве(чел.)

• уравнение регрессии в стандартизованном
виде выглядит так
t y  0 , 5  t x 1  0 ,8  t x 2 .

• Вывод:

• Достоинство стандартизованных
коэффициентов регрессии:
использовать при отсеве факторов – из
модели исключаются факторы с
наименьшим значением  j

Slide 4

Лекция № 3

множественная
регрессия и
корреляция.

• Уравнение множественной регрессии

y  a  b1 x1  b 2 x 2  ...  b p x p  



Основная
регрессии

цель

множественной

– построить модель с большим числом
факторов, определив при этом влияние
каждого из них в отдельности, а также
совокупное
их
воздействие
на
моделируемый показатель.

например
• Современная потребительская функция
чаще всего рассматривается как модель
вида
С  f ( y, P, M , Z ) ,

•
•
•
•
•

С – потребление;
у – доход;
P – цена,
M – наличные деньги;
Z – ликвидные активы;



Построение
уравнения
множественной
регрессии
начинается с решения вопроса о
спецификации модели.

Условия включения факторов при
построении множественной регрессии.
• 1. факторы должны быть
количественно измеримы.

• 2. Факторы не должны быть
интеркоррелированы.

• Если между факторами существует высокая
корреляция, то параметры уравнения
регрессии оказываются
неинтерпретируемыми.

• Пусть в уравнении

y  a  b1 х 1  b 2  х 2

r x1 x 2  0 .

Если же rx 1 x 2  1
то b 1 , b 2 нельзя интерпретировать как
показатели раздельного влияния x 1 и x 2
на у .

Пример.
• Рассмотрим регрессию себестоимости:
единицы
продукции
(руб.,у)
от
заработной платы работника (руб.,x) и
производительности его труда (единиц в
час, z ):
y  22600  5  x  10  z

•

r xz

= 0,95

Отбор факторов при построении
множественной регрессии.

• 2 этапа отбора факторов:
– факторы подбираются исходя из сущности проблемы;
– на основе корреляционной матрицы производится
исключение части факторов
• 1) проверка парной корреляции,
• 2) оценка мультиколлинеарности факторов:
– Проверка гипотезы H0: Det R=1

Пути преодоления сильной
межфакторной корреляции
• Исключение одного или нескольких факторов
• Преобразование факторов для уменьшения
корреляции между ними
– Переход к первым разностям
– Переход к линейным комбинациям (метод главных
компонент)

• Переход к совмещенным уравнениям
регрессии
• Переход к уравнениям приведенной формы

• Предпочтение отдается не фактору,
более тесно связанному с
результатом, а тому фактору,
который при достаточной тесной
связи с результатом имеет
наименьшую тесноту связи с
другими факторами.

• Пусть,
например,
при
изучении
зависимости
матрица парных
коэффициентов корреляции оказалась
следующей:

y

y

x

z

v

1

x

0,8

1

z
v

0,7

0,8

1

0,6

0,5

0,2

1

пример
y

y

x

z

v

1

x

0,3

1

z
v

0,7

0,75

1

0,6

0,5

0,8

1

• Для оценки мультиколлинеарности
факторов
может
использоваться
определитель
матрицы
парных
коэффициентов
корреляции между
факторами.

• Если бы факторы не коррелировали между
собой, то матрица парных коэффициентов
корреляции была бы единичной матрицей т.е.
rx

1 x1

rx

Det R  r x

1x2

rx

1 x3

2 x1

rx

rx

2 x2

rx

3 x2

rx

2 x3

rx

3 x3

3 x1

1

0

0

 0

1

0  1,

0

0

1

• Если же, наоборот, между факторами
существует полная линейная
зависимость и все коэффициенты
корреляции равны единице, то
определитель такой матрицы равен
нулю:
1

1

1

Det R  1

1

1  0.

1

1

1

• Таким образом,

• чем ближе к нулю определитель
матрицы межфакторной корреляции,
тем сильнее мультиколлинеарность
факторов и ненадежнее результаты
множественной регрессии.

• Через коэффициенты множественной
детерминации можно найти
переменные, ответственные за
мультиколлинеарность факторов.

• Сравнивая между собой
коэффициенты множественной
детерминации факторов

R

2
x1 x2 , x3 ... x p

;R

2
x2 x1x3 ... x p

;

• оставляем в уравнении факторы с
минимальной величиной
коэффициента множественной
детерминации.

• При дополнительном включении в
регрессию р+1 фактора коэффициент
детерминации должен возрастать, а
остаточная дисперсия уменьшаться;
R

2
p 1

R

2
p

и S p2 1  S p2 .

• Пусть для регрессии, включающих пять
факторов, коэффициент детерминации
составил 0,857
включение шестого фактора дало
коэффициент детерминации
0,855,

вряд ли целесообразно дополнительно
включать в модель этот фактор.

Оценка параметров уравнения
множественной регрессии
• Метод:
– а) метод наименьших квадратов (МНК)
– б) метод наименьших квадратов (МНК) для
стандартизованного уравнения

• В линейной множественной регрессии


y x  a  b1  x 1  b 2  x 2  ...  b p  x p

параметры при переменной x называются
коэффициентами «чистой» регрессии.
Они характеризуют среднее изменение
результата с изменением соответствующего
фактора на единицу при неизменном
значении других факторов, закрепленном на
среднем уровне.

• уравнение регрессии в стандартизованном
виде:

t y  1 t x   2 t x    b p t x
1

2

p

Где t y , y x ,  , t x
переменные
1

t xi 

xi  xi

x

-стандартизованные

p

ty 

,

i

y y



y

Свойства:

t y  t xi  0,
 t   t  1;
y

x

 i -стандартизованные коэффициенты

регрессии.

• Стандартизованные коэффициенты регрессии
показывают, на сколько % изменится в среднем
результат, если соответствующий фактор xi
изменится на 1 % при неизменном среднем
уровне других факторов.

• Стандартизованные коэффициенты регрессии i
сравнимы между собой.
• Связь между «чистыми» и
«стандартизованными» коэффициентами
регрессии

bi   i



y

x

i

• Пример. Пусть функция издержек
производства y(тыс. руб.)
характеризуется уравнением вида
y  200  1, 2  x1  1,1  x 2  

• x1 - основные производственные
фонды(тыс.руб.)
• х2 - численность занятых в
производстве(чел.)

• уравнение регрессии в стандартизованном
виде выглядит так
t y  0 , 5  t x 1  0 ,8  t x 2 .

• Вывод:

• Достоинство стандартизованных
коэффициентов регрессии:
использовать при отсеве факторов – из
модели исключаются факторы с
наименьшим значением  j

Slide 5

Лекция № 3

множественная
регрессия и
корреляция.

• Уравнение множественной регрессии

y  a  b1 x1  b 2 x 2  ...  b p x p  



Основная
регрессии

цель

множественной

– построить модель с большим числом
факторов, определив при этом влияние
каждого из них в отдельности, а также
совокупное
их
воздействие
на
моделируемый показатель.

например
• Современная потребительская функция
чаще всего рассматривается как модель
вида
С  f ( y, P, M , Z ) ,

•
•
•
•
•

С – потребление;
у – доход;
P – цена,
M – наличные деньги;
Z – ликвидные активы;



Построение
уравнения
множественной
регрессии
начинается с решения вопроса о
спецификации модели.

Условия включения факторов при
построении множественной регрессии.
• 1. факторы должны быть
количественно измеримы.

• 2. Факторы не должны быть
интеркоррелированы.

• Если между факторами существует высокая
корреляция, то параметры уравнения
регрессии оказываются
неинтерпретируемыми.

• Пусть в уравнении

y  a  b1 х 1  b 2  х 2

r x1 x 2  0 .

Если же rx 1 x 2  1
то b 1 , b 2 нельзя интерпретировать как
показатели раздельного влияния x 1 и x 2
на у .

Пример.
• Рассмотрим регрессию себестоимости:
единицы
продукции
(руб.,у)
от
заработной платы работника (руб.,x) и
производительности его труда (единиц в
час, z ):
y  22600  5  x  10  z

•

r xz

= 0,95

Отбор факторов при построении
множественной регрессии.

• 2 этапа отбора факторов:
– факторы подбираются исходя из сущности проблемы;
– на основе корреляционной матрицы производится
исключение части факторов
• 1) проверка парной корреляции,
• 2) оценка мультиколлинеарности факторов:
– Проверка гипотезы H0: Det R=1

Пути преодоления сильной
межфакторной корреляции
• Исключение одного или нескольких факторов
• Преобразование факторов для уменьшения
корреляции между ними
– Переход к первым разностям
– Переход к линейным комбинациям (метод главных
компонент)

• Переход к совмещенным уравнениям
регрессии
• Переход к уравнениям приведенной формы

• Предпочтение отдается не фактору,
более тесно связанному с
результатом, а тому фактору,
который при достаточной тесной
связи с результатом имеет
наименьшую тесноту связи с
другими факторами.

• Пусть,
например,
при
изучении
зависимости
матрица парных
коэффициентов корреляции оказалась
следующей:

y

y

x

z

v

1

x

0,8

1

z
v

0,7

0,8

1

0,6

0,5

0,2

1

пример
y

y

x

z

v

1

x

0,3

1

z
v

0,7

0,75

1

0,6

0,5

0,8

1

• Для оценки мультиколлинеарности
факторов
может
использоваться
определитель
матрицы
парных
коэффициентов
корреляции между
факторами.

• Если бы факторы не коррелировали между
собой, то матрица парных коэффициентов
корреляции была бы единичной матрицей т.е.
rx

1 x1

rx

Det R  r x

1x2

rx

1 x3

2 x1

rx

rx

2 x2

rx

3 x2

rx

2 x3

rx

3 x3

3 x1

1

0

0

 0

1

0  1,

0

0

1

• Если же, наоборот, между факторами
существует полная линейная
зависимость и все коэффициенты
корреляции равны единице, то
определитель такой матрицы равен
нулю:
1

1

1

Det R  1

1

1  0.

1

1

1

• Таким образом,

• чем ближе к нулю определитель
матрицы межфакторной корреляции,
тем сильнее мультиколлинеарность
факторов и ненадежнее результаты
множественной регрессии.

• Через коэффициенты множественной
детерминации можно найти
переменные, ответственные за
мультиколлинеарность факторов.

• Сравнивая между собой
коэффициенты множественной
детерминации факторов

R

2
x1 x2 , x3 ... x p

;R

2
x2 x1x3 ... x p

;

• оставляем в уравнении факторы с
минимальной величиной
коэффициента множественной
детерминации.

• При дополнительном включении в
регрессию р+1 фактора коэффициент
детерминации должен возрастать, а
остаточная дисперсия уменьшаться;
R

2
p 1

R

2
p

и S p2 1  S p2 .

• Пусть для регрессии, включающих пять
факторов, коэффициент детерминации
составил 0,857
включение шестого фактора дало
коэффициент детерминации
0,855,

вряд ли целесообразно дополнительно
включать в модель этот фактор.

Оценка параметров уравнения
множественной регрессии
• Метод:
– а) метод наименьших квадратов (МНК)
– б) метод наименьших квадратов (МНК) для
стандартизованного уравнения

• В линейной множественной регрессии


y x  a  b1  x 1  b 2  x 2  ...  b p  x p

параметры при переменной x называются
коэффициентами «чистой» регрессии.
Они характеризуют среднее изменение
результата с изменением соответствующего
фактора на единицу при неизменном
значении других факторов, закрепленном на
среднем уровне.

• уравнение регрессии в стандартизованном
виде:

t y  1 t x   2 t x    b p t x
1

2

p

Где t y , y x ,  , t x
переменные
1

t xi 

xi  xi

x

-стандартизованные

p

ty 

,

i

y y



y

Свойства:

t y  t xi  0,
 t   t  1;
y

x

 i -стандартизованные коэффициенты

регрессии.

• Стандартизованные коэффициенты регрессии
показывают, на сколько % изменится в среднем
результат, если соответствующий фактор xi
изменится на 1 % при неизменном среднем
уровне других факторов.

• Стандартизованные коэффициенты регрессии i
сравнимы между собой.
• Связь между «чистыми» и
«стандартизованными» коэффициентами
регрессии

bi   i



y

x

i

• Пример. Пусть функция издержек
производства y(тыс. руб.)
характеризуется уравнением вида
y  200  1, 2  x1  1,1  x 2  

• x1 - основные производственные
фонды(тыс.руб.)
• х2 - численность занятых в
производстве(чел.)

• уравнение регрессии в стандартизованном
виде выглядит так
t y  0 , 5  t x 1  0 ,8  t x 2 .

• Вывод:

• Достоинство стандартизованных
коэффициентов регрессии:
использовать при отсеве факторов – из
модели исключаются факторы с
наименьшим значением  j

Slide 6

Лекция № 3

множественная
регрессия и
корреляция.

• Уравнение множественной регрессии

y  a  b1 x1  b 2 x 2  ...  b p x p  



Основная
регрессии

цель

множественной

– построить модель с большим числом
факторов, определив при этом влияние
каждого из них в отдельности, а также
совокупное
их
воздействие
на
моделируемый показатель.

например
• Современная потребительская функция
чаще всего рассматривается как модель
вида
С  f ( y, P, M , Z ) ,

•
•
•
•
•

С – потребление;
у – доход;
P – цена,
M – наличные деньги;
Z – ликвидные активы;



Построение
уравнения
множественной
регрессии
начинается с решения вопроса о
спецификации модели.

Условия включения факторов при
построении множественной регрессии.
• 1. факторы должны быть
количественно измеримы.

• 2. Факторы не должны быть
интеркоррелированы.

• Если между факторами существует высокая
корреляция, то параметры уравнения
регрессии оказываются
неинтерпретируемыми.

• Пусть в уравнении

y  a  b1 х 1  b 2  х 2

r x1 x 2  0 .

Если же rx 1 x 2  1
то b 1 , b 2 нельзя интерпретировать как
показатели раздельного влияния x 1 и x 2
на у .

Пример.
• Рассмотрим регрессию себестоимости:
единицы
продукции
(руб.,у)
от
заработной платы работника (руб.,x) и
производительности его труда (единиц в
час, z ):
y  22600  5  x  10  z

•

r xz

= 0,95

Отбор факторов при построении
множественной регрессии.

• 2 этапа отбора факторов:
– факторы подбираются исходя из сущности проблемы;
– на основе корреляционной матрицы производится
исключение части факторов
• 1) проверка парной корреляции,
• 2) оценка мультиколлинеарности факторов:
– Проверка гипотезы H0: Det R=1

Пути преодоления сильной
межфакторной корреляции
• Исключение одного или нескольких факторов
• Преобразование факторов для уменьшения
корреляции между ними
– Переход к первым разностям
– Переход к линейным комбинациям (метод главных
компонент)

• Переход к совмещенным уравнениям
регрессии
• Переход к уравнениям приведенной формы

• Предпочтение отдается не фактору,
более тесно связанному с
результатом, а тому фактору,
который при достаточной тесной
связи с результатом имеет
наименьшую тесноту связи с
другими факторами.

• Пусть,
например,
при
изучении
зависимости
матрица парных
коэффициентов корреляции оказалась
следующей:

y

y

x

z

v

1

x

0,8

1

z
v

0,7

0,8

1

0,6

0,5

0,2

1

пример
y

y

x

z

v

1

x

0,3

1

z
v

0,7

0,75

1

0,6

0,5

0,8

1

• Для оценки мультиколлинеарности
факторов
может
использоваться
определитель
матрицы
парных
коэффициентов
корреляции между
факторами.

• Если бы факторы не коррелировали между
собой, то матрица парных коэффициентов
корреляции была бы единичной матрицей т.е.
rx

1 x1

rx

Det R  r x

1x2

rx

1 x3

2 x1

rx

rx

2 x2

rx

3 x2

rx

2 x3

rx

3 x3

3 x1

1

0

0

 0

1

0  1,

0

0

1

• Если же, наоборот, между факторами
существует полная линейная
зависимость и все коэффициенты
корреляции равны единице, то
определитель такой матрицы равен
нулю:
1

1

1

Det R  1

1

1  0.

1

1

1

• Таким образом,

• чем ближе к нулю определитель
матрицы межфакторной корреляции,
тем сильнее мультиколлинеарность
факторов и ненадежнее результаты
множественной регрессии.

• Через коэффициенты множественной
детерминации можно найти
переменные, ответственные за
мультиколлинеарность факторов.

• Сравнивая между собой
коэффициенты множественной
детерминации факторов

R

2
x1 x2 , x3 ... x p

;R

2
x2 x1x3 ... x p

;

• оставляем в уравнении факторы с
минимальной величиной
коэффициента множественной
детерминации.

• При дополнительном включении в
регрессию р+1 фактора коэффициент
детерминации должен возрастать, а
остаточная дисперсия уменьшаться;
R

2
p 1

R

2
p

и S p2 1  S p2 .

• Пусть для регрессии, включающих пять
факторов, коэффициент детерминации
составил 0,857
включение шестого фактора дало
коэффициент детерминации
0,855,

вряд ли целесообразно дополнительно
включать в модель этот фактор.

Оценка параметров уравнения
множественной регрессии
• Метод:
– а) метод наименьших квадратов (МНК)
– б) метод наименьших квадратов (МНК) для
стандартизованного уравнения

• В линейной множественной регрессии


y x  a  b1  x 1  b 2  x 2  ...  b p  x p

параметры при переменной x называются
коэффициентами «чистой» регрессии.
Они характеризуют среднее изменение
результата с изменением соответствующего
фактора на единицу при неизменном
значении других факторов, закрепленном на
среднем уровне.

• уравнение регрессии в стандартизованном
виде:

t y  1 t x   2 t x    b p t x
1

2

p

Где t y , y x ,  , t x
переменные
1

t xi 

xi  xi

x

-стандартизованные

p

ty 

,

i

y y



y

Свойства:

t y  t xi  0,
 t   t  1;
y

x

 i -стандартизованные коэффициенты

регрессии.

• Стандартизованные коэффициенты регрессии
показывают, на сколько % изменится в среднем
результат, если соответствующий фактор xi
изменится на 1 % при неизменном среднем
уровне других факторов.

• Стандартизованные коэффициенты регрессии i
сравнимы между собой.
• Связь между «чистыми» и
«стандартизованными» коэффициентами
регрессии

bi   i



y

x

i

• Пример. Пусть функция издержек
производства y(тыс. руб.)
характеризуется уравнением вида
y  200  1, 2  x1  1,1  x 2  

• x1 - основные производственные
фонды(тыс.руб.)
• х2 - численность занятых в
производстве(чел.)

• уравнение регрессии в стандартизованном
виде выглядит так
t y  0 , 5  t x 1  0 ,8  t x 2 .

• Вывод:

• Достоинство стандартизованных
коэффициентов регрессии:
использовать при отсеве факторов – из
модели исключаются факторы с
наименьшим значением  j

Slide 7

Лекция № 3

множественная
регрессия и
корреляция.

• Уравнение множественной регрессии

y  a  b1 x1  b 2 x 2  ...  b p x p  



Основная
регрессии

цель

множественной

– построить модель с большим числом
факторов, определив при этом влияние
каждого из них в отдельности, а также
совокупное
их
воздействие
на
моделируемый показатель.

например
• Современная потребительская функция
чаще всего рассматривается как модель
вида
С  f ( y, P, M , Z ) ,

•
•
•
•
•

С – потребление;
у – доход;
P – цена,
M – наличные деньги;
Z – ликвидные активы;



Построение
уравнения
множественной
регрессии
начинается с решения вопроса о
спецификации модели.

Условия включения факторов при
построении множественной регрессии.
• 1. факторы должны быть
количественно измеримы.

• 2. Факторы не должны быть
интеркоррелированы.

• Если между факторами существует высокая
корреляция, то параметры уравнения
регрессии оказываются
неинтерпретируемыми.

• Пусть в уравнении

y  a  b1 х 1  b 2  х 2

r x1 x 2  0 .

Если же rx 1 x 2  1
то b 1 , b 2 нельзя интерпретировать как
показатели раздельного влияния x 1 и x 2
на у .

Пример.
• Рассмотрим регрессию себестоимости:
единицы
продукции
(руб.,у)
от
заработной платы работника (руб.,x) и
производительности его труда (единиц в
час, z ):
y  22600  5  x  10  z

•

r xz

= 0,95

Отбор факторов при построении
множественной регрессии.

• 2 этапа отбора факторов:
– факторы подбираются исходя из сущности проблемы;
– на основе корреляционной матрицы производится
исключение части факторов
• 1) проверка парной корреляции,
• 2) оценка мультиколлинеарности факторов:
– Проверка гипотезы H0: Det R=1

Пути преодоления сильной
межфакторной корреляции
• Исключение одного или нескольких факторов
• Преобразование факторов для уменьшения
корреляции между ними
– Переход к первым разностям
– Переход к линейным комбинациям (метод главных
компонент)

• Переход к совмещенным уравнениям
регрессии
• Переход к уравнениям приведенной формы

• Предпочтение отдается не фактору,
более тесно связанному с
результатом, а тому фактору,
который при достаточной тесной
связи с результатом имеет
наименьшую тесноту связи с
другими факторами.

• Пусть,
например,
при
изучении
зависимости
матрица парных
коэффициентов корреляции оказалась
следующей:

y

y

x

z

v

1

x

0,8

1

z
v

0,7

0,8

1

0,6

0,5

0,2

1

пример
y

y

x

z

v

1

x

0,3

1

z
v

0,7

0,75

1

0,6

0,5

0,8

1

• Для оценки мультиколлинеарности
факторов
может
использоваться
определитель
матрицы
парных
коэффициентов
корреляции между
факторами.

• Если бы факторы не коррелировали между
собой, то матрица парных коэффициентов
корреляции была бы единичной матрицей т.е.
rx

1 x1

rx

Det R  r x

1x2

rx

1 x3

2 x1

rx

rx

2 x2

rx

3 x2

rx

2 x3

rx

3 x3

3 x1

1

0

0

 0

1

0  1,

0

0

1

• Если же, наоборот, между факторами
существует полная линейная
зависимость и все коэффициенты
корреляции равны единице, то
определитель такой матрицы равен
нулю:
1

1

1

Det R  1

1

1  0.

1

1

1

• Таким образом,

• чем ближе к нулю определитель
матрицы межфакторной корреляции,
тем сильнее мультиколлинеарность
факторов и ненадежнее результаты
множественной регрессии.

• Через коэффициенты множественной
детерминации можно найти
переменные, ответственные за
мультиколлинеарность факторов.

• Сравнивая между собой
коэффициенты множественной
детерминации факторов

R

2
x1 x2 , x3 ... x p

;R

2
x2 x1x3 ... x p

;

• оставляем в уравнении факторы с
минимальной величиной
коэффициента множественной
детерминации.

• При дополнительном включении в
регрессию р+1 фактора коэффициент
детерминации должен возрастать, а
остаточная дисперсия уменьшаться;
R

2
p 1

R

2
p

и S p2 1  S p2 .

• Пусть для регрессии, включающих пять
факторов, коэффициент детерминации
составил 0,857
включение шестого фактора дало
коэффициент детерминации
0,855,

вряд ли целесообразно дополнительно
включать в модель этот фактор.

Оценка параметров уравнения
множественной регрессии
• Метод:
– а) метод наименьших квадратов (МНК)
– б) метод наименьших квадратов (МНК) для
стандартизованного уравнения

• В линейной множественной регрессии


y x  a  b1  x 1  b 2  x 2  ...  b p  x p

параметры при переменной x называются
коэффициентами «чистой» регрессии.
Они характеризуют среднее изменение
результата с изменением соответствующего
фактора на единицу при неизменном
значении других факторов, закрепленном на
среднем уровне.

• уравнение регрессии в стандартизованном
виде:

t y  1 t x   2 t x    b p t x
1

2

p

Где t y , y x ,  , t x
переменные
1

t xi 

xi  xi

x

-стандартизованные

p

ty 

,

i

y y



y

Свойства:

t y  t xi  0,
 t   t  1;
y

x

 i -стандартизованные коэффициенты

регрессии.

• Стандартизованные коэффициенты регрессии
показывают, на сколько % изменится в среднем
результат, если соответствующий фактор xi
изменится на 1 % при неизменном среднем
уровне других факторов.

• Стандартизованные коэффициенты регрессии i
сравнимы между собой.
• Связь между «чистыми» и
«стандартизованными» коэффициентами
регрессии

bi   i



y

x

i

• Пример. Пусть функция издержек
производства y(тыс. руб.)
характеризуется уравнением вида
y  200  1, 2  x1  1,1  x 2  

• x1 - основные производственные
фонды(тыс.руб.)
• х2 - численность занятых в
производстве(чел.)

• уравнение регрессии в стандартизованном
виде выглядит так
t y  0 , 5  t x 1  0 ,8  t x 2 .

• Вывод:

• Достоинство стандартизованных
коэффициентов регрессии:
использовать при отсеве факторов – из
модели исключаются факторы с
наименьшим значением  j

Slide 8

Лекция № 3

множественная
регрессия и
корреляция.

• Уравнение множественной регрессии

y  a  b1 x1  b 2 x 2  ...  b p x p  



Основная
регрессии

цель

множественной

– построить модель с большим числом
факторов, определив при этом влияние
каждого из них в отдельности, а также
совокупное
их
воздействие
на
моделируемый показатель.

например
• Современная потребительская функция
чаще всего рассматривается как модель
вида
С  f ( y, P, M , Z ) ,

•
•
•
•
•

С – потребление;
у – доход;
P – цена,
M – наличные деньги;
Z – ликвидные активы;



Построение
уравнения
множественной
регрессии
начинается с решения вопроса о
спецификации модели.

Условия включения факторов при
построении множественной регрессии.
• 1. факторы должны быть
количественно измеримы.

• 2. Факторы не должны быть
интеркоррелированы.

• Если между факторами существует высокая
корреляция, то параметры уравнения
регрессии оказываются
неинтерпретируемыми.

• Пусть в уравнении

y  a  b1 х 1  b 2  х 2

r x1 x 2  0 .

Если же rx 1 x 2  1
то b 1 , b 2 нельзя интерпретировать как
показатели раздельного влияния x 1 и x 2
на у .

Пример.
• Рассмотрим регрессию себестоимости:
единицы
продукции
(руб.,у)
от
заработной платы работника (руб.,x) и
производительности его труда (единиц в
час, z ):
y  22600  5  x  10  z

•

r xz

= 0,95

Отбор факторов при построении
множественной регрессии.

• 2 этапа отбора факторов:
– факторы подбираются исходя из сущности проблемы;
– на основе корреляционной матрицы производится
исключение части факторов
• 1) проверка парной корреляции,
• 2) оценка мультиколлинеарности факторов:
– Проверка гипотезы H0: Det R=1

Пути преодоления сильной
межфакторной корреляции
• Исключение одного или нескольких факторов
• Преобразование факторов для уменьшения
корреляции между ними
– Переход к первым разностям
– Переход к линейным комбинациям (метод главных
компонент)

• Переход к совмещенным уравнениям
регрессии
• Переход к уравнениям приведенной формы

• Предпочтение отдается не фактору,
более тесно связанному с
результатом, а тому фактору,
который при достаточной тесной
связи с результатом имеет
наименьшую тесноту связи с
другими факторами.

• Пусть,
например,
при
изучении
зависимости
матрица парных
коэффициентов корреляции оказалась
следующей:

y

y

x

z

v

1

x

0,8

1

z
v

0,7

0,8

1

0,6

0,5

0,2

1

пример
y

y

x

z

v

1

x

0,3

1

z
v

0,7

0,75

1

0,6

0,5

0,8

1

• Для оценки мультиколлинеарности
факторов
может
использоваться
определитель
матрицы
парных
коэффициентов
корреляции между
факторами.

• Если бы факторы не коррелировали между
собой, то матрица парных коэффициентов
корреляции была бы единичной матрицей т.е.
rx

1 x1

rx

Det R  r x

1x2

rx

1 x3

2 x1

rx

rx

2 x2

rx

3 x2

rx

2 x3

rx

3 x3

3 x1

1

0

0

 0

1

0  1,

0

0

1

• Если же, наоборот, между факторами
существует полная линейная
зависимость и все коэффициенты
корреляции равны единице, то
определитель такой матрицы равен
нулю:
1

1

1

Det R  1

1

1  0.

1

1

1

• Таким образом,

• чем ближе к нулю определитель
матрицы межфакторной корреляции,
тем сильнее мультиколлинеарность
факторов и ненадежнее результаты
множественной регрессии.

• Через коэффициенты множественной
детерминации можно найти
переменные, ответственные за
мультиколлинеарность факторов.

• Сравнивая между собой
коэффициенты множественной
детерминации факторов

R

2
x1 x2 , x3 ... x p

;R

2
x2 x1x3 ... x p

;

• оставляем в уравнении факторы с
минимальной величиной
коэффициента множественной
детерминации.

• При дополнительном включении в
регрессию р+1 фактора коэффициент
детерминации должен возрастать, а
остаточная дисперсия уменьшаться;
R

2
p 1

R

2
p

и S p2 1  S p2 .

• Пусть для регрессии, включающих пять
факторов, коэффициент детерминации
составил 0,857
включение шестого фактора дало
коэффициент детерминации
0,855,

вряд ли целесообразно дополнительно
включать в модель этот фактор.

Оценка параметров уравнения
множественной регрессии
• Метод:
– а) метод наименьших квадратов (МНК)
– б) метод наименьших квадратов (МНК) для
стандартизованного уравнения

• В линейной множественной регрессии


y x  a  b1  x 1  b 2  x 2  ...  b p  x p

параметры при переменной x называются
коэффициентами «чистой» регрессии.
Они характеризуют среднее изменение
результата с изменением соответствующего
фактора на единицу при неизменном
значении других факторов, закрепленном на
среднем уровне.

• уравнение регрессии в стандартизованном
виде:

t y  1 t x   2 t x    b p t x
1

2

p

Где t y , y x ,  , t x
переменные
1

t xi 

xi  xi

x

-стандартизованные

p

ty 

,

i

y y



y

Свойства:

t y  t xi  0,
 t   t  1;
y

x

 i -стандартизованные коэффициенты

регрессии.

• Стандартизованные коэффициенты регрессии
показывают, на сколько % изменится в среднем
результат, если соответствующий фактор xi
изменится на 1 % при неизменном среднем
уровне других факторов.

• Стандартизованные коэффициенты регрессии i
сравнимы между собой.
• Связь между «чистыми» и
«стандартизованными» коэффициентами
регрессии

bi   i



y

x

i

• Пример. Пусть функция издержек
производства y(тыс. руб.)
характеризуется уравнением вида
y  200  1, 2  x1  1,1  x 2  

• x1 - основные производственные
фонды(тыс.руб.)
• х2 - численность занятых в
производстве(чел.)

• уравнение регрессии в стандартизованном
виде выглядит так
t y  0 , 5  t x 1  0 ,8  t x 2 .

• Вывод:

• Достоинство стандартизованных
коэффициентов регрессии:
использовать при отсеве факторов – из
модели исключаются факторы с
наименьшим значением  j

Slide 9

Лекция № 3

множественная
регрессия и
корреляция.

• Уравнение множественной регрессии

y  a  b1 x1  b 2 x 2  ...  b p x p  



Основная
регрессии

цель

множественной

– построить модель с большим числом
факторов, определив при этом влияние
каждого из них в отдельности, а также
совокупное
их
воздействие
на
моделируемый показатель.

например
• Современная потребительская функция
чаще всего рассматривается как модель
вида
С  f ( y, P, M , Z ) ,

•
•
•
•
•

С – потребление;
у – доход;
P – цена,
M – наличные деньги;
Z – ликвидные активы;



Построение
уравнения
множественной
регрессии
начинается с решения вопроса о
спецификации модели.

Условия включения факторов при
построении множественной регрессии.
• 1. факторы должны быть
количественно измеримы.

• 2. Факторы не должны быть
интеркоррелированы.

• Если между факторами существует высокая
корреляция, то параметры уравнения
регрессии оказываются
неинтерпретируемыми.

• Пусть в уравнении

y  a  b1 х 1  b 2  х 2

r x1 x 2  0 .

Если же rx 1 x 2  1
то b 1 , b 2 нельзя интерпретировать как
показатели раздельного влияния x 1 и x 2
на у .

Пример.
• Рассмотрим регрессию себестоимости:
единицы
продукции
(руб.,у)
от
заработной платы работника (руб.,x) и
производительности его труда (единиц в
час, z ):
y  22600  5  x  10  z

•

r xz

= 0,95

Отбор факторов при построении
множественной регрессии.

• 2 этапа отбора факторов:
– факторы подбираются исходя из сущности проблемы;
– на основе корреляционной матрицы производится
исключение части факторов
• 1) проверка парной корреляции,
• 2) оценка мультиколлинеарности факторов:
– Проверка гипотезы H0: Det R=1

Пути преодоления сильной
межфакторной корреляции
• Исключение одного или нескольких факторов
• Преобразование факторов для уменьшения
корреляции между ними
– Переход к первым разностям
– Переход к линейным комбинациям (метод главных
компонент)

• Переход к совмещенным уравнениям
регрессии
• Переход к уравнениям приведенной формы

• Предпочтение отдается не фактору,
более тесно связанному с
результатом, а тому фактору,
который при достаточной тесной
связи с результатом имеет
наименьшую тесноту связи с
другими факторами.

• Пусть,
например,
при
изучении
зависимости
матрица парных
коэффициентов корреляции оказалась
следующей:

y

y

x

z

v

1

x

0,8

1

z
v

0,7

0,8

1

0,6

0,5

0,2

1

пример
y

y

x

z

v

1

x

0,3

1

z
v

0,7

0,75

1

0,6

0,5

0,8

1

• Для оценки мультиколлинеарности
факторов
может
использоваться
определитель
матрицы
парных
коэффициентов
корреляции между
факторами.

• Если бы факторы не коррелировали между
собой, то матрица парных коэффициентов
корреляции была бы единичной матрицей т.е.
rx

1 x1

rx

Det R  r x

1x2

rx

1 x3

2 x1

rx

rx

2 x2

rx

3 x2

rx

2 x3

rx

3 x3

3 x1

1

0

0

 0

1

0  1,

0

0

1

• Если же, наоборот, между факторами
существует полная линейная
зависимость и все коэффициенты
корреляции равны единице, то
определитель такой матрицы равен
нулю:
1

1

1

Det R  1

1

1  0.

1

1

1

• Таким образом,

• чем ближе к нулю определитель
матрицы межфакторной корреляции,
тем сильнее мультиколлинеарность
факторов и ненадежнее результаты
множественной регрессии.

• Через коэффициенты множественной
детерминации можно найти
переменные, ответственные за
мультиколлинеарность факторов.

• Сравнивая между собой
коэффициенты множественной
детерминации факторов

R

2
x1 x2 , x3 ... x p

;R

2
x2 x1x3 ... x p

;

• оставляем в уравнении факторы с
минимальной величиной
коэффициента множественной
детерминации.

• При дополнительном включении в
регрессию р+1 фактора коэффициент
детерминации должен возрастать, а
остаточная дисперсия уменьшаться;
R

2
p 1

R

2
p

и S p2 1  S p2 .

• Пусть для регрессии, включающих пять
факторов, коэффициент детерминации
составил 0,857
включение шестого фактора дало
коэффициент детерминации
0,855,

вряд ли целесообразно дополнительно
включать в модель этот фактор.

Оценка параметров уравнения
множественной регрессии
• Метод:
– а) метод наименьших квадратов (МНК)
– б) метод наименьших квадратов (МНК) для
стандартизованного уравнения

• В линейной множественной регрессии


y x  a  b1  x 1  b 2  x 2  ...  b p  x p

параметры при переменной x называются
коэффициентами «чистой» регрессии.
Они характеризуют среднее изменение
результата с изменением соответствующего
фактора на единицу при неизменном
значении других факторов, закрепленном на
среднем уровне.

• уравнение регрессии в стандартизованном
виде:

t y  1 t x   2 t x    b p t x
1

2

p

Где t y , y x ,  , t x
переменные
1

t xi 

xi  xi

x

-стандартизованные

p

ty 

,

i

y y



y

Свойства:

t y  t xi  0,
 t   t  1;
y

x

 i -стандартизованные коэффициенты

регрессии.

• Стандартизованные коэффициенты регрессии
показывают, на сколько % изменится в среднем
результат, если соответствующий фактор xi
изменится на 1 % при неизменном среднем
уровне других факторов.

• Стандартизованные коэффициенты регрессии i
сравнимы между собой.
• Связь между «чистыми» и
«стандартизованными» коэффициентами
регрессии

bi   i



y

x

i

• Пример. Пусть функция издержек
производства y(тыс. руб.)
характеризуется уравнением вида
y  200  1, 2  x1  1,1  x 2  

• x1 - основные производственные
фонды(тыс.руб.)
• х2 - численность занятых в
производстве(чел.)

• уравнение регрессии в стандартизованном
виде выглядит так
t y  0 , 5  t x 1  0 ,8  t x 2 .

• Вывод:

• Достоинство стандартизованных
коэффициентов регрессии:
использовать при отсеве факторов – из
модели исключаются факторы с
наименьшим значением  j

Slide 10

Лекция № 3

множественная
регрессия и
корреляция.

• Уравнение множественной регрессии

y  a  b1 x1  b 2 x 2  ...  b p x p  



Основная
регрессии

цель

множественной

– построить модель с большим числом
факторов, определив при этом влияние
каждого из них в отдельности, а также
совокупное
их
воздействие
на
моделируемый показатель.

например
• Современная потребительская функция
чаще всего рассматривается как модель
вида
С  f ( y, P, M , Z ) ,

•
•
•
•
•

С – потребление;
у – доход;
P – цена,
M – наличные деньги;
Z – ликвидные активы;



Построение
уравнения
множественной
регрессии
начинается с решения вопроса о
спецификации модели.

Условия включения факторов при
построении множественной регрессии.
• 1. факторы должны быть
количественно измеримы.

• 2. Факторы не должны быть
интеркоррелированы.

• Если между факторами существует высокая
корреляция, то параметры уравнения
регрессии оказываются
неинтерпретируемыми.

• Пусть в уравнении

y  a  b1 х 1  b 2  х 2

r x1 x 2  0 .

Если же rx 1 x 2  1
то b 1 , b 2 нельзя интерпретировать как
показатели раздельного влияния x 1 и x 2
на у .

Пример.
• Рассмотрим регрессию себестоимости:
единицы
продукции
(руб.,у)
от
заработной платы работника (руб.,x) и
производительности его труда (единиц в
час, z ):
y  22600  5  x  10  z

•

r xz

= 0,95

Отбор факторов при построении
множественной регрессии.

• 2 этапа отбора факторов:
– факторы подбираются исходя из сущности проблемы;
– на основе корреляционной матрицы производится
исключение части факторов
• 1) проверка парной корреляции,
• 2) оценка мультиколлинеарности факторов:
– Проверка гипотезы H0: Det R=1

Пути преодоления сильной
межфакторной корреляции
• Исключение одного или нескольких факторов
• Преобразование факторов для уменьшения
корреляции между ними
– Переход к первым разностям
– Переход к линейным комбинациям (метод главных
компонент)

• Переход к совмещенным уравнениям
регрессии
• Переход к уравнениям приведенной формы

• Предпочтение отдается не фактору,
более тесно связанному с
результатом, а тому фактору,
который при достаточной тесной
связи с результатом имеет
наименьшую тесноту связи с
другими факторами.

• Пусть,
например,
при
изучении
зависимости
матрица парных
коэффициентов корреляции оказалась
следующей:

y

y

x

z

v

1

x

0,8

1

z
v

0,7

0,8

1

0,6

0,5

0,2

1

пример
y

y

x

z

v

1

x

0,3

1

z
v

0,7

0,75

1

0,6

0,5

0,8

1

• Для оценки мультиколлинеарности
факторов
может
использоваться
определитель
матрицы
парных
коэффициентов
корреляции между
факторами.

• Если бы факторы не коррелировали между
собой, то матрица парных коэффициентов
корреляции была бы единичной матрицей т.е.
rx

1 x1

rx

Det R  r x

1x2

rx

1 x3

2 x1

rx

rx

2 x2

rx

3 x2

rx

2 x3

rx

3 x3

3 x1

1

0

0

 0

1

0  1,

0

0

1

• Если же, наоборот, между факторами
существует полная линейная
зависимость и все коэффициенты
корреляции равны единице, то
определитель такой матрицы равен
нулю:
1

1

1

Det R  1

1

1  0.

1

1

1

• Таким образом,

• чем ближе к нулю определитель
матрицы межфакторной корреляции,
тем сильнее мультиколлинеарность
факторов и ненадежнее результаты
множественной регрессии.

• Через коэффициенты множественной
детерминации можно найти
переменные, ответственные за
мультиколлинеарность факторов.

• Сравнивая между собой
коэффициенты множественной
детерминации факторов

R

2
x1 x2 , x3 ... x p

;R

2
x2 x1x3 ... x p

;

• оставляем в уравнении факторы с
минимальной величиной
коэффициента множественной
детерминации.

• При дополнительном включении в
регрессию р+1 фактора коэффициент
детерминации должен возрастать, а
остаточная дисперсия уменьшаться;
R

2
p 1

R

2
p

и S p2 1  S p2 .

• Пусть для регрессии, включающих пять
факторов, коэффициент детерминации
составил 0,857
включение шестого фактора дало
коэффициент детерминации
0,855,

вряд ли целесообразно дополнительно
включать в модель этот фактор.

Оценка параметров уравнения
множественной регрессии
• Метод:
– а) метод наименьших квадратов (МНК)
– б) метод наименьших квадратов (МНК) для
стандартизованного уравнения

• В линейной множественной регрессии


y x  a  b1  x 1  b 2  x 2  ...  b p  x p

параметры при переменной x называются
коэффициентами «чистой» регрессии.
Они характеризуют среднее изменение
результата с изменением соответствующего
фактора на единицу при неизменном
значении других факторов, закрепленном на
среднем уровне.

• уравнение регрессии в стандартизованном
виде:

t y  1 t x   2 t x    b p t x
1

2

p

Где t y , y x ,  , t x
переменные
1

t xi 

xi  xi

x

-стандартизованные

p

ty 

,

i

y y



y

Свойства:

t y  t xi  0,
 t   t  1;
y

x

 i -стандартизованные коэффициенты

регрессии.

• Стандартизованные коэффициенты регрессии
показывают, на сколько % изменится в среднем
результат, если соответствующий фактор xi
изменится на 1 % при неизменном среднем
уровне других факторов.

• Стандартизованные коэффициенты регрессии i
сравнимы между собой.
• Связь между «чистыми» и
«стандартизованными» коэффициентами
регрессии

bi   i



y

x

i

• Пример. Пусть функция издержек
производства y(тыс. руб.)
характеризуется уравнением вида
y  200  1, 2  x1  1,1  x 2  

• x1 - основные производственные
фонды(тыс.руб.)
• х2 - численность занятых в
производстве(чел.)

• уравнение регрессии в стандартизованном
виде выглядит так
t y  0 , 5  t x 1  0 ,8  t x 2 .

• Вывод:

• Достоинство стандартизованных
коэффициентов регрессии:
использовать при отсеве факторов – из
модели исключаются факторы с
наименьшим значением  j

Slide 11

Лекция № 3

множественная
регрессия и
корреляция.

• Уравнение множественной регрессии

y  a  b1 x1  b 2 x 2  ...  b p x p  



Основная
регрессии

цель

множественной

– построить модель с большим числом
факторов, определив при этом влияние
каждого из них в отдельности, а также
совокупное
их
воздействие
на
моделируемый показатель.

например
• Современная потребительская функция
чаще всего рассматривается как модель
вида
С  f ( y, P, M , Z ) ,

•
•
•
•
•

С – потребление;
у – доход;
P – цена,
M – наличные деньги;
Z – ликвидные активы;



Построение
уравнения
множественной
регрессии
начинается с решения вопроса о
спецификации модели.

Условия включения факторов при
построении множественной регрессии.
• 1. факторы должны быть
количественно измеримы.

• 2. Факторы не должны быть
интеркоррелированы.

• Если между факторами существует высокая
корреляция, то параметры уравнения
регрессии оказываются
неинтерпретируемыми.

• Пусть в уравнении

y  a  b1 х 1  b 2  х 2

r x1 x 2  0 .

Если же rx 1 x 2  1
то b 1 , b 2 нельзя интерпретировать как
показатели раздельного влияния x 1 и x 2
на у .

Пример.
• Рассмотрим регрессию себестоимости:
единицы
продукции
(руб.,у)
от
заработной платы работника (руб.,x) и
производительности его труда (единиц в
час, z ):
y  22600  5  x  10  z

•

r xz

= 0,95

Отбор факторов при построении
множественной регрессии.

• 2 этапа отбора факторов:
– факторы подбираются исходя из сущности проблемы;
– на основе корреляционной матрицы производится
исключение части факторов
• 1) проверка парной корреляции,
• 2) оценка мультиколлинеарности факторов:
– Проверка гипотезы H0: Det R=1

Пути преодоления сильной
межфакторной корреляции
• Исключение одного или нескольких факторов
• Преобразование факторов для уменьшения
корреляции между ними
– Переход к первым разностям
– Переход к линейным комбинациям (метод главных
компонент)

• Переход к совмещенным уравнениям
регрессии
• Переход к уравнениям приведенной формы

• Предпочтение отдается не фактору,
более тесно связанному с
результатом, а тому фактору,
который при достаточной тесной
связи с результатом имеет
наименьшую тесноту связи с
другими факторами.

• Пусть,
например,
при
изучении
зависимости
матрица парных
коэффициентов корреляции оказалась
следующей:

y

y

x

z

v

1

x

0,8

1

z
v

0,7

0,8

1

0,6

0,5

0,2

1

пример
y

y

x

z

v

1

x

0,3

1

z
v

0,7

0,75

1

0,6

0,5

0,8

1

• Для оценки мультиколлинеарности
факторов
может
использоваться
определитель
матрицы
парных
коэффициентов
корреляции между
факторами.

• Если бы факторы не коррелировали между
собой, то матрица парных коэффициентов
корреляции была бы единичной матрицей т.е.
rx

1 x1

rx

Det R  r x

1x2

rx

1 x3

2 x1

rx

rx

2 x2

rx

3 x2

rx

2 x3

rx

3 x3

3 x1

1

0

0

 0

1

0  1,

0

0

1

• Если же, наоборот, между факторами
существует полная линейная
зависимость и все коэффициенты
корреляции равны единице, то
определитель такой матрицы равен
нулю:
1

1

1

Det R  1

1

1  0.

1

1

1

• Таким образом,

• чем ближе к нулю определитель
матрицы межфакторной корреляции,
тем сильнее мультиколлинеарность
факторов и ненадежнее результаты
множественной регрессии.

• Через коэффициенты множественной
детерминации можно найти
переменные, ответственные за
мультиколлинеарность факторов.

• Сравнивая между собой
коэффициенты множественной
детерминации факторов

R

2
x1 x2 , x3 ... x p

;R

2
x2 x1x3 ... x p

;

• оставляем в уравнении факторы с
минимальной величиной
коэффициента множественной
детерминации.

• При дополнительном включении в
регрессию р+1 фактора коэффициент
детерминации должен возрастать, а
остаточная дисперсия уменьшаться;
R

2
p 1

R

2
p

и S p2 1  S p2 .

• Пусть для регрессии, включающих пять
факторов, коэффициент детерминации
составил 0,857
включение шестого фактора дало
коэффициент детерминации
0,855,

вряд ли целесообразно дополнительно
включать в модель этот фактор.

Оценка параметров уравнения
множественной регрессии
• Метод:
– а) метод наименьших квадратов (МНК)
– б) метод наименьших квадратов (МНК) для
стандартизованного уравнения

• В линейной множественной регрессии


y x  a  b1  x 1  b 2  x 2  ...  b p  x p

параметры при переменной x называются
коэффициентами «чистой» регрессии.
Они характеризуют среднее изменение
результата с изменением соответствующего
фактора на единицу при неизменном
значении других факторов, закрепленном на
среднем уровне.

• уравнение регрессии в стандартизованном
виде:

t y  1 t x   2 t x    b p t x
1

2

p

Где t y , y x ,  , t x
переменные
1

t xi 

xi  xi

x

-стандартизованные

p

ty 

,

i

y y



y

Свойства:

t y  t xi  0,
 t   t  1;
y

x

 i -стандартизованные коэффициенты

регрессии.

• Стандартизованные коэффициенты регрессии
показывают, на сколько % изменится в среднем
результат, если соответствующий фактор xi
изменится на 1 % при неизменном среднем
уровне других факторов.

• Стандартизованные коэффициенты регрессии i
сравнимы между собой.
• Связь между «чистыми» и
«стандартизованными» коэффициентами
регрессии

bi   i



y

x

i

• Пример. Пусть функция издержек
производства y(тыс. руб.)
характеризуется уравнением вида
y  200  1, 2  x1  1,1  x 2  

• x1 - основные производственные
фонды(тыс.руб.)
• х2 - численность занятых в
производстве(чел.)

• уравнение регрессии в стандартизованном
виде выглядит так
t y  0 , 5  t x 1  0 ,8  t x 2 .

• Вывод:

• Достоинство стандартизованных
коэффициентов регрессии:
использовать при отсеве факторов – из
модели исключаются факторы с
наименьшим значением  j

Slide 12

Лекция № 3

множественная
регрессия и
корреляция.

• Уравнение множественной регрессии

y  a  b1 x1  b 2 x 2  ...  b p x p  



Основная
регрессии

цель

множественной

– построить модель с большим числом
факторов, определив при этом влияние
каждого из них в отдельности, а также
совокупное
их
воздействие
на
моделируемый показатель.

например
• Современная потребительская функция
чаще всего рассматривается как модель
вида
С  f ( y, P, M , Z ) ,

•
•
•
•
•

С – потребление;
у – доход;
P – цена,
M – наличные деньги;
Z – ликвидные активы;



Построение
уравнения
множественной
регрессии
начинается с решения вопроса о
спецификации модели.

Условия включения факторов при
построении множественной регрессии.
• 1. факторы должны быть
количественно измеримы.

• 2. Факторы не должны быть
интеркоррелированы.

• Если между факторами существует высокая
корреляция, то параметры уравнения
регрессии оказываются
неинтерпретируемыми.

• Пусть в уравнении

y  a  b1 х 1  b 2  х 2

r x1 x 2  0 .

Если же rx 1 x 2  1
то b 1 , b 2 нельзя интерпретировать как
показатели раздельного влияния x 1 и x 2
на у .

Пример.
• Рассмотрим регрессию себестоимости:
единицы
продукции
(руб.,у)
от
заработной платы работника (руб.,x) и
производительности его труда (единиц в
час, z ):
y  22600  5  x  10  z

•

r xz

= 0,95

Отбор факторов при построении
множественной регрессии.

• 2 этапа отбора факторов:
– факторы подбираются исходя из сущности проблемы;
– на основе корреляционной матрицы производится
исключение части факторов
• 1) проверка парной корреляции,
• 2) оценка мультиколлинеарности факторов:
– Проверка гипотезы H0: Det R=1

Пути преодоления сильной
межфакторной корреляции
• Исключение одного или нескольких факторов
• Преобразование факторов для уменьшения
корреляции между ними
– Переход к первым разностям
– Переход к линейным комбинациям (метод главных
компонент)

• Переход к совмещенным уравнениям
регрессии
• Переход к уравнениям приведенной формы

• Предпочтение отдается не фактору,
более тесно связанному с
результатом, а тому фактору,
который при достаточной тесной
связи с результатом имеет
наименьшую тесноту связи с
другими факторами.

• Пусть,
например,
при
изучении
зависимости
матрица парных
коэффициентов корреляции оказалась
следующей:

y

y

x

z

v

1

x

0,8

1

z
v

0,7

0,8

1

0,6

0,5

0,2

1

пример
y

y

x

z

v

1

x

0,3

1

z
v

0,7

0,75

1

0,6

0,5

0,8

1

• Для оценки мультиколлинеарности
факторов
может
использоваться
определитель
матрицы
парных
коэффициентов
корреляции между
факторами.

• Если бы факторы не коррелировали между
собой, то матрица парных коэффициентов
корреляции была бы единичной матрицей т.е.
rx

1 x1

rx

Det R  r x

1x2

rx

1 x3

2 x1

rx

rx

2 x2

rx

3 x2

rx

2 x3

rx

3 x3

3 x1

1

0

0

 0

1

0  1,

0

0

1

• Если же, наоборот, между факторами
существует полная линейная
зависимость и все коэффициенты
корреляции равны единице, то
определитель такой матрицы равен
нулю:
1

1

1

Det R  1

1

1  0.

1

1

1

• Таким образом,

• чем ближе к нулю определитель
матрицы межфакторной корреляции,
тем сильнее мультиколлинеарность
факторов и ненадежнее результаты
множественной регрессии.

• Через коэффициенты множественной
детерминации можно найти
переменные, ответственные за
мультиколлинеарность факторов.

• Сравнивая между собой
коэффициенты множественной
детерминации факторов

R

2
x1 x2 , x3 ... x p

;R

2
x2 x1x3 ... x p

;

• оставляем в уравнении факторы с
минимальной величиной
коэффициента множественной
детерминации.

• При дополнительном включении в
регрессию р+1 фактора коэффициент
детерминации должен возрастать, а
остаточная дисперсия уменьшаться;
R

2
p 1

R

2
p

и S p2 1  S p2 .

• Пусть для регрессии, включающих пять
факторов, коэффициент детерминации
составил 0,857
включение шестого фактора дало
коэффициент детерминации
0,855,

вряд ли целесообразно дополнительно
включать в модель этот фактор.

Оценка параметров уравнения
множественной регрессии
• Метод:
– а) метод наименьших квадратов (МНК)
– б) метод наименьших квадратов (МНК) для
стандартизованного уравнения

• В линейной множественной регрессии


y x  a  b1  x 1  b 2  x 2  ...  b p  x p

параметры при переменной x называются
коэффициентами «чистой» регрессии.
Они характеризуют среднее изменение
результата с изменением соответствующего
фактора на единицу при неизменном
значении других факторов, закрепленном на
среднем уровне.

• уравнение регрессии в стандартизованном
виде:

t y  1 t x   2 t x    b p t x
1

2

p

Где t y , y x ,  , t x
переменные
1

t xi 

xi  xi

x

-стандартизованные

p

ty 

,

i

y y



y

Свойства:

t y  t xi  0,
 t   t  1;
y

x

 i -стандартизованные коэффициенты

регрессии.

• Стандартизованные коэффициенты регрессии
показывают, на сколько % изменится в среднем
результат, если соответствующий фактор xi
изменится на 1 % при неизменном среднем
уровне других факторов.

• Стандартизованные коэффициенты регрессии i
сравнимы между собой.
• Связь между «чистыми» и
«стандартизованными» коэффициентами
регрессии

bi   i



y

x

i

• Пример. Пусть функция издержек
производства y(тыс. руб.)
характеризуется уравнением вида
y  200  1, 2  x1  1,1  x 2  

• x1 - основные производственные
фонды(тыс.руб.)
• х2 - численность занятых в
производстве(чел.)

• уравнение регрессии в стандартизованном
виде выглядит так
t y  0 , 5  t x 1  0 ,8  t x 2 .

• Вывод:

• Достоинство стандартизованных
коэффициентов регрессии:
использовать при отсеве факторов – из
модели исключаются факторы с
наименьшим значением  j

Slide 13

Лекция № 3

множественная
регрессия и
корреляция.

• Уравнение множественной регрессии

y  a  b1 x1  b 2 x 2  ...  b p x p  



Основная
регрессии

цель

множественной

– построить модель с большим числом
факторов, определив при этом влияние
каждого из них в отдельности, а также
совокупное
их
воздействие
на
моделируемый показатель.

например
• Современная потребительская функция
чаще всего рассматривается как модель
вида
С  f ( y, P, M , Z ) ,

•
•
•
•
•

С – потребление;
у – доход;
P – цена,
M – наличные деньги;
Z – ликвидные активы;



Построение
уравнения
множественной
регрессии
начинается с решения вопроса о
спецификации модели.

Условия включения факторов при
построении множественной регрессии.
• 1. факторы должны быть
количественно измеримы.

• 2. Факторы не должны быть
интеркоррелированы.

• Если между факторами существует высокая
корреляция, то параметры уравнения
регрессии оказываются
неинтерпретируемыми.

• Пусть в уравнении

y  a  b1 х 1  b 2  х 2

r x1 x 2  0 .

Если же rx 1 x 2  1
то b 1 , b 2 нельзя интерпретировать как
показатели раздельного влияния x 1 и x 2
на у .

Пример.
• Рассмотрим регрессию себестоимости:
единицы
продукции
(руб.,у)
от
заработной платы работника (руб.,x) и
производительности его труда (единиц в
час, z ):
y  22600  5  x  10  z

•

r xz

= 0,95

Отбор факторов при построении
множественной регрессии.

• 2 этапа отбора факторов:
– факторы подбираются исходя из сущности проблемы;
– на основе корреляционной матрицы производится
исключение части факторов
• 1) проверка парной корреляции,
• 2) оценка мультиколлинеарности факторов:
– Проверка гипотезы H0: Det R=1

Пути преодоления сильной
межфакторной корреляции
• Исключение одного или нескольких факторов
• Преобразование факторов для уменьшения
корреляции между ними
– Переход к первым разностям
– Переход к линейным комбинациям (метод главных
компонент)

• Переход к совмещенным уравнениям
регрессии
• Переход к уравнениям приведенной формы

• Предпочтение отдается не фактору,
более тесно связанному с
результатом, а тому фактору,
который при достаточной тесной
связи с результатом имеет
наименьшую тесноту связи с
другими факторами.

• Пусть,
например,
при
изучении
зависимости
матрица парных
коэффициентов корреляции оказалась
следующей:

y

y

x

z

v

1

x

0,8

1

z
v

0,7

0,8

1

0,6

0,5

0,2

1

пример
y

y

x

z

v

1

x

0,3

1

z
v

0,7

0,75

1

0,6

0,5

0,8

1

• Для оценки мультиколлинеарности
факторов
может
использоваться
определитель
матрицы
парных
коэффициентов
корреляции между
факторами.

• Если бы факторы не коррелировали между
собой, то матрица парных коэффициентов
корреляции была бы единичной матрицей т.е.
rx

1 x1

rx

Det R  r x

1x2

rx

1 x3

2 x1

rx

rx

2 x2

rx

3 x2

rx

2 x3

rx

3 x3

3 x1

1

0

0

 0

1

0  1,

0

0

1

• Если же, наоборот, между факторами
существует полная линейная
зависимость и все коэффициенты
корреляции равны единице, то
определитель такой матрицы равен
нулю:
1

1

1

Det R  1

1

1  0.

1

1

1

• Таким образом,

• чем ближе к нулю определитель
матрицы межфакторной корреляции,
тем сильнее мультиколлинеарность
факторов и ненадежнее результаты
множественной регрессии.

• Через коэффициенты множественной
детерминации можно найти
переменные, ответственные за
мультиколлинеарность факторов.

• Сравнивая между собой
коэффициенты множественной
детерминации факторов

R

2
x1 x2 , x3 ... x p

;R

2
x2 x1x3 ... x p

;

• оставляем в уравнении факторы с
минимальной величиной
коэффициента множественной
детерминации.

• При дополнительном включении в
регрессию р+1 фактора коэффициент
детерминации должен возрастать, а
остаточная дисперсия уменьшаться;
R

2
p 1

R

2
p

и S p2 1  S p2 .

• Пусть для регрессии, включающих пять
факторов, коэффициент детерминации
составил 0,857
включение шестого фактора дало
коэффициент детерминации
0,855,

вряд ли целесообразно дополнительно
включать в модель этот фактор.

Оценка параметров уравнения
множественной регрессии
• Метод:
– а) метод наименьших квадратов (МНК)
– б) метод наименьших квадратов (МНК) для
стандартизованного уравнения

• В линейной множественной регрессии


y x  a  b1  x 1  b 2  x 2  ...  b p  x p

параметры при переменной x называются
коэффициентами «чистой» регрессии.
Они характеризуют среднее изменение
результата с изменением соответствующего
фактора на единицу при неизменном
значении других факторов, закрепленном на
среднем уровне.

• уравнение регрессии в стандартизованном
виде:

t y  1 t x   2 t x    b p t x
1

2

p

Где t y , y x ,  , t x
переменные
1

t xi 

xi  xi

x

-стандартизованные

p

ty 

,

i

y y



y

Свойства:

t y  t xi  0,
 t   t  1;
y

x

 i -стандартизованные коэффициенты

регрессии.

• Стандартизованные коэффициенты регрессии
показывают, на сколько % изменится в среднем
результат, если соответствующий фактор xi
изменится на 1 % при неизменном среднем
уровне других факторов.

• Стандартизованные коэффициенты регрессии i
сравнимы между собой.
• Связь между «чистыми» и
«стандартизованными» коэффициентами
регрессии

bi   i



y

x

i

• Пример. Пусть функция издержек
производства y(тыс. руб.)
характеризуется уравнением вида
y  200  1, 2  x1  1,1  x 2  

• x1 - основные производственные
фонды(тыс.руб.)
• х2 - численность занятых в
производстве(чел.)

• уравнение регрессии в стандартизованном
виде выглядит так
t y  0 , 5  t x 1  0 ,8  t x 2 .

• Вывод:

• Достоинство стандартизованных
коэффициентов регрессии:
использовать при отсеве факторов – из
модели исключаются факторы с
наименьшим значением  j

Slide 14

Лекция № 3

множественная
регрессия и
корреляция.

• Уравнение множественной регрессии

y  a  b1 x1  b 2 x 2  ...  b p x p  



Основная
регрессии

цель

множественной

– построить модель с большим числом
факторов, определив при этом влияние
каждого из них в отдельности, а также
совокупное
их
воздействие
на
моделируемый показатель.

например
• Современная потребительская функция
чаще всего рассматривается как модель
вида
С  f ( y, P, M , Z ) ,

•
•
•
•
•

С – потребление;
у – доход;
P – цена,
M – наличные деньги;
Z – ликвидные активы;



Построение
уравнения
множественной
регрессии
начинается с решения вопроса о
спецификации модели.

Условия включения факторов при
построении множественной регрессии.
• 1. факторы должны быть
количественно измеримы.

• 2. Факторы не должны быть
интеркоррелированы.

• Если между факторами существует высокая
корреляция, то параметры уравнения
регрессии оказываются
неинтерпретируемыми.

• Пусть в уравнении

y  a  b1 х 1  b 2  х 2

r x1 x 2  0 .

Если же rx 1 x 2  1
то b 1 , b 2 нельзя интерпретировать как
показатели раздельного влияния x 1 и x 2
на у .

Пример.
• Рассмотрим регрессию себестоимости:
единицы
продукции
(руб.,у)
от
заработной платы работника (руб.,x) и
производительности его труда (единиц в
час, z ):
y  22600  5  x  10  z

•

r xz

= 0,95

Отбор факторов при построении
множественной регрессии.

• 2 этапа отбора факторов:
– факторы подбираются исходя из сущности проблемы;
– на основе корреляционной матрицы производится
исключение части факторов
• 1) проверка парной корреляции,
• 2) оценка мультиколлинеарности факторов:
– Проверка гипотезы H0: Det R=1

Пути преодоления сильной
межфакторной корреляции
• Исключение одного или нескольких факторов
• Преобразование факторов для уменьшения
корреляции между ними
– Переход к первым разностям
– Переход к линейным комбинациям (метод главных
компонент)

• Переход к совмещенным уравнениям
регрессии
• Переход к уравнениям приведенной формы

• Предпочтение отдается не фактору,
более тесно связанному с
результатом, а тому фактору,
который при достаточной тесной
связи с результатом имеет
наименьшую тесноту связи с
другими факторами.

• Пусть,
например,
при
изучении
зависимости
матрица парных
коэффициентов корреляции оказалась
следующей:

y

y

x

z

v

1

x

0,8

1

z
v

0,7

0,8

1

0,6

0,5

0,2

1

пример
y

y

x

z

v

1

x

0,3

1

z
v

0,7

0,75

1

0,6

0,5

0,8

1

• Для оценки мультиколлинеарности
факторов
может
использоваться
определитель
матрицы
парных
коэффициентов
корреляции между
факторами.

• Если бы факторы не коррелировали между
собой, то матрица парных коэффициентов
корреляции была бы единичной матрицей т.е.
rx

1 x1

rx

Det R  r x

1x2

rx

1 x3

2 x1

rx

rx

2 x2

rx

3 x2

rx

2 x3

rx

3 x3

3 x1

1

0

0

 0

1

0  1,

0

0

1

• Если же, наоборот, между факторами
существует полная линейная
зависимость и все коэффициенты
корреляции равны единице, то
определитель такой матрицы равен
нулю:
1

1

1

Det R  1

1

1  0.

1

1

1

• Таким образом,

• чем ближе к нулю определитель
матрицы межфакторной корреляции,
тем сильнее мультиколлинеарность
факторов и ненадежнее результаты
множественной регрессии.

• Через коэффициенты множественной
детерминации можно найти
переменные, ответственные за
мультиколлинеарность факторов.

• Сравнивая между собой
коэффициенты множественной
детерминации факторов

R

2
x1 x2 , x3 ... x p

;R

2
x2 x1x3 ... x p

;

• оставляем в уравнении факторы с
минимальной величиной
коэффициента множественной
детерминации.

• При дополнительном включении в
регрессию р+1 фактора коэффициент
детерминации должен возрастать, а
остаточная дисперсия уменьшаться;
R

2
p 1

R

2
p

и S p2 1  S p2 .

• Пусть для регрессии, включающих пять
факторов, коэффициент детерминации
составил 0,857
включение шестого фактора дало
коэффициент детерминации
0,855,

вряд ли целесообразно дополнительно
включать в модель этот фактор.

Оценка параметров уравнения
множественной регрессии
• Метод:
– а) метод наименьших квадратов (МНК)
– б) метод наименьших квадратов (МНК) для
стандартизованного уравнения

• В линейной множественной регрессии


y x  a  b1  x 1  b 2  x 2  ...  b p  x p

параметры при переменной x называются
коэффициентами «чистой» регрессии.
Они характеризуют среднее изменение
результата с изменением соответствующего
фактора на единицу при неизменном
значении других факторов, закрепленном на
среднем уровне.

• уравнение регрессии в стандартизованном
виде:

t y  1 t x   2 t x    b p t x
1

2

p

Где t y , y x ,  , t x
переменные
1

t xi 

xi  xi

x

-стандартизованные

p

ty 

,

i

y y



y

Свойства:

t y  t xi  0,
 t   t  1;
y

x

 i -стандартизованные коэффициенты

регрессии.

• Стандартизованные коэффициенты регрессии
показывают, на сколько % изменится в среднем
результат, если соответствующий фактор xi
изменится на 1 % при неизменном среднем
уровне других факторов.

• Стандартизованные коэффициенты регрессии i
сравнимы между собой.
• Связь между «чистыми» и
«стандартизованными» коэффициентами
регрессии

bi   i



y

x

i

• Пример. Пусть функция издержек
производства y(тыс. руб.)
характеризуется уравнением вида
y  200  1, 2  x1  1,1  x 2  

• x1 - основные производственные
фонды(тыс.руб.)
• х2 - численность занятых в
производстве(чел.)

• уравнение регрессии в стандартизованном
виде выглядит так
t y  0 , 5  t x 1  0 ,8  t x 2 .

• Вывод:

• Достоинство стандартизованных
коэффициентов регрессии:
использовать при отсеве факторов – из
модели исключаются факторы с
наименьшим значением  j

Slide 15

Лекция № 3

множественная
регрессия и
корреляция.

• Уравнение множественной регрессии

y  a  b1 x1  b 2 x 2  ...  b p x p  



Основная
регрессии

цель

множественной

– построить модель с большим числом
факторов, определив при этом влияние
каждого из них в отдельности, а также
совокупное
их
воздействие
на
моделируемый показатель.

например
• Современная потребительская функция
чаще всего рассматривается как модель
вида
С  f ( y, P, M , Z ) ,

•
•
•
•
•

С – потребление;
у – доход;
P – цена,
M – наличные деньги;
Z – ликвидные активы;



Построение
уравнения
множественной
регрессии
начинается с решения вопроса о
спецификации модели.

Условия включения факторов при
построении множественной регрессии.
• 1. факторы должны быть
количественно измеримы.

• 2. Факторы не должны быть
интеркоррелированы.

• Если между факторами существует высокая
корреляция, то параметры уравнения
регрессии оказываются
неинтерпретируемыми.

• Пусть в уравнении

y  a  b1 х 1  b 2  х 2

r x1 x 2  0 .

Если же rx 1 x 2  1
то b 1 , b 2 нельзя интерпретировать как
показатели раздельного влияния x 1 и x 2
на у .

Пример.
• Рассмотрим регрессию себестоимости:
единицы
продукции
(руб.,у)
от
заработной платы работника (руб.,x) и
производительности его труда (единиц в
час, z ):
y  22600  5  x  10  z

•

r xz

= 0,95

Отбор факторов при построении
множественной регрессии.

• 2 этапа отбора факторов:
– факторы подбираются исходя из сущности проблемы;
– на основе корреляционной матрицы производится
исключение части факторов
• 1) проверка парной корреляции,
• 2) оценка мультиколлинеарности факторов:
– Проверка гипотезы H0: Det R=1

Пути преодоления сильной
межфакторной корреляции
• Исключение одного или нескольких факторов
• Преобразование факторов для уменьшения
корреляции между ними
– Переход к первым разностям
– Переход к линейным комбинациям (метод главных
компонент)

• Переход к совмещенным уравнениям
регрессии
• Переход к уравнениям приведенной формы

• Предпочтение отдается не фактору,
более тесно связанному с
результатом, а тому фактору,
который при достаточной тесной
связи с результатом имеет
наименьшую тесноту связи с
другими факторами.

• Пусть,
например,
при
изучении
зависимости
матрица парных
коэффициентов корреляции оказалась
следующей:

y

y

x

z

v

1

x

0,8

1

z
v

0,7

0,8

1

0,6

0,5

0,2

1

пример
y

y

x

z

v

1

x

0,3

1

z
v

0,7

0,75

1

0,6

0,5

0,8

1

• Для оценки мультиколлинеарности
факторов
может
использоваться
определитель
матрицы
парных
коэффициентов
корреляции между
факторами.

• Если бы факторы не коррелировали между
собой, то матрица парных коэффициентов
корреляции была бы единичной матрицей т.е.
rx

1 x1

rx

Det R  r x

1x2

rx

1 x3

2 x1

rx

rx

2 x2

rx

3 x2

rx

2 x3

rx

3 x3

3 x1

1

0

0

 0

1

0  1,

0

0

1

• Если же, наоборот, между факторами
существует полная линейная
зависимость и все коэффициенты
корреляции равны единице, то
определитель такой матрицы равен
нулю:
1

1

1

Det R  1

1

1  0.

1

1

1

• Таким образом,

• чем ближе к нулю определитель
матрицы межфакторной корреляции,
тем сильнее мультиколлинеарность
факторов и ненадежнее результаты
множественной регрессии.

• Через коэффициенты множественной
детерминации можно найти
переменные, ответственные за
мультиколлинеарность факторов.

• Сравнивая между собой
коэффициенты множественной
детерминации факторов

R

2
x1 x2 , x3 ... x p

;R

2
x2 x1x3 ... x p

;

• оставляем в уравнении факторы с
минимальной величиной
коэффициента множественной
детерминации.

• При дополнительном включении в
регрессию р+1 фактора коэффициент
детерминации должен возрастать, а
остаточная дисперсия уменьшаться;
R

2
p 1

R

2
p

и S p2 1  S p2 .

• Пусть для регрессии, включающих пять
факторов, коэффициент детерминации
составил 0,857
включение шестого фактора дало
коэффициент детерминации
0,855,

вряд ли целесообразно дополнительно
включать в модель этот фактор.

Оценка параметров уравнения
множественной регрессии
• Метод:
– а) метод наименьших квадратов (МНК)
– б) метод наименьших квадратов (МНК) для
стандартизованного уравнения

• В линейной множественной регрессии


y x  a  b1  x 1  b 2  x 2  ...  b p  x p

параметры при переменной x называются
коэффициентами «чистой» регрессии.
Они характеризуют среднее изменение
результата с изменением соответствующего
фактора на единицу при неизменном
значении других факторов, закрепленном на
среднем уровне.

• уравнение регрессии в стандартизованном
виде:

t y  1 t x   2 t x    b p t x
1

2

p

Где t y , y x ,  , t x
переменные
1

t xi 

xi  xi

x

-стандартизованные

p

ty 

,

i

y y



y

Свойства:

t y  t xi  0,
 t   t  1;
y

x

 i -стандартизованные коэффициенты

регрессии.

• Стандартизованные коэффициенты регрессии
показывают, на сколько % изменится в среднем
результат, если соответствующий фактор xi
изменится на 1 % при неизменном среднем
уровне других факторов.

• Стандартизованные коэффициенты регрессии i
сравнимы между собой.
• Связь между «чистыми» и
«стандартизованными» коэффициентами
регрессии

bi   i



y

x

i

• Пример. Пусть функция издержек
производства y(тыс. руб.)
характеризуется уравнением вида
y  200  1, 2  x1  1,1  x 2  

• x1 - основные производственные
фонды(тыс.руб.)
• х2 - численность занятых в
производстве(чел.)

• уравнение регрессии в стандартизованном
виде выглядит так
t y  0 , 5  t x 1  0 ,8  t x 2 .

• Вывод:

• Достоинство стандартизованных
коэффициентов регрессии:
использовать при отсеве факторов – из
модели исключаются факторы с
наименьшим значением  j

Slide 16

Лекция № 3

множественная
регрессия и
корреляция.

• Уравнение множественной регрессии

y  a  b1 x1  b 2 x 2  ...  b p x p  



Основная
регрессии

цель

множественной

– построить модель с большим числом
факторов, определив при этом влияние
каждого из них в отдельности, а также
совокупное
их
воздействие
на
моделируемый показатель.

например
• Современная потребительская функция
чаще всего рассматривается как модель
вида
С  f ( y, P, M , Z ) ,

•
•
•
•
•

С – потребление;
у – доход;
P – цена,
M – наличные деньги;
Z – ликвидные активы;



Построение
уравнения
множественной
регрессии
начинается с решения вопроса о
спецификации модели.

Условия включения факторов при
построении множественной регрессии.
• 1. факторы должны быть
количественно измеримы.

• 2. Факторы не должны быть
интеркоррелированы.

• Если между факторами существует высокая
корреляция, то параметры уравнения
регрессии оказываются
неинтерпретируемыми.

• Пусть в уравнении

y  a  b1 х 1  b 2  х 2

r x1 x 2  0 .

Если же rx 1 x 2  1
то b 1 , b 2 нельзя интерпретировать как
показатели раздельного влияния x 1 и x 2
на у .

Пример.
• Рассмотрим регрессию себестоимости:
единицы
продукции
(руб.,у)
от
заработной платы работника (руб.,x) и
производительности его труда (единиц в
час, z ):
y  22600  5  x  10  z

•

r xz

= 0,95

Отбор факторов при построении
множественной регрессии.

• 2 этапа отбора факторов:
– факторы подбираются исходя из сущности проблемы;
– на основе корреляционной матрицы производится
исключение части факторов
• 1) проверка парной корреляции,
• 2) оценка мультиколлинеарности факторов:
– Проверка гипотезы H0: Det R=1

Пути преодоления сильной
межфакторной корреляции
• Исключение одного или нескольких факторов
• Преобразование факторов для уменьшения
корреляции между ними
– Переход к первым разностям
– Переход к линейным комбинациям (метод главных
компонент)

• Переход к совмещенным уравнениям
регрессии
• Переход к уравнениям приведенной формы

• Предпочтение отдается не фактору,
более тесно связанному с
результатом, а тому фактору,
который при достаточной тесной
связи с результатом имеет
наименьшую тесноту связи с
другими факторами.

• Пусть,
например,
при
изучении
зависимости
матрица парных
коэффициентов корреляции оказалась
следующей:

y

y

x

z

v

1

x

0,8

1

z
v

0,7

0,8

1

0,6

0,5

0,2

1

пример
y

y

x

z

v

1

x

0,3

1

z
v

0,7

0,75

1

0,6

0,5

0,8

1

• Для оценки мультиколлинеарности
факторов
может
использоваться
определитель
матрицы
парных
коэффициентов
корреляции между
факторами.

• Если бы факторы не коррелировали между
собой, то матрица парных коэффициентов
корреляции была бы единичной матрицей т.е.
rx

1 x1

rx

Det R  r x

1x2

rx

1 x3

2 x1

rx

rx

2 x2

rx

3 x2

rx

2 x3

rx

3 x3

3 x1

1

0

0

 0

1

0  1,

0

0

1

• Если же, наоборот, между факторами
существует полная линейная
зависимость и все коэффициенты
корреляции равны единице, то
определитель такой матрицы равен
нулю:
1

1

1

Det R  1

1

1  0.

1

1

1

• Таким образом,

• чем ближе к нулю определитель
матрицы межфакторной корреляции,
тем сильнее мультиколлинеарность
факторов и ненадежнее результаты
множественной регрессии.

• Через коэффициенты множественной
детерминации можно найти
переменные, ответственные за
мультиколлинеарность факторов.

• Сравнивая между собой
коэффициенты множественной
детерминации факторов

R

2
x1 x2 , x3 ... x p

;R

2
x2 x1x3 ... x p

;

• оставляем в уравнении факторы с
минимальной величиной
коэффициента множественной
детерминации.

• При дополнительном включении в
регрессию р+1 фактора коэффициент
детерминации должен возрастать, а
остаточная дисперсия уменьшаться;
R

2
p 1

R

2
p

и S p2 1  S p2 .

• Пусть для регрессии, включающих пять
факторов, коэффициент детерминации
составил 0,857
включение шестого фактора дало
коэффициент детерминации
0,855,

вряд ли целесообразно дополнительно
включать в модель этот фактор.

Оценка параметров уравнения
множественной регрессии
• Метод:
– а) метод наименьших квадратов (МНК)
– б) метод наименьших квадратов (МНК) для
стандартизованного уравнения

• В линейной множественной регрессии


y x  a  b1  x 1  b 2  x 2  ...  b p  x p

параметры при переменной x называются
коэффициентами «чистой» регрессии.
Они характеризуют среднее изменение
результата с изменением соответствующего
фактора на единицу при неизменном
значении других факторов, закрепленном на
среднем уровне.

• уравнение регрессии в стандартизованном
виде:

t y  1 t x   2 t x    b p t x
1

2

p

Где t y , y x ,  , t x
переменные
1

t xi 

xi  xi

x

-стандартизованные

p

ty 

,

i

y y



y

Свойства:

t y  t xi  0,
 t   t  1;
y

x

 i -стандартизованные коэффициенты

регрессии.

• Стандартизованные коэффициенты регрессии
показывают, на сколько % изменится в среднем
результат, если соответствующий фактор xi
изменится на 1 % при неизменном среднем
уровне других факторов.

• Стандартизованные коэффициенты регрессии i
сравнимы между собой.
• Связь между «чистыми» и
«стандартизованными» коэффициентами
регрессии

bi   i



y

x

i

• Пример. Пусть функция издержек
производства y(тыс. руб.)
характеризуется уравнением вида
y  200  1, 2  x1  1,1  x 2  

• x1 - основные производственные
фонды(тыс.руб.)
• х2 - численность занятых в
производстве(чел.)

• уравнение регрессии в стандартизованном
виде выглядит так
t y  0 , 5  t x 1  0 ,8  t x 2 .

• Вывод:

• Достоинство стандартизованных
коэффициентов регрессии:
использовать при отсеве факторов – из
модели исключаются факторы с
наименьшим значением  j

Slide 17

Лекция № 3

множественная
регрессия и
корреляция.

• Уравнение множественной регрессии

y  a  b1 x1  b 2 x 2  ...  b p x p  



Основная
регрессии

цель

множественной

– построить модель с большим числом
факторов, определив при этом влияние
каждого из них в отдельности, а также
совокупное
их
воздействие
на
моделируемый показатель.

например
• Современная потребительская функция
чаще всего рассматривается как модель
вида
С  f ( y, P, M , Z ) ,

•
•
•
•
•

С – потребление;
у – доход;
P – цена,
M – наличные деньги;
Z – ликвидные активы;



Построение
уравнения
множественной
регрессии
начинается с решения вопроса о
спецификации модели.

Условия включения факторов при
построении множественной регрессии.
• 1. факторы должны быть
количественно измеримы.

• 2. Факторы не должны быть
интеркоррелированы.

• Если между факторами существует высокая
корреляция, то параметры уравнения
регрессии оказываются
неинтерпретируемыми.

• Пусть в уравнении

y  a  b1 х 1  b 2  х 2

r x1 x 2  0 .

Если же rx 1 x 2  1
то b 1 , b 2 нельзя интерпретировать как
показатели раздельного влияния x 1 и x 2
на у .

Пример.
• Рассмотрим регрессию себестоимости:
единицы
продукции
(руб.,у)
от
заработной платы работника (руб.,x) и
производительности его труда (единиц в
час, z ):
y  22600  5  x  10  z

•

r xz

= 0,95

Отбор факторов при построении
множественной регрессии.

• 2 этапа отбора факторов:
– факторы подбираются исходя из сущности проблемы;
– на основе корреляционной матрицы производится
исключение части факторов
• 1) проверка парной корреляции,
• 2) оценка мультиколлинеарности факторов:
– Проверка гипотезы H0: Det R=1

Пути преодоления сильной
межфакторной корреляции
• Исключение одного или нескольких факторов
• Преобразование факторов для уменьшения
корреляции между ними
– Переход к первым разностям
– Переход к линейным комбинациям (метод главных
компонент)

• Переход к совмещенным уравнениям
регрессии
• Переход к уравнениям приведенной формы

• Предпочтение отдается не фактору,
более тесно связанному с
результатом, а тому фактору,
который при достаточной тесной
связи с результатом имеет
наименьшую тесноту связи с
другими факторами.

• Пусть,
например,
при
изучении
зависимости
матрица парных
коэффициентов корреляции оказалась
следующей:

y

y

x

z

v

1

x

0,8

1

z
v

0,7

0,8

1

0,6

0,5

0,2

1

пример
y

y

x

z

v

1

x

0,3

1

z
v

0,7

0,75

1

0,6

0,5

0,8

1

• Для оценки мультиколлинеарности
факторов
может
использоваться
определитель
матрицы
парных
коэффициентов
корреляции между
факторами.

• Если бы факторы не коррелировали между
собой, то матрица парных коэффициентов
корреляции была бы единичной матрицей т.е.
rx

1 x1

rx

Det R  r x

1x2

rx

1 x3

2 x1

rx

rx

2 x2

rx

3 x2

rx

2 x3

rx

3 x3

3 x1

1

0

0

 0

1

0  1,

0

0

1

• Если же, наоборот, между факторами
существует полная линейная
зависимость и все коэффициенты
корреляции равны единице, то
определитель такой матрицы равен
нулю:
1

1

1

Det R  1

1

1  0.

1

1

1

• Таким образом,

• чем ближе к нулю определитель
матрицы межфакторной корреляции,
тем сильнее мультиколлинеарность
факторов и ненадежнее результаты
множественной регрессии.

• Через коэффициенты множественной
детерминации можно найти
переменные, ответственные за
мультиколлинеарность факторов.

• Сравнивая между собой
коэффициенты множественной
детерминации факторов

R

2
x1 x2 , x3 ... x p

;R

2
x2 x1x3 ... x p

;

• оставляем в уравнении факторы с
минимальной величиной
коэффициента множественной
детерминации.

• При дополнительном включении в
регрессию р+1 фактора коэффициент
детерминации должен возрастать, а
остаточная дисперсия уменьшаться;
R

2
p 1

R

2
p

и S p2 1  S p2 .

• Пусть для регрессии, включающих пять
факторов, коэффициент детерминации
составил 0,857
включение шестого фактора дало
коэффициент детерминации
0,855,

вряд ли целесообразно дополнительно
включать в модель этот фактор.

Оценка параметров уравнения
множественной регрессии
• Метод:
– а) метод наименьших квадратов (МНК)
– б) метод наименьших квадратов (МНК) для
стандартизованного уравнения

• В линейной множественной регрессии


y x  a  b1  x 1  b 2  x 2  ...  b p  x p

параметры при переменной x называются
коэффициентами «чистой» регрессии.
Они характеризуют среднее изменение
результата с изменением соответствующего
фактора на единицу при неизменном
значении других факторов, закрепленном на
среднем уровне.

• уравнение регрессии в стандартизованном
виде:

t y  1 t x   2 t x    b p t x
1

2

p

Где t y , y x ,  , t x
переменные
1

t xi 

xi  xi

x

-стандартизованные

p

ty 

,

i

y y



y

Свойства:

t y  t xi  0,
 t   t  1;
y

x

 i -стандартизованные коэффициенты

регрессии.

• Стандартизованные коэффициенты регрессии
показывают, на сколько % изменится в среднем
результат, если соответствующий фактор xi
изменится на 1 % при неизменном среднем
уровне других факторов.

• Стандартизованные коэффициенты регрессии i
сравнимы между собой.
• Связь между «чистыми» и
«стандартизованными» коэффициентами
регрессии

bi   i



y

x

i

• Пример. Пусть функция издержек
производства y(тыс. руб.)
характеризуется уравнением вида
y  200  1, 2  x1  1,1  x 2  

• x1 - основные производственные
фонды(тыс.руб.)
• х2 - численность занятых в
производстве(чел.)

• уравнение регрессии в стандартизованном
виде выглядит так
t y  0 , 5  t x 1  0 ,8  t x 2 .

• Вывод:

• Достоинство стандартизованных
коэффициентов регрессии:
использовать при отсеве факторов – из
модели исключаются факторы с
наименьшим значением  j

Slide 18

Лекция № 3

множественная
регрессия и
корреляция.

• Уравнение множественной регрессии

y  a  b1 x1  b 2 x 2  ...  b p x p  



Основная
регрессии

цель

множественной

– построить модель с большим числом
факторов, определив при этом влияние
каждого из них в отдельности, а также
совокупное
их
воздействие
на
моделируемый показатель.

например
• Современная потребительская функция
чаще всего рассматривается как модель
вида
С  f ( y, P, M , Z ) ,

•
•
•
•
•

С – потребление;
у – доход;
P – цена,
M – наличные деньги;
Z – ликвидные активы;



Построение
уравнения
множественной
регрессии
начинается с решения вопроса о
спецификации модели.

Условия включения факторов при
построении множественной регрессии.
• 1. факторы должны быть
количественно измеримы.

• 2. Факторы не должны быть
интеркоррелированы.

• Если между факторами существует высокая
корреляция, то параметры уравнения
регрессии оказываются
неинтерпретируемыми.

• Пусть в уравнении

y  a  b1 х 1  b 2  х 2

r x1 x 2  0 .

Если же rx 1 x 2  1
то b 1 , b 2 нельзя интерпретировать как
показатели раздельного влияния x 1 и x 2
на у .

Пример.
• Рассмотрим регрессию себестоимости:
единицы
продукции
(руб.,у)
от
заработной платы работника (руб.,x) и
производительности его труда (единиц в
час, z ):
y  22600  5  x  10  z

•

r xz

= 0,95

Отбор факторов при построении
множественной регрессии.

• 2 этапа отбора факторов:
– факторы подбираются исходя из сущности проблемы;
– на основе корреляционной матрицы производится
исключение части факторов
• 1) проверка парной корреляции,
• 2) оценка мультиколлинеарности факторов:
– Проверка гипотезы H0: Det R=1

Пути преодоления сильной
межфакторной корреляции
• Исключение одного или нескольких факторов
• Преобразование факторов для уменьшения
корреляции между ними
– Переход к первым разностям
– Переход к линейным комбинациям (метод главных
компонент)

• Переход к совмещенным уравнениям
регрессии
• Переход к уравнениям приведенной формы

• Предпочтение отдается не фактору,
более тесно связанному с
результатом, а тому фактору,
который при достаточной тесной
связи с результатом имеет
наименьшую тесноту связи с
другими факторами.

• Пусть,
например,
при
изучении
зависимости
матрица парных
коэффициентов корреляции оказалась
следующей:

y

y

x

z

v

1

x

0,8

1

z
v

0,7

0,8

1

0,6

0,5

0,2

1

пример
y

y

x

z

v

1

x

0,3

1

z
v

0,7

0,75

1

0,6

0,5

0,8

1

• Для оценки мультиколлинеарности
факторов
может
использоваться
определитель
матрицы
парных
коэффициентов
корреляции между
факторами.

• Если бы факторы не коррелировали между
собой, то матрица парных коэффициентов
корреляции была бы единичной матрицей т.е.
rx

1 x1

rx

Det R  r x

1x2

rx

1 x3

2 x1

rx

rx

2 x2

rx

3 x2

rx

2 x3

rx

3 x3

3 x1

1

0

0

 0

1

0  1,

0

0

1

• Если же, наоборот, между факторами
существует полная линейная
зависимость и все коэффициенты
корреляции равны единице, то
определитель такой матрицы равен
нулю:
1

1

1

Det R  1

1

1  0.

1

1

1

• Таким образом,

• чем ближе к нулю определитель
матрицы межфакторной корреляции,
тем сильнее мультиколлинеарность
факторов и ненадежнее результаты
множественной регрессии.

• Через коэффициенты множественной
детерминации можно найти
переменные, ответственные за
мультиколлинеарность факторов.

• Сравнивая между собой
коэффициенты множественной
детерминации факторов

R

2
x1 x2 , x3 ... x p

;R

2
x2 x1x3 ... x p

;

• оставляем в уравнении факторы с
минимальной величиной
коэффициента множественной
детерминации.

• При дополнительном включении в
регрессию р+1 фактора коэффициент
детерминации должен возрастать, а
остаточная дисперсия уменьшаться;
R

2
p 1

R

2
p

и S p2 1  S p2 .

• Пусть для регрессии, включающих пять
факторов, коэффициент детерминации
составил 0,857
включение шестого фактора дало
коэффициент детерминации
0,855,

вряд ли целесообразно дополнительно
включать в модель этот фактор.

Оценка параметров уравнения
множественной регрессии
• Метод:
– а) метод наименьших квадратов (МНК)
– б) метод наименьших квадратов (МНК) для
стандартизованного уравнения

• В линейной множественной регрессии


y x  a  b1  x 1  b 2  x 2  ...  b p  x p

параметры при переменной x называются
коэффициентами «чистой» регрессии.
Они характеризуют среднее изменение
результата с изменением соответствующего
фактора на единицу при неизменном
значении других факторов, закрепленном на
среднем уровне.

• уравнение регрессии в стандартизованном
виде:

t y  1 t x   2 t x    b p t x
1

2

p

Где t y , y x ,  , t x
переменные
1

t xi 

xi  xi

x

-стандартизованные

p

ty 

,

i

y y



y

Свойства:

t y  t xi  0,
 t   t  1;
y

x

 i -стандартизованные коэффициенты

регрессии.

• Стандартизованные коэффициенты регрессии
показывают, на сколько % изменится в среднем
результат, если соответствующий фактор xi
изменится на 1 % при неизменном среднем
уровне других факторов.

• Стандартизованные коэффициенты регрессии i
сравнимы между собой.
• Связь между «чистыми» и
«стандартизованными» коэффициентами
регрессии

bi   i



y

x

i

• Пример. Пусть функция издержек
производства y(тыс. руб.)
характеризуется уравнением вида
y  200  1, 2  x1  1,1  x 2  

• x1 - основные производственные
фонды(тыс.руб.)
• х2 - численность занятых в
производстве(чел.)

• уравнение регрессии в стандартизованном
виде выглядит так
t y  0 , 5  t x 1  0 ,8  t x 2 .

• Вывод:

• Достоинство стандартизованных
коэффициентов регрессии:
использовать при отсеве факторов – из
модели исключаются факторы с
наименьшим значением  j

Slide 19

Лекция № 3

множественная
регрессия и
корреляция.

• Уравнение множественной регрессии

y  a  b1 x1  b 2 x 2  ...  b p x p  



Основная
регрессии

цель

множественной

– построить модель с большим числом
факторов, определив при этом влияние
каждого из них в отдельности, а также
совокупное
их
воздействие
на
моделируемый показатель.

например
• Современная потребительская функция
чаще всего рассматривается как модель
вида
С  f ( y, P, M , Z ) ,

•
•
•
•
•

С – потребление;
у – доход;
P – цена,
M – наличные деньги;
Z – ликвидные активы;



Построение
уравнения
множественной
регрессии
начинается с решения вопроса о
спецификации модели.

Условия включения факторов при
построении множественной регрессии.
• 1. факторы должны быть
количественно измеримы.

• 2. Факторы не должны быть
интеркоррелированы.

• Если между факторами существует высокая
корреляция, то параметры уравнения
регрессии оказываются
неинтерпретируемыми.

• Пусть в уравнении

y  a  b1 х 1  b 2  х 2

r x1 x 2  0 .

Если же rx 1 x 2  1
то b 1 , b 2 нельзя интерпретировать как
показатели раздельного влияния x 1 и x 2
на у .

Пример.
• Рассмотрим регрессию себестоимости:
единицы
продукции
(руб.,у)
от
заработной платы работника (руб.,x) и
производительности его труда (единиц в
час, z ):
y  22600  5  x  10  z

•

r xz

= 0,95

Отбор факторов при построении
множественной регрессии.

• 2 этапа отбора факторов:
– факторы подбираются исходя из сущности проблемы;
– на основе корреляционной матрицы производится
исключение части факторов
• 1) проверка парной корреляции,
• 2) оценка мультиколлинеарности факторов:
– Проверка гипотезы H0: Det R=1

Пути преодоления сильной
межфакторной корреляции
• Исключение одного или нескольких факторов
• Преобразование факторов для уменьшения
корреляции между ними
– Переход к первым разностям
– Переход к линейным комбинациям (метод главных
компонент)

• Переход к совмещенным уравнениям
регрессии
• Переход к уравнениям приведенной формы

• Предпочтение отдается не фактору,
более тесно связанному с
результатом, а тому фактору,
который при достаточной тесной
связи с результатом имеет
наименьшую тесноту связи с
другими факторами.

• Пусть,
например,
при
изучении
зависимости
матрица парных
коэффициентов корреляции оказалась
следующей:

y

y

x

z

v

1

x

0,8

1

z
v

0,7

0,8

1

0,6

0,5

0,2

1

пример
y

y

x

z

v

1

x

0,3

1

z
v

0,7

0,75

1

0,6

0,5

0,8

1

• Для оценки мультиколлинеарности
факторов
может
использоваться
определитель
матрицы
парных
коэффициентов
корреляции между
факторами.

• Если бы факторы не коррелировали между
собой, то матрица парных коэффициентов
корреляции была бы единичной матрицей т.е.
rx

1 x1

rx

Det R  r x

1x2

rx

1 x3

2 x1

rx

rx

2 x2

rx

3 x2

rx

2 x3

rx

3 x3

3 x1

1

0

0

 0

1

0  1,

0

0

1

• Если же, наоборот, между факторами
существует полная линейная
зависимость и все коэффициенты
корреляции равны единице, то
определитель такой матрицы равен
нулю:
1

1

1

Det R  1

1

1  0.

1

1

1

• Таким образом,

• чем ближе к нулю определитель
матрицы межфакторной корреляции,
тем сильнее мультиколлинеарность
факторов и ненадежнее результаты
множественной регрессии.

• Через коэффициенты множественной
детерминации можно найти
переменные, ответственные за
мультиколлинеарность факторов.

• Сравнивая между собой
коэффициенты множественной
детерминации факторов

R

2
x1 x2 , x3 ... x p

;R

2
x2 x1x3 ... x p

;

• оставляем в уравнении факторы с
минимальной величиной
коэффициента множественной
детерминации.

• При дополнительном включении в
регрессию р+1 фактора коэффициент
детерминации должен возрастать, а
остаточная дисперсия уменьшаться;
R

2
p 1

R

2
p

и S p2 1  S p2 .

• Пусть для регрессии, включающих пять
факторов, коэффициент детерминации
составил 0,857
включение шестого фактора дало
коэффициент детерминации
0,855,

вряд ли целесообразно дополнительно
включать в модель этот фактор.

Оценка параметров уравнения
множественной регрессии
• Метод:
– а) метод наименьших квадратов (МНК)
– б) метод наименьших квадратов (МНК) для
стандартизованного уравнения

• В линейной множественной регрессии


y x  a  b1  x 1  b 2  x 2  ...  b p  x p

параметры при переменной x называются
коэффициентами «чистой» регрессии.
Они характеризуют среднее изменение
результата с изменением соответствующего
фактора на единицу при неизменном
значении других факторов, закрепленном на
среднем уровне.

• уравнение регрессии в стандартизованном
виде:

t y  1 t x   2 t x    b p t x
1

2

p

Где t y , y x ,  , t x
переменные
1

t xi 

xi  xi

x

-стандартизованные

p

ty 

,

i

y y



y

Свойства:

t y  t xi  0,
 t   t  1;
y

x

 i -стандартизованные коэффициенты

регрессии.

• Стандартизованные коэффициенты регрессии
показывают, на сколько % изменится в среднем
результат, если соответствующий фактор xi
изменится на 1 % при неизменном среднем
уровне других факторов.

• Стандартизованные коэффициенты регрессии i
сравнимы между собой.
• Связь между «чистыми» и
«стандартизованными» коэффициентами
регрессии

bi   i



y

x

i

• Пример. Пусть функция издержек
производства y(тыс. руб.)
характеризуется уравнением вида
y  200  1, 2  x1  1,1  x 2  

• x1 - основные производственные
фонды(тыс.руб.)
• х2 - численность занятых в
производстве(чел.)

• уравнение регрессии в стандартизованном
виде выглядит так
t y  0 , 5  t x 1  0 ,8  t x 2 .

• Вывод:

• Достоинство стандартизованных
коэффициентов регрессии:
использовать при отсеве факторов – из
модели исключаются факторы с
наименьшим значением  j

Slide 20

Лекция № 3

множественная
регрессия и
корреляция.

• Уравнение множественной регрессии

y  a  b1 x1  b 2 x 2  ...  b p x p  



Основная
регрессии

цель

множественной

– построить модель с большим числом
факторов, определив при этом влияние
каждого из них в отдельности, а также
совокупное
их
воздействие
на
моделируемый показатель.

например
• Современная потребительская функция
чаще всего рассматривается как модель
вида
С  f ( y, P, M , Z ) ,

•
•
•
•
•

С – потребление;
у – доход;
P – цена,
M – наличные деньги;
Z – ликвидные активы;



Построение
уравнения
множественной
регрессии
начинается с решения вопроса о
спецификации модели.

Условия включения факторов при
построении множественной регрессии.
• 1. факторы должны быть
количественно измеримы.

• 2. Факторы не должны быть
интеркоррелированы.

• Если между факторами существует высокая
корреляция, то параметры уравнения
регрессии оказываются
неинтерпретируемыми.

• Пусть в уравнении

y  a  b1 х 1  b 2  х 2

r x1 x 2  0 .

Если же rx 1 x 2  1
то b 1 , b 2 нельзя интерпретировать как
показатели раздельного влияния x 1 и x 2
на у .

Пример.
• Рассмотрим регрессию себестоимости:
единицы
продукции
(руб.,у)
от
заработной платы работника (руб.,x) и
производительности его труда (единиц в
час, z ):
y  22600  5  x  10  z

•

r xz

= 0,95

Отбор факторов при построении
множественной регрессии.

• 2 этапа отбора факторов:
– факторы подбираются исходя из сущности проблемы;
– на основе корреляционной матрицы производится
исключение части факторов
• 1) проверка парной корреляции,
• 2) оценка мультиколлинеарности факторов:
– Проверка гипотезы H0: Det R=1

Пути преодоления сильной
межфакторной корреляции
• Исключение одного или нескольких факторов
• Преобразование факторов для уменьшения
корреляции между ними
– Переход к первым разностям
– Переход к линейным комбинациям (метод главных
компонент)

• Переход к совмещенным уравнениям
регрессии
• Переход к уравнениям приведенной формы

• Предпочтение отдается не фактору,
более тесно связанному с
результатом, а тому фактору,
который при достаточной тесной
связи с результатом имеет
наименьшую тесноту связи с
другими факторами.

• Пусть,
например,
при
изучении
зависимости
матрица парных
коэффициентов корреляции оказалась
следующей:

y

y

x

z

v

1

x

0,8

1

z
v

0,7

0,8

1

0,6

0,5

0,2

1

пример
y

y

x

z

v

1

x

0,3

1

z
v

0,7

0,75

1

0,6

0,5

0,8

1

• Для оценки мультиколлинеарности
факторов
может
использоваться
определитель
матрицы
парных
коэффициентов
корреляции между
факторами.

• Если бы факторы не коррелировали между
собой, то матрица парных коэффициентов
корреляции была бы единичной матрицей т.е.
rx

1 x1

rx

Det R  r x

1x2

rx

1 x3

2 x1

rx

rx

2 x2

rx

3 x2

rx

2 x3

rx

3 x3

3 x1

1

0

0

 0

1

0  1,

0

0

1

• Если же, наоборот, между факторами
существует полная линейная
зависимость и все коэффициенты
корреляции равны единице, то
определитель такой матрицы равен
нулю:
1

1

1

Det R  1

1

1  0.

1

1

1

• Таким образом,

• чем ближе к нулю определитель
матрицы межфакторной корреляции,
тем сильнее мультиколлинеарность
факторов и ненадежнее результаты
множественной регрессии.

• Через коэффициенты множественной
детерминации можно найти
переменные, ответственные за
мультиколлинеарность факторов.

• Сравнивая между собой
коэффициенты множественной
детерминации факторов

R

2
x1 x2 , x3 ... x p

;R

2
x2 x1x3 ... x p

;

• оставляем в уравнении факторы с
минимальной величиной
коэффициента множественной
детерминации.

• При дополнительном включении в
регрессию р+1 фактора коэффициент
детерминации должен возрастать, а
остаточная дисперсия уменьшаться;
R

2
p 1

R

2
p

и S p2 1  S p2 .

• Пусть для регрессии, включающих пять
факторов, коэффициент детерминации
составил 0,857
включение шестого фактора дало
коэффициент детерминации
0,855,

вряд ли целесообразно дополнительно
включать в модель этот фактор.

Оценка параметров уравнения
множественной регрессии
• Метод:
– а) метод наименьших квадратов (МНК)
– б) метод наименьших квадратов (МНК) для
стандартизованного уравнения

• В линейной множественной регрессии


y x  a  b1  x 1  b 2  x 2  ...  b p  x p

параметры при переменной x называются
коэффициентами «чистой» регрессии.
Они характеризуют среднее изменение
результата с изменением соответствующего
фактора на единицу при неизменном
значении других факторов, закрепленном на
среднем уровне.

• уравнение регрессии в стандартизованном
виде:

t y  1 t x   2 t x    b p t x
1

2

p

Где t y , y x ,  , t x
переменные
1

t xi 

xi  xi

x

-стандартизованные

p

ty 

,

i

y y



y

Свойства:

t y  t xi  0,
 t   t  1;
y

x

 i -стандартизованные коэффициенты

регрессии.

• Стандартизованные коэффициенты регрессии
показывают, на сколько % изменится в среднем
результат, если соответствующий фактор xi
изменится на 1 % при неизменном среднем
уровне других факторов.

• Стандартизованные коэффициенты регрессии i
сравнимы между собой.
• Связь между «чистыми» и
«стандартизованными» коэффициентами
регрессии

bi   i



y

x

i

• Пример. Пусть функция издержек
производства y(тыс. руб.)
характеризуется уравнением вида
y  200  1, 2  x1  1,1  x 2  

• x1 - основные производственные
фонды(тыс.руб.)
• х2 - численность занятых в
производстве(чел.)

• уравнение регрессии в стандартизованном
виде выглядит так
t y  0 , 5  t x 1  0 ,8  t x 2 .

• Вывод:

• Достоинство стандартизованных
коэффициентов регрессии:
использовать при отсеве факторов – из
модели исключаются факторы с
наименьшим значением  j

Slide 21

Лекция № 3

множественная
регрессия и
корреляция.

• Уравнение множественной регрессии

y  a  b1 x1  b 2 x 2  ...  b p x p  



Основная
регрессии

цель

множественной

– построить модель с большим числом
факторов, определив при этом влияние
каждого из них в отдельности, а также
совокупное
их
воздействие
на
моделируемый показатель.

например
• Современная потребительская функция
чаще всего рассматривается как модель
вида
С  f ( y, P, M , Z ) ,

•
•
•
•
•

С – потребление;
у – доход;
P – цена,
M – наличные деньги;
Z – ликвидные активы;



Построение
уравнения
множественной
регрессии
начинается с решения вопроса о
спецификации модели.

Условия включения факторов при
построении множественной регрессии.
• 1. факторы должны быть
количественно измеримы.

• 2. Факторы не должны быть
интеркоррелированы.

• Если между факторами существует высокая
корреляция, то параметры уравнения
регрессии оказываются
неинтерпретируемыми.

• Пусть в уравнении

y  a  b1 х 1  b 2  х 2

r x1 x 2  0 .

Если же rx 1 x 2  1
то b 1 , b 2 нельзя интерпретировать как
показатели раздельного влияния x 1 и x 2
на у .

Пример.
• Рассмотрим регрессию себестоимости:
единицы
продукции
(руб.,у)
от
заработной платы работника (руб.,x) и
производительности его труда (единиц в
час, z ):
y  22600  5  x  10  z

•

r xz

= 0,95

Отбор факторов при построении
множественной регрессии.

• 2 этапа отбора факторов:
– факторы подбираются исходя из сущности проблемы;
– на основе корреляционной матрицы производится
исключение части факторов
• 1) проверка парной корреляции,
• 2) оценка мультиколлинеарности факторов:
– Проверка гипотезы H0: Det R=1

Пути преодоления сильной
межфакторной корреляции
• Исключение одного или нескольких факторов
• Преобразование факторов для уменьшения
корреляции между ними
– Переход к первым разностям
– Переход к линейным комбинациям (метод главных
компонент)

• Переход к совмещенным уравнениям
регрессии
• Переход к уравнениям приведенной формы

• Предпочтение отдается не фактору,
более тесно связанному с
результатом, а тому фактору,
который при достаточной тесной
связи с результатом имеет
наименьшую тесноту связи с
другими факторами.

• Пусть,
например,
при
изучении
зависимости
матрица парных
коэффициентов корреляции оказалась
следующей:

y

y

x

z

v

1

x

0,8

1

z
v

0,7

0,8

1

0,6

0,5

0,2

1

пример
y

y

x

z

v

1

x

0,3

1

z
v

0,7

0,75

1

0,6

0,5

0,8

1

• Для оценки мультиколлинеарности
факторов
может
использоваться
определитель
матрицы
парных
коэффициентов
корреляции между
факторами.

• Если бы факторы не коррелировали между
собой, то матрица парных коэффициентов
корреляции была бы единичной матрицей т.е.
rx

1 x1

rx

Det R  r x

1x2

rx

1 x3

2 x1

rx

rx

2 x2

rx

3 x2

rx

2 x3

rx

3 x3

3 x1

1

0

0

 0

1

0  1,

0

0

1

• Если же, наоборот, между факторами
существует полная линейная
зависимость и все коэффициенты
корреляции равны единице, то
определитель такой матрицы равен
нулю:
1

1

1

Det R  1

1

1  0.

1

1

1

• Таким образом,

• чем ближе к нулю определитель
матрицы межфакторной корреляции,
тем сильнее мультиколлинеарность
факторов и ненадежнее результаты
множественной регрессии.

• Через коэффициенты множественной
детерминации можно найти
переменные, ответственные за
мультиколлинеарность факторов.

• Сравнивая между собой
коэффициенты множественной
детерминации факторов

R

2
x1 x2 , x3 ... x p

;R

2
x2 x1x3 ... x p

;

• оставляем в уравнении факторы с
минимальной величиной
коэффициента множественной
детерминации.

• При дополнительном включении в
регрессию р+1 фактора коэффициент
детерминации должен возрастать, а
остаточная дисперсия уменьшаться;
R

2
p 1

R

2
p

и S p2 1  S p2 .

• Пусть для регрессии, включающих пять
факторов, коэффициент детерминации
составил 0,857
включение шестого фактора дало
коэффициент детерминации
0,855,

вряд ли целесообразно дополнительно
включать в модель этот фактор.

Оценка параметров уравнения
множественной регрессии
• Метод:
– а) метод наименьших квадратов (МНК)
– б) метод наименьших квадратов (МНК) для
стандартизованного уравнения

• В линейной множественной регрессии


y x  a  b1  x 1  b 2  x 2  ...  b p  x p

параметры при переменной x называются
коэффициентами «чистой» регрессии.
Они характеризуют среднее изменение
результата с изменением соответствующего
фактора на единицу при неизменном
значении других факторов, закрепленном на
среднем уровне.

• уравнение регрессии в стандартизованном
виде:

t y  1 t x   2 t x    b p t x
1

2

p

Где t y , y x ,  , t x
переменные
1

t xi 

xi  xi

x

-стандартизованные

p

ty 

,

i

y y



y

Свойства:

t y  t xi  0,
 t   t  1;
y

x

 i -стандартизованные коэффициенты

регрессии.

• Стандартизованные коэффициенты регрессии
показывают, на сколько % изменится в среднем
результат, если соответствующий фактор xi
изменится на 1 % при неизменном среднем
уровне других факторов.

• Стандартизованные коэффициенты регрессии i
сравнимы между собой.
• Связь между «чистыми» и
«стандартизованными» коэффициентами
регрессии

bi   i



y

x

i

• Пример. Пусть функция издержек
производства y(тыс. руб.)
характеризуется уравнением вида
y  200  1, 2  x1  1,1  x 2  

• x1 - основные производственные
фонды(тыс.руб.)
• х2 - численность занятых в
производстве(чел.)

• уравнение регрессии в стандартизованном
виде выглядит так
t y  0 , 5  t x 1  0 ,8  t x 2 .

• Вывод:

• Достоинство стандартизованных
коэффициентов регрессии:
использовать при отсеве факторов – из
модели исключаются факторы с
наименьшим значением  j

Slide 22

Лекция № 3

множественная
регрессия и
корреляция.

• Уравнение множественной регрессии

y  a  b1 x1  b 2 x 2  ...  b p x p  



Основная
регрессии

цель

множественной

– построить модель с большим числом
факторов, определив при этом влияние
каждого из них в отдельности, а также
совокупное
их
воздействие
на
моделируемый показатель.

например
• Современная потребительская функция
чаще всего рассматривается как модель
вида
С  f ( y, P, M , Z ) ,

•
•
•
•
•

С – потребление;
у – доход;
P – цена,
M – наличные деньги;
Z – ликвидные активы;



Построение
уравнения
множественной
регрессии
начинается с решения вопроса о
спецификации модели.

Условия включения факторов при
построении множественной регрессии.
• 1. факторы должны быть
количественно измеримы.

• 2. Факторы не должны быть
интеркоррелированы.

• Если между факторами существует высокая
корреляция, то параметры уравнения
регрессии оказываются
неинтерпретируемыми.

• Пусть в уравнении

y  a  b1 х 1  b 2  х 2

r x1 x 2  0 .

Если же rx 1 x 2  1
то b 1 , b 2 нельзя интерпретировать как
показатели раздельного влияния x 1 и x 2
на у .

Пример.
• Рассмотрим регрессию себестоимости:
единицы
продукции
(руб.,у)
от
заработной платы работника (руб.,x) и
производительности его труда (единиц в
час, z ):
y  22600  5  x  10  z

•

r xz

= 0,95

Отбор факторов при построении
множественной регрессии.

• 2 этапа отбора факторов:
– факторы подбираются исходя из сущности проблемы;
– на основе корреляционной матрицы производится
исключение части факторов
• 1) проверка парной корреляции,
• 2) оценка мультиколлинеарности факторов:
– Проверка гипотезы H0: Det R=1

Пути преодоления сильной
межфакторной корреляции
• Исключение одного или нескольких факторов
• Преобразование факторов для уменьшения
корреляции между ними
– Переход к первым разностям
– Переход к линейным комбинациям (метод главных
компонент)

• Переход к совмещенным уравнениям
регрессии
• Переход к уравнениям приведенной формы

• Предпочтение отдается не фактору,
более тесно связанному с
результатом, а тому фактору,
который при достаточной тесной
связи с результатом имеет
наименьшую тесноту связи с
другими факторами.

• Пусть,
например,
при
изучении
зависимости
матрица парных
коэффициентов корреляции оказалась
следующей:

y

y

x

z

v

1

x

0,8

1

z
v

0,7

0,8

1

0,6

0,5

0,2

1

пример
y

y

x

z

v

1

x

0,3

1

z
v

0,7

0,75

1

0,6

0,5

0,8

1

• Для оценки мультиколлинеарности
факторов
может
использоваться
определитель
матрицы
парных
коэффициентов
корреляции между
факторами.

• Если бы факторы не коррелировали между
собой, то матрица парных коэффициентов
корреляции была бы единичной матрицей т.е.
rx

1 x1

rx

Det R  r x

1x2

rx

1 x3

2 x1

rx

rx

2 x2

rx

3 x2

rx

2 x3

rx

3 x3

3 x1

1

0

0

 0

1

0  1,

0

0

1

• Если же, наоборот, между факторами
существует полная линейная
зависимость и все коэффициенты
корреляции равны единице, то
определитель такой матрицы равен
нулю:
1

1

1

Det R  1

1

1  0.

1

1

1

• Таким образом,

• чем ближе к нулю определитель
матрицы межфакторной корреляции,
тем сильнее мультиколлинеарность
факторов и ненадежнее результаты
множественной регрессии.

• Через коэффициенты множественной
детерминации можно найти
переменные, ответственные за
мультиколлинеарность факторов.

• Сравнивая между собой
коэффициенты множественной
детерминации факторов

R

2
x1 x2 , x3 ... x p

;R

2
x2 x1x3 ... x p

;

• оставляем в уравнении факторы с
минимальной величиной
коэффициента множественной
детерминации.

• При дополнительном включении в
регрессию р+1 фактора коэффициент
детерминации должен возрастать, а
остаточная дисперсия уменьшаться;
R

2
p 1

R

2
p

и S p2 1  S p2 .

• Пусть для регрессии, включающих пять
факторов, коэффициент детерминации
составил 0,857
включение шестого фактора дало
коэффициент детерминации
0,855,

вряд ли целесообразно дополнительно
включать в модель этот фактор.

Оценка параметров уравнения
множественной регрессии
• Метод:
– а) метод наименьших квадратов (МНК)
– б) метод наименьших квадратов (МНК) для
стандартизованного уравнения

• В линейной множественной регрессии


y x  a  b1  x 1  b 2  x 2  ...  b p  x p

параметры при переменной x называются
коэффициентами «чистой» регрессии.
Они характеризуют среднее изменение
результата с изменением соответствующего
фактора на единицу при неизменном
значении других факторов, закрепленном на
среднем уровне.

• уравнение регрессии в стандартизованном
виде:

t y  1 t x   2 t x    b p t x
1

2

p

Где t y , y x ,  , t x
переменные
1

t xi 

xi  xi

x

-стандартизованные

p

ty 

,

i

y y



y

Свойства:

t y  t xi  0,
 t   t  1;
y

x

 i -стандартизованные коэффициенты

регрессии.

• Стандартизованные коэффициенты регрессии
показывают, на сколько % изменится в среднем
результат, если соответствующий фактор xi
изменится на 1 % при неизменном среднем
уровне других факторов.

• Стандартизованные коэффициенты регрессии i
сравнимы между собой.
• Связь между «чистыми» и
«стандартизованными» коэффициентами
регрессии

bi   i



y

x

i

• Пример. Пусть функция издержек
производства y(тыс. руб.)
характеризуется уравнением вида
y  200  1, 2  x1  1,1  x 2  

• x1 - основные производственные
фонды(тыс.руб.)
• х2 - численность занятых в
производстве(чел.)

• уравнение регрессии в стандартизованном
виде выглядит так
t y  0 , 5  t x 1  0 ,8  t x 2 .

• Вывод:

• Достоинство стандартизованных
коэффициентов регрессии:
использовать при отсеве факторов – из
модели исключаются факторы с
наименьшим значением  j

Slide 23

Лекция № 3

множественная
регрессия и
корреляция.

• Уравнение множественной регрессии

y  a  b1 x1  b 2 x 2  ...  b p x p  



Основная
регрессии

цель

множественной

– построить модель с большим числом
факторов, определив при этом влияние
каждого из них в отдельности, а также
совокупное
их
воздействие
на
моделируемый показатель.

например
• Современная потребительская функция
чаще всего рассматривается как модель
вида
С  f ( y, P, M , Z ) ,

•
•
•
•
•

С – потребление;
у – доход;
P – цена,
M – наличные деньги;
Z – ликвидные активы;



Построение
уравнения
множественной
регрессии
начинается с решения вопроса о
спецификации модели.

Условия включения факторов при
построении множественной регрессии.
• 1. факторы должны быть
количественно измеримы.

• 2. Факторы не должны быть
интеркоррелированы.

• Если между факторами существует высокая
корреляция, то параметры уравнения
регрессии оказываются
неинтерпретируемыми.

• Пусть в уравнении

y  a  b1 х 1  b 2  х 2

r x1 x 2  0 .

Если же rx 1 x 2  1
то b 1 , b 2 нельзя интерпретировать как
показатели раздельного влияния x 1 и x 2
на у .

Пример.
• Рассмотрим регрессию себестоимости:
единицы
продукции
(руб.,у)
от
заработной платы работника (руб.,x) и
производительности его труда (единиц в
час, z ):
y  22600  5  x  10  z

•

r xz

= 0,95

Отбор факторов при построении
множественной регрессии.

• 2 этапа отбора факторов:
– факторы подбираются исходя из сущности проблемы;
– на основе корреляционной матрицы производится
исключение части факторов
• 1) проверка парной корреляции,
• 2) оценка мультиколлинеарности факторов:
– Проверка гипотезы H0: Det R=1

Пути преодоления сильной
межфакторной корреляции
• Исключение одного или нескольких факторов
• Преобразование факторов для уменьшения
корреляции между ними
– Переход к первым разностям
– Переход к линейным комбинациям (метод главных
компонент)

• Переход к совмещенным уравнениям
регрессии
• Переход к уравнениям приведенной формы

• Предпочтение отдается не фактору,
более тесно связанному с
результатом, а тому фактору,
который при достаточной тесной
связи с результатом имеет
наименьшую тесноту связи с
другими факторами.

• Пусть,
например,
при
изучении
зависимости
матрица парных
коэффициентов корреляции оказалась
следующей:

y

y

x

z

v

1

x

0,8

1

z
v

0,7

0,8

1

0,6

0,5

0,2

1

пример
y

y

x

z

v

1

x

0,3

1

z
v

0,7

0,75

1

0,6

0,5

0,8

1

• Для оценки мультиколлинеарности
факторов
может
использоваться
определитель
матрицы
парных
коэффициентов
корреляции между
факторами.

• Если бы факторы не коррелировали между
собой, то матрица парных коэффициентов
корреляции была бы единичной матрицей т.е.
rx

1 x1

rx

Det R  r x

1x2

rx

1 x3

2 x1

rx

rx

2 x2

rx

3 x2

rx

2 x3

rx

3 x3

3 x1

1

0

0

 0

1

0  1,

0

0

1

• Если же, наоборот, между факторами
существует полная линейная
зависимость и все коэффициенты
корреляции равны единице, то
определитель такой матрицы равен
нулю:
1

1

1

Det R  1

1

1  0.

1

1

1

• Таким образом,

• чем ближе к нулю определитель
матрицы межфакторной корреляции,
тем сильнее мультиколлинеарность
факторов и ненадежнее результаты
множественной регрессии.

• Через коэффициенты множественной
детерминации можно найти
переменные, ответственные за
мультиколлинеарность факторов.

• Сравнивая между собой
коэффициенты множественной
детерминации факторов

R

2
x1 x2 , x3 ... x p

;R

2
x2 x1x3 ... x p

;

• оставляем в уравнении факторы с
минимальной величиной
коэффициента множественной
детерминации.

• При дополнительном включении в
регрессию р+1 фактора коэффициент
детерминации должен возрастать, а
остаточная дисперсия уменьшаться;
R

2
p 1

R

2
p

и S p2 1  S p2 .

• Пусть для регрессии, включающих пять
факторов, коэффициент детерминации
составил 0,857
включение шестого фактора дало
коэффициент детерминации
0,855,

вряд ли целесообразно дополнительно
включать в модель этот фактор.

Оценка параметров уравнения
множественной регрессии
• Метод:
– а) метод наименьших квадратов (МНК)
– б) метод наименьших квадратов (МНК) для
стандартизованного уравнения

• В линейной множественной регрессии


y x  a  b1  x 1  b 2  x 2  ...  b p  x p

параметры при переменной x называются
коэффициентами «чистой» регрессии.
Они характеризуют среднее изменение
результата с изменением соответствующего
фактора на единицу при неизменном
значении других факторов, закрепленном на
среднем уровне.

• уравнение регрессии в стандартизованном
виде:

t y  1 t x   2 t x    b p t x
1

2

p

Где t y , y x ,  , t x
переменные
1

t xi 

xi  xi

x

-стандартизованные

p

ty 

,

i

y y



y

Свойства:

t y  t xi  0,
 t   t  1;
y

x

 i -стандартизованные коэффициенты

регрессии.

• Стандартизованные коэффициенты регрессии
показывают, на сколько % изменится в среднем
результат, если соответствующий фактор xi
изменится на 1 % при неизменном среднем
уровне других факторов.

• Стандартизованные коэффициенты регрессии i
сравнимы между собой.
• Связь между «чистыми» и
«стандартизованными» коэффициентами
регрессии

bi   i



y

x

i

• Пример. Пусть функция издержек
производства y(тыс. руб.)
характеризуется уравнением вида
y  200  1, 2  x1  1,1  x 2  

• x1 - основные производственные
фонды(тыс.руб.)
• х2 - численность занятых в
производстве(чел.)

• уравнение регрессии в стандартизованном
виде выглядит так
t y  0 , 5  t x 1  0 ,8  t x 2 .

• Вывод:

• Достоинство стандартизованных
коэффициентов регрессии:
использовать при отсеве факторов – из
модели исключаются факторы с
наименьшим значением  j

Slide 24

Лекция № 3

множественная
регрессия и
корреляция.

• Уравнение множественной регрессии

y  a  b1 x1  b 2 x 2  ...  b p x p  



Основная
регрессии

цель

множественной

– построить модель с большим числом
факторов, определив при этом влияние
каждого из них в отдельности, а также
совокупное
их
воздействие
на
моделируемый показатель.

например
• Современная потребительская функция
чаще всего рассматривается как модель
вида
С  f ( y, P, M , Z ) ,

•
•
•
•
•

С – потребление;
у – доход;
P – цена,
M – наличные деньги;
Z – ликвидные активы;



Построение
уравнения
множественной
регрессии
начинается с решения вопроса о
спецификации модели.

Условия включения факторов при
построении множественной регрессии.
• 1. факторы должны быть
количественно измеримы.

• 2. Факторы не должны быть
интеркоррелированы.

• Если между факторами существует высокая
корреляция, то параметры уравнения
регрессии оказываются
неинтерпретируемыми.

• Пусть в уравнении

y  a  b1 х 1  b 2  х 2

r x1 x 2  0 .

Если же rx 1 x 2  1
то b 1 , b 2 нельзя интерпретировать как
показатели раздельного влияния x 1 и x 2
на у .

Пример.
• Рассмотрим регрессию себестоимости:
единицы
продукции
(руб.,у)
от
заработной платы работника (руб.,x) и
производительности его труда (единиц в
час, z ):
y  22600  5  x  10  z

•

r xz

= 0,95

Отбор факторов при построении
множественной регрессии.

• 2 этапа отбора факторов:
– факторы подбираются исходя из сущности проблемы;
– на основе корреляционной матрицы производится
исключение части факторов
• 1) проверка парной корреляции,
• 2) оценка мультиколлинеарности факторов:
– Проверка гипотезы H0: Det R=1

Пути преодоления сильной
межфакторной корреляции
• Исключение одного или нескольких факторов
• Преобразование факторов для уменьшения
корреляции между ними
– Переход к первым разностям
– Переход к линейным комбинациям (метод главных
компонент)

• Переход к совмещенным уравнениям
регрессии
• Переход к уравнениям приведенной формы

• Предпочтение отдается не фактору,
более тесно связанному с
результатом, а тому фактору,
который при достаточной тесной
связи с результатом имеет
наименьшую тесноту связи с
другими факторами.

• Пусть,
например,
при
изучении
зависимости
матрица парных
коэффициентов корреляции оказалась
следующей:

y

y

x

z

v

1

x

0,8

1

z
v

0,7

0,8

1

0,6

0,5

0,2

1

пример
y

y

x

z

v

1

x

0,3

1

z
v

0,7

0,75

1

0,6

0,5

0,8

1

• Для оценки мультиколлинеарности
факторов
может
использоваться
определитель
матрицы
парных
коэффициентов
корреляции между
факторами.

• Если бы факторы не коррелировали между
собой, то матрица парных коэффициентов
корреляции была бы единичной матрицей т.е.
rx

1 x1

rx

Det R  r x

1x2

rx

1 x3

2 x1

rx

rx

2 x2

rx

3 x2

rx

2 x3

rx

3 x3

3 x1

1

0

0

 0

1

0  1,

0

0

1

• Если же, наоборот, между факторами
существует полная линейная
зависимость и все коэффициенты
корреляции равны единице, то
определитель такой матрицы равен
нулю:
1

1

1

Det R  1

1

1  0.

1

1

1

• Таким образом,

• чем ближе к нулю определитель
матрицы межфакторной корреляции,
тем сильнее мультиколлинеарность
факторов и ненадежнее результаты
множественной регрессии.

• Через коэффициенты множественной
детерминации можно найти
переменные, ответственные за
мультиколлинеарность факторов.

• Сравнивая между собой
коэффициенты множественной
детерминации факторов

R

2
x1 x2 , x3 ... x p

;R

2
x2 x1x3 ... x p

;

• оставляем в уравнении факторы с
минимальной величиной
коэффициента множественной
детерминации.

• При дополнительном включении в
регрессию р+1 фактора коэффициент
детерминации должен возрастать, а
остаточная дисперсия уменьшаться;
R

2
p 1

R

2
p

и S p2 1  S p2 .

• Пусть для регрессии, включающих пять
факторов, коэффициент детерминации
составил 0,857
включение шестого фактора дало
коэффициент детерминации
0,855,

вряд ли целесообразно дополнительно
включать в модель этот фактор.

Оценка параметров уравнения
множественной регрессии
• Метод:
– а) метод наименьших квадратов (МНК)
– б) метод наименьших квадратов (МНК) для
стандартизованного уравнения

• В линейной множественной регрессии


y x  a  b1  x 1  b 2  x 2  ...  b p  x p

параметры при переменной x называются
коэффициентами «чистой» регрессии.
Они характеризуют среднее изменение
результата с изменением соответствующего
фактора на единицу при неизменном
значении других факторов, закрепленном на
среднем уровне.

• уравнение регрессии в стандартизованном
виде:

t y  1 t x   2 t x    b p t x
1

2

p

Где t y , y x ,  , t x
переменные
1

t xi 

xi  xi

x

-стандартизованные

p

ty 

,

i

y y



y

Свойства:

t y  t xi  0,
 t   t  1;
y

x

 i -стандартизованные коэффициенты

регрессии.

• Стандартизованные коэффициенты регрессии
показывают, на сколько % изменится в среднем
результат, если соответствующий фактор xi
изменится на 1 % при неизменном среднем
уровне других факторов.

• Стандартизованные коэффициенты регрессии i
сравнимы между собой.
• Связь между «чистыми» и
«стандартизованными» коэффициентами
регрессии

bi   i



y

x

i

• Пример. Пусть функция издержек
производства y(тыс. руб.)
характеризуется уравнением вида
y  200  1, 2  x1  1,1  x 2  

• x1 - основные производственные
фонды(тыс.руб.)
• х2 - численность занятых в
производстве(чел.)

• уравнение регрессии в стандартизованном
виде выглядит так
t y  0 , 5  t x 1  0 ,8  t x 2 .

• Вывод:

• Достоинство стандартизованных
коэффициентов регрессии:
использовать при отсеве факторов – из
модели исключаются факторы с
наименьшим значением  j

Slide 25

Лекция № 3

множественная
регрессия и
корреляция.

• Уравнение множественной регрессии

y  a  b1 x1  b 2 x 2  ...  b p x p  



Основная
регрессии

цель

множественной

– построить модель с большим числом
факторов, определив при этом влияние
каждого из них в отдельности, а также
совокупное
их
воздействие
на
моделируемый показатель.

например
• Современная потребительская функция
чаще всего рассматривается как модель
вида
С  f ( y, P, M , Z ) ,

•
•
•
•
•

С – потребление;
у – доход;
P – цена,
M – наличные деньги;
Z – ликвидные активы;



Построение
уравнения
множественной
регрессии
начинается с решения вопроса о
спецификации модели.

Условия включения факторов при
построении множественной регрессии.
• 1. факторы должны быть
количественно измеримы.

• 2. Факторы не должны быть
интеркоррелированы.

• Если между факторами существует высокая
корреляция, то параметры уравнения
регрессии оказываются
неинтерпретируемыми.

• Пусть в уравнении

y  a  b1 х 1  b 2  х 2

r x1 x 2  0 .

Если же rx 1 x 2  1
то b 1 , b 2 нельзя интерпретировать как
показатели раздельного влияния x 1 и x 2
на у .

Пример.
• Рассмотрим регрессию себестоимости:
единицы
продукции
(руб.,у)
от
заработной платы работника (руб.,x) и
производительности его труда (единиц в
час, z ):
y  22600  5  x  10  z

•

r xz

= 0,95

Отбор факторов при построении
множественной регрессии.

• 2 этапа отбора факторов:
– факторы подбираются исходя из сущности проблемы;
– на основе корреляционной матрицы производится
исключение части факторов
• 1) проверка парной корреляции,
• 2) оценка мультиколлинеарности факторов:
– Проверка гипотезы H0: Det R=1

Пути преодоления сильной
межфакторной корреляции
• Исключение одного или нескольких факторов
• Преобразование факторов для уменьшения
корреляции между ними
– Переход к первым разностям
– Переход к линейным комбинациям (метод главных
компонент)

• Переход к совмещенным уравнениям
регрессии
• Переход к уравнениям приведенной формы

• Предпочтение отдается не фактору,
более тесно связанному с
результатом, а тому фактору,
который при достаточной тесной
связи с результатом имеет
наименьшую тесноту связи с
другими факторами.

• Пусть,
например,
при
изучении
зависимости
матрица парных
коэффициентов корреляции оказалась
следующей:

y

y

x

z

v

1

x

0,8

1

z
v

0,7

0,8

1

0,6

0,5

0,2

1

пример
y

y

x

z

v

1

x

0,3

1

z
v

0,7

0,75

1

0,6

0,5

0,8

1

• Для оценки мультиколлинеарности
факторов
может
использоваться
определитель
матрицы
парных
коэффициентов
корреляции между
факторами.

• Если бы факторы не коррелировали между
собой, то матрица парных коэффициентов
корреляции была бы единичной матрицей т.е.
rx

1 x1

rx

Det R  r x

1x2

rx

1 x3

2 x1

rx

rx

2 x2

rx

3 x2

rx

2 x3

rx

3 x3

3 x1

1

0

0

 0

1

0  1,

0

0

1

• Если же, наоборот, между факторами
существует полная линейная
зависимость и все коэффициенты
корреляции равны единице, то
определитель такой матрицы равен
нулю:
1

1

1

Det R  1

1

1  0.

1

1

1

• Таким образом,

• чем ближе к нулю определитель
матрицы межфакторной корреляции,
тем сильнее мультиколлинеарность
факторов и ненадежнее результаты
множественной регрессии.

• Через коэффициенты множественной
детерминации можно найти
переменные, ответственные за
мультиколлинеарность факторов.

• Сравнивая между собой
коэффициенты множественной
детерминации факторов

R

2
x1 x2 , x3 ... x p

;R

2
x2 x1x3 ... x p

;

• оставляем в уравнении факторы с
минимальной величиной
коэффициента множественной
детерминации.

• При дополнительном включении в
регрессию р+1 фактора коэффициент
детерминации должен возрастать, а
остаточная дисперсия уменьшаться;
R

2
p 1

R

2
p

и S p2 1  S p2 .

• Пусть для регрессии, включающих пять
факторов, коэффициент детерминации
составил 0,857
включение шестого фактора дало
коэффициент детерминации
0,855,

вряд ли целесообразно дополнительно
включать в модель этот фактор.

Оценка параметров уравнения
множественной регрессии
• Метод:
– а) метод наименьших квадратов (МНК)
– б) метод наименьших квадратов (МНК) для
стандартизованного уравнения

• В линейной множественной регрессии


y x  a  b1  x 1  b 2  x 2  ...  b p  x p

параметры при переменной x называются
коэффициентами «чистой» регрессии.
Они характеризуют среднее изменение
результата с изменением соответствующего
фактора на единицу при неизменном
значении других факторов, закрепленном на
среднем уровне.

• уравнение регрессии в стандартизованном
виде:

t y  1 t x   2 t x    b p t x
1

2

p

Где t y , y x ,  , t x
переменные
1

t xi 

xi  xi

x

-стандартизованные

p

ty 

,

i

y y



y

Свойства:

t y  t xi  0,
 t   t  1;
y

x

 i -стандартизованные коэффициенты

регрессии.

• Стандартизованные коэффициенты регрессии
показывают, на сколько % изменится в среднем
результат, если соответствующий фактор xi
изменится на 1 % при неизменном среднем
уровне других факторов.

• Стандартизованные коэффициенты регрессии i
сравнимы между собой.
• Связь между «чистыми» и
«стандартизованными» коэффициентами
регрессии

bi   i



y

x

i

• Пример. Пусть функция издержек
производства y(тыс. руб.)
характеризуется уравнением вида
y  200  1, 2  x1  1,1  x 2  

• x1 - основные производственные
фонды(тыс.руб.)
• х2 - численность занятых в
производстве(чел.)

• уравнение регрессии в стандартизованном
виде выглядит так
t y  0 , 5  t x 1  0 ,8  t x 2 .

• Вывод:

• Достоинство стандартизованных
коэффициентов регрессии:
использовать при отсеве факторов – из
модели исключаются факторы с
наименьшим значением  j

Slide 26

Лекция № 3

множественная
регрессия и
корреляция.

• Уравнение множественной регрессии

y  a  b1 x1  b 2 x 2  ...  b p x p  



Основная
регрессии

цель

множественной

– построить модель с большим числом
факторов, определив при этом влияние
каждого из них в отдельности, а также
совокупное
их
воздействие
на
моделируемый показатель.

например
• Современная потребительская функция
чаще всего рассматривается как модель
вида
С  f ( y, P, M , Z ) ,

•
•
•
•
•

С – потребление;
у – доход;
P – цена,
M – наличные деньги;
Z – ликвидные активы;



Построение
уравнения
множественной
регрессии
начинается с решения вопроса о
спецификации модели.

Условия включения факторов при
построении множественной регрессии.
• 1. факторы должны быть
количественно измеримы.

• 2. Факторы не должны быть
интеркоррелированы.

• Если между факторами существует высокая
корреляция, то параметры уравнения
регрессии оказываются
неинтерпретируемыми.

• Пусть в уравнении

y  a  b1 х 1  b 2  х 2

r x1 x 2  0 .

Если же rx 1 x 2  1
то b 1 , b 2 нельзя интерпретировать как
показатели раздельного влияния x 1 и x 2
на у .

Пример.
• Рассмотрим регрессию себестоимости:
единицы
продукции
(руб.,у)
от
заработной платы работника (руб.,x) и
производительности его труда (единиц в
час, z ):
y  22600  5  x  10  z

•

r xz

= 0,95

Отбор факторов при построении
множественной регрессии.

• 2 этапа отбора факторов:
– факторы подбираются исходя из сущности проблемы;
– на основе корреляционной матрицы производится
исключение части факторов
• 1) проверка парной корреляции,
• 2) оценка мультиколлинеарности факторов:
– Проверка гипотезы H0: Det R=1

Пути преодоления сильной
межфакторной корреляции
• Исключение одного или нескольких факторов
• Преобразование факторов для уменьшения
корреляции между ними
– Переход к первым разностям
– Переход к линейным комбинациям (метод главных
компонент)

• Переход к совмещенным уравнениям
регрессии
• Переход к уравнениям приведенной формы

• Предпочтение отдается не фактору,
более тесно связанному с
результатом, а тому фактору,
который при достаточной тесной
связи с результатом имеет
наименьшую тесноту связи с
другими факторами.

• Пусть,
например,
при
изучении
зависимости
матрица парных
коэффициентов корреляции оказалась
следующей:

y

y

x

z

v

1

x

0,8

1

z
v

0,7

0,8

1

0,6

0,5

0,2

1

пример
y

y

x

z

v

1

x

0,3

1

z
v

0,7

0,75

1

0,6

0,5

0,8

1

• Для оценки мультиколлинеарности
факторов
может
использоваться
определитель
матрицы
парных
коэффициентов
корреляции между
факторами.

• Если бы факторы не коррелировали между
собой, то матрица парных коэффициентов
корреляции была бы единичной матрицей т.е.
rx

1 x1

rx

Det R  r x

1x2

rx

1 x3

2 x1

rx

rx

2 x2

rx

3 x2

rx

2 x3

rx

3 x3

3 x1

1

0

0

 0

1

0  1,

0

0

1

• Если же, наоборот, между факторами
существует полная линейная
зависимость и все коэффициенты
корреляции равны единице, то
определитель такой матрицы равен
нулю:
1

1

1

Det R  1

1

1  0.

1

1

1

• Таким образом,

• чем ближе к нулю определитель
матрицы межфакторной корреляции,
тем сильнее мультиколлинеарность
факторов и ненадежнее результаты
множественной регрессии.

• Через коэффициенты множественной
детерминации можно найти
переменные, ответственные за
мультиколлинеарность факторов.

• Сравнивая между собой
коэффициенты множественной
детерминации факторов

R

2
x1 x2 , x3 ... x p

;R

2
x2 x1x3 ... x p

;

• оставляем в уравнении факторы с
минимальной величиной
коэффициента множественной
детерминации.

• При дополнительном включении в
регрессию р+1 фактора коэффициент
детерминации должен возрастать, а
остаточная дисперсия уменьшаться;
R

2
p 1

R

2
p

и S p2 1  S p2 .

• Пусть для регрессии, включающих пять
факторов, коэффициент детерминации
составил 0,857
включение шестого фактора дало
коэффициент детерминации
0,855,

вряд ли целесообразно дополнительно
включать в модель этот фактор.

Оценка параметров уравнения
множественной регрессии
• Метод:
– а) метод наименьших квадратов (МНК)
– б) метод наименьших квадратов (МНК) для
стандартизованного уравнения

• В линейной множественной регрессии


y x  a  b1  x 1  b 2  x 2  ...  b p  x p

параметры при переменной x называются
коэффициентами «чистой» регрессии.
Они характеризуют среднее изменение
результата с изменением соответствующего
фактора на единицу при неизменном
значении других факторов, закрепленном на
среднем уровне.

• уравнение регрессии в стандартизованном
виде:

t y  1 t x   2 t x    b p t x
1

2

p

Где t y , y x ,  , t x
переменные
1

t xi 

xi  xi

x

-стандартизованные

p

ty 

,

i

y y



y

Свойства:

t y  t xi  0,
 t   t  1;
y

x

 i -стандартизованные коэффициенты

регрессии.

• Стандартизованные коэффициенты регрессии
показывают, на сколько % изменится в среднем
результат, если соответствующий фактор xi
изменится на 1 % при неизменном среднем
уровне других факторов.

• Стандартизованные коэффициенты регрессии i
сравнимы между собой.
• Связь между «чистыми» и
«стандартизованными» коэффициентами
регрессии

bi   i



y

x

i

• Пример. Пусть функция издержек
производства y(тыс. руб.)
характеризуется уравнением вида
y  200  1, 2  x1  1,1  x 2  

• x1 - основные производственные
фонды(тыс.руб.)
• х2 - численность занятых в
производстве(чел.)

• уравнение регрессии в стандартизованном
виде выглядит так
t y  0 , 5  t x 1  0 ,8  t x 2 .

• Вывод:

• Достоинство стандартизованных
коэффициентов регрессии:
использовать при отсеве факторов – из
модели исключаются факторы с
наименьшим значением  j

Slide 27

Лекция № 3

множественная
регрессия и
корреляция.

• Уравнение множественной регрессии

y  a  b1 x1  b 2 x 2  ...  b p x p  



Основная
регрессии

цель

множественной

– построить модель с большим числом
факторов, определив при этом влияние
каждого из них в отдельности, а также
совокупное
их
воздействие
на
моделируемый показатель.

например
• Современная потребительская функция
чаще всего рассматривается как модель
вида
С  f ( y, P, M , Z ) ,

•
•
•
•
•

С – потребление;
у – доход;
P – цена,
M – наличные деньги;
Z – ликвидные активы;



Построение
уравнения
множественной
регрессии
начинается с решения вопроса о
спецификации модели.

Условия включения факторов при
построении множественной регрессии.
• 1. факторы должны быть
количественно измеримы.

• 2. Факторы не должны быть
интеркоррелированы.

• Если между факторами существует высокая
корреляция, то параметры уравнения
регрессии оказываются
неинтерпретируемыми.

• Пусть в уравнении

y  a  b1 х 1  b 2  х 2

r x1 x 2  0 .

Если же rx 1 x 2  1
то b 1 , b 2 нельзя интерпретировать как
показатели раздельного влияния x 1 и x 2
на у .

Пример.
• Рассмотрим регрессию себестоимости:
единицы
продукции
(руб.,у)
от
заработной платы работника (руб.,x) и
производительности его труда (единиц в
час, z ):
y  22600  5  x  10  z

•

r xz

= 0,95

Отбор факторов при построении
множественной регрессии.

• 2 этапа отбора факторов:
– факторы подбираются исходя из сущности проблемы;
– на основе корреляционной матрицы производится
исключение части факторов
• 1) проверка парной корреляции,
• 2) оценка мультиколлинеарности факторов:
– Проверка гипотезы H0: Det R=1

Пути преодоления сильной
межфакторной корреляции
• Исключение одного или нескольких факторов
• Преобразование факторов для уменьшения
корреляции между ними
– Переход к первым разностям
– Переход к линейным комбинациям (метод главных
компонент)

• Переход к совмещенным уравнениям
регрессии
• Переход к уравнениям приведенной формы

• Предпочтение отдается не фактору,
более тесно связанному с
результатом, а тому фактору,
который при достаточной тесной
связи с результатом имеет
наименьшую тесноту связи с
другими факторами.

• Пусть,
например,
при
изучении
зависимости
матрица парных
коэффициентов корреляции оказалась
следующей:

y

y

x

z

v

1

x

0,8

1

z
v

0,7

0,8

1

0,6

0,5

0,2

1

пример
y

y

x

z

v

1

x

0,3

1

z
v

0,7

0,75

1

0,6

0,5

0,8

1

• Для оценки мультиколлинеарности
факторов
может
использоваться
определитель
матрицы
парных
коэффициентов
корреляции между
факторами.

• Если бы факторы не коррелировали между
собой, то матрица парных коэффициентов
корреляции была бы единичной матрицей т.е.
rx

1 x1

rx

Det R  r x

1x2

rx

1 x3

2 x1

rx

rx

2 x2

rx

3 x2

rx

2 x3

rx

3 x3

3 x1

1

0

0

 0

1

0  1,

0

0

1

• Если же, наоборот, между факторами
существует полная линейная
зависимость и все коэффициенты
корреляции равны единице, то
определитель такой матрицы равен
нулю:
1

1

1

Det R  1

1

1  0.

1

1

1

• Таким образом,

• чем ближе к нулю определитель
матрицы межфакторной корреляции,
тем сильнее мультиколлинеарность
факторов и ненадежнее результаты
множественной регрессии.

• Через коэффициенты множественной
детерминации можно найти
переменные, ответственные за
мультиколлинеарность факторов.

• Сравнивая между собой
коэффициенты множественной
детерминации факторов

R

2
x1 x2 , x3 ... x p

;R

2
x2 x1x3 ... x p

;

• оставляем в уравнении факторы с
минимальной величиной
коэффициента множественной
детерминации.

• При дополнительном включении в
регрессию р+1 фактора коэффициент
детерминации должен возрастать, а
остаточная дисперсия уменьшаться;
R

2
p 1

R

2
p

и S p2 1  S p2 .

• Пусть для регрессии, включающих пять
факторов, коэффициент детерминации
составил 0,857
включение шестого фактора дало
коэффициент детерминации
0,855,

вряд ли целесообразно дополнительно
включать в модель этот фактор.

Оценка параметров уравнения
множественной регрессии
• Метод:
– а) метод наименьших квадратов (МНК)
– б) метод наименьших квадратов (МНК) для
стандартизованного уравнения

• В линейной множественной регрессии


y x  a  b1  x 1  b 2  x 2  ...  b p  x p

параметры при переменной x называются
коэффициентами «чистой» регрессии.
Они характеризуют среднее изменение
результата с изменением соответствующего
фактора на единицу при неизменном
значении других факторов, закрепленном на
среднем уровне.

• уравнение регрессии в стандартизованном
виде:

t y  1 t x   2 t x    b p t x
1

2

p

Где t y , y x ,  , t x
переменные
1

t xi 

xi  xi

x

-стандартизованные

p

ty 

,

i

y y



y

Свойства:

t y  t xi  0,
 t   t  1;
y

x

 i -стандартизованные коэффициенты

регрессии.

• Стандартизованные коэффициенты регрессии
показывают, на сколько % изменится в среднем
результат, если соответствующий фактор xi
изменится на 1 % при неизменном среднем
уровне других факторов.

• Стандартизованные коэффициенты регрессии i
сравнимы между собой.
• Связь между «чистыми» и
«стандартизованными» коэффициентами
регрессии

bi   i



y

x

i

• Пример. Пусть функция издержек
производства y(тыс. руб.)
характеризуется уравнением вида
y  200  1, 2  x1  1,1  x 2  

• x1 - основные производственные
фонды(тыс.руб.)
• х2 - численность занятых в
производстве(чел.)

• уравнение регрессии в стандартизованном
виде выглядит так
t y  0 , 5  t x 1  0 ,8  t x 2 .

• Вывод:

• Достоинство стандартизованных
коэффициентов регрессии:
использовать при отсеве факторов – из
модели исключаются факторы с
наименьшим значением  j

Slide 28

Лекция № 3

множественная
регрессия и
корреляция.

• Уравнение множественной регрессии

y  a  b1 x1  b 2 x 2  ...  b p x p  



Основная
регрессии

цель

множественной

– построить модель с большим числом
факторов, определив при этом влияние
каждого из них в отдельности, а также
совокупное
их
воздействие
на
моделируемый показатель.

например
• Современная потребительская функция
чаще всего рассматривается как модель
вида
С  f ( y, P, M , Z ) ,

•
•
•
•
•

С – потребление;
у – доход;
P – цена,
M – наличные деньги;
Z – ликвидные активы;



Построение
уравнения
множественной
регрессии
начинается с решения вопроса о
спецификации модели.

Условия включения факторов при
построении множественной регрессии.
• 1. факторы должны быть
количественно измеримы.

• 2. Факторы не должны быть
интеркоррелированы.

• Если между факторами существует высокая
корреляция, то параметры уравнения
регрессии оказываются
неинтерпретируемыми.

• Пусть в уравнении

y  a  b1 х 1  b 2  х 2

r x1 x 2  0 .

Если же rx 1 x 2  1
то b 1 , b 2 нельзя интерпретировать как
показатели раздельного влияния x 1 и x 2
на у .

Пример.
• Рассмотрим регрессию себестоимости:
единицы
продукции
(руб.,у)
от
заработной платы работника (руб.,x) и
производительности его труда (единиц в
час, z ):
y  22600  5  x  10  z

•

r xz

= 0,95

Отбор факторов при построении
множественной регрессии.

• 2 этапа отбора факторов:
– факторы подбираются исходя из сущности проблемы;
– на основе корреляционной матрицы производится
исключение части факторов
• 1) проверка парной корреляции,
• 2) оценка мультиколлинеарности факторов:
– Проверка гипотезы H0: Det R=1

Пути преодоления сильной
межфакторной корреляции
• Исключение одного или нескольких факторов
• Преобразование факторов для уменьшения
корреляции между ними
– Переход к первым разностям
– Переход к линейным комбинациям (метод главных
компонент)

• Переход к совмещенным уравнениям
регрессии
• Переход к уравнениям приведенной формы

• Предпочтение отдается не фактору,
более тесно связанному с
результатом, а тому фактору,
который при достаточной тесной
связи с результатом имеет
наименьшую тесноту связи с
другими факторами.

• Пусть,
например,
при
изучении
зависимости
матрица парных
коэффициентов корреляции оказалась
следующей:

y

y

x

z

v

1

x

0,8

1

z
v

0,7

0,8

1

0,6

0,5

0,2

1

пример
y

y

x

z

v

1

x

0,3

1

z
v

0,7

0,75

1

0,6

0,5

0,8

1

• Для оценки мультиколлинеарности
факторов
может
использоваться
определитель
матрицы
парных
коэффициентов
корреляции между
факторами.

• Если бы факторы не коррелировали между
собой, то матрица парных коэффициентов
корреляции была бы единичной матрицей т.е.
rx

1 x1

rx

Det R  r x

1x2

rx

1 x3

2 x1

rx

rx

2 x2

rx

3 x2

rx

2 x3

rx

3 x3

3 x1

1

0

0

 0

1

0  1,

0

0

1

• Если же, наоборот, между факторами
существует полная линейная
зависимость и все коэффициенты
корреляции равны единице, то
определитель такой матрицы равен
нулю:
1

1

1

Det R  1

1

1  0.

1

1

1

• Таким образом,

• чем ближе к нулю определитель
матрицы межфакторной корреляции,
тем сильнее мультиколлинеарность
факторов и ненадежнее результаты
множественной регрессии.

• Через коэффициенты множественной
детерминации можно найти
переменные, ответственные за
мультиколлинеарность факторов.

• Сравнивая между собой
коэффициенты множественной
детерминации факторов

R

2
x1 x2 , x3 ... x p

;R

2
x2 x1x3 ... x p

;

• оставляем в уравнении факторы с
минимальной величиной
коэффициента множественной
детерминации.

• При дополнительном включении в
регрессию р+1 фактора коэффициент
детерминации должен возрастать, а
остаточная дисперсия уменьшаться;
R

2
p 1

R

2
p

и S p2 1  S p2 .

• Пусть для регрессии, включающих пять
факторов, коэффициент детерминации
составил 0,857
включение шестого фактора дало
коэффициент детерминации
0,855,

вряд ли целесообразно дополнительно
включать в модель этот фактор.

Оценка параметров уравнения
множественной регрессии
• Метод:
– а) метод наименьших квадратов (МНК)
– б) метод наименьших квадратов (МНК) для
стандартизованного уравнения

• В линейной множественной регрессии


y x  a  b1  x 1  b 2  x 2  ...  b p  x p

параметры при переменной x называются
коэффициентами «чистой» регрессии.
Они характеризуют среднее изменение
результата с изменением соответствующего
фактора на единицу при неизменном
значении других факторов, закрепленном на
среднем уровне.

• уравнение регрессии в стандартизованном
виде:

t y  1 t x   2 t x    b p t x
1

2

p

Где t y , y x ,  , t x
переменные
1

t xi 

xi  xi

x

-стандартизованные

p

ty 

,

i

y y



y

Свойства:

t y  t xi  0,
 t   t  1;
y

x

 i -стандартизованные коэффициенты

регрессии.

• Стандартизованные коэффициенты регрессии
показывают, на сколько % изменится в среднем
результат, если соответствующий фактор xi
изменится на 1 % при неизменном среднем
уровне других факторов.

• Стандартизованные коэффициенты регрессии i
сравнимы между собой.
• Связь между «чистыми» и
«стандартизованными» коэффициентами
регрессии

bi   i



y

x

i

• Пример. Пусть функция издержек
производства y(тыс. руб.)
характеризуется уравнением вида
y  200  1, 2  x1  1,1  x 2  

• x1 - основные производственные
фонды(тыс.руб.)
• х2 - численность занятых в
производстве(чел.)

• уравнение регрессии в стандартизованном
виде выглядит так
t y  0 , 5  t x 1  0 ,8  t x 2 .

• Вывод:

• Достоинство стандартизованных
коэффициентов регрессии:
использовать при отсеве факторов – из
модели исключаются факторы с
наименьшим значением  j

Slide 29

Лекция № 3

множественная
регрессия и
корреляция.

• Уравнение множественной регрессии

y  a  b1 x1  b 2 x 2  ...  b p x p  



Основная
регрессии

цель

множественной

– построить модель с большим числом
факторов, определив при этом влияние
каждого из них в отдельности, а также
совокупное
их
воздействие
на
моделируемый показатель.

например
• Современная потребительская функция
чаще всего рассматривается как модель
вида
С  f ( y, P, M , Z ) ,

•
•
•
•
•

С – потребление;
у – доход;
P – цена,
M – наличные деньги;
Z – ликвидные активы;



Построение
уравнения
множественной
регрессии
начинается с решения вопроса о
спецификации модели.

Условия включения факторов при
построении множественной регрессии.
• 1. факторы должны быть
количественно измеримы.

• 2. Факторы не должны быть
интеркоррелированы.

• Если между факторами существует высокая
корреляция, то параметры уравнения
регрессии оказываются
неинтерпретируемыми.

• Пусть в уравнении

y  a  b1 х 1  b 2  х 2

r x1 x 2  0 .

Если же rx 1 x 2  1
то b 1 , b 2 нельзя интерпретировать как
показатели раздельного влияния x 1 и x 2
на у .

Пример.
• Рассмотрим регрессию себестоимости:
единицы
продукции
(руб.,у)
от
заработной платы работника (руб.,x) и
производительности его труда (единиц в
час, z ):
y  22600  5  x  10  z

•

r xz

= 0,95

Отбор факторов при построении
множественной регрессии.

• 2 этапа отбора факторов:
– факторы подбираются исходя из сущности проблемы;
– на основе корреляционной матрицы производится
исключение части факторов
• 1) проверка парной корреляции,
• 2) оценка мультиколлинеарности факторов:
– Проверка гипотезы H0: Det R=1

Пути преодоления сильной
межфакторной корреляции
• Исключение одного или нескольких факторов
• Преобразование факторов для уменьшения
корреляции между ними
– Переход к первым разностям
– Переход к линейным комбинациям (метод главных
компонент)

• Переход к совмещенным уравнениям
регрессии
• Переход к уравнениям приведенной формы

• Предпочтение отдается не фактору,
более тесно связанному с
результатом, а тому фактору,
который при достаточной тесной
связи с результатом имеет
наименьшую тесноту связи с
другими факторами.

• Пусть,
например,
при
изучении
зависимости
матрица парных
коэффициентов корреляции оказалась
следующей:

y

y

x

z

v

1

x

0,8

1

z
v

0,7

0,8

1

0,6

0,5

0,2

1

пример
y

y

x

z

v

1

x

0,3

1

z
v

0,7

0,75

1

0,6

0,5

0,8

1

• Для оценки мультиколлинеарности
факторов
может
использоваться
определитель
матрицы
парных
коэффициентов
корреляции между
факторами.

• Если бы факторы не коррелировали между
собой, то матрица парных коэффициентов
корреляции была бы единичной матрицей т.е.
rx

1 x1

rx

Det R  r x

1x2

rx

1 x3

2 x1

rx

rx

2 x2

rx

3 x2

rx

2 x3

rx

3 x3

3 x1

1

0

0

 0

1

0  1,

0

0

1

• Если же, наоборот, между факторами
существует полная линейная
зависимость и все коэффициенты
корреляции равны единице, то
определитель такой матрицы равен
нулю:
1

1

1

Det R  1

1

1  0.

1

1

1

• Таким образом,

• чем ближе к нулю определитель
матрицы межфакторной корреляции,
тем сильнее мультиколлинеарность
факторов и ненадежнее результаты
множественной регрессии.

• Через коэффициенты множественной
детерминации можно найти
переменные, ответственные за
мультиколлинеарность факторов.

• Сравнивая между собой
коэффициенты множественной
детерминации факторов

R

2
x1 x2 , x3 ... x p

;R

2
x2 x1x3 ... x p

;

• оставляем в уравнении факторы с
минимальной величиной
коэффициента множественной
детерминации.

• При дополнительном включении в
регрессию р+1 фактора коэффициент
детерминации должен возрастать, а
остаточная дисперсия уменьшаться;
R

2
p 1

R

2
p

и S p2 1  S p2 .

• Пусть для регрессии, включающих пять
факторов, коэффициент детерминации
составил 0,857
включение шестого фактора дало
коэффициент детерминации
0,855,

вряд ли целесообразно дополнительно
включать в модель этот фактор.

Оценка параметров уравнения
множественной регрессии
• Метод:
– а) метод наименьших квадратов (МНК)
– б) метод наименьших квадратов (МНК) для
стандартизованного уравнения

• В линейной множественной регрессии


y x  a  b1  x 1  b 2  x 2  ...  b p  x p

параметры при переменной x называются
коэффициентами «чистой» регрессии.
Они характеризуют среднее изменение
результата с изменением соответствующего
фактора на единицу при неизменном
значении других факторов, закрепленном на
среднем уровне.

• уравнение регрессии в стандартизованном
виде:

t y  1 t x   2 t x    b p t x
1

2

p

Где t y , y x ,  , t x
переменные
1

t xi 

xi  xi

x

-стандартизованные

p

ty 

,

i

y y



y

Свойства:

t y  t xi  0,
 t   t  1;
y

x

 i -стандартизованные коэффициенты

регрессии.

• Стандартизованные коэффициенты регрессии
показывают, на сколько % изменится в среднем
результат, если соответствующий фактор xi
изменится на 1 % при неизменном среднем
уровне других факторов.

• Стандартизованные коэффициенты регрессии i
сравнимы между собой.
• Связь между «чистыми» и
«стандартизованными» коэффициентами
регрессии

bi   i



y

x

i

• Пример. Пусть функция издержек
производства y(тыс. руб.)
характеризуется уравнением вида
y  200  1, 2  x1  1,1  x 2  

• x1 - основные производственные
фонды(тыс.руб.)
• х2 - численность занятых в
производстве(чел.)

• уравнение регрессии в стандартизованном
виде выглядит так
t y  0 , 5  t x 1  0 ,8  t x 2 .

• Вывод:

• Достоинство стандартизованных
коэффициентов регрессии:
использовать при отсеве факторов – из
модели исключаются факторы с
наименьшим значением  j

Slide 30

Лекция № 3

множественная
регрессия и
корреляция.

• Уравнение множественной регрессии

y  a  b1 x1  b 2 x 2  ...  b p x p  



Основная
регрессии

цель

множественной

– построить модель с большим числом
факторов, определив при этом влияние
каждого из них в отдельности, а также
совокупное
их
воздействие
на
моделируемый показатель.

например
• Современная потребительская функция
чаще всего рассматривается как модель
вида
С  f ( y, P, M , Z ) ,

•
•
•
•
•

С – потребление;
у – доход;
P – цена,
M – наличные деньги;
Z – ликвидные активы;



Построение
уравнения
множественной
регрессии
начинается с решения вопроса о
спецификации модели.

Условия включения факторов при
построении множественной регрессии.
• 1. факторы должны быть
количественно измеримы.

• 2. Факторы не должны быть
интеркоррелированы.

• Если между факторами существует высокая
корреляция, то параметры уравнения
регрессии оказываются
неинтерпретируемыми.

• Пусть в уравнении

y  a  b1 х 1  b 2  х 2

r x1 x 2  0 .

Если же rx 1 x 2  1
то b 1 , b 2 нельзя интерпретировать как
показатели раздельного влияния x 1 и x 2
на у .

Пример.
• Рассмотрим регрессию себестоимости:
единицы
продукции
(руб.,у)
от
заработной платы работника (руб.,x) и
производительности его труда (единиц в
час, z ):
y  22600  5  x  10  z

•

r xz

= 0,95

Отбор факторов при построении
множественной регрессии.

• 2 этапа отбора факторов:
– факторы подбираются исходя из сущности проблемы;
– на основе корреляционной матрицы производится
исключение части факторов
• 1) проверка парной корреляции,
• 2) оценка мультиколлинеарности факторов:
– Проверка гипотезы H0: Det R=1

Пути преодоления сильной
межфакторной корреляции
• Исключение одного или нескольких факторов
• Преобразование факторов для уменьшения
корреляции между ними
– Переход к первым разностям
– Переход к линейным комбинациям (метод главных
компонент)

• Переход к совмещенным уравнениям
регрессии
• Переход к уравнениям приведенной формы

• Предпочтение отдается не фактору,
более тесно связанному с
результатом, а тому фактору,
который при достаточной тесной
связи с результатом имеет
наименьшую тесноту связи с
другими факторами.

• Пусть,
например,
при
изучении
зависимости
матрица парных
коэффициентов корреляции оказалась
следующей:

y

y

x

z

v

1

x

0,8

1

z
v

0,7

0,8

1

0,6

0,5

0,2

1

пример
y

y

x

z

v

1

x

0,3

1

z
v

0,7

0,75

1

0,6

0,5

0,8

1

• Для оценки мультиколлинеарности
факторов
может
использоваться
определитель
матрицы
парных
коэффициентов
корреляции между
факторами.

• Если бы факторы не коррелировали между
собой, то матрица парных коэффициентов
корреляции была бы единичной матрицей т.е.
rx

1 x1

rx

Det R  r x

1x2

rx

1 x3

2 x1

rx

rx

2 x2

rx

3 x2

rx

2 x3

rx

3 x3

3 x1

1

0

0

 0

1

0  1,

0

0

1

• Если же, наоборот, между факторами
существует полная линейная
зависимость и все коэффициенты
корреляции равны единице, то
определитель такой матрицы равен
нулю:
1

1

1

Det R  1

1

1  0.

1

1

1

• Таким образом,

• чем ближе к нулю определитель
матрицы межфакторной корреляции,
тем сильнее мультиколлинеарность
факторов и ненадежнее результаты
множественной регрессии.

• Через коэффициенты множественной
детерминации можно найти
переменные, ответственные за
мультиколлинеарность факторов.

• Сравнивая между собой
коэффициенты множественной
детерминации факторов

R

2
x1 x2 , x3 ... x p

;R

2
x2 x1x3 ... x p

;

• оставляем в уравнении факторы с
минимальной величиной
коэффициента множественной
детерминации.

• При дополнительном включении в
регрессию р+1 фактора коэффициент
детерминации должен возрастать, а
остаточная дисперсия уменьшаться;
R

2
p 1

R

2
p

и S p2 1  S p2 .

• Пусть для регрессии, включающих пять
факторов, коэффициент детерминации
составил 0,857
включение шестого фактора дало
коэффициент детерминации
0,855,

вряд ли целесообразно дополнительно
включать в модель этот фактор.

Оценка параметров уравнения
множественной регрессии
• Метод:
– а) метод наименьших квадратов (МНК)
– б) метод наименьших квадратов (МНК) для
стандартизованного уравнения

• В линейной множественной регрессии


y x  a  b1  x 1  b 2  x 2  ...  b p  x p

параметры при переменной x называются
коэффициентами «чистой» регрессии.
Они характеризуют среднее изменение
результата с изменением соответствующего
фактора на единицу при неизменном
значении других факторов, закрепленном на
среднем уровне.

• уравнение регрессии в стандартизованном
виде:

t y  1 t x   2 t x    b p t x
1

2

p

Где t y , y x ,  , t x
переменные
1

t xi 

xi  xi

x

-стандартизованные

p

ty 

,

i

y y



y

Свойства:

t y  t xi  0,
 t   t  1;
y

x

 i -стандартизованные коэффициенты

регрессии.

• Стандартизованные коэффициенты регрессии
показывают, на сколько % изменится в среднем
результат, если соответствующий фактор xi
изменится на 1 % при неизменном среднем
уровне других факторов.

• Стандартизованные коэффициенты регрессии i
сравнимы между собой.
• Связь между «чистыми» и
«стандартизованными» коэффициентами
регрессии

bi   i



y

x

i

• Пример. Пусть функция издержек
производства y(тыс. руб.)
характеризуется уравнением вида
y  200  1, 2  x1  1,1  x 2  

• x1 - основные производственные
фонды(тыс.руб.)
• х2 - численность занятых в
производстве(чел.)

• уравнение регрессии в стандартизованном
виде выглядит так
t y  0 , 5  t x 1  0 ,8  t x 2 .

• Вывод:

• Достоинство стандартизованных
коэффициентов регрессии:
использовать при отсеве факторов – из
модели исключаются факторы с
наименьшим значением  j

Slide 31

Лекция № 3

множественная
регрессия и
корреляция.

• Уравнение множественной регрессии

y  a  b1 x1  b 2 x 2  ...  b p x p  



Основная
регрессии

цель

множественной

– построить модель с большим числом
факторов, определив при этом влияние
каждого из них в отдельности, а также
совокупное
их
воздействие
на
моделируемый показатель.

например
• Современная потребительская функция
чаще всего рассматривается как модель
вида
С  f ( y, P, M , Z ) ,

•
•
•
•
•

С – потребление;
у – доход;
P – цена,
M – наличные деньги;
Z – ликвидные активы;



Построение
уравнения
множественной
регрессии
начинается с решения вопроса о
спецификации модели.

Условия включения факторов при
построении множественной регрессии.
• 1. факторы должны быть
количественно измеримы.

• 2. Факторы не должны быть
интеркоррелированы.

• Если между факторами существует высокая
корреляция, то параметры уравнения
регрессии оказываются
неинтерпретируемыми.

• Пусть в уравнении

y  a  b1 х 1  b 2  х 2

r x1 x 2  0 .

Если же rx 1 x 2  1
то b 1 , b 2 нельзя интерпретировать как
показатели раздельного влияния x 1 и x 2
на у .

Пример.
• Рассмотрим регрессию себестоимости:
единицы
продукции
(руб.,у)
от
заработной платы работника (руб.,x) и
производительности его труда (единиц в
час, z ):
y  22600  5  x  10  z

•

r xz

= 0,95

Отбор факторов при построении
множественной регрессии.

• 2 этапа отбора факторов:
– факторы подбираются исходя из сущности проблемы;
– на основе корреляционной матрицы производится
исключение части факторов
• 1) проверка парной корреляции,
• 2) оценка мультиколлинеарности факторов:
– Проверка гипотезы H0: Det R=1

Пути преодоления сильной
межфакторной корреляции
• Исключение одного или нескольких факторов
• Преобразование факторов для уменьшения
корреляции между ними
– Переход к первым разностям
– Переход к линейным комбинациям (метод главных
компонент)

• Переход к совмещенным уравнениям
регрессии
• Переход к уравнениям приведенной формы

• Предпочтение отдается не фактору,
более тесно связанному с
результатом, а тому фактору,
который при достаточной тесной
связи с результатом имеет
наименьшую тесноту связи с
другими факторами.

• Пусть,
например,
при
изучении
зависимости
матрица парных
коэффициентов корреляции оказалась
следующей:

y

y

x

z

v

1

x

0,8

1

z
v

0,7

0,8

1

0,6

0,5

0,2

1

пример
y

y

x

z

v

1

x

0,3

1

z
v

0,7

0,75

1

0,6

0,5

0,8

1

• Для оценки мультиколлинеарности
факторов
может
использоваться
определитель
матрицы
парных
коэффициентов
корреляции между
факторами.

• Если бы факторы не коррелировали между
собой, то матрица парных коэффициентов
корреляции была бы единичной матрицей т.е.
rx

1 x1

rx

Det R  r x

1x2

rx

1 x3

2 x1

rx

rx

2 x2

rx

3 x2

rx

2 x3

rx

3 x3

3 x1

1

0

0

 0

1

0  1,

0

0

1

• Если же, наоборот, между факторами
существует полная линейная
зависимость и все коэффициенты
корреляции равны единице, то
определитель такой матрицы равен
нулю:
1

1

1

Det R  1

1

1  0.

1

1

1

• Таким образом,

• чем ближе к нулю определитель
матрицы межфакторной корреляции,
тем сильнее мультиколлинеарность
факторов и ненадежнее результаты
множественной регрессии.

• Через коэффициенты множественной
детерминации можно найти
переменные, ответственные за
мультиколлинеарность факторов.

• Сравнивая между собой
коэффициенты множественной
детерминации факторов

R

2
x1 x2 , x3 ... x p

;R

2
x2 x1x3 ... x p

;

• оставляем в уравнении факторы с
минимальной величиной
коэффициента множественной
детерминации.

• При дополнительном включении в
регрессию р+1 фактора коэффициент
детерминации должен возрастать, а
остаточная дисперсия уменьшаться;
R

2
p 1

R

2
p

и S p2 1  S p2 .

• Пусть для регрессии, включающих пять
факторов, коэффициент детерминации
составил 0,857
включение шестого фактора дало
коэффициент детерминации
0,855,

вряд ли целесообразно дополнительно
включать в модель этот фактор.

Оценка параметров уравнения
множественной регрессии
• Метод:
– а) метод наименьших квадратов (МНК)
– б) метод наименьших квадратов (МНК) для
стандартизованного уравнения

• В линейной множественной регрессии


y x  a  b1  x 1  b 2  x 2  ...  b p  x p

параметры при переменной x называются
коэффициентами «чистой» регрессии.
Они характеризуют среднее изменение
результата с изменением соответствующего
фактора на единицу при неизменном
значении других факторов, закрепленном на
среднем уровне.

• уравнение регрессии в стандартизованном
виде:

t y  1 t x   2 t x    b p t x
1

2

p

Где t y , y x ,  , t x
переменные
1

t xi 

xi  xi

x

-стандартизованные

p

ty 

,

i

y y



y

Свойства:

t y  t xi  0,
 t   t  1;
y

x

 i -стандартизованные коэффициенты

регрессии.

• Стандартизованные коэффициенты регрессии
показывают, на сколько % изменится в среднем
результат, если соответствующий фактор xi
изменится на 1 % при неизменном среднем
уровне других факторов.

• Стандартизованные коэффициенты регрессии i
сравнимы между собой.
• Связь между «чистыми» и
«стандартизованными» коэффициентами
регрессии

bi   i



y

x

i

• Пример. Пусть функция издержек
производства y(тыс. руб.)
характеризуется уравнением вида
y  200  1, 2  x1  1,1  x 2  

• x1 - основные производственные
фонды(тыс.руб.)
• х2 - численность занятых в
производстве(чел.)

• уравнение регрессии в стандартизованном
виде выглядит так
t y  0 , 5  t x 1  0 ,8  t x 2 .

• Вывод:

• Достоинство стандартизованных
коэффициентов регрессии:
использовать при отсеве факторов – из
модели исключаются факторы с
наименьшим значением  j

Slide 32

Лекция № 3

множественная
регрессия и
корреляция.

• Уравнение множественной регрессии

y  a  b1 x1  b 2 x 2  ...  b p x p  



Основная
регрессии

цель

множественной

– построить модель с большим числом
факторов, определив при этом влияние
каждого из них в отдельности, а также
совокупное
их
воздействие
на
моделируемый показатель.

например
• Современная потребительская функция
чаще всего рассматривается как модель
вида
С  f ( y, P, M , Z ) ,

•
•
•
•
•

С – потребление;
у – доход;
P – цена,
M – наличные деньги;
Z – ликвидные активы;



Построение
уравнения
множественной
регрессии
начинается с решения вопроса о
спецификации модели.

Условия включения факторов при
построении множественной регрессии.
• 1. факторы должны быть
количественно измеримы.

• 2. Факторы не должны быть
интеркоррелированы.

• Если между факторами существует высокая
корреляция, то параметры уравнения
регрессии оказываются
неинтерпретируемыми.

• Пусть в уравнении

y  a  b1 х 1  b 2  х 2

r x1 x 2  0 .

Если же rx 1 x 2  1
то b 1 , b 2 нельзя интерпретировать как
показатели раздельного влияния x 1 и x 2
на у .

Пример.
• Рассмотрим регрессию себестоимости:
единицы
продукции
(руб.,у)
от
заработной платы работника (руб.,x) и
производительности его труда (единиц в
час, z ):
y  22600  5  x  10  z

•

r xz

= 0,95

Отбор факторов при построении
множественной регрессии.

• 2 этапа отбора факторов:
– факторы подбираются исходя из сущности проблемы;
– на основе корреляционной матрицы производится
исключение части факторов
• 1) проверка парной корреляции,
• 2) оценка мультиколлинеарности факторов:
– Проверка гипотезы H0: Det R=1

Пути преодоления сильной
межфакторной корреляции
• Исключение одного или нескольких факторов
• Преобразование факторов для уменьшения
корреляции между ними
– Переход к первым разностям
– Переход к линейным комбинациям (метод главных
компонент)

• Переход к совмещенным уравнениям
регрессии
• Переход к уравнениям приведенной формы

• Предпочтение отдается не фактору,
более тесно связанному с
результатом, а тому фактору,
который при достаточной тесной
связи с результатом имеет
наименьшую тесноту связи с
другими факторами.

• Пусть,
например,
при
изучении
зависимости
матрица парных
коэффициентов корреляции оказалась
следующей:

y

y

x

z

v

1

x

0,8

1

z
v

0,7

0,8

1

0,6

0,5

0,2

1

пример
y

y

x

z

v

1

x

0,3

1

z
v

0,7

0,75

1

0,6

0,5

0,8

1

• Для оценки мультиколлинеарности
факторов
может
использоваться
определитель
матрицы
парных
коэффициентов
корреляции между
факторами.

• Если бы факторы не коррелировали между
собой, то матрица парных коэффициентов
корреляции была бы единичной матрицей т.е.
rx

1 x1

rx

Det R  r x

1x2

rx

1 x3

2 x1

rx

rx

2 x2

rx

3 x2

rx

2 x3

rx

3 x3

3 x1

1

0

0

 0

1

0  1,

0

0

1

• Если же, наоборот, между факторами
существует полная линейная
зависимость и все коэффициенты
корреляции равны единице, то
определитель такой матрицы равен
нулю:
1

1

1

Det R  1

1

1  0.

1

1

1

• Таким образом,

• чем ближе к нулю определитель
матрицы межфакторной корреляции,
тем сильнее мультиколлинеарность
факторов и ненадежнее результаты
множественной регрессии.

• Через коэффициенты множественной
детерминации можно найти
переменные, ответственные за
мультиколлинеарность факторов.

• Сравнивая между собой
коэффициенты множественной
детерминации факторов

R

2
x1 x2 , x3 ... x p

;R

2
x2 x1x3 ... x p

;

• оставляем в уравнении факторы с
минимальной величиной
коэффициента множественной
детерминации.

• При дополнительном включении в
регрессию р+1 фактора коэффициент
детерминации должен возрастать, а
остаточная дисперсия уменьшаться;
R

2
p 1

R

2
p

и S p2 1  S p2 .

• Пусть для регрессии, включающих пять
факторов, коэффициент детерминации
составил 0,857
включение шестого фактора дало
коэффициент детерминации
0,855,

вряд ли целесообразно дополнительно
включать в модель этот фактор.

Оценка параметров уравнения
множественной регрессии
• Метод:
– а) метод наименьших квадратов (МНК)
– б) метод наименьших квадратов (МНК) для
стандартизованного уравнения

• В линейной множественной регрессии


y x  a  b1  x 1  b 2  x 2  ...  b p  x p

параметры при переменной x называются
коэффициентами «чистой» регрессии.
Они характеризуют среднее изменение
результата с изменением соответствующего
фактора на единицу при неизменном
значении других факторов, закрепленном на
среднем уровне.

• уравнение регрессии в стандартизованном
виде:

t y  1 t x   2 t x    b p t x
1

2

p

Где t y , y x ,  , t x
переменные
1

t xi 

xi  xi

x

-стандартизованные

p

ty 

,

i

y y



y

Свойства:

t y  t xi  0,
 t   t  1;
y

x

 i -стандартизованные коэффициенты

регрессии.

• Стандартизованные коэффициенты регрессии
показывают, на сколько % изменится в среднем
результат, если соответствующий фактор xi
изменится на 1 % при неизменном среднем
уровне других факторов.

• Стандартизованные коэффициенты регрессии i
сравнимы между собой.
• Связь между «чистыми» и
«стандартизованными» коэффициентами
регрессии

bi   i



y

x

i

• Пример. Пусть функция издержек
производства y(тыс. руб.)
характеризуется уравнением вида
y  200  1, 2  x1  1,1  x 2  

• x1 - основные производственные
фонды(тыс.руб.)
• х2 - численность занятых в
производстве(чел.)

• уравнение регрессии в стандартизованном
виде выглядит так
t y  0 , 5  t x 1  0 ,8  t x 2 .

• Вывод:

• Достоинство стандартизованных
коэффициентов регрессии:
использовать при отсеве факторов – из
модели исключаются факторы с
наименьшим значением  j

Slide 33

Лекция № 3

множественная
регрессия и
корреляция.

• Уравнение множественной регрессии

y  a  b1 x1  b 2 x 2  ...  b p x p  



Основная
регрессии

цель

множественной

– построить модель с большим числом
факторов, определив при этом влияние
каждого из них в отдельности, а также
совокупное
их
воздействие
на
моделируемый показатель.

например
• Современная потребительская функция
чаще всего рассматривается как модель
вида
С  f ( y, P, M , Z ) ,

•
•
•
•
•

С – потребление;
у – доход;
P – цена,
M – наличные деньги;
Z – ликвидные активы;



Построение
уравнения
множественной
регрессии
начинается с решения вопроса о
спецификации модели.

Условия включения факторов при
построении множественной регрессии.
• 1. факторы должны быть
количественно измеримы.

• 2. Факторы не должны быть
интеркоррелированы.

• Если между факторами существует высокая
корреляция, то параметры уравнения
регрессии оказываются
неинтерпретируемыми.

• Пусть в уравнении

y  a  b1 х 1  b 2  х 2

r x1 x 2  0 .

Если же rx 1 x 2  1
то b 1 , b 2 нельзя интерпретировать как
показатели раздельного влияния x 1 и x 2
на у .

Пример.
• Рассмотрим регрессию себестоимости:
единицы
продукции
(руб.,у)
от
заработной платы работника (руб.,x) и
производительности его труда (единиц в
час, z ):
y  22600  5  x  10  z

•

r xz

= 0,95

Отбор факторов при построении
множественной регрессии.

• 2 этапа отбора факторов:
– факторы подбираются исходя из сущности проблемы;
– на основе корреляционной матрицы производится
исключение части факторов
• 1) проверка парной корреляции,
• 2) оценка мультиколлинеарности факторов:
– Проверка гипотезы H0: Det R=1

Пути преодоления сильной
межфакторной корреляции
• Исключение одного или нескольких факторов
• Преобразование факторов для уменьшения
корреляции между ними
– Переход к первым разностям
– Переход к линейным комбинациям (метод главных
компонент)

• Переход к совмещенным уравнениям
регрессии
• Переход к уравнениям приведенной формы

• Предпочтение отдается не фактору,
более тесно связанному с
результатом, а тому фактору,
который при достаточной тесной
связи с результатом имеет
наименьшую тесноту связи с
другими факторами.

• Пусть,
например,
при
изучении
зависимости
матрица парных
коэффициентов корреляции оказалась
следующей:

y

y

x

z

v

1

x

0,8

1

z
v

0,7

0,8

1

0,6

0,5

0,2

1

пример
y

y

x

z

v

1

x

0,3

1

z
v

0,7

0,75

1

0,6

0,5

0,8

1

• Для оценки мультиколлинеарности
факторов
может
использоваться
определитель
матрицы
парных
коэффициентов
корреляции между
факторами.

• Если бы факторы не коррелировали между
собой, то матрица парных коэффициентов
корреляции была бы единичной матрицей т.е.
rx

1 x1

rx

Det R  r x

1x2

rx

1 x3

2 x1

rx

rx

2 x2

rx

3 x2

rx

2 x3

rx

3 x3

3 x1

1

0

0

 0

1

0  1,

0

0

1

• Если же, наоборот, между факторами
существует полная линейная
зависимость и все коэффициенты
корреляции равны единице, то
определитель такой матрицы равен
нулю:
1

1

1

Det R  1

1

1  0.

1

1

1

• Таким образом,

• чем ближе к нулю определитель
матрицы межфакторной корреляции,
тем сильнее мультиколлинеарность
факторов и ненадежнее результаты
множественной регрессии.

• Через коэффициенты множественной
детерминации можно найти
переменные, ответственные за
мультиколлинеарность факторов.

• Сравнивая между собой
коэффициенты множественной
детерминации факторов

R

2
x1 x2 , x3 ... x p

;R

2
x2 x1x3 ... x p

;

• оставляем в уравнении факторы с
минимальной величиной
коэффициента множественной
детерминации.

• При дополнительном включении в
регрессию р+1 фактора коэффициент
детерминации должен возрастать, а
остаточная дисперсия уменьшаться;
R

2
p 1

R

2
p

и S p2 1  S p2 .

• Пусть для регрессии, включающих пять
факторов, коэффициент детерминации
составил 0,857
включение шестого фактора дало
коэффициент детерминации
0,855,

вряд ли целесообразно дополнительно
включать в модель этот фактор.

Оценка параметров уравнения
множественной регрессии
• Метод:
– а) метод наименьших квадратов (МНК)
– б) метод наименьших квадратов (МНК) для
стандартизованного уравнения

• В линейной множественной регрессии


y x  a  b1  x 1  b 2  x 2  ...  b p  x p

параметры при переменной x называются
коэффициентами «чистой» регрессии.
Они характеризуют среднее изменение
результата с изменением соответствующего
фактора на единицу при неизменном
значении других факторов, закрепленном на
среднем уровне.

• уравнение регрессии в стандартизованном
виде:

t y  1 t x   2 t x    b p t x
1

2

p

Где t y , y x ,  , t x
переменные
1

t xi 

xi  xi

x

-стандартизованные

p

ty 

,

i

y y



y

Свойства:

t y  t xi  0,
 t   t  1;
y

x

 i -стандартизованные коэффициенты

регрессии.

• Стандартизованные коэффициенты регрессии
показывают, на сколько % изменится в среднем
результат, если соответствующий фактор xi
изменится на 1 % при неизменном среднем
уровне других факторов.

• Стандартизованные коэффициенты регрессии i
сравнимы между собой.
• Связь между «чистыми» и
«стандартизованными» коэффициентами
регрессии

bi   i



y

x

i

• Пример. Пусть функция издержек
производства y(тыс. руб.)
характеризуется уравнением вида
y  200  1, 2  x1  1,1  x 2  

• x1 - основные производственные
фонды(тыс.руб.)
• х2 - численность занятых в
производстве(чел.)

• уравнение регрессии в стандартизованном
виде выглядит так
t y  0 , 5  t x 1  0 ,8  t x 2 .

• Вывод:

• Достоинство стандартизованных
коэффициентов регрессии:
использовать при отсеве факторов – из
модели исключаются факторы с
наименьшим значением  j

Slide 34

Лекция № 3

множественная
регрессия и
корреляция.

• Уравнение множественной регрессии

y  a  b1 x1  b 2 x 2  ...  b p x p  



Основная
регрессии

цель

множественной

– построить модель с большим числом
факторов, определив при этом влияние
каждого из них в отдельности, а также
совокупное
их
воздействие
на
моделируемый показатель.

например
• Современная потребительская функция
чаще всего рассматривается как модель
вида
С  f ( y, P, M , Z ) ,

•
•
•
•
•

С – потребление;
у – доход;
P – цена,
M – наличные деньги;
Z – ликвидные активы;



Построение
уравнения
множественной
регрессии
начинается с решения вопроса о
спецификации модели.

Условия включения факторов при
построении множественной регрессии.
• 1. факторы должны быть
количественно измеримы.

• 2. Факторы не должны быть
интеркоррелированы.

• Если между факторами существует высокая
корреляция, то параметры уравнения
регрессии оказываются
неинтерпретируемыми.

• Пусть в уравнении

y  a  b1 х 1  b 2  х 2

r x1 x 2  0 .

Если же rx 1 x 2  1
то b 1 , b 2 нельзя интерпретировать как
показатели раздельного влияния x 1 и x 2
на у .

Пример.
• Рассмотрим регрессию себестоимости:
единицы
продукции
(руб.,у)
от
заработной платы работника (руб.,x) и
производительности его труда (единиц в
час, z ):
y  22600  5  x  10  z

•

r xz

= 0,95

Отбор факторов при построении
множественной регрессии.

• 2 этапа отбора факторов:
– факторы подбираются исходя из сущности проблемы;
– на основе корреляционной матрицы производится
исключение части факторов
• 1) проверка парной корреляции,
• 2) оценка мультиколлинеарности факторов:
– Проверка гипотезы H0: Det R=1

Пути преодоления сильной
межфакторной корреляции
• Исключение одного или нескольких факторов
• Преобразование факторов для уменьшения
корреляции между ними
– Переход к первым разностям
– Переход к линейным комбинациям (метод главных
компонент)

• Переход к совмещенным уравнениям
регрессии
• Переход к уравнениям приведенной формы

• Предпочтение отдается не фактору,
более тесно связанному с
результатом, а тому фактору,
который при достаточной тесной
связи с результатом имеет
наименьшую тесноту связи с
другими факторами.

• Пусть,
например,
при
изучении
зависимости
матрица парных
коэффициентов корреляции оказалась
следующей:

y

y

x

z

v

1

x

0,8

1

z
v

0,7

0,8

1

0,6

0,5

0,2

1

пример
y

y

x

z

v

1

x

0,3

1

z
v

0,7

0,75

1

0,6

0,5

0,8

1

• Для оценки мультиколлинеарности
факторов
может
использоваться
определитель
матрицы
парных
коэффициентов
корреляции между
факторами.

• Если бы факторы не коррелировали между
собой, то матрица парных коэффициентов
корреляции была бы единичной матрицей т.е.
rx

1 x1

rx

Det R  r x

1x2

rx

1 x3

2 x1

rx

rx

2 x2

rx

3 x2

rx

2 x3

rx

3 x3

3 x1

1

0

0

 0

1

0  1,

0

0

1

• Если же, наоборот, между факторами
существует полная линейная
зависимость и все коэффициенты
корреляции равны единице, то
определитель такой матрицы равен
нулю:
1

1

1

Det R  1

1

1  0.

1

1

1

• Таким образом,

• чем ближе к нулю определитель
матрицы межфакторной корреляции,
тем сильнее мультиколлинеарность
факторов и ненадежнее результаты
множественной регрессии.

• Через коэффициенты множественной
детерминации можно найти
переменные, ответственные за
мультиколлинеарность факторов.

• Сравнивая между собой
коэффициенты множественной
детерминации факторов

R

2
x1 x2 , x3 ... x p

;R

2
x2 x1x3 ... x p

;

• оставляем в уравнении факторы с
минимальной величиной
коэффициента множественной
детерминации.

• При дополнительном включении в
регрессию р+1 фактора коэффициент
детерминации должен возрастать, а
остаточная дисперсия уменьшаться;
R

2
p 1

R

2
p

и S p2 1  S p2 .

• Пусть для регрессии, включающих пять
факторов, коэффициент детерминации
составил 0,857
включение шестого фактора дало
коэффициент детерминации
0,855,

вряд ли целесообразно дополнительно
включать в модель этот фактор.

Оценка параметров уравнения
множественной регрессии
• Метод:
– а) метод наименьших квадратов (МНК)
– б) метод наименьших квадратов (МНК) для
стандартизованного уравнения

• В линейной множественной регрессии


y x  a  b1  x 1  b 2  x 2  ...  b p  x p

параметры при переменной x называются
коэффициентами «чистой» регрессии.
Они характеризуют среднее изменение
результата с изменением соответствующего
фактора на единицу при неизменном
значении других факторов, закрепленном на
среднем уровне.

• уравнение регрессии в стандартизованном
виде:

t y  1 t x   2 t x    b p t x
1

2

p

Где t y , y x ,  , t x
переменные
1

t xi 

xi  xi

x

-стандартизованные

p

ty 

,

i

y y



y

Свойства:

t y  t xi  0,
 t   t  1;
y

x

 i -стандартизованные коэффициенты

регрессии.

• Стандартизованные коэффициенты регрессии
показывают, на сколько % изменится в среднем
результат, если соответствующий фактор xi
изменится на 1 % при неизменном среднем
уровне других факторов.

• Стандартизованные коэффициенты регрессии i
сравнимы между собой.
• Связь между «чистыми» и
«стандартизованными» коэффициентами
регрессии

bi   i



y

x

i

• Пример. Пусть функция издержек
производства y(тыс. руб.)
характеризуется уравнением вида
y  200  1, 2  x1  1,1  x 2  

• x1 - основные производственные
фонды(тыс.руб.)
• х2 - численность занятых в
производстве(чел.)

• уравнение регрессии в стандартизованном
виде выглядит так
t y  0 , 5  t x 1  0 ,8  t x 2 .

• Вывод:

• Достоинство стандартизованных
коэффициентов регрессии:
использовать при отсеве факторов – из
модели исключаются факторы с
наименьшим значением  j

Slide 35

Лекция № 3

множественная
регрессия и
корреляция.

• Уравнение множественной регрессии

y  a  b1 x1  b 2 x 2  ...  b p x p  



Основная
регрессии

цель

множественной

– построить модель с большим числом
факторов, определив при этом влияние
каждого из них в отдельности, а также
совокупное
их
воздействие
на
моделируемый показатель.

например
• Современная потребительская функция
чаще всего рассматривается как модель
вида
С  f ( y, P, M , Z ) ,

•
•
•
•
•

С – потребление;
у – доход;
P – цена,
M – наличные деньги;
Z – ликвидные активы;



Построение
уравнения
множественной
регрессии
начинается с решения вопроса о
спецификации модели.

Условия включения факторов при
построении множественной регрессии.
• 1. факторы должны быть
количественно измеримы.

• 2. Факторы не должны быть
интеркоррелированы.

• Если между факторами существует высокая
корреляция, то параметры уравнения
регрессии оказываются
неинтерпретируемыми.

• Пусть в уравнении

y  a  b1 х 1  b 2  х 2

r x1 x 2  0 .

Если же rx 1 x 2  1
то b 1 , b 2 нельзя интерпретировать как
показатели раздельного влияния x 1 и x 2
на у .

Пример.
• Рассмотрим регрессию себестоимости:
единицы
продукции
(руб.,у)
от
заработной платы работника (руб.,x) и
производительности его труда (единиц в
час, z ):
y  22600  5  x  10  z

•

r xz

= 0,95

Отбор факторов при построении
множественной регрессии.

• 2 этапа отбора факторов:
– факторы подбираются исходя из сущности проблемы;
– на основе корреляционной матрицы производится
исключение части факторов
• 1) проверка парной корреляции,
• 2) оценка мультиколлинеарности факторов:
– Проверка гипотезы H0: Det R=1

Пути преодоления сильной
межфакторной корреляции
• Исключение одного или нескольких факторов
• Преобразование факторов для уменьшения
корреляции между ними
– Переход к первым разностям
– Переход к линейным комбинациям (метод главных
компонент)

• Переход к совмещенным уравнениям
регрессии
• Переход к уравнениям приведенной формы

• Предпочтение отдается не фактору,
более тесно связанному с
результатом, а тому фактору,
который при достаточной тесной
связи с результатом имеет
наименьшую тесноту связи с
другими факторами.

• Пусть,
например,
при
изучении
зависимости
матрица парных
коэффициентов корреляции оказалась
следующей:

y

y

x

z

v

1

x

0,8

1

z
v

0,7

0,8

1

0,6

0,5

0,2

1

пример
y

y

x

z

v

1

x

0,3

1

z
v

0,7

0,75

1

0,6

0,5

0,8

1

• Для оценки мультиколлинеарности
факторов
может
использоваться
определитель
матрицы
парных
коэффициентов
корреляции между
факторами.

• Если бы факторы не коррелировали между
собой, то матрица парных коэффициентов
корреляции была бы единичной матрицей т.е.
rx

1 x1

rx

Det R  r x

1x2

rx

1 x3

2 x1

rx

rx

2 x2

rx

3 x2

rx

2 x3

rx

3 x3

3 x1

1

0

0

 0

1

0  1,

0

0

1

• Если же, наоборот, между факторами
существует полная линейная
зависимость и все коэффициенты
корреляции равны единице, то
определитель такой матрицы равен
нулю:
1

1

1

Det R  1

1

1  0.

1

1

1

• Таким образом,

• чем ближе к нулю определитель
матрицы межфакторной корреляции,
тем сильнее мультиколлинеарность
факторов и ненадежнее результаты
множественной регрессии.

• Через коэффициенты множественной
детерминации можно найти
переменные, ответственные за
мультиколлинеарность факторов.

• Сравнивая между собой
коэффициенты множественной
детерминации факторов

R

2
x1 x2 , x3 ... x p

;R

2
x2 x1x3 ... x p

;

• оставляем в уравнении факторы с
минимальной величиной
коэффициента множественной
детерминации.

• При дополнительном включении в
регрессию р+1 фактора коэффициент
детерминации должен возрастать, а
остаточная дисперсия уменьшаться;
R

2
p 1

R

2
p

и S p2 1  S p2 .

• Пусть для регрессии, включающих пять
факторов, коэффициент детерминации
составил 0,857
включение шестого фактора дало
коэффициент детерминации
0,855,

вряд ли целесообразно дополнительно
включать в модель этот фактор.

Оценка параметров уравнения
множественной регрессии
• Метод:
– а) метод наименьших квадратов (МНК)
– б) метод наименьших квадратов (МНК) для
стандартизованного уравнения

• В линейной множественной регрессии


y x  a  b1  x 1  b 2  x 2  ...  b p  x p

параметры при переменной x называются
коэффициентами «чистой» регрессии.
Они характеризуют среднее изменение
результата с изменением соответствующего
фактора на единицу при неизменном
значении других факторов, закрепленном на
среднем уровне.

• уравнение регрессии в стандартизованном
виде:

t y  1 t x   2 t x    b p t x
1

2

p

Где t y , y x ,  , t x
переменные
1

t xi 

xi  xi

x

-стандартизованные

p

ty 

,

i

y y



y

Свойства:

t y  t xi  0,
 t   t  1;
y

x

 i -стандартизованные коэффициенты

регрессии.

• Стандартизованные коэффициенты регрессии
показывают, на сколько % изменится в среднем
результат, если соответствующий фактор xi
изменится на 1 % при неизменном среднем
уровне других факторов.

• Стандартизованные коэффициенты регрессии i
сравнимы между собой.
• Связь между «чистыми» и
«стандартизованными» коэффициентами
регрессии

bi   i



y

x

i

• Пример. Пусть функция издержек
производства y(тыс. руб.)
характеризуется уравнением вида
y  200  1, 2  x1  1,1  x 2  

• x1 - основные производственные
фонды(тыс.руб.)
• х2 - численность занятых в
производстве(чел.)

• уравнение регрессии в стандартизованном
виде выглядит так
t y  0 , 5  t x 1  0 ,8  t x 2 .

• Вывод:

• Достоинство стандартизованных
коэффициентов регрессии:
использовать при отсеве факторов – из
модели исключаются факторы с
наименьшим значением  j

Лекция № 3 множественная регрессия и корреляция. • Уравнение множественной регрессии y  a  b1 x1  b 2 x 2  ...

Transcript Лекция № 3 множественная регрессия и корреляция. • Уравнение множественной регрессии y  a  b1 x1  b 2 x 2  ...

Directory