Transcript Lecture_6

Спецификация Уравнения
Регрессии:
Выбор Функциональной
Формы
1
Выбор функциональной
формы должен базироваться
на экономической теории и
лишь в исключительных
случаях – на подборе
формы, наилучше
соответствующей выборке.
2
Линейный регрессионный
анализ применим только к
уравнениям линейным по
коэффициентам.
Т.е. коэффициенты входят в
уравнение в простейшей
форме – они не возведены в
степень, не умножены и не
разделены друг на друга, не
содержат функций.
3
Общий вид линейного уравнения
регрессии:
f(Y)= β1+ β2*g2(X2) +… + βk*gk(Xk) + u,
где f(•), g2(•), …, gk(•) – какие-то
функции.
4
Примеры.
(ЛР-линейная регрессия)
1.
2.
3.
4.
5.
Y = β1 + 2*X3 +u
Y = e1 X2 eu
Y = β1 X2 u
Y = β1 + 2*Xβ3 + u
Y = β1 X 2 + u
(ЛР)
(ЛР)
(ЛР)
(нет)
(нет)
5
Чтобы точнее выбрать
форму модели надо знать
свойства основных
функций.
6
Основные характеристики
функциональной формы:
наклон
/
или
Y
Y
X
j

X
j
эластичность
X
 Y ,X 

*
X /X
X Y
Y /Y
Y
j
j
j
j
j
X
 Y *
X Y
j
j
7
И наклон и эластичность
характеризуют реакцию Y на
изменения Х. Но наклон – в
абсолютных единицах, а
эластичность – в относительных.
8
Линейная форма
Y = 1 + 2*X2 + … + k*Xk + u
Базируется на предположении, что
данному приросту независимой
переменной всегда соответствует
один и тот же прирост зависимой
переменной:
Y = j*Xj (*)
9
Линейная форма
Имеет постоянный наклон:
Y/ Xj = j.
10
Y = 1 + 2*X2 + … + k*Xk + u
Эта форма выбирается, когда
предполагаемая связь между Y и
Xj удовлетворяет (*):Y = j*Xj .
Кроме того, это форма «по
умолчанию».
11
Двойная логарифмическая
(log-log) форма
Y = eβ1*X22*…*Xkk*eu
Форма приводится к линейной
логарифмированием:
lnY =1 + 2*lnX2 +… + k*lnXk + u
12
lnY =1+2*lnX2+ … + k*lnXk + u
Форма используется, когда есть
основания полагать, что
эластичности Y по каждому Xj,
j =2,…, k, постоянны.
Y,Xj = j .
Т.е., j – эластичность Y по Xj,
j =1,…,k.
13
lnY =1 + 2*lnX2 + … + k*lnXk + u
Интерпретация j:
если Xj изменяется на 1% ( и при
этом все остальные X сохраняют
постоянные значения), то Y
изменяется в среднем на j%-в.
Это также форма «по умолчанию».
14
Важный пример log-log формы –
производственная функция
(ПФ)
Кобба-Дугласа:
Y = A*K*L*eu
Y – выход продукции,
K – затраты капитала,
L – затраты труда.
(А – константа.)
15
К линейному виду приводится
логарифмированием:
lnY = С+α*lnK + β*lnL + u
(С=lnA)
α - эластичность выпуска по затратам
капитала,
 - эластичность выпуска по затратам
труда.
16
lnY = С+α*lnK + β*lnL + u
Если
 +  > 1, имеется возрастающий
эффект от масштабов производства;
 +  < 1 - убывающий;
 +  = 1 - постоянный.
17
Полулогарифмические формы.
Форма lin-log
Y = β1 + 2*lnX + u
Используется, когда есть основания
предполагать, что с ростом X
влияние X на Y уменьшается, но не
пропадает совсем.
Интерпретация 2: при изменении X
на 1% Y изменяется на 2/100
единиц (в которых Y измеряется ).
18
Эластичность Y по Х:
1
 Y.X   2 * Y
т. е. падает с ростом Y.
Моделирование «возрастания с
убывающей скоростью».
19
Применение. Например, большинство
потребительских функций.
При возрастании дохода (X) все
меньшая его часть идет на
потребление (Y).
Y = β1 + 2*lnX + u
20
21
Полулогарифмические формы.
Форма log-lin
(экспоненциальная).
lnY = 1 + 2*X + u
Эластичность:

Y.X
  *X
2
растет с ростом Х.
«Возрастание с возрастающей скоростью»
22
Интерпретация 2: при
увеличении Х на 1 единицу
(измерения Х) Y изменяется
на 2*100%.
23
Применение. Например:


потребительские функции для
товаров роскоши.
оплата труда: %-я надбавка в
зависимости от стажа и опыта.
24
в
регрессии Y по времени t,
когда можно полагать, что Y
имеет постоянный темп
прироста во времени.
25
26
Y = β1*e2t*ε
lnY = lnβ1 + 2*t + ν
2 - относительный прирост Y за
единицу времени:
Y/ t

2
Y
Темп прироста Y за единицу
времени равен 2*100%.
27
Полиномиальная Форма
(Парабола)
Y =  + 1*X + 2*X2 +…+ k*Xk + u
При k=2:
Y =  + 1*X + 2*X2 + u
Например, моделирование
зависимости цены производства
(Y) от объема выпуска (X); при
этом 1 < 0,
2 >0.
28
ОБЪЕМ ВЫПУСКА
29
ЦЕНА ПРОИЗВОДСТВА
ЗАРПЛАТА
Моделировании зависимости годовой
зарплаты человека (Y) от возраста (X);
при этом 1 > 0, 2 < 0.
ВОЗРАСТ
30
Полиномы степени k>3
применяются редко.
31
Обратная Форма
Зависимости
(гиперболическая)
1
Y    * u
X
Используется при предположении,
что с ростом фактора X его
влияние на фактор Y сводится к
нулю.
Моделирование быстрого
насыщения.
32
Y
 0

 0
X
33
Пример. Моделирование
потребления товаров 1-й
необходимости.
34
Пример.
Кривая Филлипса, описывающая
взаимосвязь между уровнем
безработицы в год t в процентах
(Ut) и темпами прироста зарплаты
в год t в процентах (  Wt):
 Wt     *
 < 0,  > 0.
1
U
u
t
35
Δwt
ΔWt
Естественный уровень безработицы,
т. е. значение ut, при котором Δwt = 0
ut
U
t
36
Взаимодействие Независимых
Переменных
Y= 1+ 2*X2 +3*X3 +4*X2*X3 + u
Используется при предположении,
что влияние X2 на Y зависит от
значения X3, а влияние X3 на Y –
от значения X2.
37
Проблема с R2
Качество уравнений регрессии
не может сравниваться по R2,
если зависимая переменная в
них присутствует в
различных функциональных
формах.
38
Например,
(1) Y
= …….; R12
(2) lnY = …….; R22
Качество уравнений (1) и (2)
нельзя сравнивать, сопоставляя
R12 и R22 (если только R12>> R22
или R22 >> R12).
39
.
Для сравнения таких моделей
используют:
1. Метод Зарембки.
2. Преобразование Бокса-Кокса.
40
Метод Зарембки
Y
X
ln(Y)
X
2
11
ln(2)
11
5
10
ln(5)
10
4
20
ln(4)
20
ˆ = b1 + b2*X
Y

lnY
= c1 + c2*X
41
Вычисляют среднее геометрическое
выборочных значений Yi:
n
(
Y *...* Y
1
n
  2 * 4 * 5  40
3
3
),
преобразуют переменные:
Y*i = Yi/
и рассчитывают новые регрессии по
таблицам:
42
Y*
ln(Y*)
X
2 / 40
11
11
ln(2 / 40)
4 / 3 40
10
ln(4 / 40) 10
3
3
5 / 40
Yˆ
X
3
3
20
3
ln(5 / 40) 20

*
= b1* + b2**X
lnY *
= с1* + c2**X
43
Для этих уравнений
рассчитывают RSS*1 и RSS*2
и модель с меньшей RSS
дает лучшее соответствие
линии регрессии выборке.
.
44
Чтобы проверить, обеспечивает
ли одна модель значимо
лучшее соответствие, надо
вычислить величину:
2 = | (n/2)*ln(RSS*1 / RSS*2 )|,
45
затем по таблице
распределения 2 найти
2кр(1;α).
Если 2 > 2кр(1;α), то
различие в качестве
объяснения двумя
уравнениями значимое.
46
Примеры интерпретации
коэффициентов в
логарифмических и
полулогарифмических моделях
47
Двойная логарифмическая
модель
Выпуск сектора экономики может быть
смоделирован производственной функцией
Кобба-Дугласа:
Y = c*Kα*Lβ*u,
где Y – выпуск в денежных единицах,
К - затраты капитала в денежных единицах,
L - затраты труда, например, в работниках,
с – константа,
α, β – параметры модели.
48
Для того, чтобы оценить по МНК
модель
Y = c*Kα*Lβ*u
Надо взять логарифм от обеих ее
частей:
lnY = ln c + α*lnK + β*lnL + ln u
49
Или:
lnY = А + α*lnK + β*lnL + v.
Эта модель была оценена по
данным для 41 фирмы
одного из секторов
экономики Индии
(соответственно, все
денежные единицы – тысячи
рупий, затраты труда – в
работниках).
50
lnŶ = -0,68 + 0,41*lnK + 0,50*lnL .
Интерпретация коэффициентов
наклона:
- при увеличении затрат
капитала на 1% и
неизменности затрат труда
выпуск фирмы увеличивается в
среднем на 0,41%.
51
lnŶ = -0,68 + 0,41*lnK + 0,50*lnL
.
Интерпретация коэффициентов
наклона:
- при увеличении затрат труда
на 1% и неизменности затрат
капитала выпуск фирмы
увеличивается в среднем на
0,50%.
52
Полулогарифмическая модель
(log-lin)
W – почасовая зарплата в $,
Е – число лет, потраченных на
образование,
S – число лет работы по
специальности.
ln W = β1 + β2*E + β2*S + u
53
ln W = β1 + β2*E + β2*S + u
Модель оценивалась по данным
для 420 человек:
ln Ŵ =-0.12 + 0.052*E + 0.103*S
54
ln Ŵ =-0.12 + 0.0052*E + 0.0103*S
Интерпретация коэффициентов:
- при увеличении числа лет,
потраченных на обучение, на 1
год и неизменности стажа работы
почасовая заработная плата
увеличивается в среднем на
0,52%.
55
ln Ŵ =-0.12 + 0.0052*E + 0.0103*S
Интерпретация коэффициентов:
- при увеличении стажа работы на 1
год и неизменности числа лет,
потраченных на обучение,
почасовая заработная плата
увеличивается в среднем на
1,03%.
56
Если экономический показатель Y
экспоненциально растет (или
убывает) во времени t, то
динамика его моделируется
уравнением:
Y = A*ert*v,
где A и r – параметры модели, v –
случайный член.
57
Y = A*ert*v,
r*100% интерпретируется как темп
прироста.
Для оценки модели берут
логарифм от обеих ее частей:
ln Y = lnA + r*t + ln v
58
Или:
ln Y = a + r*t + u.
Например, пусть модель
оценивается по ежегодным
данным для ВВП (Y) какой-то
страны, выраженном в млн. $.
Получается уравнение:
59
ln Ŷ = 0,12 + 0,042*t .
Тогда интерпретация
коэффициента при времени t
следующая:
ежегодный темп прироста ВВП
составляет в среднем 4,2%.
60
Полулогарифмическая модель
(lin-log)
Модель может быть записана в виде:
Y = β1 + β2*lnX + u
Пусть, например, эта модель
использовалась для моделирования
ежемесячного спроса на бананы (Y, в
кг) от среднемесячного душевого
дохода (Х, в тысячах рублей) в какомто населенном пункте.
61
Было получено уравнение:
Ŷ = 1,2 + 48,8*lnX
Интерпретация коэффициента
наклона:
- при увеличении среднедушевого
месячного дохода на 1% спрос на
бананы увеличивается в среднем
на 0,488 кг.
62