Transcript Lecture_6
Спецификация Уравнения Регрессии: Выбор Функциональной Формы 1 Выбор функциональной формы должен базироваться на экономической теории и лишь в исключительных случаях – на подборе формы, наилучше соответствующей выборке. 2 Линейный регрессионный анализ применим только к уравнениям линейным по коэффициентам. Т.е. коэффициенты входят в уравнение в простейшей форме – они не возведены в степень, не умножены и не разделены друг на друга, не содержат функций. 3 Общий вид линейного уравнения регрессии: f(Y)= β1+ β2*g2(X2) +… + βk*gk(Xk) + u, где f(•), g2(•), …, gk(•) – какие-то функции. 4 Примеры. (ЛР-линейная регрессия) 1. 2. 3. 4. 5. Y = β1 + 2*X3 +u Y = e1 X2 eu Y = β1 X2 u Y = β1 + 2*Xβ3 + u Y = β1 X 2 + u (ЛР) (ЛР) (ЛР) (нет) (нет) 5 Чтобы точнее выбрать форму модели надо знать свойства основных функций. 6 Основные характеристики функциональной формы: наклон / или Y Y X j X j эластичность X Y ,X * X /X X Y Y /Y Y j j j j j X Y * X Y j j 7 И наклон и эластичность характеризуют реакцию Y на изменения Х. Но наклон – в абсолютных единицах, а эластичность – в относительных. 8 Линейная форма Y = 1 + 2*X2 + … + k*Xk + u Базируется на предположении, что данному приросту независимой переменной всегда соответствует один и тот же прирост зависимой переменной: Y = j*Xj (*) 9 Линейная форма Имеет постоянный наклон: Y/ Xj = j. 10 Y = 1 + 2*X2 + … + k*Xk + u Эта форма выбирается, когда предполагаемая связь между Y и Xj удовлетворяет (*):Y = j*Xj . Кроме того, это форма «по умолчанию». 11 Двойная логарифмическая (log-log) форма Y = eβ1*X22*…*Xkk*eu Форма приводится к линейной логарифмированием: lnY =1 + 2*lnX2 +… + k*lnXk + u 12 lnY =1+2*lnX2+ … + k*lnXk + u Форма используется, когда есть основания полагать, что эластичности Y по каждому Xj, j =2,…, k, постоянны. Y,Xj = j . Т.е., j – эластичность Y по Xj, j =1,…,k. 13 lnY =1 + 2*lnX2 + … + k*lnXk + u Интерпретация j: если Xj изменяется на 1% ( и при этом все остальные X сохраняют постоянные значения), то Y изменяется в среднем на j%-в. Это также форма «по умолчанию». 14 Важный пример log-log формы – производственная функция (ПФ) Кобба-Дугласа: Y = A*K*L*eu Y – выход продукции, K – затраты капитала, L – затраты труда. (А – константа.) 15 К линейному виду приводится логарифмированием: lnY = С+α*lnK + β*lnL + u (С=lnA) α - эластичность выпуска по затратам капитала, - эластичность выпуска по затратам труда. 16 lnY = С+α*lnK + β*lnL + u Если + > 1, имеется возрастающий эффект от масштабов производства; + < 1 - убывающий; + = 1 - постоянный. 17 Полулогарифмические формы. Форма lin-log Y = β1 + 2*lnX + u Используется, когда есть основания предполагать, что с ростом X влияние X на Y уменьшается, но не пропадает совсем. Интерпретация 2: при изменении X на 1% Y изменяется на 2/100 единиц (в которых Y измеряется ). 18 Эластичность Y по Х: 1 Y.X 2 * Y т. е. падает с ростом Y. Моделирование «возрастания с убывающей скоростью». 19 Применение. Например, большинство потребительских функций. При возрастании дохода (X) все меньшая его часть идет на потребление (Y). Y = β1 + 2*lnX + u 20 21 Полулогарифмические формы. Форма log-lin (экспоненциальная). lnY = 1 + 2*X + u Эластичность: Y.X *X 2 растет с ростом Х. «Возрастание с возрастающей скоростью» 22 Интерпретация 2: при увеличении Х на 1 единицу (измерения Х) Y изменяется на 2*100%. 23 Применение. Например: потребительские функции для товаров роскоши. оплата труда: %-я надбавка в зависимости от стажа и опыта. 24 в регрессии Y по времени t, когда можно полагать, что Y имеет постоянный темп прироста во времени. 25 26 Y = β1*e2t*ε lnY = lnβ1 + 2*t + ν 2 - относительный прирост Y за единицу времени: Y/ t 2 Y Темп прироста Y за единицу времени равен 2*100%. 27 Полиномиальная Форма (Парабола) Y = + 1*X + 2*X2 +…+ k*Xk + u При k=2: Y = + 1*X + 2*X2 + u Например, моделирование зависимости цены производства (Y) от объема выпуска (X); при этом 1 < 0, 2 >0. 28 ОБЪЕМ ВЫПУСКА 29 ЦЕНА ПРОИЗВОДСТВА ЗАРПЛАТА Моделировании зависимости годовой зарплаты человека (Y) от возраста (X); при этом 1 > 0, 2 < 0. ВОЗРАСТ 30 Полиномы степени k>3 применяются редко. 31 Обратная Форма Зависимости (гиперболическая) 1 Y * u X Используется при предположении, что с ростом фактора X его влияние на фактор Y сводится к нулю. Моделирование быстрого насыщения. 32 Y 0 0 X 33 Пример. Моделирование потребления товаров 1-й необходимости. 34 Пример. Кривая Филлипса, описывающая взаимосвязь между уровнем безработицы в год t в процентах (Ut) и темпами прироста зарплаты в год t в процентах ( Wt): Wt * < 0, > 0. 1 U u t 35 Δwt ΔWt Естественный уровень безработицы, т. е. значение ut, при котором Δwt = 0 ut U t 36 Взаимодействие Независимых Переменных Y= 1+ 2*X2 +3*X3 +4*X2*X3 + u Используется при предположении, что влияние X2 на Y зависит от значения X3, а влияние X3 на Y – от значения X2. 37 Проблема с R2 Качество уравнений регрессии не может сравниваться по R2, если зависимая переменная в них присутствует в различных функциональных формах. 38 Например, (1) Y = …….; R12 (2) lnY = …….; R22 Качество уравнений (1) и (2) нельзя сравнивать, сопоставляя R12 и R22 (если только R12>> R22 или R22 >> R12). 39 . Для сравнения таких моделей используют: 1. Метод Зарембки. 2. Преобразование Бокса-Кокса. 40 Метод Зарембки Y X ln(Y) X 2 11 ln(2) 11 5 10 ln(5) 10 4 20 ln(4) 20 ˆ = b1 + b2*X Y lnY = c1 + c2*X 41 Вычисляют среднее геометрическое выборочных значений Yi: n ( Y *...* Y 1 n 2 * 4 * 5 40 3 3 ), преобразуют переменные: Y*i = Yi/ и рассчитывают новые регрессии по таблицам: 42 Y* ln(Y*) X 2 / 40 11 11 ln(2 / 40) 4 / 3 40 10 ln(4 / 40) 10 3 3 5 / 40 Yˆ X 3 3 20 3 ln(5 / 40) 20 * = b1* + b2**X lnY * = с1* + c2**X 43 Для этих уравнений рассчитывают RSS*1 и RSS*2 и модель с меньшей RSS дает лучшее соответствие линии регрессии выборке. . 44 Чтобы проверить, обеспечивает ли одна модель значимо лучшее соответствие, надо вычислить величину: 2 = | (n/2)*ln(RSS*1 / RSS*2 )|, 45 затем по таблице распределения 2 найти 2кр(1;α). Если 2 > 2кр(1;α), то различие в качестве объяснения двумя уравнениями значимое. 46 Примеры интерпретации коэффициентов в логарифмических и полулогарифмических моделях 47 Двойная логарифмическая модель Выпуск сектора экономики может быть смоделирован производственной функцией Кобба-Дугласа: Y = c*Kα*Lβ*u, где Y – выпуск в денежных единицах, К - затраты капитала в денежных единицах, L - затраты труда, например, в работниках, с – константа, α, β – параметры модели. 48 Для того, чтобы оценить по МНК модель Y = c*Kα*Lβ*u Надо взять логарифм от обеих ее частей: lnY = ln c + α*lnK + β*lnL + ln u 49 Или: lnY = А + α*lnK + β*lnL + v. Эта модель была оценена по данным для 41 фирмы одного из секторов экономики Индии (соответственно, все денежные единицы – тысячи рупий, затраты труда – в работниках). 50 lnŶ = -0,68 + 0,41*lnK + 0,50*lnL . Интерпретация коэффициентов наклона: - при увеличении затрат капитала на 1% и неизменности затрат труда выпуск фирмы увеличивается в среднем на 0,41%. 51 lnŶ = -0,68 + 0,41*lnK + 0,50*lnL . Интерпретация коэффициентов наклона: - при увеличении затрат труда на 1% и неизменности затрат капитала выпуск фирмы увеличивается в среднем на 0,50%. 52 Полулогарифмическая модель (log-lin) W – почасовая зарплата в $, Е – число лет, потраченных на образование, S – число лет работы по специальности. ln W = β1 + β2*E + β2*S + u 53 ln W = β1 + β2*E + β2*S + u Модель оценивалась по данным для 420 человек: ln Ŵ =-0.12 + 0.052*E + 0.103*S 54 ln Ŵ =-0.12 + 0.0052*E + 0.0103*S Интерпретация коэффициентов: - при увеличении числа лет, потраченных на обучение, на 1 год и неизменности стажа работы почасовая заработная плата увеличивается в среднем на 0,52%. 55 ln Ŵ =-0.12 + 0.0052*E + 0.0103*S Интерпретация коэффициентов: - при увеличении стажа работы на 1 год и неизменности числа лет, потраченных на обучение, почасовая заработная плата увеличивается в среднем на 1,03%. 56 Если экономический показатель Y экспоненциально растет (или убывает) во времени t, то динамика его моделируется уравнением: Y = A*ert*v, где A и r – параметры модели, v – случайный член. 57 Y = A*ert*v, r*100% интерпретируется как темп прироста. Для оценки модели берут логарифм от обеих ее частей: ln Y = lnA + r*t + ln v 58 Или: ln Y = a + r*t + u. Например, пусть модель оценивается по ежегодным данным для ВВП (Y) какой-то страны, выраженном в млн. $. Получается уравнение: 59 ln Ŷ = 0,12 + 0,042*t . Тогда интерпретация коэффициента при времени t следующая: ежегодный темп прироста ВВП составляет в среднем 4,2%. 60 Полулогарифмическая модель (lin-log) Модель может быть записана в виде: Y = β1 + β2*lnX + u Пусть, например, эта модель использовалась для моделирования ежемесячного спроса на бананы (Y, в кг) от среднемесячного душевого дохода (Х, в тысячах рублей) в какомто населенном пункте. 61 Было получено уравнение: Ŷ = 1,2 + 48,8*lnX Интерпретация коэффициента наклона: - при увеличении среднедушевого месячного дохода на 1% спрос на бананы увеличивается в среднем на 0,488 кг. 62