Managerial_Ecs_Quantitative_Analysis.ppt

Download Report

Transcript Managerial_Ecs_Quantitative_Analysis.ppt

оценка и прогнозирование спроса
Доц. Касимовская Елена Николаевна
1

Простая линейная регрессия ( одна
независимая переменная)
У = А +bХ
Y – зависимая переменная(функция)
Х – независимая переменная ( аргумент)
b – угол наклона= ∆У/ ∆Х
Например: У – объем продаж, Х – период времени
: Q = A + bt


Используется для прогнозирования
Стандартный пакет Excel
2

ПЕРИОД ДАННЫЕ
1
3100
2
4500
3
4400
4
5400
5
7500
6
8100
Исходные данные
Excel: функция TREND
ПЕРИОД ДАННЫЕ
1
3100
2
4500
3
4400
4
5400
5
7500
6
8100
7
9000
8
10000
9
11000
y = 1000x + 2000
R² = 0.9338
3
4
Пусть известны объемы продаж по периодам. Необходимо
дать прогноз на 9-ий период, используя простую линейную
регрессию
1
2
3
4
5
6
3100
4500
4400
5400
7500
8100
ОТВЕТ: 11000
Формула из Excel:
=SUM(LINEST(B1:B6,A1:A6)*{9,1})
ЗАДАНИЕ: рассчитайте
объем продаж на 11
период
5
ПЕРИОД
1
2
3
4
5
6
7
8
9
10
11
12
ФАКТ
291
320
142
198
389
412
271
305
492
518
363
388
6
ПЕРИОД
1
2
3
4
5
6
7
8
9
10
11
12
13
14
ФАКТ
291
320
142
198
389
412
271
305
492
518
363
388
ТРЕНД Отклонение
241.46
1.205160879
259.51
1.233074197
277.57
0.511589237
295.62
0.669781305
313.67
1.2401516
331.72
1.241997196
349.78
0.774781079
367.83
0.829190392
385.88
1.275004077
403.93
1.282389093
421.99
0.860218083
440.04
0.881741107
458.09
476.14
1
2
3
4
1
2
3
4
1
2
3
4
1
2
Ср. Сезон индекс Тренд с сезон сост
1.240105519
1.252486829
0.715529466
0.793570934
1.240105519
1.252486829
0.715529466
0.793570934
1.240105519
1.252486829
0.715529466
0.793570934
1.240105519
568.0810645
1.252486829
596.3632829
7
8

Ценовые и неценовые факторы спроса (
несколько аргументов)
Y = A + b1 + b1 X1 + b2 X2 +…… + bn Xn
Где X1 , X2 ... Xn – различные факторы,
определяющие поведение спроса ( цена, доход,
цены на сопряженные товары и пр.); знак (+/-)
перед b определяет характер связи функции и
аргумента ( прямая или обратная)

Количественное значение факторов –
результат статистической обработки
первичных данных
9
У (зависимая переменная) – стоимость
офисного здания
 4 независимых переменных: Х1 – площадь в
кв.м., Х2- количество офисов, Х3количество входов в здание, Х4- возраст
здания( в годах)
Случайная выборка 11 зданий из 1500.
Цель – определить зависимость цены здания
от выявленных переменных

10
Floor space
(x1)
2310
2333
2356
2379
2402
2425
2448
2471
2494
2517
2540
Formula
=LINEST(E2:
E12,A2:D12,
B
Offices (x2)
2
2
3
3
2
4
2
2
3
4
2
C
Entrances
(x3)
2
2
1.5
2
3
2
1.5
2
3
4
3
D
Age (x4)
20
12
33
43
53
23
99
34
23
55
22
E
Assessed
value (y)
142,000
144,000
151,000
150,000
139,000
169,000
126,000
142,900
163,000
169,000
149,000
11
1
2
3
4
5
А
mn
sen
r2
F
ssrg
В
mn-1
Sen-1
sev
df
ssresid
С
…
…
D
m2
se2
E
m1
se1
F
b
seb
12
y = 27.64*x1 + 12,530*x2 + 2,553*x3 - 234.24*x4 + 52,318

Результаты:
-234.2371645
2553.21066
12529.7682
27.6413874
52317.8305
13.26801148
530.669152
400.066838
5.42937404
12237.3616
0.996747993
970.578463
#N/A
#N/A
#N/A
459.7536742
6
#N/A
#N/A
#N/A
1732393319
5652135.32
#N/A
#N/A
#N/A
13




Используя полученную модель, можно
рассчитать стоимость здания площадью
2500 кв.м., с тремя офисами и двумя
входами, построенное 25 лет назад:
y = 27.64*2500 + 12530*3 + 2553*2 234.24*25 + 52318 = $158,261
Можно рассчитать коэффициенты
эластичности(чувствительности) цены по
каждому параметру, например:
E(по площади)= 27.64*2500/158258= 0,44
14

Прямая зависимость между ценой на здание
и:
◦ Площадью
◦ Количеством офисов
◦ Количеством входов

Обратная зависимость между ценой и
временем постройки
15



R2 – коэффициент детерминации: показывает, какая
часть изменения зависимой переменной вызвана
изменением всех объясняющих переменных в
уравнении ( чем ближе к 1, тем лучше)
F-статистика: измеряет статистическую значимость
всего уравнения ( т.е. Модели). Проверяется по
таблицам критических значений при заданном уровне
достоверности ( зависит от числа наблюдений и
количества независимых параметров). См. пример
Стандартные ошибки и t-статистики: значение tстатистики получают путем деления коэффициента
переменной на стандартную ошибку. Проверяется по
таблицам критических значений при заданном уровне
достоверности ( зависит от числа наблюдений и
количества независимых параметров). В большинстве
случаев – «правило двух»: если значение больше двух,
параметр признается значимым
16



R2 = 0,99,т.е. Параметры уравнения почти
на 100% объясняют изменение в цене
F-статистика : очень большая, критическое
значение при 11 наблюдениях и 4-х
переменных =3.36 ( при уровне
достоверности 95%), т.е. Построенное нами
уравнение статистически значимо
t-статистика:
-17.6542781 4.81130409 31.3191871
5.0910818 4.27525411
что значительно больше двух, т.е. Все
параметры значимы
17



Проблема идентификации
Мультиколлинеарность: если независимые переменные
связаны между собой, то мы получим искаженную
картину ( например, доход и образование как
переменные). Если F-статистика хорошая, а t-статистика
нет, то вероятна мультиколлинеарность. Нужно
провести корреляционный анализ ( коэф. Пирсона
и\или Спирмена). Одну из переменных надо будет
удалить.
Автокорреляция ( или корреляция внутри ряда
наблюдений) – некая систематическая связь между
зависимой и независимой переменной ( например,
циклическая\сезонная). Используют
показатель\статистику Дарбина-Уотсона ( таблицы
критических значений). Или применяют дополнительные
методы обработки данных, как то выделение данной
циклической составляющей и ее учет в прогнозах,
выводах и пр.
18
19




На основе приводимых далее данных
построить регрессионную модель
Выделить значимые факторы ( объяснить
почему)
Рассчитать значения эластичностей по
кадому фактору для уровня цены=25
Построить функцию спроса с учетом только
значимых параметров и на ее основе
определить уровень цен, при которых
доход фирмы будет максимальным
20
объем продаж (цена
тыс. за
штук)
шт
сезон (зима 1-лето 0)
доход(ср\мес тыс.руб))цена сопр товара ( за шт в руб.)
100
40
1
50
5
230
20
0
60
6
160
20
1
100
3
260
17
0
100
7
215
17
0
40
8
178
23
0
80
7
280
10
1
80
6
220
14
1
100
9
165
35
1
60
5
120
35
0
50
6
130
32
0
60
7
240
13
1
100
4
158
30
0
100
5
269
10
1
40
5
220
13
1
80
6
178
38
1
80
3
168
37
0
100
8
209
16
1
60
7
198
19
1
50
5
157
40
0
60
6
203
29
1
100
4
220
22
1
100
6
Y=241.7
246
16
1
40
7
t= 6
178
38
0
80
5
140
42
0
80
8
168
34
0
100
4
129
32
0
60
5
206
25
1
70
6
245
22
1
50
8
256
20
1
120
6
21