Matematyczne techniki zarządzania - 91 Testowanie równości wariancji populacji Stosuje się test Hartleya zwany też testem Fmax, który pozwala rozstrzygnąć czy próbki pochodzą.
Download
Report
Transcript Matematyczne techniki zarządzania - 91 Testowanie równości wariancji populacji Stosuje się test Hartleya zwany też testem Fmax, który pozwala rozstrzygnąć czy próbki pochodzą.
Matematyczne techniki zarządzania - 91
Testowanie równości wariancji populacji
Stosuje się test Hartleya zwany też testem Fmax, który pozwala rozstrzygnąć
czy próbki pochodzą z populacji o jednakowej wariancji (czy wariancje próbek są homogeniczne).
Jeśli założymy, że każda populacja ma rozkład normalny i że ich wariancje
są równe 2i (i = 1, 2, ..., k), to możemy zweryfikować hipotezy
H0: 21= 22 = .... = 2k
H1: nie wszystkie 2i są jednakowe
Reguła decyzyjna: odrzucamy H0, jeżeli
Fobl . max Fmax( ){ k , (max)}
i
Fmax( ){ k , (max)}
i
odczytujemy ze specjalnej tablicy, gdzie:
Fobl. m ax
si2 (max)
si2 (min)
k — liczba czynników
i(max) — największa liczba stopni swobody spośród próbek
Przykład 27 cd. Wariancje próbek dla poszczególnych skryptów: 114,889;
325,111; 292,000. Stąd
325,111
Fobl. max
2,83 =0,05 k=3 i(max)=9 Ftabl=5,34 JAKI WNIOSEK?
114,889
Matematyczne techniki zarządzania - 92
ANALIZA WARIANCJI DWUCZYNNIKOWA
xij i j ij
xij — wartość obserwacji w i-tym poziomie bloku i jtym poziomie czynnika
— ogólna średnia zmiennej X
i — odchylenie średniej i-tego poziomu bloku od
j — odchylenie średniej j-tego poziomu czynnika od
ij — składnik losowy (reszta) N(0; 2) [ — ksi]
CZYNNIK
SSTO
BLOK
RESZTA
CZYNNIK=BLOK
RANDOMIZED
BLOCK DESIGN
Założenia:
• mamy losowe próbki z n poziomów bloku i przydzielamy losowo
jednostki z każdego bloku do każdego z k poziomów czynnika
• reakcja w i-tym poziomie bloku na j-ty poziom czynnika pochodzi z
rozkładu normalnego
• wariancja każdej populacji nk wynosi 2
• nie ma wzajemnego oddziaływania między blokiem i czynnikiem
Matematyczne techniki zarządzania - 93
Przykład 29. Zmienną losową X jest ilość kilometrów przejechanych na 1
litrze benzyny różnej marki. Do pomiarów używamy 5 różnych samochodów:
CZYNNIK
BLOK
NUMER
SAMOCHODU
1
2
3
4
5
MARKA BENZYNY
B
C
22,4
20,6
24,9
25,6
34,2
30,6
25,3
22,4
27,3
26,1
A
21,8
24,6
31,3
24,1
23,1
Co można stwierdzić „gołym okiem”:
• czy marka benzyny wpływa na jej zużycie?
%
D
23,1
26,4
33,7
26,8
28,6
• czy egzemplarz użytego samochodu wpływa na zużycie paliwa?
Tabelka ANOWY
Źródło zmienności
Czynnik (poziomy)
Blok (poziomy)
Błąd (reszta)
Razem
Liczba stopni
swobody
3
4
12
19
Suma
kwadratów
27,35
239,95
14,29
281,59
Średni
kwadrat
9,12
59,99
1,19
Statystyka
F
7,66
50,41
Matematyczne techniki zarządzania - 94
Przyjmujemy = 0,01 i stawiamy hipotezy:
• H0: czynnik nie wpływa...
H1: czynnik...
• H0: blok nie wpływa...
H1: blok...
JAKI JEST OFICJALNY JĘZYK TYCH HIPOTEZ?
Wartości krytyczne testu Fishera: F0,01( 3;12) 5,95 F0,01(4;1 2) 5,41
Decyzje i wnioski.................................................................................
ANALIZA WARIANCJI DWUCZYNNIKOWA Z UWZGLĘDNIENIEM
WZAJEMNEGO ODDZIAŁYWANIA CZYNNIKÓW
xijk i j i j
CZYNNIK A
SUMY KWADRATÓW
SSA
SSB
SSAB
SSE
SSTO
ZAŁOŻENIA!
ŚREDNIE KWADRATY
SSA
MSA
a 1
SSB
MSB
b 1
CZYNNIK B
CZYNNIK A i B
RESZTA
SSTO
Matematyczne techniki zarządzania - 95
SSAB
MSBA
(a 1)( b 1)
SSE
MSE
n ab
Przykład 30. W pewnym przedsiębiorstwie postanowiono przeprowadzić
badania co wpływa na sukces kierowników sklepów — wykształcenie czy
doświadczenie. Z dużej liczby sklepów wylosowano 24 kierowników i dla
każdego określono współczynnik sukcesu będący ilorazem rzeczywistej
rocznej sprzedaży do sprzedaży prognozowanej, określonej na podstawie
równania regresji uwzględniającego lokalizację, powierzchnię, liczbę praconików itd.
n = 24
0,05
Źródło zmienności
Doświadczenie
Wykształcenie
Wzaj. oddziaływ.
Błąd
Razem
Wykształcenie
Staż
1.
8—P
1.
6 — <5 lat
2.
8—Ś
2.
6 — 5-10 lat
3.
8—W
3.
6 — 10-15 lat
4.
6 — >15 lat
Liczba stopni
swobody
3
2
6
12
23
%
Suma
kwadratów
0,0272
0,0394
0,0604
0,0171
0,1441
Średni
kwadrat
0,0091
0,0197
0,0101
0,0014
Statystyka
F
6,370
13,827
7,063
Matematyczne techniki zarządzania - 96
Można rozwiązać dwa problemy:
1.
H0: nie ma wzajemnego oddziaływania czynników A i B
H1: jest wzajemne oddziaływanie A i B
Odrzucamy H0, jeżeli
2.
Fobl F {(a 1)(b 1); (n ab)}
H0: czynnik A (lub B) nie wpływa na pracę kierownika
H1: czynnik A (lub B) wpływa na pracę kierownika
Odrzucamy H0, jeżeli
Fobl F {a 1; n ab}
b—1
ANALIZA REGRESJI I KORELACJI
• umożliwia badanie wpływu czynników mierzalnych,
takich jak: czas nauki, zużycie materiałów, wielkość
produkcji itd.
• umożliwia ustalanie przyczyn zachowania się danego zjawiska: dlaczego rosną koszty, co powoduje straty w firmie itd.
• jest to bardzo popularna metoda, zgodna z naszą intuicją
• obliczenia wykonuje się metodą najmniejszych kwadratów
• stosuje: estymację, testowanie hipotez, analizę wariancji itd.
Matematyczne techniki zarządzania - 97
Bardzo często robimy — odruchowo — wykres zależności dwu zmiennych:
Y
model rzeczywistości
Zapisujemy to jako:
yi a bxi
yi a0 a1 xi
obserwacje empiryczne
( ksi ) skł . losowy
X
Zmienna losowa wielowymiarowa
Dla układu trójwymiarowego:
yi a bxi cz i
yi a0 a1 x1i a2 x2 i
xijkl lub xi, yj, zk itd.
Tablica dwudzielna
• dwa wymiary
• Pij — „trzeci wymiar”
• Pi i Pj — rozkłady brzegowe
• suma =1
• jeśli rozkłady normalne, to
równanie liniowe
x1
x2
xi
xn
Suma
y1
P11
P21
Pi1
Pn1
P1
y2
P12
P22
Pi2
Pn2
P2
yi
P1j
P2j
Pij
Pnj
Pj
ym
P1n
P2n
Pin
Pnm
Pm
Suma
P1
P2
Pi
Pn
1
Matematyczne techniki zarządzania - 98
Trzy rodzaje związków pomiędzy Y i X
Y
• związek funkcyjny (deterministyczny)
yi
yi a bxi
Domena — matematyka
KAŻDEJ WARTOŚCI xi ODPOWIADA JEDNA I
TYLKO JEDNA WARTOŚĆ yi
5
5
5
6
5
8
7
6
7
9
7
12
8
8
xi
8
11
9
12
9
11
X10
15
• związek stochastyczny (losowy)
Domena — rzeczywistość
Y
KAŻDEJ WARTOŚCI xi ODPOWIADA CAŁY ZBIÓR
WARTOŚCI yi TWORZACYCH OKREŚLONY
ROZKŁAD
Obserwacja
rzeczywistości
Waga i wzrost studentek
DANE
Lp. xi yi
1 x1
y1
2 x2
y2
3
x3 y3
............
xi
X
1
5
6
8
6
9
12
8
11
12
11
15
9
Matematyczne techniki zarządzania - 99
yi a bxi
Y
• związek statystyczny
Domena — model rzeczywistości
yˆ i
— średnia rozkładu
— obrazuje rozrzut
x, y
y
yˆ i
— środek ciężkości zbioru
xi
x
X
Dlaczego w rzeczywistości mamy do czynienia ze związkami stochastycznymi?
Podstawowe pojęcia i terminy
r
KORELACJA — fakt powiązania, współzależności, związku zmiennych ze sobą
WSPÓŁCZYNNIK KORELACJI — liczba określająca siłę i kierunek tego związku
• współczynnik korelacji liniowej dwu zmiennych: r lub rxy
Współczynnik r niesie dwie
informacje poprzez swój
znak i moduł
1 r 1
0 r 1
Matematyczne techniki zarządzania - 100
Znak informuje o kierunku zależności
r>0
r<0
Korelacja dodatnia
Korelacja ujemna
Moduł informuje o sile zależności
r=1
r=0,5
r=0
Który współczynnik korelacji jest korzystniejszy: —0,8 czy 0,2?
Matematyczne techniki zarządzania - 101
• współczynnik korelacji liniowej wielu zmiennych (korelacji wielokrotnej lub wielorakiej): R
Interpretacja:
0 R1
• im wyższa wartość R, tym silniejsza współzależność (R=0: brak
korelacji, R=1: zależność funkcyjna, nie ma składnika losowego)
R
• R określa siłę powiązania zmiennej Y z wszystkimi zmiennymi Xi, bez
względu na to jak poszczególne z nich są skorelowane z Y
• współczynnik korelacji cząstkowej dwu zmiennych
r( y ) xi x j
REGRESJA — funkcja odzwierciedlająca powiązanie zmiennych (czynników)
• w mowie potocznej regresja to cofanie się, spadek, zanik
• skąd się wzięło to słowo w statystyce?
WSPÓŁCZYNNIK REGRESJI — liczba stojąca
przy każdej zmiennej X, określająca jej
wpływ na zmienną Y
yi a bxi
wzrost
synów
a
wzrost ojców
a — wyraz wolny (stała), współrzędna punktu przecięcia z osią Y
b — współczynnik regresji, tangens kąta
nachylenia prostej
Matematyczne techniki zarządzania - 102
Czynności przy badaniu zależności zmiennych
• określenie co jest skutkiem (Y), a co przyczynami (X1, X2, itd.)
• zebranie danych (pobranie próbki statystycznej)
• wyznaczenie równania regresji dla próbki
• sprawdzenie (testowanie) czy równanie to może być przyjęte dla
populacji
• wnioskowanie o przyczynach na podstawie zweryfikowanego równania
Funkcja regresji I i II rodzaju
• regresja I rodzaju dotyczy populacji (jest nieznana)
Y 0 1 X 1 2 X 2 ...
• regresja II rodzaju dotyczy próbki (jest znana)
y a0 a1 x1 a 2 x 2 ...
Współczynniki regresji to i oraz ai; tak jak przy estymacji innych
parametrów mamy to do czynienia z estymatorami, ich odchyleniami
standardowymi (czyli błędami oszacowania) oraz z wartościami
oszacowanymi.
Matematyczne techniki zarządzania - 103
Wydruk komputerowy równania regresji
Zmienna
Wartość
Błąd
Statystyka
Rzeczywisty po(czynnik)
oszacowana
oszacowania
tobl
ziom istotności P
Wyraz wolny
a0
s(a0)
t(a0)
P(a0)
Czynnik X1
a1
s(a1)
t(a1)
P(a1)
Czynnik X2
a2
s(a2)
t(a2)
P(a2)
Czynnik X3
a3
s(a3)
t(a3)
P(a3)
2
2
Współczynniki: determinacji R , zbieżności , błąd resztowy s(y) i inne
Pełny zapis równania regresji
yi a0 a1 x1i a2 x2 i a3 x3 i
s(a0 ) s(a1 ) s(a2 )
Y
reszta ui
R 2 ( R)
s( a 3 ) s( y )
X2
2
(wszystkie punkty czerwone)
parametry strukturalne i stochastyczne
X1
yˆ i a0 a1 x1 a2 x2 a3 x3
Y
— zmienna zależna, zmienna-skutek, zmienna objaśniana
yi
— zaobserwowane wartości zmiennej zależnej dla jednostek próbki
Xk
— zmienne niezależne, zmienne-przyczyny, zmienne objaśniające
xki
— zaobserwowane wartości zmiennych niezależnych
a0
— oszacowana wartość wyrazu wolnego (interpretację podano)
Matematyczne techniki zarządzania - 104
ai...
— oszacowane wartości współczynników regresji; określają wpływ
poszczególnych zmiennych Xi na zmienną Y
— składnik losowy, reprezentujący rozrzut punktów wokół płaszczyzny regresji; składnik ten jest zmienną losową; jego wartości nazywają się
reszty
ui yi yˆ i
a jego rozkład jest rozkładem normalnym o E()=0 i V()=s2(y)
s(a0) — błąd oszacowania wyrazu wolnego; służy do budowy przedziału
ufności dla nieznanej wartości wyrazu wolnego 0 dla populacji oraz do
weryfikacji istotności 0 (H0: 0=0)
s(ai) — błędy oszacowania współczynników regresji; służą do budowy
przedziału ufności dla nieznanych wartości i współczynników regresji
dla populacji oraz do weryfikacji ich istotności (H0: i=0)
s(y) — błąd resztowy; jest odchyleniem standardowym składnika
losowego ; określa średnią wielkość reszty ui
R2(r2)— współczynnik determinacji; określa jaka część zmienności całkowitej SSTO została wyjaśniona przez równanie regresji yˆ i a0 a1 x1 a2 x2 a3 x3
2
— współczynnik zbieżności (zgodności); określa jaka część zmienności całkowitej SSTO nie została wyjaśniona przez równanie regresji
Matematyczne techniki zarządzania - 105
Wszystko to jest łatwiejsze do zrozumienia w układzie dwuwymiarowym
Y
yi
yi yˆ i
yi y
yˆ i
( yˆ y)
( y yˆ )
( yi y)2 = SSTO (zmienność całkowita)
= SSTR (zmienność wyjaśniona)
2
i
yˆ i y
y
i
i
2
= SSE (zmienność niewyjaśniona)
(SUMOWANIE OD „1” DO „n” )
( yi y ) ( yˆ i y ) ( yi yˆ i )
x
X
xi
( y y) ( yˆ y) ( y yˆ )
2
SSTR ( yˆ i y ) 2
R
SSTO ( yi y ) 2
RÓWNANIE
REGRESJI JEST
MODELEM
RZECZYWISTOŚCI
WSZYSTKO TO JUŻ
ZNAMY Z ANALIZY
WARIANCJI
Razem
=
2
SSE
( yi yˆ i )
SSTO ( yi y ) 2
2
Źródło
Zmienności
Model (czynniki)
Błąd (reszta)
Liczba stopni
swobody
k1
nk
n1
2
i
SSTO
2
2
i
SSTR
s( y )
Suma
kwadratów
SSTR
SSE
SSTO
i
+
i
SSE
( yi yˆ i )
2
n2
Średni
Statystyka
kwadrat
F
MSTR
MSTR
F
obl
MSE
MSE
Matematyczne techniki zarządzania - 106
Krzywe Neymana
Y
obserwacje (dane empiryczne)
gg
środek ciężkości próbki
prosta regresji II rodzaju (dla
próbki)
yi
y
krzywe wyznaczające pas ufności, w którym z prawdopobieństwem 1- znajduje się nieznana
prosta regresji I rodzaju (dla
populacji)
dg
dlaczego taki kształt? (2 ruchy)
x
xi
X
Przykłady:
• waga — wzrost studentek
• ocena egzaminu — zaliczenie
• koszt produkcji — wielkość produkcji
• utarg — wydatki na reklamę
• prędkość — zużycie paliwa
krzywe wyznaczające przedziałowe prognozy wartości zmiennej Y
dla danego xi
yi
gg,dg
prognoza punktowa uzyskana przez
wstawienie xi do równania
przedział, w którym z szansą 1-
mieści się nieznana wartość yi dla itej nowej jednostki spoza próbki
Matematyczne techniki zarządzania - 107
Jak patrzeć na krzywe Neymana?
• przypadek z poprzedniej planszy: niezależnie od tego, co się zdarzy,
0>0 i 1>0 (jak to rozumieć)
• ale może być inna sytuacja
co wtedy wiemy o 0 i 1?
NIC — mogą być >0, =0, <0; nie wykluczymy więc, że:
• X nie wpływa na Y
• prosta I rodzaju przechodzi przez (0,0)
Te problemy można rozwiązać przez testowanie hipotez o i oraz o
Identyczne wnioski można wyciągnąć przy porównaniu dwu prostych
II rodzaju
y f ( x) a a x
x g( y ) c c y
0
mały rozrzut
1
0
duży rozrzut obserwacji
1
5
1
7
2
8
5
9
2
11
9
12
16
17
7
19
9
23
15
Matematyczne techniki zarządzania - 108
Regresja krzywoliniowa
W wielu przypadkach dane układają
się w zależności nieliniowe:
25
20
zmienna Y
Kiedy występuje regresja liniowa?
— gdy obie zmienne mają rozkład
normalny!
15
10
5
• gdy mają postać szeregu czasowego
0
0
Y
10
20
30
40
50
zmienna X
Y
t (czas )
• gdy dane przekrojowe układają się
w smugę nieliniową
• gdy krzywoliniowa funkcja wielu
zmiennych lepiej opisuje rzeczywistość niż funkcja liniowa (plansza
103); tego nie widać, która lepsza
można poznać tylko po R2
(na przykład — efekt skali)
X
Matematyczne techniki zarządzania - 109
Do opisu takich zjawisk stosujemy rozmaite
funkcje krzywoliniowe:
1. proste funkcje (rosnące lub malejące) dwu
zmiennych: wykładnicze, potęgowe itp.
2. wielomiany różnego stopnia (ich fragmenty)
3. funkcje bardziej złożone: krzywe nasycenia,
krzywe logistyczne itp..
4. funkcję potęgową wielu zmiennych
y a0 x1a1 x2a2 x3a3 ...
ABY MOŻNA BYŁO STOSOWAĆ METODĘ NAJMNIEJSZYCH KWADRATÓW, FUNKCJE TE MUSZĄ BYĆ
SPROWADZONE DO POSTACI LINIOWEJ
1. ln yi a ln xi b
ln yi axi b
yi a ln xi b
2. Wielomiany są funkcjami liniowymi pod względem swych parametrów
3. Stosuje się „chwyty” (wielokrotne podstawianie)
Matematyczne techniki zarządzania - 110
4. Także stosujemy transformację logarytmiczną
ln yi ln a0 a1 ln x1 a2 ln x2 ...
Kolejność czynności przy estymacji funkcji regresji krzywoliniowej:
1. zebranie danych empirycznych
2. dobranie modelu (funkcji nieliniowej)
3. transformacja modelu do liniowego (logarytmowanie — transformata)
4. przeliczenie danych na układ liniowy (robi to komputer)
5. oszacowanie równania regresji liniowej
6. retransformacja do postaci pierwotnej (odlogarytmowanie)
Retransformacji podlegają tylko parametry strukturalne, natomiast
wszystkie parametry stochastyczne dotyczą tylko transformaty
Metody estymacji równania regresji
• klasyczna metoda najmniejszych kwadratów (KMNK) w wielu
wariantach obliczeniowych
• podwójna MNK
• regresje specjalne: grzbietowa (ridge regression), odporna (robust) itd.
• metoda największej wiarygodności
Matematyczne techniki zarządzania - 111
Klasyczna metoda najmniejszych kwadratów (KMNK)
W książkach jest całe mnóstwo różnych wariantów, wersji, metod itd. — nie należy tracić głowy ani denerwować się!
n
min ( yi yˆ i )2
i 1
Wersja 1. Metoda równań normalnych
PLANSZA 105
min ( yi axi b)2
yˆ i axi b
Wyznaczamy pochodne cząstkowe względem a oraz b i przyrównujemy je do zera, po przekształceniu otrzymujemy układ równań normalnych
bn
a x i yi
Niewiadome: a, b
Współczynniki: z tabelki roboczej
b xi a xi2 xi yi
Lp.
1
2
...
n
Dane
xi
x1
x2
...
xn
xi
xi
yi
y1
y2
...
yn
yi
2
x12
2
x2
...
xn2
2
xi
yi
2
y12
2
y2
...
yn2
2
yi
xiyi
x1y1
x2y2
...
xnyn
xiyi
Z tego układu
równań wywodzą
się dziesiątki
rozmaitych
wzorów na
obliczanie
wartości a i b
Matematyczne techniki zarządzania - 112
Na analogicznej regule można zbudować układ równań normalnych
dla równania y ax1 bx2 c
cn
Wersja 2. Metoda „sigma prim”
( y i )
y ( yi y ) y
n
2
2
a x1
c x1 a x12
2
2
i
b x2
y
b x1 x 2 x1 y
c x2 a x1 x2 b x 22
x2 y
uzyskuje się uproszczone równania
Wersja 3. Metoda mnożników Gaussa, posługuje się formularzami
obliczeniowymi opartymi o wartości „sigma prim” (W. Volk, Statystyka dla
inżynierów)
Wersja 4. Metoda przekształceń Jordana
Wersja 5. Metoda macierzowa
a (X X) X y
T
XTX —
Xty —
1
T
współczynniki układu r. n.
prawe strony układu r. n.
yi a0 a1 x1i a2 x2i ... ak 1 xk 1
a0
a
a 1
...
a
k 1
1 x11
1 x
12
X
. ...
1 x1n
. xk 1,1
. xk 1, 2
.
...
. xk 1,n
y1
y
y 2
.
yn
Matematyczne techniki zarządzania - 113
1
[ y T y ( X T y )T a ]
nk
D 2 s 2 ( X T X ) 1
s2
na głównej przekątnej tej macierzy
znajdują się wariancje s2(a0), s2(a1)...
Wersja 5. Metoda uproszczona Hellwiga
Dzielimy zbiór na 2 podzbiory i wyznaczamy ich środki ciężkości
x ,y
I
po czym budujemy prostą
przechodzącą przez te punkty
I
y
I
II
x II , y II
x
Praktyczne zastosowania analizy regresji i korelacji (przykłady):
• wydajność pracy = f (liczby szkoleń i stażu)
zysk z akcji = f (ceny i dywidendy)
• cena = f (liczby asortymentów)
czas demolki = f (ilości pracy i odległości)
• zużycie prądu = f (pogody i produkcji)
produkcja = f (kapitału i robocizny)
• udział w rynku = f (ceny i liczby reklam)
płaca = f (wieku, funkcji, stażu)
• cena działki = f (obszaru i odległości od morza)
sprzedaż biletów MPK = f(pogody, dnia
• utarg = f (liczba klientów)
tygodnia, liczby mieszkańców)
• plon z ha = f (zużycie nawozów)
Zmienne 0-1:
3 — profesor
• czas choroby = f (temperatury i liczby bakterii)
1 — profesor
2 — adiunkt
• koszt reklamy = f (czasu)
2 — nie-profesor
1 — asystent
Matematyczne techniki zarządzania - 114
EKONOMETRIA
TROCHĘ
GREKI I
ŁACINY
Probabilistyka — probabilis (prawdopodobny, d. godny pochwały)
Statystyka — status (stan, państwo); kto to jest lo statista we Włoszech? A
kto la comparsa?
Ekonomia — oikos (dom, środowisko) + nomos (prawo, ustawa); oiko-nomos
(pan domu); oikonomia — zarządzanie gospodarstwem domowym
Metr, -metria — metron (miara)
Ekonometria — nauka zajmująca się ustalaniem, za pomocą metod
matematyczno-statystycznych, ilościowych prawidłowości zachodzących w
życiu gospodarczym
Nastawienie bardziej na makroekonomię niż na mikroekonomię (ekonomikę
przedsiębiorstwa i przemysłu) — sprawdzanie teorii ekonomicznych:
• zależność eksportu krajowego od PKB,
• zależność dochodu narodowego od ilości pieniądza w obiegu,
także na badanie poziomu życia ludności:
• zależność wydatków na określone dobra od dochodów ludności,
• zależność obrotu sklepów detalicznych od odległości od dużego miasta,
• funkcje popytu i podaży
Matematyczne techniki zarządzania - 115
ale również na zagadnienia związane z zarządzaniem przedsiębiorstwem:
• zależność wartości dodanej na roboczo-godzinę od stawki godzinowej i
kapitałochłonności pracy,
• funkcje produkcji opisujące zależność wielkości produkcji od majątku
trwałego i robocizny.
Specyficzne warunki prowadzenia badań ekonometrycznych
• brak możliwości powtórzenia eksperymentu (nie działają prawa
statystyki matematycznej)
• zaostrzone kryteria matematyczne (n>100)
• trudności z danymi: dostępność, ilość, wiarygodność, porównywalność
NARZĘDZIEM BADAWCZYM EKONOMETRII JEST MODEL EKONOMETRYCZNY, KTÓRY
MATEMATYCZNIE ODPOWIADA RÓWNANIU REGRESJI LUB KILKU RÓWNANIOM
Terminologia
• zmienna objaśniana (Y) — zmienna egzogeniczna
• zmienne objaśniające (X1, X2...) — zmienne endogeniczne
• zmienne opóźnione w czasie: yt, yt-1, xt, xt-k; służą do analizy wpływu
czasu
Matematyczne techniki zarządzania - 116
Klasyfikacja modeli ekonometrycznych
I. Klasyfikacja według wnoszonej informacji:
• modele przyczynowo-skutkowe
y — skutek
y f ( x1 , x2 ,..., xk 1 )
Przykłady zmiennej Y:
Xi — przyczyny
• średnia z indeksu studentów
Modele te budujemy z danych przekrojowych
(różne obiekty w tym samym momencie)
• modele tendencji rozwojowej
• zużycie energii elektrycznej w firmach
• koszty produkcji różnych partii wyrobów
y f (t )
y — analizowane zjawisko
t — czas
Modele te budujemy z szeregów czasowych
(ten sam obiekt w różnych momentach)
Przykłady zmiennej Y:
• codzienne ceny cebuli
• miesięczne zużycie prądu na WZ AGH
• roczne zużycie gazu ziemnego w PL
Analiza szeregów czasowych (time series analysis) — odrębny dział
matematyki
interesuje nas jak zjawisko zmienia się w czasie, nie obchodzi nas co te
zmiany wywołuje
• efekt długoterminowy: trend (tendencja)
Długość: doba,....,rok, 25 lat, 500 lat
• efekty krótkoterminowe: wahania okresowe, sezonowe, cykliczne
Matematyczne techniki zarządzania - 117
Przykład 31. Zinterpretuj wykres powstały z szeregu czasowego miesięcznego zużycia energii elektrycznej przez WZ AGH
y
t
1995
1996
1997
1998
1999
II. Klasyfikacja według stopnia uwzględniania czasu:
• modele statyczne
• modele dynamiczne
III. Klasyfikacja według powiązania równań:
JEDNO RÓWNANIE LUB KILKA ODDZIELNYCH
• modele proste
• modele rekurencyjne
• modele o równaniach współzależnych
IV. Klasyfikacja według liniowości:
y1 f ( y2 , x1 , x2 , x3 )
y2 f ( y3 , x1 , x2 , x3 )
y3 f ( y1 , y2 , x1 , x2 , x3 )
• modele liniowe
• modele nieliniowe (konieczna transformacja liniowa)
Matematyczne techniki zarządzania - 118
ETAPY BUDOWY MODELU EKONOMETRYCZNEGO
1. Sformułowanie modelu
a. wybór zmiennych: y, x1, x2,...
b. wybór postaci matematycznej modelu: liniowa, potęgowa,...
2. Zebranie danych statystycznych (różne źródła)
3. Selekcja zmiennych objaśniających (celem podziału na dwie grupy —
nadające się do modelu i niepotrzebne w nim)
4. Estymacja parametrów modelu:
a. parametrów strukturalnych: a0, a1, a2,...
b. parametrów stochastycznych: s(ai), s(y), R2, R
5. Weryfikacja modelu (przy użyciu hipotez i testów statystycznych)
MODEL BEZ WERYFIKACJI NIE MA ŻADNEJ WARTOŚCI
NIE NALEŻY KORZYSTAĆ Z PROGRAMÓW KOMPUTEROWYCH NIE
DAJĄCYCH MOŻLIWOŚCI WERYFIKACJI
6. Interpretacja modelu
• wyciągnięcie wniosków dla celów zarządzania
• sprzedanie go klientowi
Matematyczne techniki zarządzania - 119
ETAP 1a. WYBÓR ZMIENNYCH
• zmienna objaśniana Y: według zainteresowań (na ćwiczeniach), według
polecenia szefa (w przedsiębiorstwie), według życzenia klienta (w firmie
konsultingowej)
• zmienne objaśniające Xi (jak najwięcej dla modelu przyczynowoskutkowego) z następujących źródeł (w kolejności):
— teoria danej dziedziny wiedzy
— doświadczenie zleceniodawcy i statystyka
— metodą prób i błędów (intuicyjnie)
Co typujesz, gdy Y to:
• wynik studiów
• zysk firmy
• wybrane zmienne muszą mieć dużą zmienność (W>30%)
• najczęstszy błąd — „masło maślane” prowadzące do związku funkcyjnego i nie dające żadnej informacji o zmiennej objaśnianej
przykład modelu bez sensu: wynagrodzenie = f(płacy, premii i dodatku
stażowego)
ETAP 1b. WYBÓR POSTACI MATEMATYCZNEJ
• modele przyczynowo-skutkowe — najbardziej zalecane jest
równoczesne prowadzenie obliczeń dla dwu postaci:
— liniowej
— potęgowej
y ai xi
y xiai
ln y ai ln xi
Matematyczne techniki zarządzania - 120
— stosuje się też modele nieliniowej o narzuconej postaci
nieliniowej, których parametry ustala się przez
programowanie liniowe lub innymi metodami
ln yi a ln xi b
• modele tendencji rozwojowej:
— funkcja liniowa
ln yi axi b
— proste funkcje nieliniowe
yi a ln xi b
— wielomiany
(t zamiast x)
— funkcje skomplikowane
— modele kombinowane: trend + wahania okresowe
• są to zależności dla ln, dla
układu y=f(x) mogą być
dziwne (R2>1)
• wielomian jest modelem liniowym!
y ax 2 bx c
x1 x
2
y
x2 x
• są to funkcje „sztywne”,
„nieposłuszne
• można znaleźć optymalny stopień wielomianu
(przez badanie którego rzędu wartości Δy są
sobie mniej więcej równe)
Efekt „krzywego lustra”
t