Matematyczne techniki zarządzania - 121 ETAP 2. GROMADZENIE DANYCH STATYSTYCZNYCH ! ZA JAKOŚĆ DANYCH ODPOWIADA MODELUJĄCY • rodzaje danych: dane przekrojowe i szeregi czasowe •

Download Report

Transcript Matematyczne techniki zarządzania - 121 ETAP 2. GROMADZENIE DANYCH STATYSTYCZNYCH ! ZA JAKOŚĆ DANYCH ODPOWIADA MODELUJĄCY • rodzaje danych: dane przekrojowe i szeregi czasowe •

Slide 1

Matematyczne techniki zarządzania - 121
ETAP 2. GROMADZENIE DANYCH STATYSTYCZNYCH

!

ZA JAKOŚĆ DANYCH ODPOWIADA MODELUJĄCY
• rodzaje danych: dane przekrojowe i szeregi czasowe
• źródła danych: roczniki statystyczne, różne działy
przedsiębiorstwa, badania marketingowe, wywiady itd.
• wiarygodność danych: do jakiego celu zostały one
przygotowane?

MUSISZ
SPRAWDZAĆ
KAŻDE DANE

• porównywalność danych: inflacja (ceny bieżące a ceny
stałe), zmiany procesów technicznych
Wielkość
produkcji

• zmienność zjawisk: trzeba sprawdzić, czy
wybrana w etapie 1a zmienna jest rzeczywiście zmienną losową

Wx 

s( x )

nowy zakład

100 %

x

stary zakład

Wx musi wynosić co najmniej 30-40%
Wiek studenta może być dobrą zmiennąprzyczyną, ale nie w przypadku studiów
dziennych!

Zatrudnienie

Matematyczne techniki zarządzania - 122
ETAP 3. SELEKCJA ZMIENNYCH OBJAŚNIAJĄCYCH
KAŻDĄ ZMIENNĄ X WYTYPOWANĄ W ETAPIE 1a TRAKTUJEMY JAKO
KANDYDATKĘ NA ZMIENNĄ OBJAŚNIAJĄCĄ
Może być kilka przyczyn powodujących, że taka kandydatka nie może znaleźć się w modelu ekonometrycznym (w równaniu regresji):
• w modelu nie może być zbyt wielu zmiennych (nieczytelny)
• kandydatka może nie mieć wpływu na zmienną Y



• kandydatka może wnosić prawie tę samą informację o Y co inna
kandydatka

• dwie bardzo podobne kandydatki mogą sobie nawzajem przeszkadzać
(efekt katalityczny)
Kryteria, jakie musi spełniać kandydatka Xi, aby nadawała się do modelu:
• musi być silnie powiązana ze zmienną Y

• nie może być powiązana z inną kandydatką Xj
SSTO
x1
x4

x2
x3

reszta

R2=0,79

R2=0,66

x2
x1
x4

R2=0,48

x3
reszta

reszta

SSTO

SSTO

Matematyczne techniki zarządzania - 123
Efekt katalityczny
DWIE ZMIENNE DAJĄ
RAZEM MNIEJ INFORMACJI NIŻ KAŻDA Z
NICH Z OSOBNA

x1

x2

R2=0,25

x2

x1

R2=0,52

R2=0,66

Selekcja kandydatek ma na celu podzielenie ich na trzy grupy:
• zmienne wprowadzone do modelu
• zmienne nie wprowadzone do modelu, ale reprezentowane w nim przez
inne zmienne (możliwość wymiany)
• zmienne nie wprowadzone do modelu ze względu na fakt, że nie wnoszą
żadnej informacji o zmiennej Y
INFORMACJE potrzebne do selekcji: współczynniki r x i x j ,
Macierz współczynników korelacji
Y
Y
X1
X2
X3

0,52
0,64
- 0,21

X1
0,52
0,82
- 0,18

X2
0,64
0,82
0,08

X3
- 0,21
- 0,18
0,08

r yx

i

Przykład 32. Macierz powiązania
zmiennych ze sobą przedstawia
się następująco (n=20). Jak ją
można zinterpretować? Które
zmienne są powiązane ze sobą w
sposób istotny?

Matematyczne techniki zarządzania - 124
Testowanie istotności współczynnika korelacji
H0:  = 0

Można je przeprowadzić trzema testami: testem Studenta

H1:   0

(t), Fishera (F) i Wallace’a-Snedecora (R)

Fragment tablicy rozkładu Wallece’a-Snedecora (SKRYPT, tab. VII, s.161)
S to pn ie
sw ob od y

2
0,05
0,632
0,444
0,361

8
18
28

,

0,01
0,765
0,561
0,463

L iczb a zm ien n ych
3
0,05
0,01
0,726
0,827
0,532
0,633
0,439
0,530

4
0,05
0,777
0,587
0,490

0,01
0,860
0,678
0,573

Reguła decyzyjna: — jeżeli |Robl|>Rtabl, odrzucamy H0 (korelacja istotna)
— jeżeli |Robl|
W przykładzie 32, jeżeli przyjmiemy  = 0,05, to Rtabl = 0,444.
Y
Y
X1
X2
X3

0,52
0,64
- 0,21

X1
0,52
0,82
- 0,18

X2
0,64
0,82
0,08

X3
- 0,21
- 0,18
0,08

Pozostaną zatem tylko trzy
istotne powiązania:
y-x1, y-x2, x1-x2
BRAK ISTOTNEGO POWIĄZANIA Z Y NIE
OZNACZA, ŻE ZMIENNA NIE WNOSI
ŻADNEJ INFORMACJI O ZJAWISKU Y

Matematyczne techniki zarządzania - 125



Metody selekcji zmiennych objaśniających:
• grafowa
• Hellwiga (pojemności informacji)
• taksonomiczne (clustering)
Metoda grafowa
• obliczenie macierzy współczynników:

rx

i

xj

• wyłowienie z macierzy powiązań istotnych

, r yx

BUDOWA GRAFU
i

• graf spójny

• budowa grafu z powiązań istotnych
• wybranie zmiennych na podstawie grafu

x6

• graf zerowy
x1
x4

x9

DO MODELU WYBIERA SIĘ ZMIENNE:
• każdy graf zerowy (jeśli |ryx|>0,1)

istotne powiązanie

• po jednej reprezentantce grafu spójnego;

reprezentantką grafu jest zmienna, która ma najwięcej powiązań z
innymi kandydatkami
jeżeli kilka zmiennych ma tę samą maksymalną liczbę powiązań, wybiera
się z nich tę, która jest najsilniej powiązana za zmienną Y (max ryx)
jeżeli graf jest rozległy, może mieć dwie reprezentantki, ale muszą one
leżeć na przeciwległych stronach grafu

Matematyczne techniki zarządzania - 126
Przykład 32 cd. Wybierzemy
zmienną x2 (reprezentantka grafu
spójnego) i zmienną x3 (graf
zerowy)
Metoda Hellwiga

Y
Y
X1
X2
X3

0,52
0,64
- 0,21

• wypisujemy wszystkie możliwe kombinacje
kandydatek; jest ich K = 2m—1
• obliczamy pojemność informacji dla każdej
zmiennej w każdej kombinacji

h kl  f ( r yx , r x
i

ixj

)

• obliczamy pojemność całkowitą dla każdej
kombinacji
H l   h kl
k

• wybieramy kombinację o największej
pojemności Hl = max

X1
0,52
0,82
- 0,18

X2
0,64
0,82

X3
- 0,21
- 0,18
0,08

0,08

W przykładzie 32 mamy 7
możliwych kombinacji kandydatek:
1. x1
2. x2

3. x3

maximum:

H6 = 0,42

4. x1,x2
5. x1,x3

Hmax = R2

6. x2,x3
7. x1,x2,x3

Metody taksonomiczne
Taksonomia wrocławska (cluster analysis) to metoda grupowania obiektów (zmiennych) w grupy jednorodne pod względem n cech (wymiarów)
łącznie. Podstawą grupowania jest odległość euklidesowa, która w przypadku zmiennych d ij  f ( r x x )
WSZYSTKIE METODY TO SELEKCJA WSTĘPNA
i

j

Matematyczne techniki zarządzania - 127
ETAP 4. ESTYMACJA PARAMETRÓW MODELU
Cel etapu: wyznaczenie parametrów strukturalnych i stochastycznych
Estymacja: szacowanie parametrów populacji na podstawie próbki
Metody estymacji: analiza regresji i korelacji (KMNK i inne)

Założenia dla KMNK
1. Zmienne losowe są prawdziwymi zmiennymi, nie powiązanymi ze sobą
2. Składnik losowy  ma stałą wariancję, niezależną od zmiennej x lub t
3. Wartości reszt ui są niezależne od siebie

4. Składnik losowy  nie jest powiązany ze zmienną objaśniającą
Skutki niedotrzymania założeń i środki zaradcze
1. Model bez sensu, nieprzydatny; niekiedy absurdalny (źle uwarunkowane
dane)
Stosuje się: dużą próbkę (n>100), regresję grzbietową (ridge regression)
2.

Y

reszta ui

Lewa część zbioru ma dużą wariancję, a
prawa — wariancję małą
Stosuje się specjalny wariant MNK z
korektą na różne wariancje
X

Matematyczne techniki zarządzania - 128
3. Jeśli reszty ui są ze sobą powiązane (skorelowane), mówimy, że
występuje autokorelacja składnika losowego (zjawisko występuje przy
szeregach czasowych — sztywny porządek obserwacji)
Oznacza to, że istnieje istotna zależność u t  f ( u t  k )
Przyczyny autokorelacji: zakłócenia
(dodatnie lub ujemne) w jednym okresie
wpływają na poziom zjawiska w następnych
okresach (rolnictwo, produkcja, rynek)

t  1 , 2 ,...

u t  y t  yˆ t

u t 1

u1
u2
u3
u4
u5

Występowanie autokorelacji powoduje
nieprzydatność modelu


u1
u2
u3
u4

Istnienie autokorelacji sprawdza się testem
Durbina-Watsona d
Stosuje się metodę różniczki zupełnej

y  f (x )

yt  yt  ytk

4. Składnik losowy jest skorelowany ze zmienną objaśniającą, wtedy
gdy została pominięta jakaś ważna zmienna-przyczyna

Model taki nie ma żadnej wartości; trzeba dbać o jak najwyższy współczynnik determinacji (R2>0,9)
• zbiór danych rzeczywistych nigdy
nie spełnia tych wymagań

ESTYMACJĘ MODELU POWTARZA SIĘ WIELOKROTNIE
ponieważ dopiero weryfikacja zapewnia ostateczną selekcję
kandydatek na zmienne objaśniające

• ekonometria to analiza danych nie
spełniających tych założeń
• nie stosować statystyki bezmyślnie (na ślepo)

Matematyczne techniki zarządzania - 129
ETAP 5. WERYFIKACJA MODELU
Cele:

1. opis rzeczywistości (populacji generalnej)



2. dokładna (ostateczna) selekcja zmiennych objaśniających
3. poznanie składnika losowego (spełnienie założeń KMNK)
Narzędzia: hipotezy i testy statystyczne

Metodyka: każde równanie oddzielnie; weryfikacja obejmuje 9 etapów (od
najmniej do najbardziej pracochłonnego)
WYKAZ ETAPÓW WERYFIKACJI MODELU
I.
II.

Badanie istotności korelacji
Badanie wyrazistości modelu

III.

Badanie istotności parametrów

IV.

Badanie symetrii skł. losowego

V.
VI.
VII.
VIII.
IX.

Badanie losowości skł. losowego
Badanie stacjonarności skł. los.
Badanie wartości oczekiwanej skł. los.
Badanie autokorelacji skł. losowego
Badanie normalności skł. losowego

Opis każdego etapu weryfikacji
obejmuje:
• cel etapu
• sposób weryfikacji: wzory,
hipotezy, testy
• podanie których modeli dotyczy (przyczynowo-skutkowych
czy tendencji rozwojowej)
• podanie której postaci modeli
nieliniowych dotyczy (pierwotnej czy transformaty)

Matematyczne techniki zarządzania - 130
Etap I. Badanie istotności korelacji
7
2

8

9

11

12

17

19

23

21

5
2 etapu
9
16
7
9
15
14
Celem
jest
sprawdzenie,
czy
istnieje w populacji generalnej powiązanie pomiędzy zmienną Y i wszystkimi zmiennymi objaśniającymi

25

Przedział ufności dla
nieznanego współczynnika korelacji  dla populacji buduje się przy
użyciu błędu

populacja

zmienna Y

20
15
10

próbka

5
0
8
5

0 9

1011

2

9

20
12

30
17
16
7
zmienna X

25

1940
9

23 50
15

populacja

20

zmienna Y

7
2

15
10

próbka

5
0
0

10

20

30

zmienna X

40

50

21
14

sR 

1 R

0

Robl

2

nk

Istotność korelacji weryfikuje się przez postawienie
następujących hipotez dla
współczynnika korelacji dla
populacji generalnej:

1
R,|r|

H0 :   0

Brak korelacji, nie ma powiązania...

H1 :   0

Korelacja istotna, jest powiązanie...

,

Matematyczne techniki zarządzania - 131
Hipotezy te można weryfikować trzema równoważnymi testami:
• testem t Studenta (tylko dla regresji dwu zmiennych)
• testem F Fishera-Snedecora
• testem R Wallace’a-Snedecora

,

W każdym przypadku obliczamy wartość
statystyki dla próbki (tobl, Fobl, Robl) i porównujemy z wartością krytyczną odczytaną z tablicy odpowiedniego rozkładu w
funkcji poziomu istotności i liczby stopni
swobody (ttabl, Ftabl, Rtabl)

Reguła decyzyjna:
• jeżeli |tobl|< ttabl, nie ma podstaw do odrzucenia H0 (brak korelacji)
• jeżeli |tobl|> ttabl, odrzucamy H0 na korzyść H1 (korelacja istnieje)

TAK SAMO DLA
FiR

W przypadku regresji wielorakiej, gdy liczba zmiennych objaśniajacych
jest duża w porównaniu do liczby obserwacji, współczynnik determinacji
R2 może dawać zawyżoną ocenę stopnia wyjaśnienia zmienności zmiennej
objaśnianej; dlatego wprowadzono skorygowany współczynnik determinacji (i korelacji):
 ( yˆ i  y )

R

2

2

k
n

k

1


2
nk 1
(
y

y
)

i
n1

• adjusted coefficient of multiple
determination (wydruki komputerowe)

• jeśli k jest małe, nie ma większej różnicy
pomiędzy normalnym a skorygowanym R2

Matematyczne techniki zarządzania - 132
Skąd wziąć wartość odpowiedniej statystyki dla próbki i jak odczytywać jej wartości z tablic?
n2
r
t

r

t tabl  t  / 2 { n  2 }
TEST STUDENTA
obl
2
sr
1 r

F obl 

TEST FISHERA

Ź ró d ło z m ien n o śc i

MSTR
MSE



R

nk

2

1 R

2

L ic zb a sto p n i
sw o b o d y

Suma
k w a d ra tó w

Ś re d n i
k w a d ra t

M o d el (c z yn n ik i)
B łą d (re sz ta )

k1
nk

SSTR
SSE

MSTR
MSE

R azem

n1

SSTO

TEST WALLACE’A

R obl 

R

2

k 1

F tabl  F { k  1 , n  k }

S ta ty sty k a
F
F obl 

MSTR
MSE

NIE MYLIĆ
STOPNI SWOBODY LICZNIKA I MIANOWNIKA

R tabl  R { k , n  k }

Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

Matematyczne techniki zarządzania - 133
Odczyt Rtabl z tablicy testu R (SKRYPT s.161-162)

, k,  = n-k

S to pn ie
sw ob od y
8
18
28

2
0,05
0,632
0,444
0,361

0,01
0,765
0,561
0,463

L iczb a zm ien n ych
3
0,05
0,01
0,726
0,827
0,532
0,633
0,439
0,530

4
0,05
0,777
0,587
0,490

0,01
0,860
0,678
0,573

Wnioski dotyczące rozkładu R Wallace’a-Snedecora:
• tablica zawiera maksymalne wartości współczynnika korelacji w danej
sytuacji, jakich można oczekiwać, gdy nie ma korelacji w populacji
• im wyższy poziom istotności, tym niższe Rtabl

• im większa liczba zmiennych w modelu, tym wyższe Rtabl
• im wyższa liczba stopni swobody (większa próbka), tym niższe Rtabl
• tablica R powstała z przeliczenia tablic t oraz F (odwrócenie wzorów)
• tablica testu R jest najszybszym i nawygodniejszym narzędziem do
weryfikacji istotności korelacji

Werdykt z etapu I:

Matematyczne techniki zarządzania - 134

• jeżeli Robl>Rtabl, model jest poprawny, można przejść do etapu II
• jeżeli Roblzmiennych objaśniających albo jego postać matematyczną
ETAP I OBOWIĄZUJE DLA WSZYSTKICH MODELI
ETAP I PRZEPROWADZA SIĘ DLA TRANSFORMATY (dla postaci pierwotnej
można uzyskać R>1)
Rola współczynnika determinacji R2
• korelacja może być istotna przy małym R i bardzo małym R2 (r=0,4,
R2=0,16, co oznacza, że tylko 16% zmienności zmiennej Y jest
wyjaśnione przez zmienną objaśniającą)
• małe R2 oznacza niski stopień wyjaśnienia rzeczywistości i stanowi
zagrożenie dla modelu
• należy dążyć (poprzez odpowiedni dobór zmiennych-przyczyn i postaci
matematycznej modelu) do jak największego R2 (dla postaci pierwotnej)
• wysoka wartość R2 świadczy o dobrym poznaniu badanego zjawiska
• wysoka wartość R2 bardzo często wynika jednak ze złego dobrania
zmiennych objaśniających (silnie powiązane ze sobą — „masło maślane”)
KORELACJA POZORNA — jest zależność, ale jej nie ma? Przyczyny...
Trzeba unikać wartości bezwzględnych (ludność, liczba sklepów, wielkość produkcji)

6

9

12

8

11

12

11

15

9

18

9

11

11

18

15

Matematyczne techniki zarządzania - 135
Etap II. Badanie wyrazistości modelu
Y

Wyrazistość modelu dana jest wzorem

s( y )

ui

y

W obl 

s( y )

100 %

y

Celem etapu
jest kontrola
rozrzutu danych

Współczynnik Wobl<30%, w przeciwnym
przypadku rozrzut danych jest zbyt duży

y

Kłopoty: gdyy jest bliskie 0

x

X

Werdykt: model poprawny lub niepoprawny

ETAP II OBOWIĄZUJE DLA WSZYSTKICH MODELI (ale nie ma on charakteru
statystycznego)

ETAP II PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ (sprawdzamy, czy
nie występuje silny efekt „krzywego lustra”)
Etap III. Badanie istotności parametrów (współczynników) modelu
Celem etapu jest sprawdzenie:
• czy poszczególne zmienne objaśniające mają istotny wpływ na zmienną
objaśnianą?
• czy zmienne objaśniające są wybrane prawidłowo?

• czy wyraz wolny różni się istotnie od zera?

Matematyczne techniki zarządzania - 136
Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

Problem istotności parametrów ai można rozpatrywać (tak jak problem
średniej dla populacji) z dwu punktów widzenia:
• przedziału ufności dla nieznanej wartości i

• hipotez — zerowej H0: i=0 i alternatywnej H1: i 0

1
0

ai

1

i

ISTOTNY (W PRZEDZIALE NIE MA ZERA)

0

ai

i

NIEISTOTNY (W PRZEDZIALE JEST ZERO)

P ( a i  t / 2 { n  k } s ( a i )   i  a i  t / 2 { n  k } s ( a i )  1  

Z tablicy rozkładu Studenta, a nie z wydruku komputerowego!

Matematyczne techniki zarządzania - 137
Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

W praktyce posługujemy się raczej hipotezami:
Badanie istotności przeprowadza
się dla każdego i oddzielnie:

t obl ( a i ) 

ai  0
s(a i )

t tabl  t  / 2 { n  k }

• jeżeli |tobl(ai)|>ttabl(ai), odrzucamy hipotezę zerową; parametr jest istotny z błędem równym co najwyżej 
• jeżeli |tobl(ai)|parametr nie jest istotny
Praktycznie jest to bardzo łatwe:
• sprawdzamy, czy |t(ai)| jest większe czy mniejsze od około 2, a najlepiej
• porównujemy rzeczywisty poziom istotności P(ai) z przyjętym 
ODRZUCAMY H0, JEŻELI P(ai) JEST MNIEJSZE OD 

WTEDY ZMIENNA
Xi MA WPŁYW NA
ZMIENNĄ Y

Matematyczne techniki zarządzania - 138
W etapie III następuje ostateczna selekcja zmiennych objaśniających:
• jeżeli wszystkie ai okażą się istotne, model jest poprawny:
— model przyczynowo-skutkowy: do interpretacji
— model tendencji rozwojowej: do etapu IV
• jeżeli choć jedno ai okaże się nieistotne, model jest niepoprawny i wymaga poprawy przez usunięcie nieistotnych zmiennych:
— zmienne należy usuwać po jednej (ze względu na efekt katalityczny)
— usuwa się zawsze zmienną o najniższej wartości |t(ai)| [czyli o
najwyższej wartości P(ai)]
— usunięcie ostatniej zmiennej nieistotnej kończy proces selekcji
kandydatek na zmienne,

— selekcja nie jest ostateczna, gdyż zawsze istnieje możliwość zamiany zmiennych, które są powiązane ze sobą
Praktyczne znaczenie istotności wyrazu wolnego a0
To są jedne z możliwości dla populacji (p. plansza 106)

Y

W przypadku funkcji K=f(P) wyraz wolny wyznacza poziom kosztów stałych (rachunkowość zarządcza)
W przypadku zależności technicznej Q=f(h) wyraz
wolny oznacza, że przy miąższości pokładu h=0 wydajność produkcji Q też jest równa 0

0
X

Matematyczne techniki zarządzania - 139
Praktyczne znaczenie istotności współczynnika regresji ai



KRZYWE NEYMANA — PLANSZE 106-107
WSPÓŁCZ. ISTOTNY
WSPÓŁ. NIEISTOTNY

ETAP III OBOWIĄZUJE DLA WSZYSTKICH MODELI
ETAP III PRZEPROWADZA SIĘ DLA TRANSFORMATY
Etap IV. Badanie symetrii składnika losowego

Y

CZĘSTOŚĆ RESZT DODATNICH I UJEMNYCH MA BYĆ
ZBLIŻONA

Y

ASYMETRYCZNY
SYMETRYCZNY

t
t
Badanie symetrii przeprowadza się testem Studenta (St. Bartosiewicz
Ekonometria)
Brak symetrii wymaga zmiany matematycznej postaci modelu
ETAP IV OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ

ETAP IV PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ

Matematyczne techniki zarządzania - 140
Etap V. Badanie losowości składnika losowego

Y

Y
NIELOSOWY

LOSOWY

t
t
Badanie losowości przeprowadza się testem Studenta lub testem serii
(Ekonometria, praca zb. pod red. M. Krzysztofiaka)
Brak losowości wymaga zmiany matematycznej postaci modelu
ETAP V OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP V PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ
Etap VI. Badanie stacjonarności składnika losowego
W etapie tym chodzi o niezależność wariancji składnika losowego od
zmiennej objaśniającej t (plansza 127)

Bada się istotność współczynnika korelacji ru t , t
ETAP VI OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VI PRZEPROWADZA SIĘ DLA TRANSFORMATY

Matematyczne techniki zarządzania - 141
Etap VII. Badanie wartości oczekiwanej składnika losowego
Normalnie, gdy przeprowadzamy estymację postaci liniowej, parametry
składnika losowego E ( )  0
{ ui  0}
V ( )  const
Po retransformacji do postaci pierwotnej mamy nowe reszty u’, dla
których
'
'
ui  0
 ui  0
Celem etapu jest sprawdzenie, czy odchyłka od O nie jest zbyt duża
(służy do tego test Studenta)
ETAP VII OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VII PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ
Etap VIII. Badanie autokorelacji składnika losowego
Pojęcie autokorelacji opisano na planszy 128; chodzi o istotność korelacji ru , u
t

tk

Badanie autokorelacji można przeprowadzić:

• testem R istotności korelacji ru

t

,ut  k

d obl

• testem Durbina-Watsona
NIE MA AUTOK.

d1

?

d2 JEST AUTOKORELACJA

ETAP VIII OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VIII PRZEPROWADZA SIĘ DLA TRANSFORMATY

Matematyczne techniki zarządzania - 142
Etap IX. Badanie normalności składnika losowego
Celem etapu jest stwierdzenie, czy reszty mają rozkład normalny
Analiza reszt — oddzielny dział analizy regresji i korelacji
Jeżeli reszty mają rozkład normalny, statystyk otrzymuje „ulgi”
ETAP 6. PRAKTYCZNA INTERPRETACJA MODELU



Celem etapu jest wydobycie z modelu całej nowej wiedzy, której nie widać
„gołym okiem”
INTERPRETUJĄC MODEL (RÓWNANIE REGRESJI) NALEŻY UŻYWAĆ WYŁĄCZNIE
PROSTEJ TERMINOLOGII EKONOMICZNEJ ZROZUMIAŁEJ DLA KLIENTA
NIE NALEŻY UŻYWAĆ TERMINOLOGII MATEMATYCZNEJ ZROZUMIAŁEJ TYLKO DLA
TWÓRCÓW MODELU
INTERPRETOWAĆ WOLNO TYLKO MODEL ZWERYFIKOWANY
CAŁY TRUD MODELOWANIA NIE MOŻE BYĆ „SZTUKĄ DLA SZTUKI”, LECZ MA
SŁUŻYĆ UZYSKANIU KONKRETNYCH WNIOSKÓW PRAKTYCZNYCH

Interpretacja modelu przyczynowo-skutkowego

Polega ona na określeniu wpływu poszczególnych czynników na badane
zjawisko:
• podział wszystkich czynników na trzy grupy

Matematyczne techniki zarządzania - 143
A — czynniki nie mające wpływu na Y
B — czynniki mające wpływ na Y i wprowadzone do modelu
C — czynniki mające wpływ na Y, ale nie występujące w modelu
• ocena jakościowa wpływu czynników B i C
• ocena ilościowa wpływu czynników B i C
Ocena jakościowa



Na podstawie znaków stojących przy współczynnikach r oraz ai możemy
stwierdzić, że wpływ jest:

• dodatni (im lepsze zaliczenie, tym lepszy wynik egzaminu; im więcej
wydatków na reklamę, tym większy zysk; itd.)
• ujemny (im więcej zatrudnionych, tym gorszy wynik finansowy; im
mniej braków, tym wyższy zysk; im mniejsza absencja, tym wyższe
wynagrodzenie; itd.)

Ocena ilościowa
• model liniowy
Przykład 33. Zinterpretuj zweryfikowany model zależności miesięcznych
kosztów działalności przedsiębiorstwa (tys. zł) od wielkości produkcji
(sztuk) i liczby reklamacji:
y i  50 , 8  14 , 5 x 1  3 , 9 x 2  

Matematyczne techniki zarządzania - 144
a0 = 50,8

poziom kosztów stałych; jeśli firma nie będzie prowadzić
żadnej działalności, poniesie koszty w wysokości 50,8 tys. zł

a1 = 14,5

każda sztuka produktu firmy kosztuje ją przeciętnie 14,5
tys. zł; jeżeli firma zwiększy produkcję o 2 sztuki, koszty
wzrosną o 29,0 tys. zł

a2 = 3,9każda wniesiona reklamacja powiększa koszty przeciętnie o
3,9 tys. zł
• model potęgowy
Przykłąd 34. Zinterpretuj zweryfikowaną funkcję produkcji Cobba-Douglasa
0 , 65

Pi  45 , 2 M i

0 , 73

Zi

e

0 , 04



Funkcja produkcji to specjalny model, określający zależność pomiędzy
produkcją (P) a czynnikami produkcji: majątkiem trwałym (M) i nakładami
robocizny (Z).



Funkcje produkcji to modele umożliwiające „prześwietlenie”
przedsiębiorstwa (szereg czasowy) lub branży (dane przekrojowe) i określenie poziomu gospodarowania oraz postępu
technicznego i organizacyjnego.
Elastyczność  to współczynnik określający reakcję zmiany
jednej zmiennej na inną zmienną — na przykład elastyczność
cenowa popytu (jak popyt zmienia się wraz z ceną towaru).

EKSPERCI
ZACHODNI

Matematyczne techniki zarządzania - 145

 

y
y

:

x

FUNKCJA POTĘGOWA JEST JEDYNĄ FUNKCJĄ O STAŁEJ ELASTYCZNOŚCI

x

Izolinie funkcji produkcji

T1
M

Produkcję P można osiągnąć różnymi
kombinacjami majątku i robocizny:

T2

• T1— technika kapitałochłonna, np.
pełna automatyzacja
• T2 — pośredni poziom techniki

T3
P  const

• T3 — niski poziom techniki, produkcja
pracochłonna
P. LOWE

Z
Efekt poprawy zarządzania bez
zmiany techniki (lepsze wykorzystanie ludzi i sprzętu):

P2
M

ZARZĄDZANIE
TECHNOLOGIĄ

P1

T

• zmniejszenie kapitałochłonności

• zmniejszenie pracochłonności
• zwiększenie produkcji (przejście z
funkcji P1 na P2)

Można też rozpatrzyć łączne efekty
zmiany techniki i zarządzania

Z

Matematyczne techniki zarządzania - 146
Wszystkie informacje tego typu można odczytać w trakcie interpretacji
0 , 65
0 , 73 0 , 04
funkcji produkcji:
Pi  45 , 2 M i
Zi
e

• wartości 45,2 nie interpretuje się
• wartość 0,65 to współczynnik elastyczności majątkowej (kapitałowej)
produkcji: zmiana majątku o 10% daje średnio zmianę produkcji o 6,5%
• wartość 0,73 to współczynnik elastyczności zatrudnieniowej produkcji:
zmiana zatrudnienia o 10% daje zmianę produkcji średnio o 7,3%
• suma obu współczynników k=0,65+0,73=1,38 to współczynnik skali
produkcji:

— jeżeli k<1, to firma rozwija się ekstensywnie
— jeżeli k>1, to firma rozwija się intensywnie
• wartość  = 0,04 to współczynnik postępu organizacyjnego:
— jeżeli  >O, to miał miejsce postęp organizacyjny

— jeżeli  <0, to miał miejsce regres organizacyjny
Interpretacja modelu tendencji rozwojowej

DODAMY
TROCHĘ
TEORII

Przypomnienie: t — zmienna objaśniająca (stałe przyrosty)
y — zmienna objaśniana; rozdzielana w ogólności na trzy
części: trend, wahania okresowe, wahania losowe ()

Matematyczne techniki zarządzania - 147
Wykres z planszy 117 (zużycie energii elektrycznej przez WZ AGH)
WAHANIA OKRESOWE OKREŚLA SIĘ WZGLĘDEM TRENDU A
NIE WZGLĘDEM OSI CZASU

y

trend

t
1995

1996

1997

1998

1999

Te trzy części trzeba zidentyfikować, a potem złożyć razem w model:

• addytywny (jeśli amplituda wahań jest stała)
• multiplikatywny (jeśli amplituda wahań rośnie lub maleje regularnie)
Wyznaczanie trendu
Metody mechaniczne:

• wskaźniki bezwzględne (stały przyrost =
postęp arytmetyczny = funkcja liniowa)
• wskaźniki względne (przyrost o stały procent =
postęp geometryczny = funkcja potęgowa)
• średnia ruchoma (wygładzanie danych linią łamaną)

JAK OBLICZYĆ O
ILE PROCENT ROCZNIE SPADAŁA
ŚREDNIO LICZBA
WIDZÓW W
KINACH:
1982 - 193,7 MLN
1989 - 141,3 MLN

Matematyczne techniki zarządzania - 148
Średnia ruchoma: mając szereg czasowy y1, y2,....., yn, przyjmujemy
długość kroku k = 3, lub 5, lub 7 itd. i liczymy
y  ...  y k
y  ...  y k  1
y k / 2 0 ,5  1
a następnie y k / 2  1 , 5  2
itd.
k
k
y  y2  y3
y  y3  y4
dla k=3:
y2  1
y3  2
itd.
3
3
Przykład 35. Wyznacz trend metodą średniej ruchomej dla następujących
danych:
okres
t
wartość yt

1
5

2
4

3
7

4
6

5
8

12

y2 
10

y3 

y

8

y4 

6
4

y5 

2

y6 

0
0

1

2

3

4

5

czas, t

6

7

8

9

y7 

547

6
10

 5 , 67

CECHY
ŚREDNIEJ
RUCHOMEJ:

 7 , 00

• TRACI SIĘ
k-1 DANYCH

3
768

8
8

 5 , 33

3
476

7
9

3
6  8  10

 8 , 00

3
8  10  9

 9 , 00

3
10  9  8

 9 , 00

• IM
WIĘKSZE k,
TYM
BARDZIEJ
SZTYWNY
TREND

3

Metody statystyczne: analiza regresji i korelacji, różne funkcje oparte na
modelach ekonomii

Matematyczne techniki zarządzania - 149
Wyznaczanie wahań okresowych: dobowych, tygodniowych, miesięcznych,
kwartalnych, rocznych, wieloletnich
Trzy metody:

— metoda wskaźników sezonowości
— metoda zmiennych zero-jedynkowych (0-1)

— metoda harmoniczna
Wszystkie metody mają jeden cel:
uzyskanie przeciętnego obrazu jednego cyklu

+

Ws
[t ]
[%]
trend

I

II



III

IV

WADY:
• KONIECZNOŚĆ
KOREKTY
• BRAK
WERYFIKACJI
STATYSTYCZNEJ

Metoda wskaźników sezonowości

• obliczenie surowych wskaźników sezonowości (wyeliminowanie trendu):
y

S s  yt  yt
S s  t
yt
addytywny multiplikatywny
wynik: n wartości odchyleń od trendu

• obliczenie oczyszczonych wskaźników
sezonowości (wyeliminowanie wahań
losowych):
 Ss
So 
k-liczba okresów
k
jednoimiennych
m-długość cyklu wynik: m wartości śr. odchyleń od trendu

Matematyczne techniki zarządzania - 150
Metoda zmiennych zero-jedynkowych (0-1)
m

y t  a 0  a1 t   bi Q i  
i 1

bi — przeciętne odchylenie od trendu dla
okresu i-tego
Qi — zmienna 0-1

wahania losowe
trend

wahania okresowe

t
1
2
3
4
5
6
7
8
9

yt
y1
y2
y3
y4
y5
y6
y7
y8
y9

Q1
1
0
0
0
1
0
0
0
1

Q2
0
1
0
0
0
1
0
0
0

Q3
0
0
1
0
0
0
1
0
0

Q4
0
0
0
1
0
0
0
1
0

Metoda harmoniczna (szeregi Fouriera)
Wahania okresowe przedstawia się jako sumę określonej liczby drgań harmonicznych (sinusoid i cosinusoid) przesuniętych w fazie, lecz o jednakowym okresie
m /2
2 i m / 2
2 i
y t  a 0  a 1 t   b1 i sin
  b 2 i cos

m
m
i 1
i 1
Obie metody dają taki sam wynik, istnieje możliwość weryfikacji
statystycznej
W metodzie 0-1 dostajemy bi = Ws, natomiast w metodzie harmonicznej Ws
jest sumą wartości poszczególnych sinusoid dla danego momentu czasu


Slide 2

Matematyczne techniki zarządzania - 121
ETAP 2. GROMADZENIE DANYCH STATYSTYCZNYCH

!

ZA JAKOŚĆ DANYCH ODPOWIADA MODELUJĄCY
• rodzaje danych: dane przekrojowe i szeregi czasowe
• źródła danych: roczniki statystyczne, różne działy
przedsiębiorstwa, badania marketingowe, wywiady itd.
• wiarygodność danych: do jakiego celu zostały one
przygotowane?

MUSISZ
SPRAWDZAĆ
KAŻDE DANE

• porównywalność danych: inflacja (ceny bieżące a ceny
stałe), zmiany procesów technicznych
Wielkość
produkcji

• zmienność zjawisk: trzeba sprawdzić, czy
wybrana w etapie 1a zmienna jest rzeczywiście zmienną losową

Wx 

s( x )

nowy zakład

100 %

x

stary zakład

Wx musi wynosić co najmniej 30-40%
Wiek studenta może być dobrą zmiennąprzyczyną, ale nie w przypadku studiów
dziennych!

Zatrudnienie

Matematyczne techniki zarządzania - 122
ETAP 3. SELEKCJA ZMIENNYCH OBJAŚNIAJĄCYCH
KAŻDĄ ZMIENNĄ X WYTYPOWANĄ W ETAPIE 1a TRAKTUJEMY JAKO
KANDYDATKĘ NA ZMIENNĄ OBJAŚNIAJĄCĄ
Może być kilka przyczyn powodujących, że taka kandydatka nie może znaleźć się w modelu ekonometrycznym (w równaniu regresji):
• w modelu nie może być zbyt wielu zmiennych (nieczytelny)
• kandydatka może nie mieć wpływu na zmienną Y



• kandydatka może wnosić prawie tę samą informację o Y co inna
kandydatka

• dwie bardzo podobne kandydatki mogą sobie nawzajem przeszkadzać
(efekt katalityczny)
Kryteria, jakie musi spełniać kandydatka Xi, aby nadawała się do modelu:
• musi być silnie powiązana ze zmienną Y

• nie może być powiązana z inną kandydatką Xj
SSTO
x1
x4

x2
x3

reszta

R2=0,79

R2=0,66

x2
x1
x4

R2=0,48

x3
reszta

reszta

SSTO

SSTO

Matematyczne techniki zarządzania - 123
Efekt katalityczny
DWIE ZMIENNE DAJĄ
RAZEM MNIEJ INFORMACJI NIŻ KAŻDA Z
NICH Z OSOBNA

x1

x2

R2=0,25

x2

x1

R2=0,52

R2=0,66

Selekcja kandydatek ma na celu podzielenie ich na trzy grupy:
• zmienne wprowadzone do modelu
• zmienne nie wprowadzone do modelu, ale reprezentowane w nim przez
inne zmienne (możliwość wymiany)
• zmienne nie wprowadzone do modelu ze względu na fakt, że nie wnoszą
żadnej informacji o zmiennej Y
INFORMACJE potrzebne do selekcji: współczynniki r x i x j ,
Macierz współczynników korelacji
Y
Y
X1
X2
X3

0,52
0,64
- 0,21

X1
0,52
0,82
- 0,18

X2
0,64
0,82
0,08

X3
- 0,21
- 0,18
0,08

r yx

i

Przykład 32. Macierz powiązania
zmiennych ze sobą przedstawia
się następująco (n=20). Jak ją
można zinterpretować? Które
zmienne są powiązane ze sobą w
sposób istotny?

Matematyczne techniki zarządzania - 124
Testowanie istotności współczynnika korelacji
H0:  = 0

Można je przeprowadzić trzema testami: testem Studenta

H1:   0

(t), Fishera (F) i Wallace’a-Snedecora (R)

Fragment tablicy rozkładu Wallece’a-Snedecora (SKRYPT, tab. VII, s.161)
S to pn ie
sw ob od y

2
0,05
0,632
0,444
0,361

8
18
28

,

0,01
0,765
0,561
0,463

L iczb a zm ien n ych
3
0,05
0,01
0,726
0,827
0,532
0,633
0,439
0,530

4
0,05
0,777
0,587
0,490

0,01
0,860
0,678
0,573

Reguła decyzyjna: — jeżeli |Robl|>Rtabl, odrzucamy H0 (korelacja istotna)
— jeżeli |Robl|
W przykładzie 32, jeżeli przyjmiemy  = 0,05, to Rtabl = 0,444.
Y
Y
X1
X2
X3

0,52
0,64
- 0,21

X1
0,52
0,82
- 0,18

X2
0,64
0,82
0,08

X3
- 0,21
- 0,18
0,08

Pozostaną zatem tylko trzy
istotne powiązania:
y-x1, y-x2, x1-x2
BRAK ISTOTNEGO POWIĄZANIA Z Y NIE
OZNACZA, ŻE ZMIENNA NIE WNOSI
ŻADNEJ INFORMACJI O ZJAWISKU Y

Matematyczne techniki zarządzania - 125



Metody selekcji zmiennych objaśniających:
• grafowa
• Hellwiga (pojemności informacji)
• taksonomiczne (clustering)
Metoda grafowa
• obliczenie macierzy współczynników:

rx

i

xj

• wyłowienie z macierzy powiązań istotnych

, r yx

BUDOWA GRAFU
i

• graf spójny

• budowa grafu z powiązań istotnych
• wybranie zmiennych na podstawie grafu

x6

• graf zerowy
x1
x4

x9

DO MODELU WYBIERA SIĘ ZMIENNE:
• każdy graf zerowy (jeśli |ryx|>0,1)

istotne powiązanie

• po jednej reprezentantce grafu spójnego;

reprezentantką grafu jest zmienna, która ma najwięcej powiązań z
innymi kandydatkami
jeżeli kilka zmiennych ma tę samą maksymalną liczbę powiązań, wybiera
się z nich tę, która jest najsilniej powiązana za zmienną Y (max ryx)
jeżeli graf jest rozległy, może mieć dwie reprezentantki, ale muszą one
leżeć na przeciwległych stronach grafu

Matematyczne techniki zarządzania - 126
Przykład 32 cd. Wybierzemy
zmienną x2 (reprezentantka grafu
spójnego) i zmienną x3 (graf
zerowy)
Metoda Hellwiga

Y
Y
X1
X2
X3

0,52
0,64
- 0,21

• wypisujemy wszystkie możliwe kombinacje
kandydatek; jest ich K = 2m—1
• obliczamy pojemność informacji dla każdej
zmiennej w każdej kombinacji

h kl  f ( r yx , r x
i

ixj

)

• obliczamy pojemność całkowitą dla każdej
kombinacji
H l   h kl
k

• wybieramy kombinację o największej
pojemności Hl = max

X1
0,52
0,82
- 0,18

X2
0,64
0,82

X3
- 0,21
- 0,18
0,08

0,08

W przykładzie 32 mamy 7
możliwych kombinacji kandydatek:
1. x1
2. x2

3. x3

maximum:

H6 = 0,42

4. x1,x2
5. x1,x3

Hmax = R2

6. x2,x3
7. x1,x2,x3

Metody taksonomiczne
Taksonomia wrocławska (cluster analysis) to metoda grupowania obiektów (zmiennych) w grupy jednorodne pod względem n cech (wymiarów)
łącznie. Podstawą grupowania jest odległość euklidesowa, która w przypadku zmiennych d ij  f ( r x x )
WSZYSTKIE METODY TO SELEKCJA WSTĘPNA
i

j

Matematyczne techniki zarządzania - 127
ETAP 4. ESTYMACJA PARAMETRÓW MODELU
Cel etapu: wyznaczenie parametrów strukturalnych i stochastycznych
Estymacja: szacowanie parametrów populacji na podstawie próbki
Metody estymacji: analiza regresji i korelacji (KMNK i inne)

Założenia dla KMNK
1. Zmienne losowe są prawdziwymi zmiennymi, nie powiązanymi ze sobą
2. Składnik losowy  ma stałą wariancję, niezależną od zmiennej x lub t
3. Wartości reszt ui są niezależne od siebie

4. Składnik losowy  nie jest powiązany ze zmienną objaśniającą
Skutki niedotrzymania założeń i środki zaradcze
1. Model bez sensu, nieprzydatny; niekiedy absurdalny (źle uwarunkowane
dane)
Stosuje się: dużą próbkę (n>100), regresję grzbietową (ridge regression)
2.

Y

reszta ui

Lewa część zbioru ma dużą wariancję, a
prawa — wariancję małą
Stosuje się specjalny wariant MNK z
korektą na różne wariancje
X

Matematyczne techniki zarządzania - 128
3. Jeśli reszty ui są ze sobą powiązane (skorelowane), mówimy, że
występuje autokorelacja składnika losowego (zjawisko występuje przy
szeregach czasowych — sztywny porządek obserwacji)
Oznacza to, że istnieje istotna zależność u t  f ( u t  k )
Przyczyny autokorelacji: zakłócenia
(dodatnie lub ujemne) w jednym okresie
wpływają na poziom zjawiska w następnych
okresach (rolnictwo, produkcja, rynek)

t  1 , 2 ,...

u t  y t  yˆ t

u t 1

u1
u2
u3
u4
u5

Występowanie autokorelacji powoduje
nieprzydatność modelu


u1
u2
u3
u4

Istnienie autokorelacji sprawdza się testem
Durbina-Watsona d
Stosuje się metodę różniczki zupełnej

y  f (x )

yt  yt  ytk

4. Składnik losowy jest skorelowany ze zmienną objaśniającą, wtedy
gdy została pominięta jakaś ważna zmienna-przyczyna

Model taki nie ma żadnej wartości; trzeba dbać o jak najwyższy współczynnik determinacji (R2>0,9)
• zbiór danych rzeczywistych nigdy
nie spełnia tych wymagań

ESTYMACJĘ MODELU POWTARZA SIĘ WIELOKROTNIE
ponieważ dopiero weryfikacja zapewnia ostateczną selekcję
kandydatek na zmienne objaśniające

• ekonometria to analiza danych nie
spełniających tych założeń
• nie stosować statystyki bezmyślnie (na ślepo)

Matematyczne techniki zarządzania - 129
ETAP 5. WERYFIKACJA MODELU
Cele:

1. opis rzeczywistości (populacji generalnej)



2. dokładna (ostateczna) selekcja zmiennych objaśniających
3. poznanie składnika losowego (spełnienie założeń KMNK)
Narzędzia: hipotezy i testy statystyczne

Metodyka: każde równanie oddzielnie; weryfikacja obejmuje 9 etapów (od
najmniej do najbardziej pracochłonnego)
WYKAZ ETAPÓW WERYFIKACJI MODELU
I.
II.

Badanie istotności korelacji
Badanie wyrazistości modelu

III.

Badanie istotności parametrów

IV.

Badanie symetrii skł. losowego

V.
VI.
VII.
VIII.
IX.

Badanie losowości skł. losowego
Badanie stacjonarności skł. los.
Badanie wartości oczekiwanej skł. los.
Badanie autokorelacji skł. losowego
Badanie normalności skł. losowego

Opis każdego etapu weryfikacji
obejmuje:
• cel etapu
• sposób weryfikacji: wzory,
hipotezy, testy
• podanie których modeli dotyczy (przyczynowo-skutkowych
czy tendencji rozwojowej)
• podanie której postaci modeli
nieliniowych dotyczy (pierwotnej czy transformaty)

Matematyczne techniki zarządzania - 130
Etap I. Badanie istotności korelacji
7
2

8

9

11

12

17

19

23

21

5
2 etapu
9
16
7
9
15
14
Celem
jest
sprawdzenie,
czy
istnieje w populacji generalnej powiązanie pomiędzy zmienną Y i wszystkimi zmiennymi objaśniającymi

25

Przedział ufności dla
nieznanego współczynnika korelacji  dla populacji buduje się przy
użyciu błędu

populacja

zmienna Y

20
15
10

próbka

5
0
8
5

0 9

1011

2

9

20
12

30
17
16
7
zmienna X

25

1940
9

23 50
15

populacja

20

zmienna Y

7
2

15
10

próbka

5
0
0

10

20

30

zmienna X

40

50

21
14

sR 

1 R

0

Robl

2

nk

Istotność korelacji weryfikuje się przez postawienie
następujących hipotez dla
współczynnika korelacji dla
populacji generalnej:

1
R,|r|

H0 :   0

Brak korelacji, nie ma powiązania...

H1 :   0

Korelacja istotna, jest powiązanie...

,

Matematyczne techniki zarządzania - 131
Hipotezy te można weryfikować trzema równoważnymi testami:
• testem t Studenta (tylko dla regresji dwu zmiennych)
• testem F Fishera-Snedecora
• testem R Wallace’a-Snedecora

,

W każdym przypadku obliczamy wartość
statystyki dla próbki (tobl, Fobl, Robl) i porównujemy z wartością krytyczną odczytaną z tablicy odpowiedniego rozkładu w
funkcji poziomu istotności i liczby stopni
swobody (ttabl, Ftabl, Rtabl)

Reguła decyzyjna:
• jeżeli |tobl|< ttabl, nie ma podstaw do odrzucenia H0 (brak korelacji)
• jeżeli |tobl|> ttabl, odrzucamy H0 na korzyść H1 (korelacja istnieje)

TAK SAMO DLA
FiR

W przypadku regresji wielorakiej, gdy liczba zmiennych objaśniajacych
jest duża w porównaniu do liczby obserwacji, współczynnik determinacji
R2 może dawać zawyżoną ocenę stopnia wyjaśnienia zmienności zmiennej
objaśnianej; dlatego wprowadzono skorygowany współczynnik determinacji (i korelacji):
 ( yˆ i  y )

R

2

2

k
n

k

1


2
nk 1
(
y

y
)

i
n1

• adjusted coefficient of multiple
determination (wydruki komputerowe)

• jeśli k jest małe, nie ma większej różnicy
pomiędzy normalnym a skorygowanym R2

Matematyczne techniki zarządzania - 132
Skąd wziąć wartość odpowiedniej statystyki dla próbki i jak odczytywać jej wartości z tablic?
n2
r
t

r

t tabl  t  / 2 { n  2 }
TEST STUDENTA
obl
2
sr
1 r

F obl 

TEST FISHERA

Ź ró d ło z m ien n o śc i

MSTR
MSE



R

nk

2

1 R

2

L ic zb a sto p n i
sw o b o d y

Suma
k w a d ra tó w

Ś re d n i
k w a d ra t

M o d el (c z yn n ik i)
B łą d (re sz ta )

k1
nk

SSTR
SSE

MSTR
MSE

R azem

n1

SSTO

TEST WALLACE’A

R obl 

R

2

k 1

F tabl  F { k  1 , n  k }

S ta ty sty k a
F
F obl 

MSTR
MSE

NIE MYLIĆ
STOPNI SWOBODY LICZNIKA I MIANOWNIKA

R tabl  R { k , n  k }

Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

Matematyczne techniki zarządzania - 133
Odczyt Rtabl z tablicy testu R (SKRYPT s.161-162)

, k,  = n-k

S to pn ie
sw ob od y
8
18
28

2
0,05
0,632
0,444
0,361

0,01
0,765
0,561
0,463

L iczb a zm ien n ych
3
0,05
0,01
0,726
0,827
0,532
0,633
0,439
0,530

4
0,05
0,777
0,587
0,490

0,01
0,860
0,678
0,573

Wnioski dotyczące rozkładu R Wallace’a-Snedecora:
• tablica zawiera maksymalne wartości współczynnika korelacji w danej
sytuacji, jakich można oczekiwać, gdy nie ma korelacji w populacji
• im wyższy poziom istotności, tym niższe Rtabl

• im większa liczba zmiennych w modelu, tym wyższe Rtabl
• im wyższa liczba stopni swobody (większa próbka), tym niższe Rtabl
• tablica R powstała z przeliczenia tablic t oraz F (odwrócenie wzorów)
• tablica testu R jest najszybszym i nawygodniejszym narzędziem do
weryfikacji istotności korelacji

Werdykt z etapu I:

Matematyczne techniki zarządzania - 134

• jeżeli Robl>Rtabl, model jest poprawny, można przejść do etapu II
• jeżeli Roblzmiennych objaśniających albo jego postać matematyczną
ETAP I OBOWIĄZUJE DLA WSZYSTKICH MODELI
ETAP I PRZEPROWADZA SIĘ DLA TRANSFORMATY (dla postaci pierwotnej
można uzyskać R>1)
Rola współczynnika determinacji R2
• korelacja może być istotna przy małym R i bardzo małym R2 (r=0,4,
R2=0,16, co oznacza, że tylko 16% zmienności zmiennej Y jest
wyjaśnione przez zmienną objaśniającą)
• małe R2 oznacza niski stopień wyjaśnienia rzeczywistości i stanowi
zagrożenie dla modelu
• należy dążyć (poprzez odpowiedni dobór zmiennych-przyczyn i postaci
matematycznej modelu) do jak największego R2 (dla postaci pierwotnej)
• wysoka wartość R2 świadczy o dobrym poznaniu badanego zjawiska
• wysoka wartość R2 bardzo często wynika jednak ze złego dobrania
zmiennych objaśniających (silnie powiązane ze sobą — „masło maślane”)
KORELACJA POZORNA — jest zależność, ale jej nie ma? Przyczyny...
Trzeba unikać wartości bezwzględnych (ludność, liczba sklepów, wielkość produkcji)

6

9

12

8

11

12

11

15

9

18

9

11

11

18

15

Matematyczne techniki zarządzania - 135
Etap II. Badanie wyrazistości modelu
Y

Wyrazistość modelu dana jest wzorem

s( y )

ui

y

W obl 

s( y )

100 %

y

Celem etapu
jest kontrola
rozrzutu danych

Współczynnik Wobl<30%, w przeciwnym
przypadku rozrzut danych jest zbyt duży

y

Kłopoty: gdyy jest bliskie 0

x

X

Werdykt: model poprawny lub niepoprawny

ETAP II OBOWIĄZUJE DLA WSZYSTKICH MODELI (ale nie ma on charakteru
statystycznego)

ETAP II PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ (sprawdzamy, czy
nie występuje silny efekt „krzywego lustra”)
Etap III. Badanie istotności parametrów (współczynników) modelu
Celem etapu jest sprawdzenie:
• czy poszczególne zmienne objaśniające mają istotny wpływ na zmienną
objaśnianą?
• czy zmienne objaśniające są wybrane prawidłowo?

• czy wyraz wolny różni się istotnie od zera?

Matematyczne techniki zarządzania - 136
Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

Problem istotności parametrów ai można rozpatrywać (tak jak problem
średniej dla populacji) z dwu punktów widzenia:
• przedziału ufności dla nieznanej wartości i

• hipotez — zerowej H0: i=0 i alternatywnej H1: i 0

1
0

ai

1

i

ISTOTNY (W PRZEDZIALE NIE MA ZERA)

0

ai

i

NIEISTOTNY (W PRZEDZIALE JEST ZERO)

P ( a i  t / 2 { n  k } s ( a i )   i  a i  t / 2 { n  k } s ( a i )  1  

Z tablicy rozkładu Studenta, a nie z wydruku komputerowego!

Matematyczne techniki zarządzania - 137
Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

W praktyce posługujemy się raczej hipotezami:
Badanie istotności przeprowadza
się dla każdego i oddzielnie:

t obl ( a i ) 

ai  0
s(a i )

t tabl  t  / 2 { n  k }

• jeżeli |tobl(ai)|>ttabl(ai), odrzucamy hipotezę zerową; parametr jest istotny z błędem równym co najwyżej 
• jeżeli |tobl(ai)|parametr nie jest istotny
Praktycznie jest to bardzo łatwe:
• sprawdzamy, czy |t(ai)| jest większe czy mniejsze od około 2, a najlepiej
• porównujemy rzeczywisty poziom istotności P(ai) z przyjętym 
ODRZUCAMY H0, JEŻELI P(ai) JEST MNIEJSZE OD 

WTEDY ZMIENNA
Xi MA WPŁYW NA
ZMIENNĄ Y

Matematyczne techniki zarządzania - 138
W etapie III następuje ostateczna selekcja zmiennych objaśniających:
• jeżeli wszystkie ai okażą się istotne, model jest poprawny:
— model przyczynowo-skutkowy: do interpretacji
— model tendencji rozwojowej: do etapu IV
• jeżeli choć jedno ai okaże się nieistotne, model jest niepoprawny i wymaga poprawy przez usunięcie nieistotnych zmiennych:
— zmienne należy usuwać po jednej (ze względu na efekt katalityczny)
— usuwa się zawsze zmienną o najniższej wartości |t(ai)| [czyli o
najwyższej wartości P(ai)]
— usunięcie ostatniej zmiennej nieistotnej kończy proces selekcji
kandydatek na zmienne,

— selekcja nie jest ostateczna, gdyż zawsze istnieje możliwość zamiany zmiennych, które są powiązane ze sobą
Praktyczne znaczenie istotności wyrazu wolnego a0
To są jedne z możliwości dla populacji (p. plansza 106)

Y

W przypadku funkcji K=f(P) wyraz wolny wyznacza poziom kosztów stałych (rachunkowość zarządcza)
W przypadku zależności technicznej Q=f(h) wyraz
wolny oznacza, że przy miąższości pokładu h=0 wydajność produkcji Q też jest równa 0

0
X

Matematyczne techniki zarządzania - 139
Praktyczne znaczenie istotności współczynnika regresji ai



KRZYWE NEYMANA — PLANSZE 106-107
WSPÓŁCZ. ISTOTNY
WSPÓŁ. NIEISTOTNY

ETAP III OBOWIĄZUJE DLA WSZYSTKICH MODELI
ETAP III PRZEPROWADZA SIĘ DLA TRANSFORMATY
Etap IV. Badanie symetrii składnika losowego

Y

CZĘSTOŚĆ RESZT DODATNICH I UJEMNYCH MA BYĆ
ZBLIŻONA

Y

ASYMETRYCZNY
SYMETRYCZNY

t
t
Badanie symetrii przeprowadza się testem Studenta (St. Bartosiewicz
Ekonometria)
Brak symetrii wymaga zmiany matematycznej postaci modelu
ETAP IV OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ

ETAP IV PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ

Matematyczne techniki zarządzania - 140
Etap V. Badanie losowości składnika losowego

Y

Y
NIELOSOWY

LOSOWY

t
t
Badanie losowości przeprowadza się testem Studenta lub testem serii
(Ekonometria, praca zb. pod red. M. Krzysztofiaka)
Brak losowości wymaga zmiany matematycznej postaci modelu
ETAP V OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP V PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ
Etap VI. Badanie stacjonarności składnika losowego
W etapie tym chodzi o niezależność wariancji składnika losowego od
zmiennej objaśniającej t (plansza 127)

Bada się istotność współczynnika korelacji ru t , t
ETAP VI OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VI PRZEPROWADZA SIĘ DLA TRANSFORMATY

Matematyczne techniki zarządzania - 141
Etap VII. Badanie wartości oczekiwanej składnika losowego
Normalnie, gdy przeprowadzamy estymację postaci liniowej, parametry
składnika losowego E ( )  0
{ ui  0}
V ( )  const
Po retransformacji do postaci pierwotnej mamy nowe reszty u’, dla
których
'
'
ui  0
 ui  0
Celem etapu jest sprawdzenie, czy odchyłka od O nie jest zbyt duża
(służy do tego test Studenta)
ETAP VII OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VII PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ
Etap VIII. Badanie autokorelacji składnika losowego
Pojęcie autokorelacji opisano na planszy 128; chodzi o istotność korelacji ru , u
t

tk

Badanie autokorelacji można przeprowadzić:

• testem R istotności korelacji ru

t

,ut  k

d obl

• testem Durbina-Watsona
NIE MA AUTOK.

d1

?

d2 JEST AUTOKORELACJA

ETAP VIII OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VIII PRZEPROWADZA SIĘ DLA TRANSFORMATY

Matematyczne techniki zarządzania - 142
Etap IX. Badanie normalności składnika losowego
Celem etapu jest stwierdzenie, czy reszty mają rozkład normalny
Analiza reszt — oddzielny dział analizy regresji i korelacji
Jeżeli reszty mają rozkład normalny, statystyk otrzymuje „ulgi”
ETAP 6. PRAKTYCZNA INTERPRETACJA MODELU



Celem etapu jest wydobycie z modelu całej nowej wiedzy, której nie widać
„gołym okiem”
INTERPRETUJĄC MODEL (RÓWNANIE REGRESJI) NALEŻY UŻYWAĆ WYŁĄCZNIE
PROSTEJ TERMINOLOGII EKONOMICZNEJ ZROZUMIAŁEJ DLA KLIENTA
NIE NALEŻY UŻYWAĆ TERMINOLOGII MATEMATYCZNEJ ZROZUMIAŁEJ TYLKO DLA
TWÓRCÓW MODELU
INTERPRETOWAĆ WOLNO TYLKO MODEL ZWERYFIKOWANY
CAŁY TRUD MODELOWANIA NIE MOŻE BYĆ „SZTUKĄ DLA SZTUKI”, LECZ MA
SŁUŻYĆ UZYSKANIU KONKRETNYCH WNIOSKÓW PRAKTYCZNYCH

Interpretacja modelu przyczynowo-skutkowego

Polega ona na określeniu wpływu poszczególnych czynników na badane
zjawisko:
• podział wszystkich czynników na trzy grupy

Matematyczne techniki zarządzania - 143
A — czynniki nie mające wpływu na Y
B — czynniki mające wpływ na Y i wprowadzone do modelu
C — czynniki mające wpływ na Y, ale nie występujące w modelu
• ocena jakościowa wpływu czynników B i C
• ocena ilościowa wpływu czynników B i C
Ocena jakościowa



Na podstawie znaków stojących przy współczynnikach r oraz ai możemy
stwierdzić, że wpływ jest:

• dodatni (im lepsze zaliczenie, tym lepszy wynik egzaminu; im więcej
wydatków na reklamę, tym większy zysk; itd.)
• ujemny (im więcej zatrudnionych, tym gorszy wynik finansowy; im
mniej braków, tym wyższy zysk; im mniejsza absencja, tym wyższe
wynagrodzenie; itd.)

Ocena ilościowa
• model liniowy
Przykład 33. Zinterpretuj zweryfikowany model zależności miesięcznych
kosztów działalności przedsiębiorstwa (tys. zł) od wielkości produkcji
(sztuk) i liczby reklamacji:
y i  50 , 8  14 , 5 x 1  3 , 9 x 2  

Matematyczne techniki zarządzania - 144
a0 = 50,8

poziom kosztów stałych; jeśli firma nie będzie prowadzić
żadnej działalności, poniesie koszty w wysokości 50,8 tys. zł

a1 = 14,5

każda sztuka produktu firmy kosztuje ją przeciętnie 14,5
tys. zł; jeżeli firma zwiększy produkcję o 2 sztuki, koszty
wzrosną o 29,0 tys. zł

a2 = 3,9każda wniesiona reklamacja powiększa koszty przeciętnie o
3,9 tys. zł
• model potęgowy
Przykłąd 34. Zinterpretuj zweryfikowaną funkcję produkcji Cobba-Douglasa
0 , 65

Pi  45 , 2 M i

0 , 73

Zi

e

0 , 04



Funkcja produkcji to specjalny model, określający zależność pomiędzy
produkcją (P) a czynnikami produkcji: majątkiem trwałym (M) i nakładami
robocizny (Z).



Funkcje produkcji to modele umożliwiające „prześwietlenie”
przedsiębiorstwa (szereg czasowy) lub branży (dane przekrojowe) i określenie poziomu gospodarowania oraz postępu
technicznego i organizacyjnego.
Elastyczność  to współczynnik określający reakcję zmiany
jednej zmiennej na inną zmienną — na przykład elastyczność
cenowa popytu (jak popyt zmienia się wraz z ceną towaru).

EKSPERCI
ZACHODNI

Matematyczne techniki zarządzania - 145

 

y
y

:

x

FUNKCJA POTĘGOWA JEST JEDYNĄ FUNKCJĄ O STAŁEJ ELASTYCZNOŚCI

x

Izolinie funkcji produkcji

T1
M

Produkcję P można osiągnąć różnymi
kombinacjami majątku i robocizny:

T2

• T1— technika kapitałochłonna, np.
pełna automatyzacja
• T2 — pośredni poziom techniki

T3
P  const

• T3 — niski poziom techniki, produkcja
pracochłonna
P. LOWE

Z
Efekt poprawy zarządzania bez
zmiany techniki (lepsze wykorzystanie ludzi i sprzętu):

P2
M

ZARZĄDZANIE
TECHNOLOGIĄ

P1

T

• zmniejszenie kapitałochłonności

• zmniejszenie pracochłonności
• zwiększenie produkcji (przejście z
funkcji P1 na P2)

Można też rozpatrzyć łączne efekty
zmiany techniki i zarządzania

Z

Matematyczne techniki zarządzania - 146
Wszystkie informacje tego typu można odczytać w trakcie interpretacji
0 , 65
0 , 73 0 , 04
funkcji produkcji:
Pi  45 , 2 M i
Zi
e

• wartości 45,2 nie interpretuje się
• wartość 0,65 to współczynnik elastyczności majątkowej (kapitałowej)
produkcji: zmiana majątku o 10% daje średnio zmianę produkcji o 6,5%
• wartość 0,73 to współczynnik elastyczności zatrudnieniowej produkcji:
zmiana zatrudnienia o 10% daje zmianę produkcji średnio o 7,3%
• suma obu współczynników k=0,65+0,73=1,38 to współczynnik skali
produkcji:

— jeżeli k<1, to firma rozwija się ekstensywnie
— jeżeli k>1, to firma rozwija się intensywnie
• wartość  = 0,04 to współczynnik postępu organizacyjnego:
— jeżeli  >O, to miał miejsce postęp organizacyjny

— jeżeli  <0, to miał miejsce regres organizacyjny
Interpretacja modelu tendencji rozwojowej

DODAMY
TROCHĘ
TEORII

Przypomnienie: t — zmienna objaśniająca (stałe przyrosty)
y — zmienna objaśniana; rozdzielana w ogólności na trzy
części: trend, wahania okresowe, wahania losowe ()

Matematyczne techniki zarządzania - 147
Wykres z planszy 117 (zużycie energii elektrycznej przez WZ AGH)
WAHANIA OKRESOWE OKREŚLA SIĘ WZGLĘDEM TRENDU A
NIE WZGLĘDEM OSI CZASU

y

trend

t
1995

1996

1997

1998

1999

Te trzy części trzeba zidentyfikować, a potem złożyć razem w model:

• addytywny (jeśli amplituda wahań jest stała)
• multiplikatywny (jeśli amplituda wahań rośnie lub maleje regularnie)
Wyznaczanie trendu
Metody mechaniczne:

• wskaźniki bezwzględne (stały przyrost =
postęp arytmetyczny = funkcja liniowa)
• wskaźniki względne (przyrost o stały procent =
postęp geometryczny = funkcja potęgowa)
• średnia ruchoma (wygładzanie danych linią łamaną)

JAK OBLICZYĆ O
ILE PROCENT ROCZNIE SPADAŁA
ŚREDNIO LICZBA
WIDZÓW W
KINACH:
1982 - 193,7 MLN
1989 - 141,3 MLN

Matematyczne techniki zarządzania - 148
Średnia ruchoma: mając szereg czasowy y1, y2,....., yn, przyjmujemy
długość kroku k = 3, lub 5, lub 7 itd. i liczymy
y  ...  y k
y  ...  y k  1
y k / 2 0 ,5  1
a następnie y k / 2  1 , 5  2
itd.
k
k
y  y2  y3
y  y3  y4
dla k=3:
y2  1
y3  2
itd.
3
3
Przykład 35. Wyznacz trend metodą średniej ruchomej dla następujących
danych:
okres
t
wartość yt

1
5

2
4

3
7

4
6

5
8

12

y2 
10

y3 

y

8

y4 

6
4

y5 

2

y6 

0
0

1

2

3

4

5

czas, t

6

7

8

9

y7 

547

6
10

 5 , 67

CECHY
ŚREDNIEJ
RUCHOMEJ:

 7 , 00

• TRACI SIĘ
k-1 DANYCH

3
768

8
8

 5 , 33

3
476

7
9

3
6  8  10

 8 , 00

3
8  10  9

 9 , 00

3
10  9  8

 9 , 00

• IM
WIĘKSZE k,
TYM
BARDZIEJ
SZTYWNY
TREND

3

Metody statystyczne: analiza regresji i korelacji, różne funkcje oparte na
modelach ekonomii

Matematyczne techniki zarządzania - 149
Wyznaczanie wahań okresowych: dobowych, tygodniowych, miesięcznych,
kwartalnych, rocznych, wieloletnich
Trzy metody:

— metoda wskaźników sezonowości
— metoda zmiennych zero-jedynkowych (0-1)

— metoda harmoniczna
Wszystkie metody mają jeden cel:
uzyskanie przeciętnego obrazu jednego cyklu

+

Ws
[t ]
[%]
trend

I

II



III

IV

WADY:
• KONIECZNOŚĆ
KOREKTY
• BRAK
WERYFIKACJI
STATYSTYCZNEJ

Metoda wskaźników sezonowości

• obliczenie surowych wskaźników sezonowości (wyeliminowanie trendu):
y

S s  yt  yt
S s  t
yt
addytywny multiplikatywny
wynik: n wartości odchyleń od trendu

• obliczenie oczyszczonych wskaźników
sezonowości (wyeliminowanie wahań
losowych):
 Ss
So 
k-liczba okresów
k
jednoimiennych
m-długość cyklu wynik: m wartości śr. odchyleń od trendu

Matematyczne techniki zarządzania - 150
Metoda zmiennych zero-jedynkowych (0-1)
m

y t  a 0  a1 t   bi Q i  
i 1

bi — przeciętne odchylenie od trendu dla
okresu i-tego
Qi — zmienna 0-1

wahania losowe
trend

wahania okresowe

t
1
2
3
4
5
6
7
8
9

yt
y1
y2
y3
y4
y5
y6
y7
y8
y9

Q1
1
0
0
0
1
0
0
0
1

Q2
0
1
0
0
0
1
0
0
0

Q3
0
0
1
0
0
0
1
0
0

Q4
0
0
0
1
0
0
0
1
0

Metoda harmoniczna (szeregi Fouriera)
Wahania okresowe przedstawia się jako sumę określonej liczby drgań harmonicznych (sinusoid i cosinusoid) przesuniętych w fazie, lecz o jednakowym okresie
m /2
2 i m / 2
2 i
y t  a 0  a 1 t   b1 i sin
  b 2 i cos

m
m
i 1
i 1
Obie metody dają taki sam wynik, istnieje możliwość weryfikacji
statystycznej
W metodzie 0-1 dostajemy bi = Ws, natomiast w metodzie harmonicznej Ws
jest sumą wartości poszczególnych sinusoid dla danego momentu czasu


Slide 3

Matematyczne techniki zarządzania - 121
ETAP 2. GROMADZENIE DANYCH STATYSTYCZNYCH

!

ZA JAKOŚĆ DANYCH ODPOWIADA MODELUJĄCY
• rodzaje danych: dane przekrojowe i szeregi czasowe
• źródła danych: roczniki statystyczne, różne działy
przedsiębiorstwa, badania marketingowe, wywiady itd.
• wiarygodność danych: do jakiego celu zostały one
przygotowane?

MUSISZ
SPRAWDZAĆ
KAŻDE DANE

• porównywalność danych: inflacja (ceny bieżące a ceny
stałe), zmiany procesów technicznych
Wielkość
produkcji

• zmienność zjawisk: trzeba sprawdzić, czy
wybrana w etapie 1a zmienna jest rzeczywiście zmienną losową

Wx 

s( x )

nowy zakład

100 %

x

stary zakład

Wx musi wynosić co najmniej 30-40%
Wiek studenta może być dobrą zmiennąprzyczyną, ale nie w przypadku studiów
dziennych!

Zatrudnienie

Matematyczne techniki zarządzania - 122
ETAP 3. SELEKCJA ZMIENNYCH OBJAŚNIAJĄCYCH
KAŻDĄ ZMIENNĄ X WYTYPOWANĄ W ETAPIE 1a TRAKTUJEMY JAKO
KANDYDATKĘ NA ZMIENNĄ OBJAŚNIAJĄCĄ
Może być kilka przyczyn powodujących, że taka kandydatka nie może znaleźć się w modelu ekonometrycznym (w równaniu regresji):
• w modelu nie może być zbyt wielu zmiennych (nieczytelny)
• kandydatka może nie mieć wpływu na zmienną Y



• kandydatka może wnosić prawie tę samą informację o Y co inna
kandydatka

• dwie bardzo podobne kandydatki mogą sobie nawzajem przeszkadzać
(efekt katalityczny)
Kryteria, jakie musi spełniać kandydatka Xi, aby nadawała się do modelu:
• musi być silnie powiązana ze zmienną Y

• nie może być powiązana z inną kandydatką Xj
SSTO
x1
x4

x2
x3

reszta

R2=0,79

R2=0,66

x2
x1
x4

R2=0,48

x3
reszta

reszta

SSTO

SSTO

Matematyczne techniki zarządzania - 123
Efekt katalityczny
DWIE ZMIENNE DAJĄ
RAZEM MNIEJ INFORMACJI NIŻ KAŻDA Z
NICH Z OSOBNA

x1

x2

R2=0,25

x2

x1

R2=0,52

R2=0,66

Selekcja kandydatek ma na celu podzielenie ich na trzy grupy:
• zmienne wprowadzone do modelu
• zmienne nie wprowadzone do modelu, ale reprezentowane w nim przez
inne zmienne (możliwość wymiany)
• zmienne nie wprowadzone do modelu ze względu na fakt, że nie wnoszą
żadnej informacji o zmiennej Y
INFORMACJE potrzebne do selekcji: współczynniki r x i x j ,
Macierz współczynników korelacji
Y
Y
X1
X2
X3

0,52
0,64
- 0,21

X1
0,52
0,82
- 0,18

X2
0,64
0,82
0,08

X3
- 0,21
- 0,18
0,08

r yx

i

Przykład 32. Macierz powiązania
zmiennych ze sobą przedstawia
się następująco (n=20). Jak ją
można zinterpretować? Które
zmienne są powiązane ze sobą w
sposób istotny?

Matematyczne techniki zarządzania - 124
Testowanie istotności współczynnika korelacji
H0:  = 0

Można je przeprowadzić trzema testami: testem Studenta

H1:   0

(t), Fishera (F) i Wallace’a-Snedecora (R)

Fragment tablicy rozkładu Wallece’a-Snedecora (SKRYPT, tab. VII, s.161)
S to pn ie
sw ob od y

2
0,05
0,632
0,444
0,361

8
18
28

,

0,01
0,765
0,561
0,463

L iczb a zm ien n ych
3
0,05
0,01
0,726
0,827
0,532
0,633
0,439
0,530

4
0,05
0,777
0,587
0,490

0,01
0,860
0,678
0,573

Reguła decyzyjna: — jeżeli |Robl|>Rtabl, odrzucamy H0 (korelacja istotna)
— jeżeli |Robl|
W przykładzie 32, jeżeli przyjmiemy  = 0,05, to Rtabl = 0,444.
Y
Y
X1
X2
X3

0,52
0,64
- 0,21

X1
0,52
0,82
- 0,18

X2
0,64
0,82
0,08

X3
- 0,21
- 0,18
0,08

Pozostaną zatem tylko trzy
istotne powiązania:
y-x1, y-x2, x1-x2
BRAK ISTOTNEGO POWIĄZANIA Z Y NIE
OZNACZA, ŻE ZMIENNA NIE WNOSI
ŻADNEJ INFORMACJI O ZJAWISKU Y

Matematyczne techniki zarządzania - 125



Metody selekcji zmiennych objaśniających:
• grafowa
• Hellwiga (pojemności informacji)
• taksonomiczne (clustering)
Metoda grafowa
• obliczenie macierzy współczynników:

rx

i

xj

• wyłowienie z macierzy powiązań istotnych

, r yx

BUDOWA GRAFU
i

• graf spójny

• budowa grafu z powiązań istotnych
• wybranie zmiennych na podstawie grafu

x6

• graf zerowy
x1
x4

x9

DO MODELU WYBIERA SIĘ ZMIENNE:
• każdy graf zerowy (jeśli |ryx|>0,1)

istotne powiązanie

• po jednej reprezentantce grafu spójnego;

reprezentantką grafu jest zmienna, która ma najwięcej powiązań z
innymi kandydatkami
jeżeli kilka zmiennych ma tę samą maksymalną liczbę powiązań, wybiera
się z nich tę, która jest najsilniej powiązana za zmienną Y (max ryx)
jeżeli graf jest rozległy, może mieć dwie reprezentantki, ale muszą one
leżeć na przeciwległych stronach grafu

Matematyczne techniki zarządzania - 126
Przykład 32 cd. Wybierzemy
zmienną x2 (reprezentantka grafu
spójnego) i zmienną x3 (graf
zerowy)
Metoda Hellwiga

Y
Y
X1
X2
X3

0,52
0,64
- 0,21

• wypisujemy wszystkie możliwe kombinacje
kandydatek; jest ich K = 2m—1
• obliczamy pojemność informacji dla każdej
zmiennej w każdej kombinacji

h kl  f ( r yx , r x
i

ixj

)

• obliczamy pojemność całkowitą dla każdej
kombinacji
H l   h kl
k

• wybieramy kombinację o największej
pojemności Hl = max

X1
0,52
0,82
- 0,18

X2
0,64
0,82

X3
- 0,21
- 0,18
0,08

0,08

W przykładzie 32 mamy 7
możliwych kombinacji kandydatek:
1. x1
2. x2

3. x3

maximum:

H6 = 0,42

4. x1,x2
5. x1,x3

Hmax = R2

6. x2,x3
7. x1,x2,x3

Metody taksonomiczne
Taksonomia wrocławska (cluster analysis) to metoda grupowania obiektów (zmiennych) w grupy jednorodne pod względem n cech (wymiarów)
łącznie. Podstawą grupowania jest odległość euklidesowa, która w przypadku zmiennych d ij  f ( r x x )
WSZYSTKIE METODY TO SELEKCJA WSTĘPNA
i

j

Matematyczne techniki zarządzania - 127
ETAP 4. ESTYMACJA PARAMETRÓW MODELU
Cel etapu: wyznaczenie parametrów strukturalnych i stochastycznych
Estymacja: szacowanie parametrów populacji na podstawie próbki
Metody estymacji: analiza regresji i korelacji (KMNK i inne)

Założenia dla KMNK
1. Zmienne losowe są prawdziwymi zmiennymi, nie powiązanymi ze sobą
2. Składnik losowy  ma stałą wariancję, niezależną od zmiennej x lub t
3. Wartości reszt ui są niezależne od siebie

4. Składnik losowy  nie jest powiązany ze zmienną objaśniającą
Skutki niedotrzymania założeń i środki zaradcze
1. Model bez sensu, nieprzydatny; niekiedy absurdalny (źle uwarunkowane
dane)
Stosuje się: dużą próbkę (n>100), regresję grzbietową (ridge regression)
2.

Y

reszta ui

Lewa część zbioru ma dużą wariancję, a
prawa — wariancję małą
Stosuje się specjalny wariant MNK z
korektą na różne wariancje
X

Matematyczne techniki zarządzania - 128
3. Jeśli reszty ui są ze sobą powiązane (skorelowane), mówimy, że
występuje autokorelacja składnika losowego (zjawisko występuje przy
szeregach czasowych — sztywny porządek obserwacji)
Oznacza to, że istnieje istotna zależność u t  f ( u t  k )
Przyczyny autokorelacji: zakłócenia
(dodatnie lub ujemne) w jednym okresie
wpływają na poziom zjawiska w następnych
okresach (rolnictwo, produkcja, rynek)

t  1 , 2 ,...

u t  y t  yˆ t

u t 1

u1
u2
u3
u4
u5

Występowanie autokorelacji powoduje
nieprzydatność modelu


u1
u2
u3
u4

Istnienie autokorelacji sprawdza się testem
Durbina-Watsona d
Stosuje się metodę różniczki zupełnej

y  f (x )

yt  yt  ytk

4. Składnik losowy jest skorelowany ze zmienną objaśniającą, wtedy
gdy została pominięta jakaś ważna zmienna-przyczyna

Model taki nie ma żadnej wartości; trzeba dbać o jak najwyższy współczynnik determinacji (R2>0,9)
• zbiór danych rzeczywistych nigdy
nie spełnia tych wymagań

ESTYMACJĘ MODELU POWTARZA SIĘ WIELOKROTNIE
ponieważ dopiero weryfikacja zapewnia ostateczną selekcję
kandydatek na zmienne objaśniające

• ekonometria to analiza danych nie
spełniających tych założeń
• nie stosować statystyki bezmyślnie (na ślepo)

Matematyczne techniki zarządzania - 129
ETAP 5. WERYFIKACJA MODELU
Cele:

1. opis rzeczywistości (populacji generalnej)



2. dokładna (ostateczna) selekcja zmiennych objaśniających
3. poznanie składnika losowego (spełnienie założeń KMNK)
Narzędzia: hipotezy i testy statystyczne

Metodyka: każde równanie oddzielnie; weryfikacja obejmuje 9 etapów (od
najmniej do najbardziej pracochłonnego)
WYKAZ ETAPÓW WERYFIKACJI MODELU
I.
II.

Badanie istotności korelacji
Badanie wyrazistości modelu

III.

Badanie istotności parametrów

IV.

Badanie symetrii skł. losowego

V.
VI.
VII.
VIII.
IX.

Badanie losowości skł. losowego
Badanie stacjonarności skł. los.
Badanie wartości oczekiwanej skł. los.
Badanie autokorelacji skł. losowego
Badanie normalności skł. losowego

Opis każdego etapu weryfikacji
obejmuje:
• cel etapu
• sposób weryfikacji: wzory,
hipotezy, testy
• podanie których modeli dotyczy (przyczynowo-skutkowych
czy tendencji rozwojowej)
• podanie której postaci modeli
nieliniowych dotyczy (pierwotnej czy transformaty)

Matematyczne techniki zarządzania - 130
Etap I. Badanie istotności korelacji
7
2

8

9

11

12

17

19

23

21

5
2 etapu
9
16
7
9
15
14
Celem
jest
sprawdzenie,
czy
istnieje w populacji generalnej powiązanie pomiędzy zmienną Y i wszystkimi zmiennymi objaśniającymi

25

Przedział ufności dla
nieznanego współczynnika korelacji  dla populacji buduje się przy
użyciu błędu

populacja

zmienna Y

20
15
10

próbka

5
0
8
5

0 9

1011

2

9

20
12

30
17
16
7
zmienna X

25

1940
9

23 50
15

populacja

20

zmienna Y

7
2

15
10

próbka

5
0
0

10

20

30

zmienna X

40

50

21
14

sR 

1 R

0

Robl

2

nk

Istotność korelacji weryfikuje się przez postawienie
następujących hipotez dla
współczynnika korelacji dla
populacji generalnej:

1
R,|r|

H0 :   0

Brak korelacji, nie ma powiązania...

H1 :   0

Korelacja istotna, jest powiązanie...

,

Matematyczne techniki zarządzania - 131
Hipotezy te można weryfikować trzema równoważnymi testami:
• testem t Studenta (tylko dla regresji dwu zmiennych)
• testem F Fishera-Snedecora
• testem R Wallace’a-Snedecora

,

W każdym przypadku obliczamy wartość
statystyki dla próbki (tobl, Fobl, Robl) i porównujemy z wartością krytyczną odczytaną z tablicy odpowiedniego rozkładu w
funkcji poziomu istotności i liczby stopni
swobody (ttabl, Ftabl, Rtabl)

Reguła decyzyjna:
• jeżeli |tobl|< ttabl, nie ma podstaw do odrzucenia H0 (brak korelacji)
• jeżeli |tobl|> ttabl, odrzucamy H0 na korzyść H1 (korelacja istnieje)

TAK SAMO DLA
FiR

W przypadku regresji wielorakiej, gdy liczba zmiennych objaśniajacych
jest duża w porównaniu do liczby obserwacji, współczynnik determinacji
R2 może dawać zawyżoną ocenę stopnia wyjaśnienia zmienności zmiennej
objaśnianej; dlatego wprowadzono skorygowany współczynnik determinacji (i korelacji):
 ( yˆ i  y )

R

2

2

k
n

k

1


2
nk 1
(
y

y
)

i
n1

• adjusted coefficient of multiple
determination (wydruki komputerowe)

• jeśli k jest małe, nie ma większej różnicy
pomiędzy normalnym a skorygowanym R2

Matematyczne techniki zarządzania - 132
Skąd wziąć wartość odpowiedniej statystyki dla próbki i jak odczytywać jej wartości z tablic?
n2
r
t

r

t tabl  t  / 2 { n  2 }
TEST STUDENTA
obl
2
sr
1 r

F obl 

TEST FISHERA

Ź ró d ło z m ien n o śc i

MSTR
MSE



R

nk

2

1 R

2

L ic zb a sto p n i
sw o b o d y

Suma
k w a d ra tó w

Ś re d n i
k w a d ra t

M o d el (c z yn n ik i)
B łą d (re sz ta )

k1
nk

SSTR
SSE

MSTR
MSE

R azem

n1

SSTO

TEST WALLACE’A

R obl 

R

2

k 1

F tabl  F { k  1 , n  k }

S ta ty sty k a
F
F obl 

MSTR
MSE

NIE MYLIĆ
STOPNI SWOBODY LICZNIKA I MIANOWNIKA

R tabl  R { k , n  k }

Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

Matematyczne techniki zarządzania - 133
Odczyt Rtabl z tablicy testu R (SKRYPT s.161-162)

, k,  = n-k

S to pn ie
sw ob od y
8
18
28

2
0,05
0,632
0,444
0,361

0,01
0,765
0,561
0,463

L iczb a zm ien n ych
3
0,05
0,01
0,726
0,827
0,532
0,633
0,439
0,530

4
0,05
0,777
0,587
0,490

0,01
0,860
0,678
0,573

Wnioski dotyczące rozkładu R Wallace’a-Snedecora:
• tablica zawiera maksymalne wartości współczynnika korelacji w danej
sytuacji, jakich można oczekiwać, gdy nie ma korelacji w populacji
• im wyższy poziom istotności, tym niższe Rtabl

• im większa liczba zmiennych w modelu, tym wyższe Rtabl
• im wyższa liczba stopni swobody (większa próbka), tym niższe Rtabl
• tablica R powstała z przeliczenia tablic t oraz F (odwrócenie wzorów)
• tablica testu R jest najszybszym i nawygodniejszym narzędziem do
weryfikacji istotności korelacji

Werdykt z etapu I:

Matematyczne techniki zarządzania - 134

• jeżeli Robl>Rtabl, model jest poprawny, można przejść do etapu II
• jeżeli Roblzmiennych objaśniających albo jego postać matematyczną
ETAP I OBOWIĄZUJE DLA WSZYSTKICH MODELI
ETAP I PRZEPROWADZA SIĘ DLA TRANSFORMATY (dla postaci pierwotnej
można uzyskać R>1)
Rola współczynnika determinacji R2
• korelacja może być istotna przy małym R i bardzo małym R2 (r=0,4,
R2=0,16, co oznacza, że tylko 16% zmienności zmiennej Y jest
wyjaśnione przez zmienną objaśniającą)
• małe R2 oznacza niski stopień wyjaśnienia rzeczywistości i stanowi
zagrożenie dla modelu
• należy dążyć (poprzez odpowiedni dobór zmiennych-przyczyn i postaci
matematycznej modelu) do jak największego R2 (dla postaci pierwotnej)
• wysoka wartość R2 świadczy o dobrym poznaniu badanego zjawiska
• wysoka wartość R2 bardzo często wynika jednak ze złego dobrania
zmiennych objaśniających (silnie powiązane ze sobą — „masło maślane”)
KORELACJA POZORNA — jest zależność, ale jej nie ma? Przyczyny...
Trzeba unikać wartości bezwzględnych (ludność, liczba sklepów, wielkość produkcji)

6

9

12

8

11

12

11

15

9

18

9

11

11

18

15

Matematyczne techniki zarządzania - 135
Etap II. Badanie wyrazistości modelu
Y

Wyrazistość modelu dana jest wzorem

s( y )

ui

y

W obl 

s( y )

100 %

y

Celem etapu
jest kontrola
rozrzutu danych

Współczynnik Wobl<30%, w przeciwnym
przypadku rozrzut danych jest zbyt duży

y

Kłopoty: gdyy jest bliskie 0

x

X

Werdykt: model poprawny lub niepoprawny

ETAP II OBOWIĄZUJE DLA WSZYSTKICH MODELI (ale nie ma on charakteru
statystycznego)

ETAP II PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ (sprawdzamy, czy
nie występuje silny efekt „krzywego lustra”)
Etap III. Badanie istotności parametrów (współczynników) modelu
Celem etapu jest sprawdzenie:
• czy poszczególne zmienne objaśniające mają istotny wpływ na zmienną
objaśnianą?
• czy zmienne objaśniające są wybrane prawidłowo?

• czy wyraz wolny różni się istotnie od zera?

Matematyczne techniki zarządzania - 136
Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

Problem istotności parametrów ai można rozpatrywać (tak jak problem
średniej dla populacji) z dwu punktów widzenia:
• przedziału ufności dla nieznanej wartości i

• hipotez — zerowej H0: i=0 i alternatywnej H1: i 0

1
0

ai

1

i

ISTOTNY (W PRZEDZIALE NIE MA ZERA)

0

ai

i

NIEISTOTNY (W PRZEDZIALE JEST ZERO)

P ( a i  t / 2 { n  k } s ( a i )   i  a i  t / 2 { n  k } s ( a i )  1  

Z tablicy rozkładu Studenta, a nie z wydruku komputerowego!

Matematyczne techniki zarządzania - 137
Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

W praktyce posługujemy się raczej hipotezami:
Badanie istotności przeprowadza
się dla każdego i oddzielnie:

t obl ( a i ) 

ai  0
s(a i )

t tabl  t  / 2 { n  k }

• jeżeli |tobl(ai)|>ttabl(ai), odrzucamy hipotezę zerową; parametr jest istotny z błędem równym co najwyżej 
• jeżeli |tobl(ai)|parametr nie jest istotny
Praktycznie jest to bardzo łatwe:
• sprawdzamy, czy |t(ai)| jest większe czy mniejsze od około 2, a najlepiej
• porównujemy rzeczywisty poziom istotności P(ai) z przyjętym 
ODRZUCAMY H0, JEŻELI P(ai) JEST MNIEJSZE OD 

WTEDY ZMIENNA
Xi MA WPŁYW NA
ZMIENNĄ Y

Matematyczne techniki zarządzania - 138
W etapie III następuje ostateczna selekcja zmiennych objaśniających:
• jeżeli wszystkie ai okażą się istotne, model jest poprawny:
— model przyczynowo-skutkowy: do interpretacji
— model tendencji rozwojowej: do etapu IV
• jeżeli choć jedno ai okaże się nieistotne, model jest niepoprawny i wymaga poprawy przez usunięcie nieistotnych zmiennych:
— zmienne należy usuwać po jednej (ze względu na efekt katalityczny)
— usuwa się zawsze zmienną o najniższej wartości |t(ai)| [czyli o
najwyższej wartości P(ai)]
— usunięcie ostatniej zmiennej nieistotnej kończy proces selekcji
kandydatek na zmienne,

— selekcja nie jest ostateczna, gdyż zawsze istnieje możliwość zamiany zmiennych, które są powiązane ze sobą
Praktyczne znaczenie istotności wyrazu wolnego a0
To są jedne z możliwości dla populacji (p. plansza 106)

Y

W przypadku funkcji K=f(P) wyraz wolny wyznacza poziom kosztów stałych (rachunkowość zarządcza)
W przypadku zależności technicznej Q=f(h) wyraz
wolny oznacza, że przy miąższości pokładu h=0 wydajność produkcji Q też jest równa 0

0
X

Matematyczne techniki zarządzania - 139
Praktyczne znaczenie istotności współczynnika regresji ai



KRZYWE NEYMANA — PLANSZE 106-107
WSPÓŁCZ. ISTOTNY
WSPÓŁ. NIEISTOTNY

ETAP III OBOWIĄZUJE DLA WSZYSTKICH MODELI
ETAP III PRZEPROWADZA SIĘ DLA TRANSFORMATY
Etap IV. Badanie symetrii składnika losowego

Y

CZĘSTOŚĆ RESZT DODATNICH I UJEMNYCH MA BYĆ
ZBLIŻONA

Y

ASYMETRYCZNY
SYMETRYCZNY

t
t
Badanie symetrii przeprowadza się testem Studenta (St. Bartosiewicz
Ekonometria)
Brak symetrii wymaga zmiany matematycznej postaci modelu
ETAP IV OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ

ETAP IV PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ

Matematyczne techniki zarządzania - 140
Etap V. Badanie losowości składnika losowego

Y

Y
NIELOSOWY

LOSOWY

t
t
Badanie losowości przeprowadza się testem Studenta lub testem serii
(Ekonometria, praca zb. pod red. M. Krzysztofiaka)
Brak losowości wymaga zmiany matematycznej postaci modelu
ETAP V OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP V PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ
Etap VI. Badanie stacjonarności składnika losowego
W etapie tym chodzi o niezależność wariancji składnika losowego od
zmiennej objaśniającej t (plansza 127)

Bada się istotność współczynnika korelacji ru t , t
ETAP VI OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VI PRZEPROWADZA SIĘ DLA TRANSFORMATY

Matematyczne techniki zarządzania - 141
Etap VII. Badanie wartości oczekiwanej składnika losowego
Normalnie, gdy przeprowadzamy estymację postaci liniowej, parametry
składnika losowego E ( )  0
{ ui  0}
V ( )  const
Po retransformacji do postaci pierwotnej mamy nowe reszty u’, dla
których
'
'
ui  0
 ui  0
Celem etapu jest sprawdzenie, czy odchyłka od O nie jest zbyt duża
(służy do tego test Studenta)
ETAP VII OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VII PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ
Etap VIII. Badanie autokorelacji składnika losowego
Pojęcie autokorelacji opisano na planszy 128; chodzi o istotność korelacji ru , u
t

tk

Badanie autokorelacji można przeprowadzić:

• testem R istotności korelacji ru

t

,ut  k

d obl

• testem Durbina-Watsona
NIE MA AUTOK.

d1

?

d2 JEST AUTOKORELACJA

ETAP VIII OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VIII PRZEPROWADZA SIĘ DLA TRANSFORMATY

Matematyczne techniki zarządzania - 142
Etap IX. Badanie normalności składnika losowego
Celem etapu jest stwierdzenie, czy reszty mają rozkład normalny
Analiza reszt — oddzielny dział analizy regresji i korelacji
Jeżeli reszty mają rozkład normalny, statystyk otrzymuje „ulgi”
ETAP 6. PRAKTYCZNA INTERPRETACJA MODELU



Celem etapu jest wydobycie z modelu całej nowej wiedzy, której nie widać
„gołym okiem”
INTERPRETUJĄC MODEL (RÓWNANIE REGRESJI) NALEŻY UŻYWAĆ WYŁĄCZNIE
PROSTEJ TERMINOLOGII EKONOMICZNEJ ZROZUMIAŁEJ DLA KLIENTA
NIE NALEŻY UŻYWAĆ TERMINOLOGII MATEMATYCZNEJ ZROZUMIAŁEJ TYLKO DLA
TWÓRCÓW MODELU
INTERPRETOWAĆ WOLNO TYLKO MODEL ZWERYFIKOWANY
CAŁY TRUD MODELOWANIA NIE MOŻE BYĆ „SZTUKĄ DLA SZTUKI”, LECZ MA
SŁUŻYĆ UZYSKANIU KONKRETNYCH WNIOSKÓW PRAKTYCZNYCH

Interpretacja modelu przyczynowo-skutkowego

Polega ona na określeniu wpływu poszczególnych czynników na badane
zjawisko:
• podział wszystkich czynników na trzy grupy

Matematyczne techniki zarządzania - 143
A — czynniki nie mające wpływu na Y
B — czynniki mające wpływ na Y i wprowadzone do modelu
C — czynniki mające wpływ na Y, ale nie występujące w modelu
• ocena jakościowa wpływu czynników B i C
• ocena ilościowa wpływu czynników B i C
Ocena jakościowa



Na podstawie znaków stojących przy współczynnikach r oraz ai możemy
stwierdzić, że wpływ jest:

• dodatni (im lepsze zaliczenie, tym lepszy wynik egzaminu; im więcej
wydatków na reklamę, tym większy zysk; itd.)
• ujemny (im więcej zatrudnionych, tym gorszy wynik finansowy; im
mniej braków, tym wyższy zysk; im mniejsza absencja, tym wyższe
wynagrodzenie; itd.)

Ocena ilościowa
• model liniowy
Przykład 33. Zinterpretuj zweryfikowany model zależności miesięcznych
kosztów działalności przedsiębiorstwa (tys. zł) od wielkości produkcji
(sztuk) i liczby reklamacji:
y i  50 , 8  14 , 5 x 1  3 , 9 x 2  

Matematyczne techniki zarządzania - 144
a0 = 50,8

poziom kosztów stałych; jeśli firma nie będzie prowadzić
żadnej działalności, poniesie koszty w wysokości 50,8 tys. zł

a1 = 14,5

każda sztuka produktu firmy kosztuje ją przeciętnie 14,5
tys. zł; jeżeli firma zwiększy produkcję o 2 sztuki, koszty
wzrosną o 29,0 tys. zł

a2 = 3,9każda wniesiona reklamacja powiększa koszty przeciętnie o
3,9 tys. zł
• model potęgowy
Przykłąd 34. Zinterpretuj zweryfikowaną funkcję produkcji Cobba-Douglasa
0 , 65

Pi  45 , 2 M i

0 , 73

Zi

e

0 , 04



Funkcja produkcji to specjalny model, określający zależność pomiędzy
produkcją (P) a czynnikami produkcji: majątkiem trwałym (M) i nakładami
robocizny (Z).



Funkcje produkcji to modele umożliwiające „prześwietlenie”
przedsiębiorstwa (szereg czasowy) lub branży (dane przekrojowe) i określenie poziomu gospodarowania oraz postępu
technicznego i organizacyjnego.
Elastyczność  to współczynnik określający reakcję zmiany
jednej zmiennej na inną zmienną — na przykład elastyczność
cenowa popytu (jak popyt zmienia się wraz z ceną towaru).

EKSPERCI
ZACHODNI

Matematyczne techniki zarządzania - 145

 

y
y

:

x

FUNKCJA POTĘGOWA JEST JEDYNĄ FUNKCJĄ O STAŁEJ ELASTYCZNOŚCI

x

Izolinie funkcji produkcji

T1
M

Produkcję P można osiągnąć różnymi
kombinacjami majątku i robocizny:

T2

• T1— technika kapitałochłonna, np.
pełna automatyzacja
• T2 — pośredni poziom techniki

T3
P  const

• T3 — niski poziom techniki, produkcja
pracochłonna
P. LOWE

Z
Efekt poprawy zarządzania bez
zmiany techniki (lepsze wykorzystanie ludzi i sprzętu):

P2
M

ZARZĄDZANIE
TECHNOLOGIĄ

P1

T

• zmniejszenie kapitałochłonności

• zmniejszenie pracochłonności
• zwiększenie produkcji (przejście z
funkcji P1 na P2)

Można też rozpatrzyć łączne efekty
zmiany techniki i zarządzania

Z

Matematyczne techniki zarządzania - 146
Wszystkie informacje tego typu można odczytać w trakcie interpretacji
0 , 65
0 , 73 0 , 04
funkcji produkcji:
Pi  45 , 2 M i
Zi
e

• wartości 45,2 nie interpretuje się
• wartość 0,65 to współczynnik elastyczności majątkowej (kapitałowej)
produkcji: zmiana majątku o 10% daje średnio zmianę produkcji o 6,5%
• wartość 0,73 to współczynnik elastyczności zatrudnieniowej produkcji:
zmiana zatrudnienia o 10% daje zmianę produkcji średnio o 7,3%
• suma obu współczynników k=0,65+0,73=1,38 to współczynnik skali
produkcji:

— jeżeli k<1, to firma rozwija się ekstensywnie
— jeżeli k>1, to firma rozwija się intensywnie
• wartość  = 0,04 to współczynnik postępu organizacyjnego:
— jeżeli  >O, to miał miejsce postęp organizacyjny

— jeżeli  <0, to miał miejsce regres organizacyjny
Interpretacja modelu tendencji rozwojowej

DODAMY
TROCHĘ
TEORII

Przypomnienie: t — zmienna objaśniająca (stałe przyrosty)
y — zmienna objaśniana; rozdzielana w ogólności na trzy
części: trend, wahania okresowe, wahania losowe ()

Matematyczne techniki zarządzania - 147
Wykres z planszy 117 (zużycie energii elektrycznej przez WZ AGH)
WAHANIA OKRESOWE OKREŚLA SIĘ WZGLĘDEM TRENDU A
NIE WZGLĘDEM OSI CZASU

y

trend

t
1995

1996

1997

1998

1999

Te trzy części trzeba zidentyfikować, a potem złożyć razem w model:

• addytywny (jeśli amplituda wahań jest stała)
• multiplikatywny (jeśli amplituda wahań rośnie lub maleje regularnie)
Wyznaczanie trendu
Metody mechaniczne:

• wskaźniki bezwzględne (stały przyrost =
postęp arytmetyczny = funkcja liniowa)
• wskaźniki względne (przyrost o stały procent =
postęp geometryczny = funkcja potęgowa)
• średnia ruchoma (wygładzanie danych linią łamaną)

JAK OBLICZYĆ O
ILE PROCENT ROCZNIE SPADAŁA
ŚREDNIO LICZBA
WIDZÓW W
KINACH:
1982 - 193,7 MLN
1989 - 141,3 MLN

Matematyczne techniki zarządzania - 148
Średnia ruchoma: mając szereg czasowy y1, y2,....., yn, przyjmujemy
długość kroku k = 3, lub 5, lub 7 itd. i liczymy
y  ...  y k
y  ...  y k  1
y k / 2 0 ,5  1
a następnie y k / 2  1 , 5  2
itd.
k
k
y  y2  y3
y  y3  y4
dla k=3:
y2  1
y3  2
itd.
3
3
Przykład 35. Wyznacz trend metodą średniej ruchomej dla następujących
danych:
okres
t
wartość yt

1
5

2
4

3
7

4
6

5
8

12

y2 
10

y3 

y

8

y4 

6
4

y5 

2

y6 

0
0

1

2

3

4

5

czas, t

6

7

8

9

y7 

547

6
10

 5 , 67

CECHY
ŚREDNIEJ
RUCHOMEJ:

 7 , 00

• TRACI SIĘ
k-1 DANYCH

3
768

8
8

 5 , 33

3
476

7
9

3
6  8  10

 8 , 00

3
8  10  9

 9 , 00

3
10  9  8

 9 , 00

• IM
WIĘKSZE k,
TYM
BARDZIEJ
SZTYWNY
TREND

3

Metody statystyczne: analiza regresji i korelacji, różne funkcje oparte na
modelach ekonomii

Matematyczne techniki zarządzania - 149
Wyznaczanie wahań okresowych: dobowych, tygodniowych, miesięcznych,
kwartalnych, rocznych, wieloletnich
Trzy metody:

— metoda wskaźników sezonowości
— metoda zmiennych zero-jedynkowych (0-1)

— metoda harmoniczna
Wszystkie metody mają jeden cel:
uzyskanie przeciętnego obrazu jednego cyklu

+

Ws
[t ]
[%]
trend

I

II



III

IV

WADY:
• KONIECZNOŚĆ
KOREKTY
• BRAK
WERYFIKACJI
STATYSTYCZNEJ

Metoda wskaźników sezonowości

• obliczenie surowych wskaźników sezonowości (wyeliminowanie trendu):
y

S s  yt  yt
S s  t
yt
addytywny multiplikatywny
wynik: n wartości odchyleń od trendu

• obliczenie oczyszczonych wskaźników
sezonowości (wyeliminowanie wahań
losowych):
 Ss
So 
k-liczba okresów
k
jednoimiennych
m-długość cyklu wynik: m wartości śr. odchyleń od trendu

Matematyczne techniki zarządzania - 150
Metoda zmiennych zero-jedynkowych (0-1)
m

y t  a 0  a1 t   bi Q i  
i 1

bi — przeciętne odchylenie od trendu dla
okresu i-tego
Qi — zmienna 0-1

wahania losowe
trend

wahania okresowe

t
1
2
3
4
5
6
7
8
9

yt
y1
y2
y3
y4
y5
y6
y7
y8
y9

Q1
1
0
0
0
1
0
0
0
1

Q2
0
1
0
0
0
1
0
0
0

Q3
0
0
1
0
0
0
1
0
0

Q4
0
0
0
1
0
0
0
1
0

Metoda harmoniczna (szeregi Fouriera)
Wahania okresowe przedstawia się jako sumę określonej liczby drgań harmonicznych (sinusoid i cosinusoid) przesuniętych w fazie, lecz o jednakowym okresie
m /2
2 i m / 2
2 i
y t  a 0  a 1 t   b1 i sin
  b 2 i cos

m
m
i 1
i 1
Obie metody dają taki sam wynik, istnieje możliwość weryfikacji
statystycznej
W metodzie 0-1 dostajemy bi = Ws, natomiast w metodzie harmonicznej Ws
jest sumą wartości poszczególnych sinusoid dla danego momentu czasu


Slide 4

Matematyczne techniki zarządzania - 121
ETAP 2. GROMADZENIE DANYCH STATYSTYCZNYCH

!

ZA JAKOŚĆ DANYCH ODPOWIADA MODELUJĄCY
• rodzaje danych: dane przekrojowe i szeregi czasowe
• źródła danych: roczniki statystyczne, różne działy
przedsiębiorstwa, badania marketingowe, wywiady itd.
• wiarygodność danych: do jakiego celu zostały one
przygotowane?

MUSISZ
SPRAWDZAĆ
KAŻDE DANE

• porównywalność danych: inflacja (ceny bieżące a ceny
stałe), zmiany procesów technicznych
Wielkość
produkcji

• zmienność zjawisk: trzeba sprawdzić, czy
wybrana w etapie 1a zmienna jest rzeczywiście zmienną losową

Wx 

s( x )

nowy zakład

100 %

x

stary zakład

Wx musi wynosić co najmniej 30-40%
Wiek studenta może być dobrą zmiennąprzyczyną, ale nie w przypadku studiów
dziennych!

Zatrudnienie

Matematyczne techniki zarządzania - 122
ETAP 3. SELEKCJA ZMIENNYCH OBJAŚNIAJĄCYCH
KAŻDĄ ZMIENNĄ X WYTYPOWANĄ W ETAPIE 1a TRAKTUJEMY JAKO
KANDYDATKĘ NA ZMIENNĄ OBJAŚNIAJĄCĄ
Może być kilka przyczyn powodujących, że taka kandydatka nie może znaleźć się w modelu ekonometrycznym (w równaniu regresji):
• w modelu nie może być zbyt wielu zmiennych (nieczytelny)
• kandydatka może nie mieć wpływu na zmienną Y



• kandydatka może wnosić prawie tę samą informację o Y co inna
kandydatka

• dwie bardzo podobne kandydatki mogą sobie nawzajem przeszkadzać
(efekt katalityczny)
Kryteria, jakie musi spełniać kandydatka Xi, aby nadawała się do modelu:
• musi być silnie powiązana ze zmienną Y

• nie może być powiązana z inną kandydatką Xj
SSTO
x1
x4

x2
x3

reszta

R2=0,79

R2=0,66

x2
x1
x4

R2=0,48

x3
reszta

reszta

SSTO

SSTO

Matematyczne techniki zarządzania - 123
Efekt katalityczny
DWIE ZMIENNE DAJĄ
RAZEM MNIEJ INFORMACJI NIŻ KAŻDA Z
NICH Z OSOBNA

x1

x2

R2=0,25

x2

x1

R2=0,52

R2=0,66

Selekcja kandydatek ma na celu podzielenie ich na trzy grupy:
• zmienne wprowadzone do modelu
• zmienne nie wprowadzone do modelu, ale reprezentowane w nim przez
inne zmienne (możliwość wymiany)
• zmienne nie wprowadzone do modelu ze względu na fakt, że nie wnoszą
żadnej informacji o zmiennej Y
INFORMACJE potrzebne do selekcji: współczynniki r x i x j ,
Macierz współczynników korelacji
Y
Y
X1
X2
X3

0,52
0,64
- 0,21

X1
0,52
0,82
- 0,18

X2
0,64
0,82
0,08

X3
- 0,21
- 0,18
0,08

r yx

i

Przykład 32. Macierz powiązania
zmiennych ze sobą przedstawia
się następująco (n=20). Jak ją
można zinterpretować? Które
zmienne są powiązane ze sobą w
sposób istotny?

Matematyczne techniki zarządzania - 124
Testowanie istotności współczynnika korelacji
H0:  = 0

Można je przeprowadzić trzema testami: testem Studenta

H1:   0

(t), Fishera (F) i Wallace’a-Snedecora (R)

Fragment tablicy rozkładu Wallece’a-Snedecora (SKRYPT, tab. VII, s.161)
S to pn ie
sw ob od y

2
0,05
0,632
0,444
0,361

8
18
28

,

0,01
0,765
0,561
0,463

L iczb a zm ien n ych
3
0,05
0,01
0,726
0,827
0,532
0,633
0,439
0,530

4
0,05
0,777
0,587
0,490

0,01
0,860
0,678
0,573

Reguła decyzyjna: — jeżeli |Robl|>Rtabl, odrzucamy H0 (korelacja istotna)
— jeżeli |Robl|
W przykładzie 32, jeżeli przyjmiemy  = 0,05, to Rtabl = 0,444.
Y
Y
X1
X2
X3

0,52
0,64
- 0,21

X1
0,52
0,82
- 0,18

X2
0,64
0,82
0,08

X3
- 0,21
- 0,18
0,08

Pozostaną zatem tylko trzy
istotne powiązania:
y-x1, y-x2, x1-x2
BRAK ISTOTNEGO POWIĄZANIA Z Y NIE
OZNACZA, ŻE ZMIENNA NIE WNOSI
ŻADNEJ INFORMACJI O ZJAWISKU Y

Matematyczne techniki zarządzania - 125



Metody selekcji zmiennych objaśniających:
• grafowa
• Hellwiga (pojemności informacji)
• taksonomiczne (clustering)
Metoda grafowa
• obliczenie macierzy współczynników:

rx

i

xj

• wyłowienie z macierzy powiązań istotnych

, r yx

BUDOWA GRAFU
i

• graf spójny

• budowa grafu z powiązań istotnych
• wybranie zmiennych na podstawie grafu

x6

• graf zerowy
x1
x4

x9

DO MODELU WYBIERA SIĘ ZMIENNE:
• każdy graf zerowy (jeśli |ryx|>0,1)

istotne powiązanie

• po jednej reprezentantce grafu spójnego;

reprezentantką grafu jest zmienna, która ma najwięcej powiązań z
innymi kandydatkami
jeżeli kilka zmiennych ma tę samą maksymalną liczbę powiązań, wybiera
się z nich tę, która jest najsilniej powiązana za zmienną Y (max ryx)
jeżeli graf jest rozległy, może mieć dwie reprezentantki, ale muszą one
leżeć na przeciwległych stronach grafu

Matematyczne techniki zarządzania - 126
Przykład 32 cd. Wybierzemy
zmienną x2 (reprezentantka grafu
spójnego) i zmienną x3 (graf
zerowy)
Metoda Hellwiga

Y
Y
X1
X2
X3

0,52
0,64
- 0,21

• wypisujemy wszystkie możliwe kombinacje
kandydatek; jest ich K = 2m—1
• obliczamy pojemność informacji dla każdej
zmiennej w każdej kombinacji

h kl  f ( r yx , r x
i

ixj

)

• obliczamy pojemność całkowitą dla każdej
kombinacji
H l   h kl
k

• wybieramy kombinację o największej
pojemności Hl = max

X1
0,52
0,82
- 0,18

X2
0,64
0,82

X3
- 0,21
- 0,18
0,08

0,08

W przykładzie 32 mamy 7
możliwych kombinacji kandydatek:
1. x1
2. x2

3. x3

maximum:

H6 = 0,42

4. x1,x2
5. x1,x3

Hmax = R2

6. x2,x3
7. x1,x2,x3

Metody taksonomiczne
Taksonomia wrocławska (cluster analysis) to metoda grupowania obiektów (zmiennych) w grupy jednorodne pod względem n cech (wymiarów)
łącznie. Podstawą grupowania jest odległość euklidesowa, która w przypadku zmiennych d ij  f ( r x x )
WSZYSTKIE METODY TO SELEKCJA WSTĘPNA
i

j

Matematyczne techniki zarządzania - 127
ETAP 4. ESTYMACJA PARAMETRÓW MODELU
Cel etapu: wyznaczenie parametrów strukturalnych i stochastycznych
Estymacja: szacowanie parametrów populacji na podstawie próbki
Metody estymacji: analiza regresji i korelacji (KMNK i inne)

Założenia dla KMNK
1. Zmienne losowe są prawdziwymi zmiennymi, nie powiązanymi ze sobą
2. Składnik losowy  ma stałą wariancję, niezależną od zmiennej x lub t
3. Wartości reszt ui są niezależne od siebie

4. Składnik losowy  nie jest powiązany ze zmienną objaśniającą
Skutki niedotrzymania założeń i środki zaradcze
1. Model bez sensu, nieprzydatny; niekiedy absurdalny (źle uwarunkowane
dane)
Stosuje się: dużą próbkę (n>100), regresję grzbietową (ridge regression)
2.

Y

reszta ui

Lewa część zbioru ma dużą wariancję, a
prawa — wariancję małą
Stosuje się specjalny wariant MNK z
korektą na różne wariancje
X

Matematyczne techniki zarządzania - 128
3. Jeśli reszty ui są ze sobą powiązane (skorelowane), mówimy, że
występuje autokorelacja składnika losowego (zjawisko występuje przy
szeregach czasowych — sztywny porządek obserwacji)
Oznacza to, że istnieje istotna zależność u t  f ( u t  k )
Przyczyny autokorelacji: zakłócenia
(dodatnie lub ujemne) w jednym okresie
wpływają na poziom zjawiska w następnych
okresach (rolnictwo, produkcja, rynek)

t  1 , 2 ,...

u t  y t  yˆ t

u t 1

u1
u2
u3
u4
u5

Występowanie autokorelacji powoduje
nieprzydatność modelu


u1
u2
u3
u4

Istnienie autokorelacji sprawdza się testem
Durbina-Watsona d
Stosuje się metodę różniczki zupełnej

y  f (x )

yt  yt  ytk

4. Składnik losowy jest skorelowany ze zmienną objaśniającą, wtedy
gdy została pominięta jakaś ważna zmienna-przyczyna

Model taki nie ma żadnej wartości; trzeba dbać o jak najwyższy współczynnik determinacji (R2>0,9)
• zbiór danych rzeczywistych nigdy
nie spełnia tych wymagań

ESTYMACJĘ MODELU POWTARZA SIĘ WIELOKROTNIE
ponieważ dopiero weryfikacja zapewnia ostateczną selekcję
kandydatek na zmienne objaśniające

• ekonometria to analiza danych nie
spełniających tych założeń
• nie stosować statystyki bezmyślnie (na ślepo)

Matematyczne techniki zarządzania - 129
ETAP 5. WERYFIKACJA MODELU
Cele:

1. opis rzeczywistości (populacji generalnej)



2. dokładna (ostateczna) selekcja zmiennych objaśniających
3. poznanie składnika losowego (spełnienie założeń KMNK)
Narzędzia: hipotezy i testy statystyczne

Metodyka: każde równanie oddzielnie; weryfikacja obejmuje 9 etapów (od
najmniej do najbardziej pracochłonnego)
WYKAZ ETAPÓW WERYFIKACJI MODELU
I.
II.

Badanie istotności korelacji
Badanie wyrazistości modelu

III.

Badanie istotności parametrów

IV.

Badanie symetrii skł. losowego

V.
VI.
VII.
VIII.
IX.

Badanie losowości skł. losowego
Badanie stacjonarności skł. los.
Badanie wartości oczekiwanej skł. los.
Badanie autokorelacji skł. losowego
Badanie normalności skł. losowego

Opis każdego etapu weryfikacji
obejmuje:
• cel etapu
• sposób weryfikacji: wzory,
hipotezy, testy
• podanie których modeli dotyczy (przyczynowo-skutkowych
czy tendencji rozwojowej)
• podanie której postaci modeli
nieliniowych dotyczy (pierwotnej czy transformaty)

Matematyczne techniki zarządzania - 130
Etap I. Badanie istotności korelacji
7
2

8

9

11

12

17

19

23

21

5
2 etapu
9
16
7
9
15
14
Celem
jest
sprawdzenie,
czy
istnieje w populacji generalnej powiązanie pomiędzy zmienną Y i wszystkimi zmiennymi objaśniającymi

25

Przedział ufności dla
nieznanego współczynnika korelacji  dla populacji buduje się przy
użyciu błędu

populacja

zmienna Y

20
15
10

próbka

5
0
8
5

0 9

1011

2

9

20
12

30
17
16
7
zmienna X

25

1940
9

23 50
15

populacja

20

zmienna Y

7
2

15
10

próbka

5
0
0

10

20

30

zmienna X

40

50

21
14

sR 

1 R

0

Robl

2

nk

Istotność korelacji weryfikuje się przez postawienie
następujących hipotez dla
współczynnika korelacji dla
populacji generalnej:

1
R,|r|

H0 :   0

Brak korelacji, nie ma powiązania...

H1 :   0

Korelacja istotna, jest powiązanie...

,

Matematyczne techniki zarządzania - 131
Hipotezy te można weryfikować trzema równoważnymi testami:
• testem t Studenta (tylko dla regresji dwu zmiennych)
• testem F Fishera-Snedecora
• testem R Wallace’a-Snedecora

,

W każdym przypadku obliczamy wartość
statystyki dla próbki (tobl, Fobl, Robl) i porównujemy z wartością krytyczną odczytaną z tablicy odpowiedniego rozkładu w
funkcji poziomu istotności i liczby stopni
swobody (ttabl, Ftabl, Rtabl)

Reguła decyzyjna:
• jeżeli |tobl|< ttabl, nie ma podstaw do odrzucenia H0 (brak korelacji)
• jeżeli |tobl|> ttabl, odrzucamy H0 na korzyść H1 (korelacja istnieje)

TAK SAMO DLA
FiR

W przypadku regresji wielorakiej, gdy liczba zmiennych objaśniajacych
jest duża w porównaniu do liczby obserwacji, współczynnik determinacji
R2 może dawać zawyżoną ocenę stopnia wyjaśnienia zmienności zmiennej
objaśnianej; dlatego wprowadzono skorygowany współczynnik determinacji (i korelacji):
 ( yˆ i  y )

R

2

2

k
n

k

1


2
nk 1
(
y

y
)

i
n1

• adjusted coefficient of multiple
determination (wydruki komputerowe)

• jeśli k jest małe, nie ma większej różnicy
pomiędzy normalnym a skorygowanym R2

Matematyczne techniki zarządzania - 132
Skąd wziąć wartość odpowiedniej statystyki dla próbki i jak odczytywać jej wartości z tablic?
n2
r
t

r

t tabl  t  / 2 { n  2 }
TEST STUDENTA
obl
2
sr
1 r

F obl 

TEST FISHERA

Ź ró d ło z m ien n o śc i

MSTR
MSE



R

nk

2

1 R

2

L ic zb a sto p n i
sw o b o d y

Suma
k w a d ra tó w

Ś re d n i
k w a d ra t

M o d el (c z yn n ik i)
B łą d (re sz ta )

k1
nk

SSTR
SSE

MSTR
MSE

R azem

n1

SSTO

TEST WALLACE’A

R obl 

R

2

k 1

F tabl  F { k  1 , n  k }

S ta ty sty k a
F
F obl 

MSTR
MSE

NIE MYLIĆ
STOPNI SWOBODY LICZNIKA I MIANOWNIKA

R tabl  R { k , n  k }

Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

Matematyczne techniki zarządzania - 133
Odczyt Rtabl z tablicy testu R (SKRYPT s.161-162)

, k,  = n-k

S to pn ie
sw ob od y
8
18
28

2
0,05
0,632
0,444
0,361

0,01
0,765
0,561
0,463

L iczb a zm ien n ych
3
0,05
0,01
0,726
0,827
0,532
0,633
0,439
0,530

4
0,05
0,777
0,587
0,490

0,01
0,860
0,678
0,573

Wnioski dotyczące rozkładu R Wallace’a-Snedecora:
• tablica zawiera maksymalne wartości współczynnika korelacji w danej
sytuacji, jakich można oczekiwać, gdy nie ma korelacji w populacji
• im wyższy poziom istotności, tym niższe Rtabl

• im większa liczba zmiennych w modelu, tym wyższe Rtabl
• im wyższa liczba stopni swobody (większa próbka), tym niższe Rtabl
• tablica R powstała z przeliczenia tablic t oraz F (odwrócenie wzorów)
• tablica testu R jest najszybszym i nawygodniejszym narzędziem do
weryfikacji istotności korelacji

Werdykt z etapu I:

Matematyczne techniki zarządzania - 134

• jeżeli Robl>Rtabl, model jest poprawny, można przejść do etapu II
• jeżeli Roblzmiennych objaśniających albo jego postać matematyczną
ETAP I OBOWIĄZUJE DLA WSZYSTKICH MODELI
ETAP I PRZEPROWADZA SIĘ DLA TRANSFORMATY (dla postaci pierwotnej
można uzyskać R>1)
Rola współczynnika determinacji R2
• korelacja może być istotna przy małym R i bardzo małym R2 (r=0,4,
R2=0,16, co oznacza, że tylko 16% zmienności zmiennej Y jest
wyjaśnione przez zmienną objaśniającą)
• małe R2 oznacza niski stopień wyjaśnienia rzeczywistości i stanowi
zagrożenie dla modelu
• należy dążyć (poprzez odpowiedni dobór zmiennych-przyczyn i postaci
matematycznej modelu) do jak największego R2 (dla postaci pierwotnej)
• wysoka wartość R2 świadczy o dobrym poznaniu badanego zjawiska
• wysoka wartość R2 bardzo często wynika jednak ze złego dobrania
zmiennych objaśniających (silnie powiązane ze sobą — „masło maślane”)
KORELACJA POZORNA — jest zależność, ale jej nie ma? Przyczyny...
Trzeba unikać wartości bezwzględnych (ludność, liczba sklepów, wielkość produkcji)

6

9

12

8

11

12

11

15

9

18

9

11

11

18

15

Matematyczne techniki zarządzania - 135
Etap II. Badanie wyrazistości modelu
Y

Wyrazistość modelu dana jest wzorem

s( y )

ui

y

W obl 

s( y )

100 %

y

Celem etapu
jest kontrola
rozrzutu danych

Współczynnik Wobl<30%, w przeciwnym
przypadku rozrzut danych jest zbyt duży

y

Kłopoty: gdyy jest bliskie 0

x

X

Werdykt: model poprawny lub niepoprawny

ETAP II OBOWIĄZUJE DLA WSZYSTKICH MODELI (ale nie ma on charakteru
statystycznego)

ETAP II PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ (sprawdzamy, czy
nie występuje silny efekt „krzywego lustra”)
Etap III. Badanie istotności parametrów (współczynników) modelu
Celem etapu jest sprawdzenie:
• czy poszczególne zmienne objaśniające mają istotny wpływ na zmienną
objaśnianą?
• czy zmienne objaśniające są wybrane prawidłowo?

• czy wyraz wolny różni się istotnie od zera?

Matematyczne techniki zarządzania - 136
Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

Problem istotności parametrów ai można rozpatrywać (tak jak problem
średniej dla populacji) z dwu punktów widzenia:
• przedziału ufności dla nieznanej wartości i

• hipotez — zerowej H0: i=0 i alternatywnej H1: i 0

1
0

ai

1

i

ISTOTNY (W PRZEDZIALE NIE MA ZERA)

0

ai

i

NIEISTOTNY (W PRZEDZIALE JEST ZERO)

P ( a i  t / 2 { n  k } s ( a i )   i  a i  t / 2 { n  k } s ( a i )  1  

Z tablicy rozkładu Studenta, a nie z wydruku komputerowego!

Matematyczne techniki zarządzania - 137
Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

W praktyce posługujemy się raczej hipotezami:
Badanie istotności przeprowadza
się dla każdego i oddzielnie:

t obl ( a i ) 

ai  0
s(a i )

t tabl  t  / 2 { n  k }

• jeżeli |tobl(ai)|>ttabl(ai), odrzucamy hipotezę zerową; parametr jest istotny z błędem równym co najwyżej 
• jeżeli |tobl(ai)|parametr nie jest istotny
Praktycznie jest to bardzo łatwe:
• sprawdzamy, czy |t(ai)| jest większe czy mniejsze od około 2, a najlepiej
• porównujemy rzeczywisty poziom istotności P(ai) z przyjętym 
ODRZUCAMY H0, JEŻELI P(ai) JEST MNIEJSZE OD 

WTEDY ZMIENNA
Xi MA WPŁYW NA
ZMIENNĄ Y

Matematyczne techniki zarządzania - 138
W etapie III następuje ostateczna selekcja zmiennych objaśniających:
• jeżeli wszystkie ai okażą się istotne, model jest poprawny:
— model przyczynowo-skutkowy: do interpretacji
— model tendencji rozwojowej: do etapu IV
• jeżeli choć jedno ai okaże się nieistotne, model jest niepoprawny i wymaga poprawy przez usunięcie nieistotnych zmiennych:
— zmienne należy usuwać po jednej (ze względu na efekt katalityczny)
— usuwa się zawsze zmienną o najniższej wartości |t(ai)| [czyli o
najwyższej wartości P(ai)]
— usunięcie ostatniej zmiennej nieistotnej kończy proces selekcji
kandydatek na zmienne,

— selekcja nie jest ostateczna, gdyż zawsze istnieje możliwość zamiany zmiennych, które są powiązane ze sobą
Praktyczne znaczenie istotności wyrazu wolnego a0
To są jedne z możliwości dla populacji (p. plansza 106)

Y

W przypadku funkcji K=f(P) wyraz wolny wyznacza poziom kosztów stałych (rachunkowość zarządcza)
W przypadku zależności technicznej Q=f(h) wyraz
wolny oznacza, że przy miąższości pokładu h=0 wydajność produkcji Q też jest równa 0

0
X

Matematyczne techniki zarządzania - 139
Praktyczne znaczenie istotności współczynnika regresji ai



KRZYWE NEYMANA — PLANSZE 106-107
WSPÓŁCZ. ISTOTNY
WSPÓŁ. NIEISTOTNY

ETAP III OBOWIĄZUJE DLA WSZYSTKICH MODELI
ETAP III PRZEPROWADZA SIĘ DLA TRANSFORMATY
Etap IV. Badanie symetrii składnika losowego

Y

CZĘSTOŚĆ RESZT DODATNICH I UJEMNYCH MA BYĆ
ZBLIŻONA

Y

ASYMETRYCZNY
SYMETRYCZNY

t
t
Badanie symetrii przeprowadza się testem Studenta (St. Bartosiewicz
Ekonometria)
Brak symetrii wymaga zmiany matematycznej postaci modelu
ETAP IV OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ

ETAP IV PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ

Matematyczne techniki zarządzania - 140
Etap V. Badanie losowości składnika losowego

Y

Y
NIELOSOWY

LOSOWY

t
t
Badanie losowości przeprowadza się testem Studenta lub testem serii
(Ekonometria, praca zb. pod red. M. Krzysztofiaka)
Brak losowości wymaga zmiany matematycznej postaci modelu
ETAP V OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP V PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ
Etap VI. Badanie stacjonarności składnika losowego
W etapie tym chodzi o niezależność wariancji składnika losowego od
zmiennej objaśniającej t (plansza 127)

Bada się istotność współczynnika korelacji ru t , t
ETAP VI OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VI PRZEPROWADZA SIĘ DLA TRANSFORMATY

Matematyczne techniki zarządzania - 141
Etap VII. Badanie wartości oczekiwanej składnika losowego
Normalnie, gdy przeprowadzamy estymację postaci liniowej, parametry
składnika losowego E ( )  0
{ ui  0}
V ( )  const
Po retransformacji do postaci pierwotnej mamy nowe reszty u’, dla
których
'
'
ui  0
 ui  0
Celem etapu jest sprawdzenie, czy odchyłka od O nie jest zbyt duża
(służy do tego test Studenta)
ETAP VII OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VII PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ
Etap VIII. Badanie autokorelacji składnika losowego
Pojęcie autokorelacji opisano na planszy 128; chodzi o istotność korelacji ru , u
t

tk

Badanie autokorelacji można przeprowadzić:

• testem R istotności korelacji ru

t

,ut  k

d obl

• testem Durbina-Watsona
NIE MA AUTOK.

d1

?

d2 JEST AUTOKORELACJA

ETAP VIII OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VIII PRZEPROWADZA SIĘ DLA TRANSFORMATY

Matematyczne techniki zarządzania - 142
Etap IX. Badanie normalności składnika losowego
Celem etapu jest stwierdzenie, czy reszty mają rozkład normalny
Analiza reszt — oddzielny dział analizy regresji i korelacji
Jeżeli reszty mają rozkład normalny, statystyk otrzymuje „ulgi”
ETAP 6. PRAKTYCZNA INTERPRETACJA MODELU



Celem etapu jest wydobycie z modelu całej nowej wiedzy, której nie widać
„gołym okiem”
INTERPRETUJĄC MODEL (RÓWNANIE REGRESJI) NALEŻY UŻYWAĆ WYŁĄCZNIE
PROSTEJ TERMINOLOGII EKONOMICZNEJ ZROZUMIAŁEJ DLA KLIENTA
NIE NALEŻY UŻYWAĆ TERMINOLOGII MATEMATYCZNEJ ZROZUMIAŁEJ TYLKO DLA
TWÓRCÓW MODELU
INTERPRETOWAĆ WOLNO TYLKO MODEL ZWERYFIKOWANY
CAŁY TRUD MODELOWANIA NIE MOŻE BYĆ „SZTUKĄ DLA SZTUKI”, LECZ MA
SŁUŻYĆ UZYSKANIU KONKRETNYCH WNIOSKÓW PRAKTYCZNYCH

Interpretacja modelu przyczynowo-skutkowego

Polega ona na określeniu wpływu poszczególnych czynników na badane
zjawisko:
• podział wszystkich czynników na trzy grupy

Matematyczne techniki zarządzania - 143
A — czynniki nie mające wpływu na Y
B — czynniki mające wpływ na Y i wprowadzone do modelu
C — czynniki mające wpływ na Y, ale nie występujące w modelu
• ocena jakościowa wpływu czynników B i C
• ocena ilościowa wpływu czynników B i C
Ocena jakościowa



Na podstawie znaków stojących przy współczynnikach r oraz ai możemy
stwierdzić, że wpływ jest:

• dodatni (im lepsze zaliczenie, tym lepszy wynik egzaminu; im więcej
wydatków na reklamę, tym większy zysk; itd.)
• ujemny (im więcej zatrudnionych, tym gorszy wynik finansowy; im
mniej braków, tym wyższy zysk; im mniejsza absencja, tym wyższe
wynagrodzenie; itd.)

Ocena ilościowa
• model liniowy
Przykład 33. Zinterpretuj zweryfikowany model zależności miesięcznych
kosztów działalności przedsiębiorstwa (tys. zł) od wielkości produkcji
(sztuk) i liczby reklamacji:
y i  50 , 8  14 , 5 x 1  3 , 9 x 2  

Matematyczne techniki zarządzania - 144
a0 = 50,8

poziom kosztów stałych; jeśli firma nie będzie prowadzić
żadnej działalności, poniesie koszty w wysokości 50,8 tys. zł

a1 = 14,5

każda sztuka produktu firmy kosztuje ją przeciętnie 14,5
tys. zł; jeżeli firma zwiększy produkcję o 2 sztuki, koszty
wzrosną o 29,0 tys. zł

a2 = 3,9każda wniesiona reklamacja powiększa koszty przeciętnie o
3,9 tys. zł
• model potęgowy
Przykłąd 34. Zinterpretuj zweryfikowaną funkcję produkcji Cobba-Douglasa
0 , 65

Pi  45 , 2 M i

0 , 73

Zi

e

0 , 04



Funkcja produkcji to specjalny model, określający zależność pomiędzy
produkcją (P) a czynnikami produkcji: majątkiem trwałym (M) i nakładami
robocizny (Z).



Funkcje produkcji to modele umożliwiające „prześwietlenie”
przedsiębiorstwa (szereg czasowy) lub branży (dane przekrojowe) i określenie poziomu gospodarowania oraz postępu
technicznego i organizacyjnego.
Elastyczność  to współczynnik określający reakcję zmiany
jednej zmiennej na inną zmienną — na przykład elastyczność
cenowa popytu (jak popyt zmienia się wraz z ceną towaru).

EKSPERCI
ZACHODNI

Matematyczne techniki zarządzania - 145

 

y
y

:

x

FUNKCJA POTĘGOWA JEST JEDYNĄ FUNKCJĄ O STAŁEJ ELASTYCZNOŚCI

x

Izolinie funkcji produkcji

T1
M

Produkcję P można osiągnąć różnymi
kombinacjami majątku i robocizny:

T2

• T1— technika kapitałochłonna, np.
pełna automatyzacja
• T2 — pośredni poziom techniki

T3
P  const

• T3 — niski poziom techniki, produkcja
pracochłonna
P. LOWE

Z
Efekt poprawy zarządzania bez
zmiany techniki (lepsze wykorzystanie ludzi i sprzętu):

P2
M

ZARZĄDZANIE
TECHNOLOGIĄ

P1

T

• zmniejszenie kapitałochłonności

• zmniejszenie pracochłonności
• zwiększenie produkcji (przejście z
funkcji P1 na P2)

Można też rozpatrzyć łączne efekty
zmiany techniki i zarządzania

Z

Matematyczne techniki zarządzania - 146
Wszystkie informacje tego typu można odczytać w trakcie interpretacji
0 , 65
0 , 73 0 , 04
funkcji produkcji:
Pi  45 , 2 M i
Zi
e

• wartości 45,2 nie interpretuje się
• wartość 0,65 to współczynnik elastyczności majątkowej (kapitałowej)
produkcji: zmiana majątku o 10% daje średnio zmianę produkcji o 6,5%
• wartość 0,73 to współczynnik elastyczności zatrudnieniowej produkcji:
zmiana zatrudnienia o 10% daje zmianę produkcji średnio o 7,3%
• suma obu współczynników k=0,65+0,73=1,38 to współczynnik skali
produkcji:

— jeżeli k<1, to firma rozwija się ekstensywnie
— jeżeli k>1, to firma rozwija się intensywnie
• wartość  = 0,04 to współczynnik postępu organizacyjnego:
— jeżeli  >O, to miał miejsce postęp organizacyjny

— jeżeli  <0, to miał miejsce regres organizacyjny
Interpretacja modelu tendencji rozwojowej

DODAMY
TROCHĘ
TEORII

Przypomnienie: t — zmienna objaśniająca (stałe przyrosty)
y — zmienna objaśniana; rozdzielana w ogólności na trzy
części: trend, wahania okresowe, wahania losowe ()

Matematyczne techniki zarządzania - 147
Wykres z planszy 117 (zużycie energii elektrycznej przez WZ AGH)
WAHANIA OKRESOWE OKREŚLA SIĘ WZGLĘDEM TRENDU A
NIE WZGLĘDEM OSI CZASU

y

trend

t
1995

1996

1997

1998

1999

Te trzy części trzeba zidentyfikować, a potem złożyć razem w model:

• addytywny (jeśli amplituda wahań jest stała)
• multiplikatywny (jeśli amplituda wahań rośnie lub maleje regularnie)
Wyznaczanie trendu
Metody mechaniczne:

• wskaźniki bezwzględne (stały przyrost =
postęp arytmetyczny = funkcja liniowa)
• wskaźniki względne (przyrost o stały procent =
postęp geometryczny = funkcja potęgowa)
• średnia ruchoma (wygładzanie danych linią łamaną)

JAK OBLICZYĆ O
ILE PROCENT ROCZNIE SPADAŁA
ŚREDNIO LICZBA
WIDZÓW W
KINACH:
1982 - 193,7 MLN
1989 - 141,3 MLN

Matematyczne techniki zarządzania - 148
Średnia ruchoma: mając szereg czasowy y1, y2,....., yn, przyjmujemy
długość kroku k = 3, lub 5, lub 7 itd. i liczymy
y  ...  y k
y  ...  y k  1
y k / 2 0 ,5  1
a następnie y k / 2  1 , 5  2
itd.
k
k
y  y2  y3
y  y3  y4
dla k=3:
y2  1
y3  2
itd.
3
3
Przykład 35. Wyznacz trend metodą średniej ruchomej dla następujących
danych:
okres
t
wartość yt

1
5

2
4

3
7

4
6

5
8

12

y2 
10

y3 

y

8

y4 

6
4

y5 

2

y6 

0
0

1

2

3

4

5

czas, t

6

7

8

9

y7 

547

6
10

 5 , 67

CECHY
ŚREDNIEJ
RUCHOMEJ:

 7 , 00

• TRACI SIĘ
k-1 DANYCH

3
768

8
8

 5 , 33

3
476

7
9

3
6  8  10

 8 , 00

3
8  10  9

 9 , 00

3
10  9  8

 9 , 00

• IM
WIĘKSZE k,
TYM
BARDZIEJ
SZTYWNY
TREND

3

Metody statystyczne: analiza regresji i korelacji, różne funkcje oparte na
modelach ekonomii

Matematyczne techniki zarządzania - 149
Wyznaczanie wahań okresowych: dobowych, tygodniowych, miesięcznych,
kwartalnych, rocznych, wieloletnich
Trzy metody:

— metoda wskaźników sezonowości
— metoda zmiennych zero-jedynkowych (0-1)

— metoda harmoniczna
Wszystkie metody mają jeden cel:
uzyskanie przeciętnego obrazu jednego cyklu

+

Ws
[t ]
[%]
trend

I

II



III

IV

WADY:
• KONIECZNOŚĆ
KOREKTY
• BRAK
WERYFIKACJI
STATYSTYCZNEJ

Metoda wskaźników sezonowości

• obliczenie surowych wskaźników sezonowości (wyeliminowanie trendu):
y

S s  yt  yt
S s  t
yt
addytywny multiplikatywny
wynik: n wartości odchyleń od trendu

• obliczenie oczyszczonych wskaźników
sezonowości (wyeliminowanie wahań
losowych):
 Ss
So 
k-liczba okresów
k
jednoimiennych
m-długość cyklu wynik: m wartości śr. odchyleń od trendu

Matematyczne techniki zarządzania - 150
Metoda zmiennych zero-jedynkowych (0-1)
m

y t  a 0  a1 t   bi Q i  
i 1

bi — przeciętne odchylenie od trendu dla
okresu i-tego
Qi — zmienna 0-1

wahania losowe
trend

wahania okresowe

t
1
2
3
4
5
6
7
8
9

yt
y1
y2
y3
y4
y5
y6
y7
y8
y9

Q1
1
0
0
0
1
0
0
0
1

Q2
0
1
0
0
0
1
0
0
0

Q3
0
0
1
0
0
0
1
0
0

Q4
0
0
0
1
0
0
0
1
0

Metoda harmoniczna (szeregi Fouriera)
Wahania okresowe przedstawia się jako sumę określonej liczby drgań harmonicznych (sinusoid i cosinusoid) przesuniętych w fazie, lecz o jednakowym okresie
m /2
2 i m / 2
2 i
y t  a 0  a 1 t   b1 i sin
  b 2 i cos

m
m
i 1
i 1
Obie metody dają taki sam wynik, istnieje możliwość weryfikacji
statystycznej
W metodzie 0-1 dostajemy bi = Ws, natomiast w metodzie harmonicznej Ws
jest sumą wartości poszczególnych sinusoid dla danego momentu czasu


Slide 5

Matematyczne techniki zarządzania - 121
ETAP 2. GROMADZENIE DANYCH STATYSTYCZNYCH

!

ZA JAKOŚĆ DANYCH ODPOWIADA MODELUJĄCY
• rodzaje danych: dane przekrojowe i szeregi czasowe
• źródła danych: roczniki statystyczne, różne działy
przedsiębiorstwa, badania marketingowe, wywiady itd.
• wiarygodność danych: do jakiego celu zostały one
przygotowane?

MUSISZ
SPRAWDZAĆ
KAŻDE DANE

• porównywalność danych: inflacja (ceny bieżące a ceny
stałe), zmiany procesów technicznych
Wielkość
produkcji

• zmienność zjawisk: trzeba sprawdzić, czy
wybrana w etapie 1a zmienna jest rzeczywiście zmienną losową

Wx 

s( x )

nowy zakład

100 %

x

stary zakład

Wx musi wynosić co najmniej 30-40%
Wiek studenta może być dobrą zmiennąprzyczyną, ale nie w przypadku studiów
dziennych!

Zatrudnienie

Matematyczne techniki zarządzania - 122
ETAP 3. SELEKCJA ZMIENNYCH OBJAŚNIAJĄCYCH
KAŻDĄ ZMIENNĄ X WYTYPOWANĄ W ETAPIE 1a TRAKTUJEMY JAKO
KANDYDATKĘ NA ZMIENNĄ OBJAŚNIAJĄCĄ
Może być kilka przyczyn powodujących, że taka kandydatka nie może znaleźć się w modelu ekonometrycznym (w równaniu regresji):
• w modelu nie może być zbyt wielu zmiennych (nieczytelny)
• kandydatka może nie mieć wpływu na zmienną Y



• kandydatka może wnosić prawie tę samą informację o Y co inna
kandydatka

• dwie bardzo podobne kandydatki mogą sobie nawzajem przeszkadzać
(efekt katalityczny)
Kryteria, jakie musi spełniać kandydatka Xi, aby nadawała się do modelu:
• musi być silnie powiązana ze zmienną Y

• nie może być powiązana z inną kandydatką Xj
SSTO
x1
x4

x2
x3

reszta

R2=0,79

R2=0,66

x2
x1
x4

R2=0,48

x3
reszta

reszta

SSTO

SSTO

Matematyczne techniki zarządzania - 123
Efekt katalityczny
DWIE ZMIENNE DAJĄ
RAZEM MNIEJ INFORMACJI NIŻ KAŻDA Z
NICH Z OSOBNA

x1

x2

R2=0,25

x2

x1

R2=0,52

R2=0,66

Selekcja kandydatek ma na celu podzielenie ich na trzy grupy:
• zmienne wprowadzone do modelu
• zmienne nie wprowadzone do modelu, ale reprezentowane w nim przez
inne zmienne (możliwość wymiany)
• zmienne nie wprowadzone do modelu ze względu na fakt, że nie wnoszą
żadnej informacji o zmiennej Y
INFORMACJE potrzebne do selekcji: współczynniki r x i x j ,
Macierz współczynników korelacji
Y
Y
X1
X2
X3

0,52
0,64
- 0,21

X1
0,52
0,82
- 0,18

X2
0,64
0,82
0,08

X3
- 0,21
- 0,18
0,08

r yx

i

Przykład 32. Macierz powiązania
zmiennych ze sobą przedstawia
się następująco (n=20). Jak ją
można zinterpretować? Które
zmienne są powiązane ze sobą w
sposób istotny?

Matematyczne techniki zarządzania - 124
Testowanie istotności współczynnika korelacji
H0:  = 0

Można je przeprowadzić trzema testami: testem Studenta

H1:   0

(t), Fishera (F) i Wallace’a-Snedecora (R)

Fragment tablicy rozkładu Wallece’a-Snedecora (SKRYPT, tab. VII, s.161)
S to pn ie
sw ob od y

2
0,05
0,632
0,444
0,361

8
18
28

,

0,01
0,765
0,561
0,463

L iczb a zm ien n ych
3
0,05
0,01
0,726
0,827
0,532
0,633
0,439
0,530

4
0,05
0,777
0,587
0,490

0,01
0,860
0,678
0,573

Reguła decyzyjna: — jeżeli |Robl|>Rtabl, odrzucamy H0 (korelacja istotna)
— jeżeli |Robl|
W przykładzie 32, jeżeli przyjmiemy  = 0,05, to Rtabl = 0,444.
Y
Y
X1
X2
X3

0,52
0,64
- 0,21

X1
0,52
0,82
- 0,18

X2
0,64
0,82
0,08

X3
- 0,21
- 0,18
0,08

Pozostaną zatem tylko trzy
istotne powiązania:
y-x1, y-x2, x1-x2
BRAK ISTOTNEGO POWIĄZANIA Z Y NIE
OZNACZA, ŻE ZMIENNA NIE WNOSI
ŻADNEJ INFORMACJI O ZJAWISKU Y

Matematyczne techniki zarządzania - 125



Metody selekcji zmiennych objaśniających:
• grafowa
• Hellwiga (pojemności informacji)
• taksonomiczne (clustering)
Metoda grafowa
• obliczenie macierzy współczynników:

rx

i

xj

• wyłowienie z macierzy powiązań istotnych

, r yx

BUDOWA GRAFU
i

• graf spójny

• budowa grafu z powiązań istotnych
• wybranie zmiennych na podstawie grafu

x6

• graf zerowy
x1
x4

x9

DO MODELU WYBIERA SIĘ ZMIENNE:
• każdy graf zerowy (jeśli |ryx|>0,1)

istotne powiązanie

• po jednej reprezentantce grafu spójnego;

reprezentantką grafu jest zmienna, która ma najwięcej powiązań z
innymi kandydatkami
jeżeli kilka zmiennych ma tę samą maksymalną liczbę powiązań, wybiera
się z nich tę, która jest najsilniej powiązana za zmienną Y (max ryx)
jeżeli graf jest rozległy, może mieć dwie reprezentantki, ale muszą one
leżeć na przeciwległych stronach grafu

Matematyczne techniki zarządzania - 126
Przykład 32 cd. Wybierzemy
zmienną x2 (reprezentantka grafu
spójnego) i zmienną x3 (graf
zerowy)
Metoda Hellwiga

Y
Y
X1
X2
X3

0,52
0,64
- 0,21

• wypisujemy wszystkie możliwe kombinacje
kandydatek; jest ich K = 2m—1
• obliczamy pojemność informacji dla każdej
zmiennej w każdej kombinacji

h kl  f ( r yx , r x
i

ixj

)

• obliczamy pojemność całkowitą dla każdej
kombinacji
H l   h kl
k

• wybieramy kombinację o największej
pojemności Hl = max

X1
0,52
0,82
- 0,18

X2
0,64
0,82

X3
- 0,21
- 0,18
0,08

0,08

W przykładzie 32 mamy 7
możliwych kombinacji kandydatek:
1. x1
2. x2

3. x3

maximum:

H6 = 0,42

4. x1,x2
5. x1,x3

Hmax = R2

6. x2,x3
7. x1,x2,x3

Metody taksonomiczne
Taksonomia wrocławska (cluster analysis) to metoda grupowania obiektów (zmiennych) w grupy jednorodne pod względem n cech (wymiarów)
łącznie. Podstawą grupowania jest odległość euklidesowa, która w przypadku zmiennych d ij  f ( r x x )
WSZYSTKIE METODY TO SELEKCJA WSTĘPNA
i

j

Matematyczne techniki zarządzania - 127
ETAP 4. ESTYMACJA PARAMETRÓW MODELU
Cel etapu: wyznaczenie parametrów strukturalnych i stochastycznych
Estymacja: szacowanie parametrów populacji na podstawie próbki
Metody estymacji: analiza regresji i korelacji (KMNK i inne)

Założenia dla KMNK
1. Zmienne losowe są prawdziwymi zmiennymi, nie powiązanymi ze sobą
2. Składnik losowy  ma stałą wariancję, niezależną od zmiennej x lub t
3. Wartości reszt ui są niezależne od siebie

4. Składnik losowy  nie jest powiązany ze zmienną objaśniającą
Skutki niedotrzymania założeń i środki zaradcze
1. Model bez sensu, nieprzydatny; niekiedy absurdalny (źle uwarunkowane
dane)
Stosuje się: dużą próbkę (n>100), regresję grzbietową (ridge regression)
2.

Y

reszta ui

Lewa część zbioru ma dużą wariancję, a
prawa — wariancję małą
Stosuje się specjalny wariant MNK z
korektą na różne wariancje
X

Matematyczne techniki zarządzania - 128
3. Jeśli reszty ui są ze sobą powiązane (skorelowane), mówimy, że
występuje autokorelacja składnika losowego (zjawisko występuje przy
szeregach czasowych — sztywny porządek obserwacji)
Oznacza to, że istnieje istotna zależność u t  f ( u t  k )
Przyczyny autokorelacji: zakłócenia
(dodatnie lub ujemne) w jednym okresie
wpływają na poziom zjawiska w następnych
okresach (rolnictwo, produkcja, rynek)

t  1 , 2 ,...

u t  y t  yˆ t

u t 1

u1
u2
u3
u4
u5

Występowanie autokorelacji powoduje
nieprzydatność modelu


u1
u2
u3
u4

Istnienie autokorelacji sprawdza się testem
Durbina-Watsona d
Stosuje się metodę różniczki zupełnej

y  f (x )

yt  yt  ytk

4. Składnik losowy jest skorelowany ze zmienną objaśniającą, wtedy
gdy została pominięta jakaś ważna zmienna-przyczyna

Model taki nie ma żadnej wartości; trzeba dbać o jak najwyższy współczynnik determinacji (R2>0,9)
• zbiór danych rzeczywistych nigdy
nie spełnia tych wymagań

ESTYMACJĘ MODELU POWTARZA SIĘ WIELOKROTNIE
ponieważ dopiero weryfikacja zapewnia ostateczną selekcję
kandydatek na zmienne objaśniające

• ekonometria to analiza danych nie
spełniających tych założeń
• nie stosować statystyki bezmyślnie (na ślepo)

Matematyczne techniki zarządzania - 129
ETAP 5. WERYFIKACJA MODELU
Cele:

1. opis rzeczywistości (populacji generalnej)



2. dokładna (ostateczna) selekcja zmiennych objaśniających
3. poznanie składnika losowego (spełnienie założeń KMNK)
Narzędzia: hipotezy i testy statystyczne

Metodyka: każde równanie oddzielnie; weryfikacja obejmuje 9 etapów (od
najmniej do najbardziej pracochłonnego)
WYKAZ ETAPÓW WERYFIKACJI MODELU
I.
II.

Badanie istotności korelacji
Badanie wyrazistości modelu

III.

Badanie istotności parametrów

IV.

Badanie symetrii skł. losowego

V.
VI.
VII.
VIII.
IX.

Badanie losowości skł. losowego
Badanie stacjonarności skł. los.
Badanie wartości oczekiwanej skł. los.
Badanie autokorelacji skł. losowego
Badanie normalności skł. losowego

Opis każdego etapu weryfikacji
obejmuje:
• cel etapu
• sposób weryfikacji: wzory,
hipotezy, testy
• podanie których modeli dotyczy (przyczynowo-skutkowych
czy tendencji rozwojowej)
• podanie której postaci modeli
nieliniowych dotyczy (pierwotnej czy transformaty)

Matematyczne techniki zarządzania - 130
Etap I. Badanie istotności korelacji
7
2

8

9

11

12

17

19

23

21

5
2 etapu
9
16
7
9
15
14
Celem
jest
sprawdzenie,
czy
istnieje w populacji generalnej powiązanie pomiędzy zmienną Y i wszystkimi zmiennymi objaśniającymi

25

Przedział ufności dla
nieznanego współczynnika korelacji  dla populacji buduje się przy
użyciu błędu

populacja

zmienna Y

20
15
10

próbka

5
0
8
5

0 9

1011

2

9

20
12

30
17
16
7
zmienna X

25

1940
9

23 50
15

populacja

20

zmienna Y

7
2

15
10

próbka

5
0
0

10

20

30

zmienna X

40

50

21
14

sR 

1 R

0

Robl

2

nk

Istotność korelacji weryfikuje się przez postawienie
następujących hipotez dla
współczynnika korelacji dla
populacji generalnej:

1
R,|r|

H0 :   0

Brak korelacji, nie ma powiązania...

H1 :   0

Korelacja istotna, jest powiązanie...

,

Matematyczne techniki zarządzania - 131
Hipotezy te można weryfikować trzema równoważnymi testami:
• testem t Studenta (tylko dla regresji dwu zmiennych)
• testem F Fishera-Snedecora
• testem R Wallace’a-Snedecora

,

W każdym przypadku obliczamy wartość
statystyki dla próbki (tobl, Fobl, Robl) i porównujemy z wartością krytyczną odczytaną z tablicy odpowiedniego rozkładu w
funkcji poziomu istotności i liczby stopni
swobody (ttabl, Ftabl, Rtabl)

Reguła decyzyjna:
• jeżeli |tobl|< ttabl, nie ma podstaw do odrzucenia H0 (brak korelacji)
• jeżeli |tobl|> ttabl, odrzucamy H0 na korzyść H1 (korelacja istnieje)

TAK SAMO DLA
FiR

W przypadku regresji wielorakiej, gdy liczba zmiennych objaśniajacych
jest duża w porównaniu do liczby obserwacji, współczynnik determinacji
R2 może dawać zawyżoną ocenę stopnia wyjaśnienia zmienności zmiennej
objaśnianej; dlatego wprowadzono skorygowany współczynnik determinacji (i korelacji):
 ( yˆ i  y )

R

2

2

k
n

k

1


2
nk 1
(
y

y
)

i
n1

• adjusted coefficient of multiple
determination (wydruki komputerowe)

• jeśli k jest małe, nie ma większej różnicy
pomiędzy normalnym a skorygowanym R2

Matematyczne techniki zarządzania - 132
Skąd wziąć wartość odpowiedniej statystyki dla próbki i jak odczytywać jej wartości z tablic?
n2
r
t

r

t tabl  t  / 2 { n  2 }
TEST STUDENTA
obl
2
sr
1 r

F obl 

TEST FISHERA

Ź ró d ło z m ien n o śc i

MSTR
MSE



R

nk

2

1 R

2

L ic zb a sto p n i
sw o b o d y

Suma
k w a d ra tó w

Ś re d n i
k w a d ra t

M o d el (c z yn n ik i)
B łą d (re sz ta )

k1
nk

SSTR
SSE

MSTR
MSE

R azem

n1

SSTO

TEST WALLACE’A

R obl 

R

2

k 1

F tabl  F { k  1 , n  k }

S ta ty sty k a
F
F obl 

MSTR
MSE

NIE MYLIĆ
STOPNI SWOBODY LICZNIKA I MIANOWNIKA

R tabl  R { k , n  k }

Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

Matematyczne techniki zarządzania - 133
Odczyt Rtabl z tablicy testu R (SKRYPT s.161-162)

, k,  = n-k

S to pn ie
sw ob od y
8
18
28

2
0,05
0,632
0,444
0,361

0,01
0,765
0,561
0,463

L iczb a zm ien n ych
3
0,05
0,01
0,726
0,827
0,532
0,633
0,439
0,530

4
0,05
0,777
0,587
0,490

0,01
0,860
0,678
0,573

Wnioski dotyczące rozkładu R Wallace’a-Snedecora:
• tablica zawiera maksymalne wartości współczynnika korelacji w danej
sytuacji, jakich można oczekiwać, gdy nie ma korelacji w populacji
• im wyższy poziom istotności, tym niższe Rtabl

• im większa liczba zmiennych w modelu, tym wyższe Rtabl
• im wyższa liczba stopni swobody (większa próbka), tym niższe Rtabl
• tablica R powstała z przeliczenia tablic t oraz F (odwrócenie wzorów)
• tablica testu R jest najszybszym i nawygodniejszym narzędziem do
weryfikacji istotności korelacji

Werdykt z etapu I:

Matematyczne techniki zarządzania - 134

• jeżeli Robl>Rtabl, model jest poprawny, można przejść do etapu II
• jeżeli Roblzmiennych objaśniających albo jego postać matematyczną
ETAP I OBOWIĄZUJE DLA WSZYSTKICH MODELI
ETAP I PRZEPROWADZA SIĘ DLA TRANSFORMATY (dla postaci pierwotnej
można uzyskać R>1)
Rola współczynnika determinacji R2
• korelacja może być istotna przy małym R i bardzo małym R2 (r=0,4,
R2=0,16, co oznacza, że tylko 16% zmienności zmiennej Y jest
wyjaśnione przez zmienną objaśniającą)
• małe R2 oznacza niski stopień wyjaśnienia rzeczywistości i stanowi
zagrożenie dla modelu
• należy dążyć (poprzez odpowiedni dobór zmiennych-przyczyn i postaci
matematycznej modelu) do jak największego R2 (dla postaci pierwotnej)
• wysoka wartość R2 świadczy o dobrym poznaniu badanego zjawiska
• wysoka wartość R2 bardzo często wynika jednak ze złego dobrania
zmiennych objaśniających (silnie powiązane ze sobą — „masło maślane”)
KORELACJA POZORNA — jest zależność, ale jej nie ma? Przyczyny...
Trzeba unikać wartości bezwzględnych (ludność, liczba sklepów, wielkość produkcji)

6

9

12

8

11

12

11

15

9

18

9

11

11

18

15

Matematyczne techniki zarządzania - 135
Etap II. Badanie wyrazistości modelu
Y

Wyrazistość modelu dana jest wzorem

s( y )

ui

y

W obl 

s( y )

100 %

y

Celem etapu
jest kontrola
rozrzutu danych

Współczynnik Wobl<30%, w przeciwnym
przypadku rozrzut danych jest zbyt duży

y

Kłopoty: gdyy jest bliskie 0

x

X

Werdykt: model poprawny lub niepoprawny

ETAP II OBOWIĄZUJE DLA WSZYSTKICH MODELI (ale nie ma on charakteru
statystycznego)

ETAP II PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ (sprawdzamy, czy
nie występuje silny efekt „krzywego lustra”)
Etap III. Badanie istotności parametrów (współczynników) modelu
Celem etapu jest sprawdzenie:
• czy poszczególne zmienne objaśniające mają istotny wpływ na zmienną
objaśnianą?
• czy zmienne objaśniające są wybrane prawidłowo?

• czy wyraz wolny różni się istotnie od zera?

Matematyczne techniki zarządzania - 136
Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

Problem istotności parametrów ai można rozpatrywać (tak jak problem
średniej dla populacji) z dwu punktów widzenia:
• przedziału ufności dla nieznanej wartości i

• hipotez — zerowej H0: i=0 i alternatywnej H1: i 0

1
0

ai

1

i

ISTOTNY (W PRZEDZIALE NIE MA ZERA)

0

ai

i

NIEISTOTNY (W PRZEDZIALE JEST ZERO)

P ( a i  t / 2 { n  k } s ( a i )   i  a i  t / 2 { n  k } s ( a i )  1  

Z tablicy rozkładu Studenta, a nie z wydruku komputerowego!

Matematyczne techniki zarządzania - 137
Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

W praktyce posługujemy się raczej hipotezami:
Badanie istotności przeprowadza
się dla każdego i oddzielnie:

t obl ( a i ) 

ai  0
s(a i )

t tabl  t  / 2 { n  k }

• jeżeli |tobl(ai)|>ttabl(ai), odrzucamy hipotezę zerową; parametr jest istotny z błędem równym co najwyżej 
• jeżeli |tobl(ai)|parametr nie jest istotny
Praktycznie jest to bardzo łatwe:
• sprawdzamy, czy |t(ai)| jest większe czy mniejsze od około 2, a najlepiej
• porównujemy rzeczywisty poziom istotności P(ai) z przyjętym 
ODRZUCAMY H0, JEŻELI P(ai) JEST MNIEJSZE OD 

WTEDY ZMIENNA
Xi MA WPŁYW NA
ZMIENNĄ Y

Matematyczne techniki zarządzania - 138
W etapie III następuje ostateczna selekcja zmiennych objaśniających:
• jeżeli wszystkie ai okażą się istotne, model jest poprawny:
— model przyczynowo-skutkowy: do interpretacji
— model tendencji rozwojowej: do etapu IV
• jeżeli choć jedno ai okaże się nieistotne, model jest niepoprawny i wymaga poprawy przez usunięcie nieistotnych zmiennych:
— zmienne należy usuwać po jednej (ze względu na efekt katalityczny)
— usuwa się zawsze zmienną o najniższej wartości |t(ai)| [czyli o
najwyższej wartości P(ai)]
— usunięcie ostatniej zmiennej nieistotnej kończy proces selekcji
kandydatek na zmienne,

— selekcja nie jest ostateczna, gdyż zawsze istnieje możliwość zamiany zmiennych, które są powiązane ze sobą
Praktyczne znaczenie istotności wyrazu wolnego a0
To są jedne z możliwości dla populacji (p. plansza 106)

Y

W przypadku funkcji K=f(P) wyraz wolny wyznacza poziom kosztów stałych (rachunkowość zarządcza)
W przypadku zależności technicznej Q=f(h) wyraz
wolny oznacza, że przy miąższości pokładu h=0 wydajność produkcji Q też jest równa 0

0
X

Matematyczne techniki zarządzania - 139
Praktyczne znaczenie istotności współczynnika regresji ai



KRZYWE NEYMANA — PLANSZE 106-107
WSPÓŁCZ. ISTOTNY
WSPÓŁ. NIEISTOTNY

ETAP III OBOWIĄZUJE DLA WSZYSTKICH MODELI
ETAP III PRZEPROWADZA SIĘ DLA TRANSFORMATY
Etap IV. Badanie symetrii składnika losowego

Y

CZĘSTOŚĆ RESZT DODATNICH I UJEMNYCH MA BYĆ
ZBLIŻONA

Y

ASYMETRYCZNY
SYMETRYCZNY

t
t
Badanie symetrii przeprowadza się testem Studenta (St. Bartosiewicz
Ekonometria)
Brak symetrii wymaga zmiany matematycznej postaci modelu
ETAP IV OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ

ETAP IV PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ

Matematyczne techniki zarządzania - 140
Etap V. Badanie losowości składnika losowego

Y

Y
NIELOSOWY

LOSOWY

t
t
Badanie losowości przeprowadza się testem Studenta lub testem serii
(Ekonometria, praca zb. pod red. M. Krzysztofiaka)
Brak losowości wymaga zmiany matematycznej postaci modelu
ETAP V OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP V PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ
Etap VI. Badanie stacjonarności składnika losowego
W etapie tym chodzi o niezależność wariancji składnika losowego od
zmiennej objaśniającej t (plansza 127)

Bada się istotność współczynnika korelacji ru t , t
ETAP VI OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VI PRZEPROWADZA SIĘ DLA TRANSFORMATY

Matematyczne techniki zarządzania - 141
Etap VII. Badanie wartości oczekiwanej składnika losowego
Normalnie, gdy przeprowadzamy estymację postaci liniowej, parametry
składnika losowego E ( )  0
{ ui  0}
V ( )  const
Po retransformacji do postaci pierwotnej mamy nowe reszty u’, dla
których
'
'
ui  0
 ui  0
Celem etapu jest sprawdzenie, czy odchyłka od O nie jest zbyt duża
(służy do tego test Studenta)
ETAP VII OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VII PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ
Etap VIII. Badanie autokorelacji składnika losowego
Pojęcie autokorelacji opisano na planszy 128; chodzi o istotność korelacji ru , u
t

tk

Badanie autokorelacji można przeprowadzić:

• testem R istotności korelacji ru

t

,ut  k

d obl

• testem Durbina-Watsona
NIE MA AUTOK.

d1

?

d2 JEST AUTOKORELACJA

ETAP VIII OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VIII PRZEPROWADZA SIĘ DLA TRANSFORMATY

Matematyczne techniki zarządzania - 142
Etap IX. Badanie normalności składnika losowego
Celem etapu jest stwierdzenie, czy reszty mają rozkład normalny
Analiza reszt — oddzielny dział analizy regresji i korelacji
Jeżeli reszty mają rozkład normalny, statystyk otrzymuje „ulgi”
ETAP 6. PRAKTYCZNA INTERPRETACJA MODELU



Celem etapu jest wydobycie z modelu całej nowej wiedzy, której nie widać
„gołym okiem”
INTERPRETUJĄC MODEL (RÓWNANIE REGRESJI) NALEŻY UŻYWAĆ WYŁĄCZNIE
PROSTEJ TERMINOLOGII EKONOMICZNEJ ZROZUMIAŁEJ DLA KLIENTA
NIE NALEŻY UŻYWAĆ TERMINOLOGII MATEMATYCZNEJ ZROZUMIAŁEJ TYLKO DLA
TWÓRCÓW MODELU
INTERPRETOWAĆ WOLNO TYLKO MODEL ZWERYFIKOWANY
CAŁY TRUD MODELOWANIA NIE MOŻE BYĆ „SZTUKĄ DLA SZTUKI”, LECZ MA
SŁUŻYĆ UZYSKANIU KONKRETNYCH WNIOSKÓW PRAKTYCZNYCH

Interpretacja modelu przyczynowo-skutkowego

Polega ona na określeniu wpływu poszczególnych czynników na badane
zjawisko:
• podział wszystkich czynników na trzy grupy

Matematyczne techniki zarządzania - 143
A — czynniki nie mające wpływu na Y
B — czynniki mające wpływ na Y i wprowadzone do modelu
C — czynniki mające wpływ na Y, ale nie występujące w modelu
• ocena jakościowa wpływu czynników B i C
• ocena ilościowa wpływu czynników B i C
Ocena jakościowa



Na podstawie znaków stojących przy współczynnikach r oraz ai możemy
stwierdzić, że wpływ jest:

• dodatni (im lepsze zaliczenie, tym lepszy wynik egzaminu; im więcej
wydatków na reklamę, tym większy zysk; itd.)
• ujemny (im więcej zatrudnionych, tym gorszy wynik finansowy; im
mniej braków, tym wyższy zysk; im mniejsza absencja, tym wyższe
wynagrodzenie; itd.)

Ocena ilościowa
• model liniowy
Przykład 33. Zinterpretuj zweryfikowany model zależności miesięcznych
kosztów działalności przedsiębiorstwa (tys. zł) od wielkości produkcji
(sztuk) i liczby reklamacji:
y i  50 , 8  14 , 5 x 1  3 , 9 x 2  

Matematyczne techniki zarządzania - 144
a0 = 50,8

poziom kosztów stałych; jeśli firma nie będzie prowadzić
żadnej działalności, poniesie koszty w wysokości 50,8 tys. zł

a1 = 14,5

każda sztuka produktu firmy kosztuje ją przeciętnie 14,5
tys. zł; jeżeli firma zwiększy produkcję o 2 sztuki, koszty
wzrosną o 29,0 tys. zł

a2 = 3,9każda wniesiona reklamacja powiększa koszty przeciętnie o
3,9 tys. zł
• model potęgowy
Przykłąd 34. Zinterpretuj zweryfikowaną funkcję produkcji Cobba-Douglasa
0 , 65

Pi  45 , 2 M i

0 , 73

Zi

e

0 , 04



Funkcja produkcji to specjalny model, określający zależność pomiędzy
produkcją (P) a czynnikami produkcji: majątkiem trwałym (M) i nakładami
robocizny (Z).



Funkcje produkcji to modele umożliwiające „prześwietlenie”
przedsiębiorstwa (szereg czasowy) lub branży (dane przekrojowe) i określenie poziomu gospodarowania oraz postępu
technicznego i organizacyjnego.
Elastyczność  to współczynnik określający reakcję zmiany
jednej zmiennej na inną zmienną — na przykład elastyczność
cenowa popytu (jak popyt zmienia się wraz z ceną towaru).

EKSPERCI
ZACHODNI

Matematyczne techniki zarządzania - 145

 

y
y

:

x

FUNKCJA POTĘGOWA JEST JEDYNĄ FUNKCJĄ O STAŁEJ ELASTYCZNOŚCI

x

Izolinie funkcji produkcji

T1
M

Produkcję P można osiągnąć różnymi
kombinacjami majątku i robocizny:

T2

• T1— technika kapitałochłonna, np.
pełna automatyzacja
• T2 — pośredni poziom techniki

T3
P  const

• T3 — niski poziom techniki, produkcja
pracochłonna
P. LOWE

Z
Efekt poprawy zarządzania bez
zmiany techniki (lepsze wykorzystanie ludzi i sprzętu):

P2
M

ZARZĄDZANIE
TECHNOLOGIĄ

P1

T

• zmniejszenie kapitałochłonności

• zmniejszenie pracochłonności
• zwiększenie produkcji (przejście z
funkcji P1 na P2)

Można też rozpatrzyć łączne efekty
zmiany techniki i zarządzania

Z

Matematyczne techniki zarządzania - 146
Wszystkie informacje tego typu można odczytać w trakcie interpretacji
0 , 65
0 , 73 0 , 04
funkcji produkcji:
Pi  45 , 2 M i
Zi
e

• wartości 45,2 nie interpretuje się
• wartość 0,65 to współczynnik elastyczności majątkowej (kapitałowej)
produkcji: zmiana majątku o 10% daje średnio zmianę produkcji o 6,5%
• wartość 0,73 to współczynnik elastyczności zatrudnieniowej produkcji:
zmiana zatrudnienia o 10% daje zmianę produkcji średnio o 7,3%
• suma obu współczynników k=0,65+0,73=1,38 to współczynnik skali
produkcji:

— jeżeli k<1, to firma rozwija się ekstensywnie
— jeżeli k>1, to firma rozwija się intensywnie
• wartość  = 0,04 to współczynnik postępu organizacyjnego:
— jeżeli  >O, to miał miejsce postęp organizacyjny

— jeżeli  <0, to miał miejsce regres organizacyjny
Interpretacja modelu tendencji rozwojowej

DODAMY
TROCHĘ
TEORII

Przypomnienie: t — zmienna objaśniająca (stałe przyrosty)
y — zmienna objaśniana; rozdzielana w ogólności na trzy
części: trend, wahania okresowe, wahania losowe ()

Matematyczne techniki zarządzania - 147
Wykres z planszy 117 (zużycie energii elektrycznej przez WZ AGH)
WAHANIA OKRESOWE OKREŚLA SIĘ WZGLĘDEM TRENDU A
NIE WZGLĘDEM OSI CZASU

y

trend

t
1995

1996

1997

1998

1999

Te trzy części trzeba zidentyfikować, a potem złożyć razem w model:

• addytywny (jeśli amplituda wahań jest stała)
• multiplikatywny (jeśli amplituda wahań rośnie lub maleje regularnie)
Wyznaczanie trendu
Metody mechaniczne:

• wskaźniki bezwzględne (stały przyrost =
postęp arytmetyczny = funkcja liniowa)
• wskaźniki względne (przyrost o stały procent =
postęp geometryczny = funkcja potęgowa)
• średnia ruchoma (wygładzanie danych linią łamaną)

JAK OBLICZYĆ O
ILE PROCENT ROCZNIE SPADAŁA
ŚREDNIO LICZBA
WIDZÓW W
KINACH:
1982 - 193,7 MLN
1989 - 141,3 MLN

Matematyczne techniki zarządzania - 148
Średnia ruchoma: mając szereg czasowy y1, y2,....., yn, przyjmujemy
długość kroku k = 3, lub 5, lub 7 itd. i liczymy
y  ...  y k
y  ...  y k  1
y k / 2 0 ,5  1
a następnie y k / 2  1 , 5  2
itd.
k
k
y  y2  y3
y  y3  y4
dla k=3:
y2  1
y3  2
itd.
3
3
Przykład 35. Wyznacz trend metodą średniej ruchomej dla następujących
danych:
okres
t
wartość yt

1
5

2
4

3
7

4
6

5
8

12

y2 
10

y3 

y

8

y4 

6
4

y5 

2

y6 

0
0

1

2

3

4

5

czas, t

6

7

8

9

y7 

547

6
10

 5 , 67

CECHY
ŚREDNIEJ
RUCHOMEJ:

 7 , 00

• TRACI SIĘ
k-1 DANYCH

3
768

8
8

 5 , 33

3
476

7
9

3
6  8  10

 8 , 00

3
8  10  9

 9 , 00

3
10  9  8

 9 , 00

• IM
WIĘKSZE k,
TYM
BARDZIEJ
SZTYWNY
TREND

3

Metody statystyczne: analiza regresji i korelacji, różne funkcje oparte na
modelach ekonomii

Matematyczne techniki zarządzania - 149
Wyznaczanie wahań okresowych: dobowych, tygodniowych, miesięcznych,
kwartalnych, rocznych, wieloletnich
Trzy metody:

— metoda wskaźników sezonowości
— metoda zmiennych zero-jedynkowych (0-1)

— metoda harmoniczna
Wszystkie metody mają jeden cel:
uzyskanie przeciętnego obrazu jednego cyklu

+

Ws
[t ]
[%]
trend

I

II



III

IV

WADY:
• KONIECZNOŚĆ
KOREKTY
• BRAK
WERYFIKACJI
STATYSTYCZNEJ

Metoda wskaźników sezonowości

• obliczenie surowych wskaźników sezonowości (wyeliminowanie trendu):
y

S s  yt  yt
S s  t
yt
addytywny multiplikatywny
wynik: n wartości odchyleń od trendu

• obliczenie oczyszczonych wskaźników
sezonowości (wyeliminowanie wahań
losowych):
 Ss
So 
k-liczba okresów
k
jednoimiennych
m-długość cyklu wynik: m wartości śr. odchyleń od trendu

Matematyczne techniki zarządzania - 150
Metoda zmiennych zero-jedynkowych (0-1)
m

y t  a 0  a1 t   bi Q i  
i 1

bi — przeciętne odchylenie od trendu dla
okresu i-tego
Qi — zmienna 0-1

wahania losowe
trend

wahania okresowe

t
1
2
3
4
5
6
7
8
9

yt
y1
y2
y3
y4
y5
y6
y7
y8
y9

Q1
1
0
0
0
1
0
0
0
1

Q2
0
1
0
0
0
1
0
0
0

Q3
0
0
1
0
0
0
1
0
0

Q4
0
0
0
1
0
0
0
1
0

Metoda harmoniczna (szeregi Fouriera)
Wahania okresowe przedstawia się jako sumę określonej liczby drgań harmonicznych (sinusoid i cosinusoid) przesuniętych w fazie, lecz o jednakowym okresie
m /2
2 i m / 2
2 i
y t  a 0  a 1 t   b1 i sin
  b 2 i cos

m
m
i 1
i 1
Obie metody dają taki sam wynik, istnieje możliwość weryfikacji
statystycznej
W metodzie 0-1 dostajemy bi = Ws, natomiast w metodzie harmonicznej Ws
jest sumą wartości poszczególnych sinusoid dla danego momentu czasu


Slide 6

Matematyczne techniki zarządzania - 121
ETAP 2. GROMADZENIE DANYCH STATYSTYCZNYCH

!

ZA JAKOŚĆ DANYCH ODPOWIADA MODELUJĄCY
• rodzaje danych: dane przekrojowe i szeregi czasowe
• źródła danych: roczniki statystyczne, różne działy
przedsiębiorstwa, badania marketingowe, wywiady itd.
• wiarygodność danych: do jakiego celu zostały one
przygotowane?

MUSISZ
SPRAWDZAĆ
KAŻDE DANE

• porównywalność danych: inflacja (ceny bieżące a ceny
stałe), zmiany procesów technicznych
Wielkość
produkcji

• zmienność zjawisk: trzeba sprawdzić, czy
wybrana w etapie 1a zmienna jest rzeczywiście zmienną losową

Wx 

s( x )

nowy zakład

100 %

x

stary zakład

Wx musi wynosić co najmniej 30-40%
Wiek studenta może być dobrą zmiennąprzyczyną, ale nie w przypadku studiów
dziennych!

Zatrudnienie

Matematyczne techniki zarządzania - 122
ETAP 3. SELEKCJA ZMIENNYCH OBJAŚNIAJĄCYCH
KAŻDĄ ZMIENNĄ X WYTYPOWANĄ W ETAPIE 1a TRAKTUJEMY JAKO
KANDYDATKĘ NA ZMIENNĄ OBJAŚNIAJĄCĄ
Może być kilka przyczyn powodujących, że taka kandydatka nie może znaleźć się w modelu ekonometrycznym (w równaniu regresji):
• w modelu nie może być zbyt wielu zmiennych (nieczytelny)
• kandydatka może nie mieć wpływu na zmienną Y



• kandydatka może wnosić prawie tę samą informację o Y co inna
kandydatka

• dwie bardzo podobne kandydatki mogą sobie nawzajem przeszkadzać
(efekt katalityczny)
Kryteria, jakie musi spełniać kandydatka Xi, aby nadawała się do modelu:
• musi być silnie powiązana ze zmienną Y

• nie może być powiązana z inną kandydatką Xj
SSTO
x1
x4

x2
x3

reszta

R2=0,79

R2=0,66

x2
x1
x4

R2=0,48

x3
reszta

reszta

SSTO

SSTO

Matematyczne techniki zarządzania - 123
Efekt katalityczny
DWIE ZMIENNE DAJĄ
RAZEM MNIEJ INFORMACJI NIŻ KAŻDA Z
NICH Z OSOBNA

x1

x2

R2=0,25

x2

x1

R2=0,52

R2=0,66

Selekcja kandydatek ma na celu podzielenie ich na trzy grupy:
• zmienne wprowadzone do modelu
• zmienne nie wprowadzone do modelu, ale reprezentowane w nim przez
inne zmienne (możliwość wymiany)
• zmienne nie wprowadzone do modelu ze względu na fakt, że nie wnoszą
żadnej informacji o zmiennej Y
INFORMACJE potrzebne do selekcji: współczynniki r x i x j ,
Macierz współczynników korelacji
Y
Y
X1
X2
X3

0,52
0,64
- 0,21

X1
0,52
0,82
- 0,18

X2
0,64
0,82
0,08

X3
- 0,21
- 0,18
0,08

r yx

i

Przykład 32. Macierz powiązania
zmiennych ze sobą przedstawia
się następująco (n=20). Jak ją
można zinterpretować? Które
zmienne są powiązane ze sobą w
sposób istotny?

Matematyczne techniki zarządzania - 124
Testowanie istotności współczynnika korelacji
H0:  = 0

Można je przeprowadzić trzema testami: testem Studenta

H1:   0

(t), Fishera (F) i Wallace’a-Snedecora (R)

Fragment tablicy rozkładu Wallece’a-Snedecora (SKRYPT, tab. VII, s.161)
S to pn ie
sw ob od y

2
0,05
0,632
0,444
0,361

8
18
28

,

0,01
0,765
0,561
0,463

L iczb a zm ien n ych
3
0,05
0,01
0,726
0,827
0,532
0,633
0,439
0,530

4
0,05
0,777
0,587
0,490

0,01
0,860
0,678
0,573

Reguła decyzyjna: — jeżeli |Robl|>Rtabl, odrzucamy H0 (korelacja istotna)
— jeżeli |Robl|
W przykładzie 32, jeżeli przyjmiemy  = 0,05, to Rtabl = 0,444.
Y
Y
X1
X2
X3

0,52
0,64
- 0,21

X1
0,52
0,82
- 0,18

X2
0,64
0,82
0,08

X3
- 0,21
- 0,18
0,08

Pozostaną zatem tylko trzy
istotne powiązania:
y-x1, y-x2, x1-x2
BRAK ISTOTNEGO POWIĄZANIA Z Y NIE
OZNACZA, ŻE ZMIENNA NIE WNOSI
ŻADNEJ INFORMACJI O ZJAWISKU Y

Matematyczne techniki zarządzania - 125



Metody selekcji zmiennych objaśniających:
• grafowa
• Hellwiga (pojemności informacji)
• taksonomiczne (clustering)
Metoda grafowa
• obliczenie macierzy współczynników:

rx

i

xj

• wyłowienie z macierzy powiązań istotnych

, r yx

BUDOWA GRAFU
i

• graf spójny

• budowa grafu z powiązań istotnych
• wybranie zmiennych na podstawie grafu

x6

• graf zerowy
x1
x4

x9

DO MODELU WYBIERA SIĘ ZMIENNE:
• każdy graf zerowy (jeśli |ryx|>0,1)

istotne powiązanie

• po jednej reprezentantce grafu spójnego;

reprezentantką grafu jest zmienna, która ma najwięcej powiązań z
innymi kandydatkami
jeżeli kilka zmiennych ma tę samą maksymalną liczbę powiązań, wybiera
się z nich tę, która jest najsilniej powiązana za zmienną Y (max ryx)
jeżeli graf jest rozległy, może mieć dwie reprezentantki, ale muszą one
leżeć na przeciwległych stronach grafu

Matematyczne techniki zarządzania - 126
Przykład 32 cd. Wybierzemy
zmienną x2 (reprezentantka grafu
spójnego) i zmienną x3 (graf
zerowy)
Metoda Hellwiga

Y
Y
X1
X2
X3

0,52
0,64
- 0,21

• wypisujemy wszystkie możliwe kombinacje
kandydatek; jest ich K = 2m—1
• obliczamy pojemność informacji dla każdej
zmiennej w każdej kombinacji

h kl  f ( r yx , r x
i

ixj

)

• obliczamy pojemność całkowitą dla każdej
kombinacji
H l   h kl
k

• wybieramy kombinację o największej
pojemności Hl = max

X1
0,52
0,82
- 0,18

X2
0,64
0,82

X3
- 0,21
- 0,18
0,08

0,08

W przykładzie 32 mamy 7
możliwych kombinacji kandydatek:
1. x1
2. x2

3. x3

maximum:

H6 = 0,42

4. x1,x2
5. x1,x3

Hmax = R2

6. x2,x3
7. x1,x2,x3

Metody taksonomiczne
Taksonomia wrocławska (cluster analysis) to metoda grupowania obiektów (zmiennych) w grupy jednorodne pod względem n cech (wymiarów)
łącznie. Podstawą grupowania jest odległość euklidesowa, która w przypadku zmiennych d ij  f ( r x x )
WSZYSTKIE METODY TO SELEKCJA WSTĘPNA
i

j

Matematyczne techniki zarządzania - 127
ETAP 4. ESTYMACJA PARAMETRÓW MODELU
Cel etapu: wyznaczenie parametrów strukturalnych i stochastycznych
Estymacja: szacowanie parametrów populacji na podstawie próbki
Metody estymacji: analiza regresji i korelacji (KMNK i inne)

Założenia dla KMNK
1. Zmienne losowe są prawdziwymi zmiennymi, nie powiązanymi ze sobą
2. Składnik losowy  ma stałą wariancję, niezależną od zmiennej x lub t
3. Wartości reszt ui są niezależne od siebie

4. Składnik losowy  nie jest powiązany ze zmienną objaśniającą
Skutki niedotrzymania założeń i środki zaradcze
1. Model bez sensu, nieprzydatny; niekiedy absurdalny (źle uwarunkowane
dane)
Stosuje się: dużą próbkę (n>100), regresję grzbietową (ridge regression)
2.

Y

reszta ui

Lewa część zbioru ma dużą wariancję, a
prawa — wariancję małą
Stosuje się specjalny wariant MNK z
korektą na różne wariancje
X

Matematyczne techniki zarządzania - 128
3. Jeśli reszty ui są ze sobą powiązane (skorelowane), mówimy, że
występuje autokorelacja składnika losowego (zjawisko występuje przy
szeregach czasowych — sztywny porządek obserwacji)
Oznacza to, że istnieje istotna zależność u t  f ( u t  k )
Przyczyny autokorelacji: zakłócenia
(dodatnie lub ujemne) w jednym okresie
wpływają na poziom zjawiska w następnych
okresach (rolnictwo, produkcja, rynek)

t  1 , 2 ,...

u t  y t  yˆ t

u t 1

u1
u2
u3
u4
u5

Występowanie autokorelacji powoduje
nieprzydatność modelu


u1
u2
u3
u4

Istnienie autokorelacji sprawdza się testem
Durbina-Watsona d
Stosuje się metodę różniczki zupełnej

y  f (x )

yt  yt  ytk

4. Składnik losowy jest skorelowany ze zmienną objaśniającą, wtedy
gdy została pominięta jakaś ważna zmienna-przyczyna

Model taki nie ma żadnej wartości; trzeba dbać o jak najwyższy współczynnik determinacji (R2>0,9)
• zbiór danych rzeczywistych nigdy
nie spełnia tych wymagań

ESTYMACJĘ MODELU POWTARZA SIĘ WIELOKROTNIE
ponieważ dopiero weryfikacja zapewnia ostateczną selekcję
kandydatek na zmienne objaśniające

• ekonometria to analiza danych nie
spełniających tych założeń
• nie stosować statystyki bezmyślnie (na ślepo)

Matematyczne techniki zarządzania - 129
ETAP 5. WERYFIKACJA MODELU
Cele:

1. opis rzeczywistości (populacji generalnej)



2. dokładna (ostateczna) selekcja zmiennych objaśniających
3. poznanie składnika losowego (spełnienie założeń KMNK)
Narzędzia: hipotezy i testy statystyczne

Metodyka: każde równanie oddzielnie; weryfikacja obejmuje 9 etapów (od
najmniej do najbardziej pracochłonnego)
WYKAZ ETAPÓW WERYFIKACJI MODELU
I.
II.

Badanie istotności korelacji
Badanie wyrazistości modelu

III.

Badanie istotności parametrów

IV.

Badanie symetrii skł. losowego

V.
VI.
VII.
VIII.
IX.

Badanie losowości skł. losowego
Badanie stacjonarności skł. los.
Badanie wartości oczekiwanej skł. los.
Badanie autokorelacji skł. losowego
Badanie normalności skł. losowego

Opis każdego etapu weryfikacji
obejmuje:
• cel etapu
• sposób weryfikacji: wzory,
hipotezy, testy
• podanie których modeli dotyczy (przyczynowo-skutkowych
czy tendencji rozwojowej)
• podanie której postaci modeli
nieliniowych dotyczy (pierwotnej czy transformaty)

Matematyczne techniki zarządzania - 130
Etap I. Badanie istotności korelacji
7
2

8

9

11

12

17

19

23

21

5
2 etapu
9
16
7
9
15
14
Celem
jest
sprawdzenie,
czy
istnieje w populacji generalnej powiązanie pomiędzy zmienną Y i wszystkimi zmiennymi objaśniającymi

25

Przedział ufności dla
nieznanego współczynnika korelacji  dla populacji buduje się przy
użyciu błędu

populacja

zmienna Y

20
15
10

próbka

5
0
8
5

0 9

1011

2

9

20
12

30
17
16
7
zmienna X

25

1940
9

23 50
15

populacja

20

zmienna Y

7
2

15
10

próbka

5
0
0

10

20

30

zmienna X

40

50

21
14

sR 

1 R

0

Robl

2

nk

Istotność korelacji weryfikuje się przez postawienie
następujących hipotez dla
współczynnika korelacji dla
populacji generalnej:

1
R,|r|

H0 :   0

Brak korelacji, nie ma powiązania...

H1 :   0

Korelacja istotna, jest powiązanie...

,

Matematyczne techniki zarządzania - 131
Hipotezy te można weryfikować trzema równoważnymi testami:
• testem t Studenta (tylko dla regresji dwu zmiennych)
• testem F Fishera-Snedecora
• testem R Wallace’a-Snedecora

,

W każdym przypadku obliczamy wartość
statystyki dla próbki (tobl, Fobl, Robl) i porównujemy z wartością krytyczną odczytaną z tablicy odpowiedniego rozkładu w
funkcji poziomu istotności i liczby stopni
swobody (ttabl, Ftabl, Rtabl)

Reguła decyzyjna:
• jeżeli |tobl|< ttabl, nie ma podstaw do odrzucenia H0 (brak korelacji)
• jeżeli |tobl|> ttabl, odrzucamy H0 na korzyść H1 (korelacja istnieje)

TAK SAMO DLA
FiR

W przypadku regresji wielorakiej, gdy liczba zmiennych objaśniajacych
jest duża w porównaniu do liczby obserwacji, współczynnik determinacji
R2 może dawać zawyżoną ocenę stopnia wyjaśnienia zmienności zmiennej
objaśnianej; dlatego wprowadzono skorygowany współczynnik determinacji (i korelacji):
 ( yˆ i  y )

R

2

2

k
n

k

1


2
nk 1
(
y

y
)

i
n1

• adjusted coefficient of multiple
determination (wydruki komputerowe)

• jeśli k jest małe, nie ma większej różnicy
pomiędzy normalnym a skorygowanym R2

Matematyczne techniki zarządzania - 132
Skąd wziąć wartość odpowiedniej statystyki dla próbki i jak odczytywać jej wartości z tablic?
n2
r
t

r

t tabl  t  / 2 { n  2 }
TEST STUDENTA
obl
2
sr
1 r

F obl 

TEST FISHERA

Ź ró d ło z m ien n o śc i

MSTR
MSE



R

nk

2

1 R

2

L ic zb a sto p n i
sw o b o d y

Suma
k w a d ra tó w

Ś re d n i
k w a d ra t

M o d el (c z yn n ik i)
B łą d (re sz ta )

k1
nk

SSTR
SSE

MSTR
MSE

R azem

n1

SSTO

TEST WALLACE’A

R obl 

R

2

k 1

F tabl  F { k  1 , n  k }

S ta ty sty k a
F
F obl 

MSTR
MSE

NIE MYLIĆ
STOPNI SWOBODY LICZNIKA I MIANOWNIKA

R tabl  R { k , n  k }

Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

Matematyczne techniki zarządzania - 133
Odczyt Rtabl z tablicy testu R (SKRYPT s.161-162)

, k,  = n-k

S to pn ie
sw ob od y
8
18
28

2
0,05
0,632
0,444
0,361

0,01
0,765
0,561
0,463

L iczb a zm ien n ych
3
0,05
0,01
0,726
0,827
0,532
0,633
0,439
0,530

4
0,05
0,777
0,587
0,490

0,01
0,860
0,678
0,573

Wnioski dotyczące rozkładu R Wallace’a-Snedecora:
• tablica zawiera maksymalne wartości współczynnika korelacji w danej
sytuacji, jakich można oczekiwać, gdy nie ma korelacji w populacji
• im wyższy poziom istotności, tym niższe Rtabl

• im większa liczba zmiennych w modelu, tym wyższe Rtabl
• im wyższa liczba stopni swobody (większa próbka), tym niższe Rtabl
• tablica R powstała z przeliczenia tablic t oraz F (odwrócenie wzorów)
• tablica testu R jest najszybszym i nawygodniejszym narzędziem do
weryfikacji istotności korelacji

Werdykt z etapu I:

Matematyczne techniki zarządzania - 134

• jeżeli Robl>Rtabl, model jest poprawny, można przejść do etapu II
• jeżeli Roblzmiennych objaśniających albo jego postać matematyczną
ETAP I OBOWIĄZUJE DLA WSZYSTKICH MODELI
ETAP I PRZEPROWADZA SIĘ DLA TRANSFORMATY (dla postaci pierwotnej
można uzyskać R>1)
Rola współczynnika determinacji R2
• korelacja może być istotna przy małym R i bardzo małym R2 (r=0,4,
R2=0,16, co oznacza, że tylko 16% zmienności zmiennej Y jest
wyjaśnione przez zmienną objaśniającą)
• małe R2 oznacza niski stopień wyjaśnienia rzeczywistości i stanowi
zagrożenie dla modelu
• należy dążyć (poprzez odpowiedni dobór zmiennych-przyczyn i postaci
matematycznej modelu) do jak największego R2 (dla postaci pierwotnej)
• wysoka wartość R2 świadczy o dobrym poznaniu badanego zjawiska
• wysoka wartość R2 bardzo często wynika jednak ze złego dobrania
zmiennych objaśniających (silnie powiązane ze sobą — „masło maślane”)
KORELACJA POZORNA — jest zależność, ale jej nie ma? Przyczyny...
Trzeba unikać wartości bezwzględnych (ludność, liczba sklepów, wielkość produkcji)

6

9

12

8

11

12

11

15

9

18

9

11

11

18

15

Matematyczne techniki zarządzania - 135
Etap II. Badanie wyrazistości modelu
Y

Wyrazistość modelu dana jest wzorem

s( y )

ui

y

W obl 

s( y )

100 %

y

Celem etapu
jest kontrola
rozrzutu danych

Współczynnik Wobl<30%, w przeciwnym
przypadku rozrzut danych jest zbyt duży

y

Kłopoty: gdyy jest bliskie 0

x

X

Werdykt: model poprawny lub niepoprawny

ETAP II OBOWIĄZUJE DLA WSZYSTKICH MODELI (ale nie ma on charakteru
statystycznego)

ETAP II PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ (sprawdzamy, czy
nie występuje silny efekt „krzywego lustra”)
Etap III. Badanie istotności parametrów (współczynników) modelu
Celem etapu jest sprawdzenie:
• czy poszczególne zmienne objaśniające mają istotny wpływ na zmienną
objaśnianą?
• czy zmienne objaśniające są wybrane prawidłowo?

• czy wyraz wolny różni się istotnie od zera?

Matematyczne techniki zarządzania - 136
Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

Problem istotności parametrów ai można rozpatrywać (tak jak problem
średniej dla populacji) z dwu punktów widzenia:
• przedziału ufności dla nieznanej wartości i

• hipotez — zerowej H0: i=0 i alternatywnej H1: i 0

1
0

ai

1

i

ISTOTNY (W PRZEDZIALE NIE MA ZERA)

0

ai

i

NIEISTOTNY (W PRZEDZIALE JEST ZERO)

P ( a i  t / 2 { n  k } s ( a i )   i  a i  t / 2 { n  k } s ( a i )  1  

Z tablicy rozkładu Studenta, a nie z wydruku komputerowego!

Matematyczne techniki zarządzania - 137
Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

W praktyce posługujemy się raczej hipotezami:
Badanie istotności przeprowadza
się dla każdego i oddzielnie:

t obl ( a i ) 

ai  0
s(a i )

t tabl  t  / 2 { n  k }

• jeżeli |tobl(ai)|>ttabl(ai), odrzucamy hipotezę zerową; parametr jest istotny z błędem równym co najwyżej 
• jeżeli |tobl(ai)|parametr nie jest istotny
Praktycznie jest to bardzo łatwe:
• sprawdzamy, czy |t(ai)| jest większe czy mniejsze od około 2, a najlepiej
• porównujemy rzeczywisty poziom istotności P(ai) z przyjętym 
ODRZUCAMY H0, JEŻELI P(ai) JEST MNIEJSZE OD 

WTEDY ZMIENNA
Xi MA WPŁYW NA
ZMIENNĄ Y

Matematyczne techniki zarządzania - 138
W etapie III następuje ostateczna selekcja zmiennych objaśniających:
• jeżeli wszystkie ai okażą się istotne, model jest poprawny:
— model przyczynowo-skutkowy: do interpretacji
— model tendencji rozwojowej: do etapu IV
• jeżeli choć jedno ai okaże się nieistotne, model jest niepoprawny i wymaga poprawy przez usunięcie nieistotnych zmiennych:
— zmienne należy usuwać po jednej (ze względu na efekt katalityczny)
— usuwa się zawsze zmienną o najniższej wartości |t(ai)| [czyli o
najwyższej wartości P(ai)]
— usunięcie ostatniej zmiennej nieistotnej kończy proces selekcji
kandydatek na zmienne,

— selekcja nie jest ostateczna, gdyż zawsze istnieje możliwość zamiany zmiennych, które są powiązane ze sobą
Praktyczne znaczenie istotności wyrazu wolnego a0
To są jedne z możliwości dla populacji (p. plansza 106)

Y

W przypadku funkcji K=f(P) wyraz wolny wyznacza poziom kosztów stałych (rachunkowość zarządcza)
W przypadku zależności technicznej Q=f(h) wyraz
wolny oznacza, że przy miąższości pokładu h=0 wydajność produkcji Q też jest równa 0

0
X

Matematyczne techniki zarządzania - 139
Praktyczne znaczenie istotności współczynnika regresji ai



KRZYWE NEYMANA — PLANSZE 106-107
WSPÓŁCZ. ISTOTNY
WSPÓŁ. NIEISTOTNY

ETAP III OBOWIĄZUJE DLA WSZYSTKICH MODELI
ETAP III PRZEPROWADZA SIĘ DLA TRANSFORMATY
Etap IV. Badanie symetrii składnika losowego

Y

CZĘSTOŚĆ RESZT DODATNICH I UJEMNYCH MA BYĆ
ZBLIŻONA

Y

ASYMETRYCZNY
SYMETRYCZNY

t
t
Badanie symetrii przeprowadza się testem Studenta (St. Bartosiewicz
Ekonometria)
Brak symetrii wymaga zmiany matematycznej postaci modelu
ETAP IV OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ

ETAP IV PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ

Matematyczne techniki zarządzania - 140
Etap V. Badanie losowości składnika losowego

Y

Y
NIELOSOWY

LOSOWY

t
t
Badanie losowości przeprowadza się testem Studenta lub testem serii
(Ekonometria, praca zb. pod red. M. Krzysztofiaka)
Brak losowości wymaga zmiany matematycznej postaci modelu
ETAP V OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP V PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ
Etap VI. Badanie stacjonarności składnika losowego
W etapie tym chodzi o niezależność wariancji składnika losowego od
zmiennej objaśniającej t (plansza 127)

Bada się istotność współczynnika korelacji ru t , t
ETAP VI OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VI PRZEPROWADZA SIĘ DLA TRANSFORMATY

Matematyczne techniki zarządzania - 141
Etap VII. Badanie wartości oczekiwanej składnika losowego
Normalnie, gdy przeprowadzamy estymację postaci liniowej, parametry
składnika losowego E ( )  0
{ ui  0}
V ( )  const
Po retransformacji do postaci pierwotnej mamy nowe reszty u’, dla
których
'
'
ui  0
 ui  0
Celem etapu jest sprawdzenie, czy odchyłka od O nie jest zbyt duża
(służy do tego test Studenta)
ETAP VII OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VII PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ
Etap VIII. Badanie autokorelacji składnika losowego
Pojęcie autokorelacji opisano na planszy 128; chodzi o istotność korelacji ru , u
t

tk

Badanie autokorelacji można przeprowadzić:

• testem R istotności korelacji ru

t

,ut  k

d obl

• testem Durbina-Watsona
NIE MA AUTOK.

d1

?

d2 JEST AUTOKORELACJA

ETAP VIII OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VIII PRZEPROWADZA SIĘ DLA TRANSFORMATY

Matematyczne techniki zarządzania - 142
Etap IX. Badanie normalności składnika losowego
Celem etapu jest stwierdzenie, czy reszty mają rozkład normalny
Analiza reszt — oddzielny dział analizy regresji i korelacji
Jeżeli reszty mają rozkład normalny, statystyk otrzymuje „ulgi”
ETAP 6. PRAKTYCZNA INTERPRETACJA MODELU



Celem etapu jest wydobycie z modelu całej nowej wiedzy, której nie widać
„gołym okiem”
INTERPRETUJĄC MODEL (RÓWNANIE REGRESJI) NALEŻY UŻYWAĆ WYŁĄCZNIE
PROSTEJ TERMINOLOGII EKONOMICZNEJ ZROZUMIAŁEJ DLA KLIENTA
NIE NALEŻY UŻYWAĆ TERMINOLOGII MATEMATYCZNEJ ZROZUMIAŁEJ TYLKO DLA
TWÓRCÓW MODELU
INTERPRETOWAĆ WOLNO TYLKO MODEL ZWERYFIKOWANY
CAŁY TRUD MODELOWANIA NIE MOŻE BYĆ „SZTUKĄ DLA SZTUKI”, LECZ MA
SŁUŻYĆ UZYSKANIU KONKRETNYCH WNIOSKÓW PRAKTYCZNYCH

Interpretacja modelu przyczynowo-skutkowego

Polega ona na określeniu wpływu poszczególnych czynników na badane
zjawisko:
• podział wszystkich czynników na trzy grupy

Matematyczne techniki zarządzania - 143
A — czynniki nie mające wpływu na Y
B — czynniki mające wpływ na Y i wprowadzone do modelu
C — czynniki mające wpływ na Y, ale nie występujące w modelu
• ocena jakościowa wpływu czynników B i C
• ocena ilościowa wpływu czynników B i C
Ocena jakościowa



Na podstawie znaków stojących przy współczynnikach r oraz ai możemy
stwierdzić, że wpływ jest:

• dodatni (im lepsze zaliczenie, tym lepszy wynik egzaminu; im więcej
wydatków na reklamę, tym większy zysk; itd.)
• ujemny (im więcej zatrudnionych, tym gorszy wynik finansowy; im
mniej braków, tym wyższy zysk; im mniejsza absencja, tym wyższe
wynagrodzenie; itd.)

Ocena ilościowa
• model liniowy
Przykład 33. Zinterpretuj zweryfikowany model zależności miesięcznych
kosztów działalności przedsiębiorstwa (tys. zł) od wielkości produkcji
(sztuk) i liczby reklamacji:
y i  50 , 8  14 , 5 x 1  3 , 9 x 2  

Matematyczne techniki zarządzania - 144
a0 = 50,8

poziom kosztów stałych; jeśli firma nie będzie prowadzić
żadnej działalności, poniesie koszty w wysokości 50,8 tys. zł

a1 = 14,5

każda sztuka produktu firmy kosztuje ją przeciętnie 14,5
tys. zł; jeżeli firma zwiększy produkcję o 2 sztuki, koszty
wzrosną o 29,0 tys. zł

a2 = 3,9każda wniesiona reklamacja powiększa koszty przeciętnie o
3,9 tys. zł
• model potęgowy
Przykłąd 34. Zinterpretuj zweryfikowaną funkcję produkcji Cobba-Douglasa
0 , 65

Pi  45 , 2 M i

0 , 73

Zi

e

0 , 04



Funkcja produkcji to specjalny model, określający zależność pomiędzy
produkcją (P) a czynnikami produkcji: majątkiem trwałym (M) i nakładami
robocizny (Z).



Funkcje produkcji to modele umożliwiające „prześwietlenie”
przedsiębiorstwa (szereg czasowy) lub branży (dane przekrojowe) i określenie poziomu gospodarowania oraz postępu
technicznego i organizacyjnego.
Elastyczność  to współczynnik określający reakcję zmiany
jednej zmiennej na inną zmienną — na przykład elastyczność
cenowa popytu (jak popyt zmienia się wraz z ceną towaru).

EKSPERCI
ZACHODNI

Matematyczne techniki zarządzania - 145

 

y
y

:

x

FUNKCJA POTĘGOWA JEST JEDYNĄ FUNKCJĄ O STAŁEJ ELASTYCZNOŚCI

x

Izolinie funkcji produkcji

T1
M

Produkcję P można osiągnąć różnymi
kombinacjami majątku i robocizny:

T2

• T1— technika kapitałochłonna, np.
pełna automatyzacja
• T2 — pośredni poziom techniki

T3
P  const

• T3 — niski poziom techniki, produkcja
pracochłonna
P. LOWE

Z
Efekt poprawy zarządzania bez
zmiany techniki (lepsze wykorzystanie ludzi i sprzętu):

P2
M

ZARZĄDZANIE
TECHNOLOGIĄ

P1

T

• zmniejszenie kapitałochłonności

• zmniejszenie pracochłonności
• zwiększenie produkcji (przejście z
funkcji P1 na P2)

Można też rozpatrzyć łączne efekty
zmiany techniki i zarządzania

Z

Matematyczne techniki zarządzania - 146
Wszystkie informacje tego typu można odczytać w trakcie interpretacji
0 , 65
0 , 73 0 , 04
funkcji produkcji:
Pi  45 , 2 M i
Zi
e

• wartości 45,2 nie interpretuje się
• wartość 0,65 to współczynnik elastyczności majątkowej (kapitałowej)
produkcji: zmiana majątku o 10% daje średnio zmianę produkcji o 6,5%
• wartość 0,73 to współczynnik elastyczności zatrudnieniowej produkcji:
zmiana zatrudnienia o 10% daje zmianę produkcji średnio o 7,3%
• suma obu współczynników k=0,65+0,73=1,38 to współczynnik skali
produkcji:

— jeżeli k<1, to firma rozwija się ekstensywnie
— jeżeli k>1, to firma rozwija się intensywnie
• wartość  = 0,04 to współczynnik postępu organizacyjnego:
— jeżeli  >O, to miał miejsce postęp organizacyjny

— jeżeli  <0, to miał miejsce regres organizacyjny
Interpretacja modelu tendencji rozwojowej

DODAMY
TROCHĘ
TEORII

Przypomnienie: t — zmienna objaśniająca (stałe przyrosty)
y — zmienna objaśniana; rozdzielana w ogólności na trzy
części: trend, wahania okresowe, wahania losowe ()

Matematyczne techniki zarządzania - 147
Wykres z planszy 117 (zużycie energii elektrycznej przez WZ AGH)
WAHANIA OKRESOWE OKREŚLA SIĘ WZGLĘDEM TRENDU A
NIE WZGLĘDEM OSI CZASU

y

trend

t
1995

1996

1997

1998

1999

Te trzy części trzeba zidentyfikować, a potem złożyć razem w model:

• addytywny (jeśli amplituda wahań jest stała)
• multiplikatywny (jeśli amplituda wahań rośnie lub maleje regularnie)
Wyznaczanie trendu
Metody mechaniczne:

• wskaźniki bezwzględne (stały przyrost =
postęp arytmetyczny = funkcja liniowa)
• wskaźniki względne (przyrost o stały procent =
postęp geometryczny = funkcja potęgowa)
• średnia ruchoma (wygładzanie danych linią łamaną)

JAK OBLICZYĆ O
ILE PROCENT ROCZNIE SPADAŁA
ŚREDNIO LICZBA
WIDZÓW W
KINACH:
1982 - 193,7 MLN
1989 - 141,3 MLN

Matematyczne techniki zarządzania - 148
Średnia ruchoma: mając szereg czasowy y1, y2,....., yn, przyjmujemy
długość kroku k = 3, lub 5, lub 7 itd. i liczymy
y  ...  y k
y  ...  y k  1
y k / 2 0 ,5  1
a następnie y k / 2  1 , 5  2
itd.
k
k
y  y2  y3
y  y3  y4
dla k=3:
y2  1
y3  2
itd.
3
3
Przykład 35. Wyznacz trend metodą średniej ruchomej dla następujących
danych:
okres
t
wartość yt

1
5

2
4

3
7

4
6

5
8

12

y2 
10

y3 

y

8

y4 

6
4

y5 

2

y6 

0
0

1

2

3

4

5

czas, t

6

7

8

9

y7 

547

6
10

 5 , 67

CECHY
ŚREDNIEJ
RUCHOMEJ:

 7 , 00

• TRACI SIĘ
k-1 DANYCH

3
768

8
8

 5 , 33

3
476

7
9

3
6  8  10

 8 , 00

3
8  10  9

 9 , 00

3
10  9  8

 9 , 00

• IM
WIĘKSZE k,
TYM
BARDZIEJ
SZTYWNY
TREND

3

Metody statystyczne: analiza regresji i korelacji, różne funkcje oparte na
modelach ekonomii

Matematyczne techniki zarządzania - 149
Wyznaczanie wahań okresowych: dobowych, tygodniowych, miesięcznych,
kwartalnych, rocznych, wieloletnich
Trzy metody:

— metoda wskaźników sezonowości
— metoda zmiennych zero-jedynkowych (0-1)

— metoda harmoniczna
Wszystkie metody mają jeden cel:
uzyskanie przeciętnego obrazu jednego cyklu

+

Ws
[t ]
[%]
trend

I

II



III

IV

WADY:
• KONIECZNOŚĆ
KOREKTY
• BRAK
WERYFIKACJI
STATYSTYCZNEJ

Metoda wskaźników sezonowości

• obliczenie surowych wskaźników sezonowości (wyeliminowanie trendu):
y

S s  yt  yt
S s  t
yt
addytywny multiplikatywny
wynik: n wartości odchyleń od trendu

• obliczenie oczyszczonych wskaźników
sezonowości (wyeliminowanie wahań
losowych):
 Ss
So 
k-liczba okresów
k
jednoimiennych
m-długość cyklu wynik: m wartości śr. odchyleń od trendu

Matematyczne techniki zarządzania - 150
Metoda zmiennych zero-jedynkowych (0-1)
m

y t  a 0  a1 t   bi Q i  
i 1

bi — przeciętne odchylenie od trendu dla
okresu i-tego
Qi — zmienna 0-1

wahania losowe
trend

wahania okresowe

t
1
2
3
4
5
6
7
8
9

yt
y1
y2
y3
y4
y5
y6
y7
y8
y9

Q1
1
0
0
0
1
0
0
0
1

Q2
0
1
0
0
0
1
0
0
0

Q3
0
0
1
0
0
0
1
0
0

Q4
0
0
0
1
0
0
0
1
0

Metoda harmoniczna (szeregi Fouriera)
Wahania okresowe przedstawia się jako sumę określonej liczby drgań harmonicznych (sinusoid i cosinusoid) przesuniętych w fazie, lecz o jednakowym okresie
m /2
2 i m / 2
2 i
y t  a 0  a 1 t   b1 i sin
  b 2 i cos

m
m
i 1
i 1
Obie metody dają taki sam wynik, istnieje możliwość weryfikacji
statystycznej
W metodzie 0-1 dostajemy bi = Ws, natomiast w metodzie harmonicznej Ws
jest sumą wartości poszczególnych sinusoid dla danego momentu czasu


Slide 7

Matematyczne techniki zarządzania - 121
ETAP 2. GROMADZENIE DANYCH STATYSTYCZNYCH

!

ZA JAKOŚĆ DANYCH ODPOWIADA MODELUJĄCY
• rodzaje danych: dane przekrojowe i szeregi czasowe
• źródła danych: roczniki statystyczne, różne działy
przedsiębiorstwa, badania marketingowe, wywiady itd.
• wiarygodność danych: do jakiego celu zostały one
przygotowane?

MUSISZ
SPRAWDZAĆ
KAŻDE DANE

• porównywalność danych: inflacja (ceny bieżące a ceny
stałe), zmiany procesów technicznych
Wielkość
produkcji

• zmienność zjawisk: trzeba sprawdzić, czy
wybrana w etapie 1a zmienna jest rzeczywiście zmienną losową

Wx 

s( x )

nowy zakład

100 %

x

stary zakład

Wx musi wynosić co najmniej 30-40%
Wiek studenta może być dobrą zmiennąprzyczyną, ale nie w przypadku studiów
dziennych!

Zatrudnienie

Matematyczne techniki zarządzania - 122
ETAP 3. SELEKCJA ZMIENNYCH OBJAŚNIAJĄCYCH
KAŻDĄ ZMIENNĄ X WYTYPOWANĄ W ETAPIE 1a TRAKTUJEMY JAKO
KANDYDATKĘ NA ZMIENNĄ OBJAŚNIAJĄCĄ
Może być kilka przyczyn powodujących, że taka kandydatka nie może znaleźć się w modelu ekonometrycznym (w równaniu regresji):
• w modelu nie może być zbyt wielu zmiennych (nieczytelny)
• kandydatka może nie mieć wpływu na zmienną Y



• kandydatka może wnosić prawie tę samą informację o Y co inna
kandydatka

• dwie bardzo podobne kandydatki mogą sobie nawzajem przeszkadzać
(efekt katalityczny)
Kryteria, jakie musi spełniać kandydatka Xi, aby nadawała się do modelu:
• musi być silnie powiązana ze zmienną Y

• nie może być powiązana z inną kandydatką Xj
SSTO
x1
x4

x2
x3

reszta

R2=0,79

R2=0,66

x2
x1
x4

R2=0,48

x3
reszta

reszta

SSTO

SSTO

Matematyczne techniki zarządzania - 123
Efekt katalityczny
DWIE ZMIENNE DAJĄ
RAZEM MNIEJ INFORMACJI NIŻ KAŻDA Z
NICH Z OSOBNA

x1

x2

R2=0,25

x2

x1

R2=0,52

R2=0,66

Selekcja kandydatek ma na celu podzielenie ich na trzy grupy:
• zmienne wprowadzone do modelu
• zmienne nie wprowadzone do modelu, ale reprezentowane w nim przez
inne zmienne (możliwość wymiany)
• zmienne nie wprowadzone do modelu ze względu na fakt, że nie wnoszą
żadnej informacji o zmiennej Y
INFORMACJE potrzebne do selekcji: współczynniki r x i x j ,
Macierz współczynników korelacji
Y
Y
X1
X2
X3

0,52
0,64
- 0,21

X1
0,52
0,82
- 0,18

X2
0,64
0,82
0,08

X3
- 0,21
- 0,18
0,08

r yx

i

Przykład 32. Macierz powiązania
zmiennych ze sobą przedstawia
się następująco (n=20). Jak ją
można zinterpretować? Które
zmienne są powiązane ze sobą w
sposób istotny?

Matematyczne techniki zarządzania - 124
Testowanie istotności współczynnika korelacji
H0:  = 0

Można je przeprowadzić trzema testami: testem Studenta

H1:   0

(t), Fishera (F) i Wallace’a-Snedecora (R)

Fragment tablicy rozkładu Wallece’a-Snedecora (SKRYPT, tab. VII, s.161)
S to pn ie
sw ob od y

2
0,05
0,632
0,444
0,361

8
18
28

,

0,01
0,765
0,561
0,463

L iczb a zm ien n ych
3
0,05
0,01
0,726
0,827
0,532
0,633
0,439
0,530

4
0,05
0,777
0,587
0,490

0,01
0,860
0,678
0,573

Reguła decyzyjna: — jeżeli |Robl|>Rtabl, odrzucamy H0 (korelacja istotna)
— jeżeli |Robl|
W przykładzie 32, jeżeli przyjmiemy  = 0,05, to Rtabl = 0,444.
Y
Y
X1
X2
X3

0,52
0,64
- 0,21

X1
0,52
0,82
- 0,18

X2
0,64
0,82
0,08

X3
- 0,21
- 0,18
0,08

Pozostaną zatem tylko trzy
istotne powiązania:
y-x1, y-x2, x1-x2
BRAK ISTOTNEGO POWIĄZANIA Z Y NIE
OZNACZA, ŻE ZMIENNA NIE WNOSI
ŻADNEJ INFORMACJI O ZJAWISKU Y

Matematyczne techniki zarządzania - 125



Metody selekcji zmiennych objaśniających:
• grafowa
• Hellwiga (pojemności informacji)
• taksonomiczne (clustering)
Metoda grafowa
• obliczenie macierzy współczynników:

rx

i

xj

• wyłowienie z macierzy powiązań istotnych

, r yx

BUDOWA GRAFU
i

• graf spójny

• budowa grafu z powiązań istotnych
• wybranie zmiennych na podstawie grafu

x6

• graf zerowy
x1
x4

x9

DO MODELU WYBIERA SIĘ ZMIENNE:
• każdy graf zerowy (jeśli |ryx|>0,1)

istotne powiązanie

• po jednej reprezentantce grafu spójnego;

reprezentantką grafu jest zmienna, która ma najwięcej powiązań z
innymi kandydatkami
jeżeli kilka zmiennych ma tę samą maksymalną liczbę powiązań, wybiera
się z nich tę, która jest najsilniej powiązana za zmienną Y (max ryx)
jeżeli graf jest rozległy, może mieć dwie reprezentantki, ale muszą one
leżeć na przeciwległych stronach grafu

Matematyczne techniki zarządzania - 126
Przykład 32 cd. Wybierzemy
zmienną x2 (reprezentantka grafu
spójnego) i zmienną x3 (graf
zerowy)
Metoda Hellwiga

Y
Y
X1
X2
X3

0,52
0,64
- 0,21

• wypisujemy wszystkie możliwe kombinacje
kandydatek; jest ich K = 2m—1
• obliczamy pojemność informacji dla każdej
zmiennej w każdej kombinacji

h kl  f ( r yx , r x
i

ixj

)

• obliczamy pojemność całkowitą dla każdej
kombinacji
H l   h kl
k

• wybieramy kombinację o największej
pojemności Hl = max

X1
0,52
0,82
- 0,18

X2
0,64
0,82

X3
- 0,21
- 0,18
0,08

0,08

W przykładzie 32 mamy 7
możliwych kombinacji kandydatek:
1. x1
2. x2

3. x3

maximum:

H6 = 0,42

4. x1,x2
5. x1,x3

Hmax = R2

6. x2,x3
7. x1,x2,x3

Metody taksonomiczne
Taksonomia wrocławska (cluster analysis) to metoda grupowania obiektów (zmiennych) w grupy jednorodne pod względem n cech (wymiarów)
łącznie. Podstawą grupowania jest odległość euklidesowa, która w przypadku zmiennych d ij  f ( r x x )
WSZYSTKIE METODY TO SELEKCJA WSTĘPNA
i

j

Matematyczne techniki zarządzania - 127
ETAP 4. ESTYMACJA PARAMETRÓW MODELU
Cel etapu: wyznaczenie parametrów strukturalnych i stochastycznych
Estymacja: szacowanie parametrów populacji na podstawie próbki
Metody estymacji: analiza regresji i korelacji (KMNK i inne)

Założenia dla KMNK
1. Zmienne losowe są prawdziwymi zmiennymi, nie powiązanymi ze sobą
2. Składnik losowy  ma stałą wariancję, niezależną od zmiennej x lub t
3. Wartości reszt ui są niezależne od siebie

4. Składnik losowy  nie jest powiązany ze zmienną objaśniającą
Skutki niedotrzymania założeń i środki zaradcze
1. Model bez sensu, nieprzydatny; niekiedy absurdalny (źle uwarunkowane
dane)
Stosuje się: dużą próbkę (n>100), regresję grzbietową (ridge regression)
2.

Y

reszta ui

Lewa część zbioru ma dużą wariancję, a
prawa — wariancję małą
Stosuje się specjalny wariant MNK z
korektą na różne wariancje
X

Matematyczne techniki zarządzania - 128
3. Jeśli reszty ui są ze sobą powiązane (skorelowane), mówimy, że
występuje autokorelacja składnika losowego (zjawisko występuje przy
szeregach czasowych — sztywny porządek obserwacji)
Oznacza to, że istnieje istotna zależność u t  f ( u t  k )
Przyczyny autokorelacji: zakłócenia
(dodatnie lub ujemne) w jednym okresie
wpływają na poziom zjawiska w następnych
okresach (rolnictwo, produkcja, rynek)

t  1 , 2 ,...

u t  y t  yˆ t

u t 1

u1
u2
u3
u4
u5

Występowanie autokorelacji powoduje
nieprzydatność modelu


u1
u2
u3
u4

Istnienie autokorelacji sprawdza się testem
Durbina-Watsona d
Stosuje się metodę różniczki zupełnej

y  f (x )

yt  yt  ytk

4. Składnik losowy jest skorelowany ze zmienną objaśniającą, wtedy
gdy została pominięta jakaś ważna zmienna-przyczyna

Model taki nie ma żadnej wartości; trzeba dbać o jak najwyższy współczynnik determinacji (R2>0,9)
• zbiór danych rzeczywistych nigdy
nie spełnia tych wymagań

ESTYMACJĘ MODELU POWTARZA SIĘ WIELOKROTNIE
ponieważ dopiero weryfikacja zapewnia ostateczną selekcję
kandydatek na zmienne objaśniające

• ekonometria to analiza danych nie
spełniających tych założeń
• nie stosować statystyki bezmyślnie (na ślepo)

Matematyczne techniki zarządzania - 129
ETAP 5. WERYFIKACJA MODELU
Cele:

1. opis rzeczywistości (populacji generalnej)



2. dokładna (ostateczna) selekcja zmiennych objaśniających
3. poznanie składnika losowego (spełnienie założeń KMNK)
Narzędzia: hipotezy i testy statystyczne

Metodyka: każde równanie oddzielnie; weryfikacja obejmuje 9 etapów (od
najmniej do najbardziej pracochłonnego)
WYKAZ ETAPÓW WERYFIKACJI MODELU
I.
II.

Badanie istotności korelacji
Badanie wyrazistości modelu

III.

Badanie istotności parametrów

IV.

Badanie symetrii skł. losowego

V.
VI.
VII.
VIII.
IX.

Badanie losowości skł. losowego
Badanie stacjonarności skł. los.
Badanie wartości oczekiwanej skł. los.
Badanie autokorelacji skł. losowego
Badanie normalności skł. losowego

Opis każdego etapu weryfikacji
obejmuje:
• cel etapu
• sposób weryfikacji: wzory,
hipotezy, testy
• podanie których modeli dotyczy (przyczynowo-skutkowych
czy tendencji rozwojowej)
• podanie której postaci modeli
nieliniowych dotyczy (pierwotnej czy transformaty)

Matematyczne techniki zarządzania - 130
Etap I. Badanie istotności korelacji
7
2

8

9

11

12

17

19

23

21

5
2 etapu
9
16
7
9
15
14
Celem
jest
sprawdzenie,
czy
istnieje w populacji generalnej powiązanie pomiędzy zmienną Y i wszystkimi zmiennymi objaśniającymi

25

Przedział ufności dla
nieznanego współczynnika korelacji  dla populacji buduje się przy
użyciu błędu

populacja

zmienna Y

20
15
10

próbka

5
0
8
5

0 9

1011

2

9

20
12

30
17
16
7
zmienna X

25

1940
9

23 50
15

populacja

20

zmienna Y

7
2

15
10

próbka

5
0
0

10

20

30

zmienna X

40

50

21
14

sR 

1 R

0

Robl

2

nk

Istotność korelacji weryfikuje się przez postawienie
następujących hipotez dla
współczynnika korelacji dla
populacji generalnej:

1
R,|r|

H0 :   0

Brak korelacji, nie ma powiązania...

H1 :   0

Korelacja istotna, jest powiązanie...

,

Matematyczne techniki zarządzania - 131
Hipotezy te można weryfikować trzema równoważnymi testami:
• testem t Studenta (tylko dla regresji dwu zmiennych)
• testem F Fishera-Snedecora
• testem R Wallace’a-Snedecora

,

W każdym przypadku obliczamy wartość
statystyki dla próbki (tobl, Fobl, Robl) i porównujemy z wartością krytyczną odczytaną z tablicy odpowiedniego rozkładu w
funkcji poziomu istotności i liczby stopni
swobody (ttabl, Ftabl, Rtabl)

Reguła decyzyjna:
• jeżeli |tobl|< ttabl, nie ma podstaw do odrzucenia H0 (brak korelacji)
• jeżeli |tobl|> ttabl, odrzucamy H0 na korzyść H1 (korelacja istnieje)

TAK SAMO DLA
FiR

W przypadku regresji wielorakiej, gdy liczba zmiennych objaśniajacych
jest duża w porównaniu do liczby obserwacji, współczynnik determinacji
R2 może dawać zawyżoną ocenę stopnia wyjaśnienia zmienności zmiennej
objaśnianej; dlatego wprowadzono skorygowany współczynnik determinacji (i korelacji):
 ( yˆ i  y )

R

2

2

k
n

k

1


2
nk 1
(
y

y
)

i
n1

• adjusted coefficient of multiple
determination (wydruki komputerowe)

• jeśli k jest małe, nie ma większej różnicy
pomiędzy normalnym a skorygowanym R2

Matematyczne techniki zarządzania - 132
Skąd wziąć wartość odpowiedniej statystyki dla próbki i jak odczytywać jej wartości z tablic?
n2
r
t

r

t tabl  t  / 2 { n  2 }
TEST STUDENTA
obl
2
sr
1 r

F obl 

TEST FISHERA

Ź ró d ło z m ien n o śc i

MSTR
MSE



R

nk

2

1 R

2

L ic zb a sto p n i
sw o b o d y

Suma
k w a d ra tó w

Ś re d n i
k w a d ra t

M o d el (c z yn n ik i)
B łą d (re sz ta )

k1
nk

SSTR
SSE

MSTR
MSE

R azem

n1

SSTO

TEST WALLACE’A

R obl 

R

2

k 1

F tabl  F { k  1 , n  k }

S ta ty sty k a
F
F obl 

MSTR
MSE

NIE MYLIĆ
STOPNI SWOBODY LICZNIKA I MIANOWNIKA

R tabl  R { k , n  k }

Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

Matematyczne techniki zarządzania - 133
Odczyt Rtabl z tablicy testu R (SKRYPT s.161-162)

, k,  = n-k

S to pn ie
sw ob od y
8
18
28

2
0,05
0,632
0,444
0,361

0,01
0,765
0,561
0,463

L iczb a zm ien n ych
3
0,05
0,01
0,726
0,827
0,532
0,633
0,439
0,530

4
0,05
0,777
0,587
0,490

0,01
0,860
0,678
0,573

Wnioski dotyczące rozkładu R Wallace’a-Snedecora:
• tablica zawiera maksymalne wartości współczynnika korelacji w danej
sytuacji, jakich można oczekiwać, gdy nie ma korelacji w populacji
• im wyższy poziom istotności, tym niższe Rtabl

• im większa liczba zmiennych w modelu, tym wyższe Rtabl
• im wyższa liczba stopni swobody (większa próbka), tym niższe Rtabl
• tablica R powstała z przeliczenia tablic t oraz F (odwrócenie wzorów)
• tablica testu R jest najszybszym i nawygodniejszym narzędziem do
weryfikacji istotności korelacji

Werdykt z etapu I:

Matematyczne techniki zarządzania - 134

• jeżeli Robl>Rtabl, model jest poprawny, można przejść do etapu II
• jeżeli Roblzmiennych objaśniających albo jego postać matematyczną
ETAP I OBOWIĄZUJE DLA WSZYSTKICH MODELI
ETAP I PRZEPROWADZA SIĘ DLA TRANSFORMATY (dla postaci pierwotnej
można uzyskać R>1)
Rola współczynnika determinacji R2
• korelacja może być istotna przy małym R i bardzo małym R2 (r=0,4,
R2=0,16, co oznacza, że tylko 16% zmienności zmiennej Y jest
wyjaśnione przez zmienną objaśniającą)
• małe R2 oznacza niski stopień wyjaśnienia rzeczywistości i stanowi
zagrożenie dla modelu
• należy dążyć (poprzez odpowiedni dobór zmiennych-przyczyn i postaci
matematycznej modelu) do jak największego R2 (dla postaci pierwotnej)
• wysoka wartość R2 świadczy o dobrym poznaniu badanego zjawiska
• wysoka wartość R2 bardzo często wynika jednak ze złego dobrania
zmiennych objaśniających (silnie powiązane ze sobą — „masło maślane”)
KORELACJA POZORNA — jest zależność, ale jej nie ma? Przyczyny...
Trzeba unikać wartości bezwzględnych (ludność, liczba sklepów, wielkość produkcji)

6

9

12

8

11

12

11

15

9

18

9

11

11

18

15

Matematyczne techniki zarządzania - 135
Etap II. Badanie wyrazistości modelu
Y

Wyrazistość modelu dana jest wzorem

s( y )

ui

y

W obl 

s( y )

100 %

y

Celem etapu
jest kontrola
rozrzutu danych

Współczynnik Wobl<30%, w przeciwnym
przypadku rozrzut danych jest zbyt duży

y

Kłopoty: gdyy jest bliskie 0

x

X

Werdykt: model poprawny lub niepoprawny

ETAP II OBOWIĄZUJE DLA WSZYSTKICH MODELI (ale nie ma on charakteru
statystycznego)

ETAP II PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ (sprawdzamy, czy
nie występuje silny efekt „krzywego lustra”)
Etap III. Badanie istotności parametrów (współczynników) modelu
Celem etapu jest sprawdzenie:
• czy poszczególne zmienne objaśniające mają istotny wpływ na zmienną
objaśnianą?
• czy zmienne objaśniające są wybrane prawidłowo?

• czy wyraz wolny różni się istotnie od zera?

Matematyczne techniki zarządzania - 136
Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

Problem istotności parametrów ai można rozpatrywać (tak jak problem
średniej dla populacji) z dwu punktów widzenia:
• przedziału ufności dla nieznanej wartości i

• hipotez — zerowej H0: i=0 i alternatywnej H1: i 0

1
0

ai

1

i

ISTOTNY (W PRZEDZIALE NIE MA ZERA)

0

ai

i

NIEISTOTNY (W PRZEDZIALE JEST ZERO)

P ( a i  t / 2 { n  k } s ( a i )   i  a i  t / 2 { n  k } s ( a i )  1  

Z tablicy rozkładu Studenta, a nie z wydruku komputerowego!

Matematyczne techniki zarządzania - 137
Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

W praktyce posługujemy się raczej hipotezami:
Badanie istotności przeprowadza
się dla każdego i oddzielnie:

t obl ( a i ) 

ai  0
s(a i )

t tabl  t  / 2 { n  k }

• jeżeli |tobl(ai)|>ttabl(ai), odrzucamy hipotezę zerową; parametr jest istotny z błędem równym co najwyżej 
• jeżeli |tobl(ai)|parametr nie jest istotny
Praktycznie jest to bardzo łatwe:
• sprawdzamy, czy |t(ai)| jest większe czy mniejsze od około 2, a najlepiej
• porównujemy rzeczywisty poziom istotności P(ai) z przyjętym 
ODRZUCAMY H0, JEŻELI P(ai) JEST MNIEJSZE OD 

WTEDY ZMIENNA
Xi MA WPŁYW NA
ZMIENNĄ Y

Matematyczne techniki zarządzania - 138
W etapie III następuje ostateczna selekcja zmiennych objaśniających:
• jeżeli wszystkie ai okażą się istotne, model jest poprawny:
— model przyczynowo-skutkowy: do interpretacji
— model tendencji rozwojowej: do etapu IV
• jeżeli choć jedno ai okaże się nieistotne, model jest niepoprawny i wymaga poprawy przez usunięcie nieistotnych zmiennych:
— zmienne należy usuwać po jednej (ze względu na efekt katalityczny)
— usuwa się zawsze zmienną o najniższej wartości |t(ai)| [czyli o
najwyższej wartości P(ai)]
— usunięcie ostatniej zmiennej nieistotnej kończy proces selekcji
kandydatek na zmienne,

— selekcja nie jest ostateczna, gdyż zawsze istnieje możliwość zamiany zmiennych, które są powiązane ze sobą
Praktyczne znaczenie istotności wyrazu wolnego a0
To są jedne z możliwości dla populacji (p. plansza 106)

Y

W przypadku funkcji K=f(P) wyraz wolny wyznacza poziom kosztów stałych (rachunkowość zarządcza)
W przypadku zależności technicznej Q=f(h) wyraz
wolny oznacza, że przy miąższości pokładu h=0 wydajność produkcji Q też jest równa 0

0
X

Matematyczne techniki zarządzania - 139
Praktyczne znaczenie istotności współczynnika regresji ai



KRZYWE NEYMANA — PLANSZE 106-107
WSPÓŁCZ. ISTOTNY
WSPÓŁ. NIEISTOTNY

ETAP III OBOWIĄZUJE DLA WSZYSTKICH MODELI
ETAP III PRZEPROWADZA SIĘ DLA TRANSFORMATY
Etap IV. Badanie symetrii składnika losowego

Y

CZĘSTOŚĆ RESZT DODATNICH I UJEMNYCH MA BYĆ
ZBLIŻONA

Y

ASYMETRYCZNY
SYMETRYCZNY

t
t
Badanie symetrii przeprowadza się testem Studenta (St. Bartosiewicz
Ekonometria)
Brak symetrii wymaga zmiany matematycznej postaci modelu
ETAP IV OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ

ETAP IV PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ

Matematyczne techniki zarządzania - 140
Etap V. Badanie losowości składnika losowego

Y

Y
NIELOSOWY

LOSOWY

t
t
Badanie losowości przeprowadza się testem Studenta lub testem serii
(Ekonometria, praca zb. pod red. M. Krzysztofiaka)
Brak losowości wymaga zmiany matematycznej postaci modelu
ETAP V OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP V PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ
Etap VI. Badanie stacjonarności składnika losowego
W etapie tym chodzi o niezależność wariancji składnika losowego od
zmiennej objaśniającej t (plansza 127)

Bada się istotność współczynnika korelacji ru t , t
ETAP VI OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VI PRZEPROWADZA SIĘ DLA TRANSFORMATY

Matematyczne techniki zarządzania - 141
Etap VII. Badanie wartości oczekiwanej składnika losowego
Normalnie, gdy przeprowadzamy estymację postaci liniowej, parametry
składnika losowego E ( )  0
{ ui  0}
V ( )  const
Po retransformacji do postaci pierwotnej mamy nowe reszty u’, dla
których
'
'
ui  0
 ui  0
Celem etapu jest sprawdzenie, czy odchyłka od O nie jest zbyt duża
(służy do tego test Studenta)
ETAP VII OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VII PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ
Etap VIII. Badanie autokorelacji składnika losowego
Pojęcie autokorelacji opisano na planszy 128; chodzi o istotność korelacji ru , u
t

tk

Badanie autokorelacji można przeprowadzić:

• testem R istotności korelacji ru

t

,ut  k

d obl

• testem Durbina-Watsona
NIE MA AUTOK.

d1

?

d2 JEST AUTOKORELACJA

ETAP VIII OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VIII PRZEPROWADZA SIĘ DLA TRANSFORMATY

Matematyczne techniki zarządzania - 142
Etap IX. Badanie normalności składnika losowego
Celem etapu jest stwierdzenie, czy reszty mają rozkład normalny
Analiza reszt — oddzielny dział analizy regresji i korelacji
Jeżeli reszty mają rozkład normalny, statystyk otrzymuje „ulgi”
ETAP 6. PRAKTYCZNA INTERPRETACJA MODELU



Celem etapu jest wydobycie z modelu całej nowej wiedzy, której nie widać
„gołym okiem”
INTERPRETUJĄC MODEL (RÓWNANIE REGRESJI) NALEŻY UŻYWAĆ WYŁĄCZNIE
PROSTEJ TERMINOLOGII EKONOMICZNEJ ZROZUMIAŁEJ DLA KLIENTA
NIE NALEŻY UŻYWAĆ TERMINOLOGII MATEMATYCZNEJ ZROZUMIAŁEJ TYLKO DLA
TWÓRCÓW MODELU
INTERPRETOWAĆ WOLNO TYLKO MODEL ZWERYFIKOWANY
CAŁY TRUD MODELOWANIA NIE MOŻE BYĆ „SZTUKĄ DLA SZTUKI”, LECZ MA
SŁUŻYĆ UZYSKANIU KONKRETNYCH WNIOSKÓW PRAKTYCZNYCH

Interpretacja modelu przyczynowo-skutkowego

Polega ona na określeniu wpływu poszczególnych czynników na badane
zjawisko:
• podział wszystkich czynników na trzy grupy

Matematyczne techniki zarządzania - 143
A — czynniki nie mające wpływu na Y
B — czynniki mające wpływ na Y i wprowadzone do modelu
C — czynniki mające wpływ na Y, ale nie występujące w modelu
• ocena jakościowa wpływu czynników B i C
• ocena ilościowa wpływu czynników B i C
Ocena jakościowa



Na podstawie znaków stojących przy współczynnikach r oraz ai możemy
stwierdzić, że wpływ jest:

• dodatni (im lepsze zaliczenie, tym lepszy wynik egzaminu; im więcej
wydatków na reklamę, tym większy zysk; itd.)
• ujemny (im więcej zatrudnionych, tym gorszy wynik finansowy; im
mniej braków, tym wyższy zysk; im mniejsza absencja, tym wyższe
wynagrodzenie; itd.)

Ocena ilościowa
• model liniowy
Przykład 33. Zinterpretuj zweryfikowany model zależności miesięcznych
kosztów działalności przedsiębiorstwa (tys. zł) od wielkości produkcji
(sztuk) i liczby reklamacji:
y i  50 , 8  14 , 5 x 1  3 , 9 x 2  

Matematyczne techniki zarządzania - 144
a0 = 50,8

poziom kosztów stałych; jeśli firma nie będzie prowadzić
żadnej działalności, poniesie koszty w wysokości 50,8 tys. zł

a1 = 14,5

każda sztuka produktu firmy kosztuje ją przeciętnie 14,5
tys. zł; jeżeli firma zwiększy produkcję o 2 sztuki, koszty
wzrosną o 29,0 tys. zł

a2 = 3,9każda wniesiona reklamacja powiększa koszty przeciętnie o
3,9 tys. zł
• model potęgowy
Przykłąd 34. Zinterpretuj zweryfikowaną funkcję produkcji Cobba-Douglasa
0 , 65

Pi  45 , 2 M i

0 , 73

Zi

e

0 , 04



Funkcja produkcji to specjalny model, określający zależność pomiędzy
produkcją (P) a czynnikami produkcji: majątkiem trwałym (M) i nakładami
robocizny (Z).



Funkcje produkcji to modele umożliwiające „prześwietlenie”
przedsiębiorstwa (szereg czasowy) lub branży (dane przekrojowe) i określenie poziomu gospodarowania oraz postępu
technicznego i organizacyjnego.
Elastyczność  to współczynnik określający reakcję zmiany
jednej zmiennej na inną zmienną — na przykład elastyczność
cenowa popytu (jak popyt zmienia się wraz z ceną towaru).

EKSPERCI
ZACHODNI

Matematyczne techniki zarządzania - 145

 

y
y

:

x

FUNKCJA POTĘGOWA JEST JEDYNĄ FUNKCJĄ O STAŁEJ ELASTYCZNOŚCI

x

Izolinie funkcji produkcji

T1
M

Produkcję P można osiągnąć różnymi
kombinacjami majątku i robocizny:

T2

• T1— technika kapitałochłonna, np.
pełna automatyzacja
• T2 — pośredni poziom techniki

T3
P  const

• T3 — niski poziom techniki, produkcja
pracochłonna
P. LOWE

Z
Efekt poprawy zarządzania bez
zmiany techniki (lepsze wykorzystanie ludzi i sprzętu):

P2
M

ZARZĄDZANIE
TECHNOLOGIĄ

P1

T

• zmniejszenie kapitałochłonności

• zmniejszenie pracochłonności
• zwiększenie produkcji (przejście z
funkcji P1 na P2)

Można też rozpatrzyć łączne efekty
zmiany techniki i zarządzania

Z

Matematyczne techniki zarządzania - 146
Wszystkie informacje tego typu można odczytać w trakcie interpretacji
0 , 65
0 , 73 0 , 04
funkcji produkcji:
Pi  45 , 2 M i
Zi
e

• wartości 45,2 nie interpretuje się
• wartość 0,65 to współczynnik elastyczności majątkowej (kapitałowej)
produkcji: zmiana majątku o 10% daje średnio zmianę produkcji o 6,5%
• wartość 0,73 to współczynnik elastyczności zatrudnieniowej produkcji:
zmiana zatrudnienia o 10% daje zmianę produkcji średnio o 7,3%
• suma obu współczynników k=0,65+0,73=1,38 to współczynnik skali
produkcji:

— jeżeli k<1, to firma rozwija się ekstensywnie
— jeżeli k>1, to firma rozwija się intensywnie
• wartość  = 0,04 to współczynnik postępu organizacyjnego:
— jeżeli  >O, to miał miejsce postęp organizacyjny

— jeżeli  <0, to miał miejsce regres organizacyjny
Interpretacja modelu tendencji rozwojowej

DODAMY
TROCHĘ
TEORII

Przypomnienie: t — zmienna objaśniająca (stałe przyrosty)
y — zmienna objaśniana; rozdzielana w ogólności na trzy
części: trend, wahania okresowe, wahania losowe ()

Matematyczne techniki zarządzania - 147
Wykres z planszy 117 (zużycie energii elektrycznej przez WZ AGH)
WAHANIA OKRESOWE OKREŚLA SIĘ WZGLĘDEM TRENDU A
NIE WZGLĘDEM OSI CZASU

y

trend

t
1995

1996

1997

1998

1999

Te trzy części trzeba zidentyfikować, a potem złożyć razem w model:

• addytywny (jeśli amplituda wahań jest stała)
• multiplikatywny (jeśli amplituda wahań rośnie lub maleje regularnie)
Wyznaczanie trendu
Metody mechaniczne:

• wskaźniki bezwzględne (stały przyrost =
postęp arytmetyczny = funkcja liniowa)
• wskaźniki względne (przyrost o stały procent =
postęp geometryczny = funkcja potęgowa)
• średnia ruchoma (wygładzanie danych linią łamaną)

JAK OBLICZYĆ O
ILE PROCENT ROCZNIE SPADAŁA
ŚREDNIO LICZBA
WIDZÓW W
KINACH:
1982 - 193,7 MLN
1989 - 141,3 MLN

Matematyczne techniki zarządzania - 148
Średnia ruchoma: mając szereg czasowy y1, y2,....., yn, przyjmujemy
długość kroku k = 3, lub 5, lub 7 itd. i liczymy
y  ...  y k
y  ...  y k  1
y k / 2 0 ,5  1
a następnie y k / 2  1 , 5  2
itd.
k
k
y  y2  y3
y  y3  y4
dla k=3:
y2  1
y3  2
itd.
3
3
Przykład 35. Wyznacz trend metodą średniej ruchomej dla następujących
danych:
okres
t
wartość yt

1
5

2
4

3
7

4
6

5
8

12

y2 
10

y3 

y

8

y4 

6
4

y5 

2

y6 

0
0

1

2

3

4

5

czas, t

6

7

8

9

y7 

547

6
10

 5 , 67

CECHY
ŚREDNIEJ
RUCHOMEJ:

 7 , 00

• TRACI SIĘ
k-1 DANYCH

3
768

8
8

 5 , 33

3
476

7
9

3
6  8  10

 8 , 00

3
8  10  9

 9 , 00

3
10  9  8

 9 , 00

• IM
WIĘKSZE k,
TYM
BARDZIEJ
SZTYWNY
TREND

3

Metody statystyczne: analiza regresji i korelacji, różne funkcje oparte na
modelach ekonomii

Matematyczne techniki zarządzania - 149
Wyznaczanie wahań okresowych: dobowych, tygodniowych, miesięcznych,
kwartalnych, rocznych, wieloletnich
Trzy metody:

— metoda wskaźników sezonowości
— metoda zmiennych zero-jedynkowych (0-1)

— metoda harmoniczna
Wszystkie metody mają jeden cel:
uzyskanie przeciętnego obrazu jednego cyklu

+

Ws
[t ]
[%]
trend

I

II



III

IV

WADY:
• KONIECZNOŚĆ
KOREKTY
• BRAK
WERYFIKACJI
STATYSTYCZNEJ

Metoda wskaźników sezonowości

• obliczenie surowych wskaźników sezonowości (wyeliminowanie trendu):
y

S s  yt  yt
S s  t
yt
addytywny multiplikatywny
wynik: n wartości odchyleń od trendu

• obliczenie oczyszczonych wskaźników
sezonowości (wyeliminowanie wahań
losowych):
 Ss
So 
k-liczba okresów
k
jednoimiennych
m-długość cyklu wynik: m wartości śr. odchyleń od trendu

Matematyczne techniki zarządzania - 150
Metoda zmiennych zero-jedynkowych (0-1)
m

y t  a 0  a1 t   bi Q i  
i 1

bi — przeciętne odchylenie od trendu dla
okresu i-tego
Qi — zmienna 0-1

wahania losowe
trend

wahania okresowe

t
1
2
3
4
5
6
7
8
9

yt
y1
y2
y3
y4
y5
y6
y7
y8
y9

Q1
1
0
0
0
1
0
0
0
1

Q2
0
1
0
0
0
1
0
0
0

Q3
0
0
1
0
0
0
1
0
0

Q4
0
0
0
1
0
0
0
1
0

Metoda harmoniczna (szeregi Fouriera)
Wahania okresowe przedstawia się jako sumę określonej liczby drgań harmonicznych (sinusoid i cosinusoid) przesuniętych w fazie, lecz o jednakowym okresie
m /2
2 i m / 2
2 i
y t  a 0  a 1 t   b1 i sin
  b 2 i cos

m
m
i 1
i 1
Obie metody dają taki sam wynik, istnieje możliwość weryfikacji
statystycznej
W metodzie 0-1 dostajemy bi = Ws, natomiast w metodzie harmonicznej Ws
jest sumą wartości poszczególnych sinusoid dla danego momentu czasu


Slide 8

Matematyczne techniki zarządzania - 121
ETAP 2. GROMADZENIE DANYCH STATYSTYCZNYCH

!

ZA JAKOŚĆ DANYCH ODPOWIADA MODELUJĄCY
• rodzaje danych: dane przekrojowe i szeregi czasowe
• źródła danych: roczniki statystyczne, różne działy
przedsiębiorstwa, badania marketingowe, wywiady itd.
• wiarygodność danych: do jakiego celu zostały one
przygotowane?

MUSISZ
SPRAWDZAĆ
KAŻDE DANE

• porównywalność danych: inflacja (ceny bieżące a ceny
stałe), zmiany procesów technicznych
Wielkość
produkcji

• zmienność zjawisk: trzeba sprawdzić, czy
wybrana w etapie 1a zmienna jest rzeczywiście zmienną losową

Wx 

s( x )

nowy zakład

100 %

x

stary zakład

Wx musi wynosić co najmniej 30-40%
Wiek studenta może być dobrą zmiennąprzyczyną, ale nie w przypadku studiów
dziennych!

Zatrudnienie

Matematyczne techniki zarządzania - 122
ETAP 3. SELEKCJA ZMIENNYCH OBJAŚNIAJĄCYCH
KAŻDĄ ZMIENNĄ X WYTYPOWANĄ W ETAPIE 1a TRAKTUJEMY JAKO
KANDYDATKĘ NA ZMIENNĄ OBJAŚNIAJĄCĄ
Może być kilka przyczyn powodujących, że taka kandydatka nie może znaleźć się w modelu ekonometrycznym (w równaniu regresji):
• w modelu nie może być zbyt wielu zmiennych (nieczytelny)
• kandydatka może nie mieć wpływu na zmienną Y



• kandydatka może wnosić prawie tę samą informację o Y co inna
kandydatka

• dwie bardzo podobne kandydatki mogą sobie nawzajem przeszkadzać
(efekt katalityczny)
Kryteria, jakie musi spełniać kandydatka Xi, aby nadawała się do modelu:
• musi być silnie powiązana ze zmienną Y

• nie może być powiązana z inną kandydatką Xj
SSTO
x1
x4

x2
x3

reszta

R2=0,79

R2=0,66

x2
x1
x4

R2=0,48

x3
reszta

reszta

SSTO

SSTO

Matematyczne techniki zarządzania - 123
Efekt katalityczny
DWIE ZMIENNE DAJĄ
RAZEM MNIEJ INFORMACJI NIŻ KAŻDA Z
NICH Z OSOBNA

x1

x2

R2=0,25

x2

x1

R2=0,52

R2=0,66

Selekcja kandydatek ma na celu podzielenie ich na trzy grupy:
• zmienne wprowadzone do modelu
• zmienne nie wprowadzone do modelu, ale reprezentowane w nim przez
inne zmienne (możliwość wymiany)
• zmienne nie wprowadzone do modelu ze względu na fakt, że nie wnoszą
żadnej informacji o zmiennej Y
INFORMACJE potrzebne do selekcji: współczynniki r x i x j ,
Macierz współczynników korelacji
Y
Y
X1
X2
X3

0,52
0,64
- 0,21

X1
0,52
0,82
- 0,18

X2
0,64
0,82
0,08

X3
- 0,21
- 0,18
0,08

r yx

i

Przykład 32. Macierz powiązania
zmiennych ze sobą przedstawia
się następująco (n=20). Jak ją
można zinterpretować? Które
zmienne są powiązane ze sobą w
sposób istotny?

Matematyczne techniki zarządzania - 124
Testowanie istotności współczynnika korelacji
H0:  = 0

Można je przeprowadzić trzema testami: testem Studenta

H1:   0

(t), Fishera (F) i Wallace’a-Snedecora (R)

Fragment tablicy rozkładu Wallece’a-Snedecora (SKRYPT, tab. VII, s.161)
S to pn ie
sw ob od y

2
0,05
0,632
0,444
0,361

8
18
28

,

0,01
0,765
0,561
0,463

L iczb a zm ien n ych
3
0,05
0,01
0,726
0,827
0,532
0,633
0,439
0,530

4
0,05
0,777
0,587
0,490

0,01
0,860
0,678
0,573

Reguła decyzyjna: — jeżeli |Robl|>Rtabl, odrzucamy H0 (korelacja istotna)
— jeżeli |Robl|
W przykładzie 32, jeżeli przyjmiemy  = 0,05, to Rtabl = 0,444.
Y
Y
X1
X2
X3

0,52
0,64
- 0,21

X1
0,52
0,82
- 0,18

X2
0,64
0,82
0,08

X3
- 0,21
- 0,18
0,08

Pozostaną zatem tylko trzy
istotne powiązania:
y-x1, y-x2, x1-x2
BRAK ISTOTNEGO POWIĄZANIA Z Y NIE
OZNACZA, ŻE ZMIENNA NIE WNOSI
ŻADNEJ INFORMACJI O ZJAWISKU Y

Matematyczne techniki zarządzania - 125



Metody selekcji zmiennych objaśniających:
• grafowa
• Hellwiga (pojemności informacji)
• taksonomiczne (clustering)
Metoda grafowa
• obliczenie macierzy współczynników:

rx

i

xj

• wyłowienie z macierzy powiązań istotnych

, r yx

BUDOWA GRAFU
i

• graf spójny

• budowa grafu z powiązań istotnych
• wybranie zmiennych na podstawie grafu

x6

• graf zerowy
x1
x4

x9

DO MODELU WYBIERA SIĘ ZMIENNE:
• każdy graf zerowy (jeśli |ryx|>0,1)

istotne powiązanie

• po jednej reprezentantce grafu spójnego;

reprezentantką grafu jest zmienna, która ma najwięcej powiązań z
innymi kandydatkami
jeżeli kilka zmiennych ma tę samą maksymalną liczbę powiązań, wybiera
się z nich tę, która jest najsilniej powiązana za zmienną Y (max ryx)
jeżeli graf jest rozległy, może mieć dwie reprezentantki, ale muszą one
leżeć na przeciwległych stronach grafu

Matematyczne techniki zarządzania - 126
Przykład 32 cd. Wybierzemy
zmienną x2 (reprezentantka grafu
spójnego) i zmienną x3 (graf
zerowy)
Metoda Hellwiga

Y
Y
X1
X2
X3

0,52
0,64
- 0,21

• wypisujemy wszystkie możliwe kombinacje
kandydatek; jest ich K = 2m—1
• obliczamy pojemność informacji dla każdej
zmiennej w każdej kombinacji

h kl  f ( r yx , r x
i

ixj

)

• obliczamy pojemność całkowitą dla każdej
kombinacji
H l   h kl
k

• wybieramy kombinację o największej
pojemności Hl = max

X1
0,52
0,82
- 0,18

X2
0,64
0,82

X3
- 0,21
- 0,18
0,08

0,08

W przykładzie 32 mamy 7
możliwych kombinacji kandydatek:
1. x1
2. x2

3. x3

maximum:

H6 = 0,42

4. x1,x2
5. x1,x3

Hmax = R2

6. x2,x3
7. x1,x2,x3

Metody taksonomiczne
Taksonomia wrocławska (cluster analysis) to metoda grupowania obiektów (zmiennych) w grupy jednorodne pod względem n cech (wymiarów)
łącznie. Podstawą grupowania jest odległość euklidesowa, która w przypadku zmiennych d ij  f ( r x x )
WSZYSTKIE METODY TO SELEKCJA WSTĘPNA
i

j

Matematyczne techniki zarządzania - 127
ETAP 4. ESTYMACJA PARAMETRÓW MODELU
Cel etapu: wyznaczenie parametrów strukturalnych i stochastycznych
Estymacja: szacowanie parametrów populacji na podstawie próbki
Metody estymacji: analiza regresji i korelacji (KMNK i inne)

Założenia dla KMNK
1. Zmienne losowe są prawdziwymi zmiennymi, nie powiązanymi ze sobą
2. Składnik losowy  ma stałą wariancję, niezależną od zmiennej x lub t
3. Wartości reszt ui są niezależne od siebie

4. Składnik losowy  nie jest powiązany ze zmienną objaśniającą
Skutki niedotrzymania założeń i środki zaradcze
1. Model bez sensu, nieprzydatny; niekiedy absurdalny (źle uwarunkowane
dane)
Stosuje się: dużą próbkę (n>100), regresję grzbietową (ridge regression)
2.

Y

reszta ui

Lewa część zbioru ma dużą wariancję, a
prawa — wariancję małą
Stosuje się specjalny wariant MNK z
korektą na różne wariancje
X

Matematyczne techniki zarządzania - 128
3. Jeśli reszty ui są ze sobą powiązane (skorelowane), mówimy, że
występuje autokorelacja składnika losowego (zjawisko występuje przy
szeregach czasowych — sztywny porządek obserwacji)
Oznacza to, że istnieje istotna zależność u t  f ( u t  k )
Przyczyny autokorelacji: zakłócenia
(dodatnie lub ujemne) w jednym okresie
wpływają na poziom zjawiska w następnych
okresach (rolnictwo, produkcja, rynek)

t  1 , 2 ,...

u t  y t  yˆ t

u t 1

u1
u2
u3
u4
u5

Występowanie autokorelacji powoduje
nieprzydatność modelu


u1
u2
u3
u4

Istnienie autokorelacji sprawdza się testem
Durbina-Watsona d
Stosuje się metodę różniczki zupełnej

y  f (x )

yt  yt  ytk

4. Składnik losowy jest skorelowany ze zmienną objaśniającą, wtedy
gdy została pominięta jakaś ważna zmienna-przyczyna

Model taki nie ma żadnej wartości; trzeba dbać o jak najwyższy współczynnik determinacji (R2>0,9)
• zbiór danych rzeczywistych nigdy
nie spełnia tych wymagań

ESTYMACJĘ MODELU POWTARZA SIĘ WIELOKROTNIE
ponieważ dopiero weryfikacja zapewnia ostateczną selekcję
kandydatek na zmienne objaśniające

• ekonometria to analiza danych nie
spełniających tych założeń
• nie stosować statystyki bezmyślnie (na ślepo)

Matematyczne techniki zarządzania - 129
ETAP 5. WERYFIKACJA MODELU
Cele:

1. opis rzeczywistości (populacji generalnej)



2. dokładna (ostateczna) selekcja zmiennych objaśniających
3. poznanie składnika losowego (spełnienie założeń KMNK)
Narzędzia: hipotezy i testy statystyczne

Metodyka: każde równanie oddzielnie; weryfikacja obejmuje 9 etapów (od
najmniej do najbardziej pracochłonnego)
WYKAZ ETAPÓW WERYFIKACJI MODELU
I.
II.

Badanie istotności korelacji
Badanie wyrazistości modelu

III.

Badanie istotności parametrów

IV.

Badanie symetrii skł. losowego

V.
VI.
VII.
VIII.
IX.

Badanie losowości skł. losowego
Badanie stacjonarności skł. los.
Badanie wartości oczekiwanej skł. los.
Badanie autokorelacji skł. losowego
Badanie normalności skł. losowego

Opis każdego etapu weryfikacji
obejmuje:
• cel etapu
• sposób weryfikacji: wzory,
hipotezy, testy
• podanie których modeli dotyczy (przyczynowo-skutkowych
czy tendencji rozwojowej)
• podanie której postaci modeli
nieliniowych dotyczy (pierwotnej czy transformaty)

Matematyczne techniki zarządzania - 130
Etap I. Badanie istotności korelacji
7
2

8

9

11

12

17

19

23

21

5
2 etapu
9
16
7
9
15
14
Celem
jest
sprawdzenie,
czy
istnieje w populacji generalnej powiązanie pomiędzy zmienną Y i wszystkimi zmiennymi objaśniającymi

25

Przedział ufności dla
nieznanego współczynnika korelacji  dla populacji buduje się przy
użyciu błędu

populacja

zmienna Y

20
15
10

próbka

5
0
8
5

0 9

1011

2

9

20
12

30
17
16
7
zmienna X

25

1940
9

23 50
15

populacja

20

zmienna Y

7
2

15
10

próbka

5
0
0

10

20

30

zmienna X

40

50

21
14

sR 

1 R

0

Robl

2

nk

Istotność korelacji weryfikuje się przez postawienie
następujących hipotez dla
współczynnika korelacji dla
populacji generalnej:

1
R,|r|

H0 :   0

Brak korelacji, nie ma powiązania...

H1 :   0

Korelacja istotna, jest powiązanie...

,

Matematyczne techniki zarządzania - 131
Hipotezy te można weryfikować trzema równoważnymi testami:
• testem t Studenta (tylko dla regresji dwu zmiennych)
• testem F Fishera-Snedecora
• testem R Wallace’a-Snedecora

,

W każdym przypadku obliczamy wartość
statystyki dla próbki (tobl, Fobl, Robl) i porównujemy z wartością krytyczną odczytaną z tablicy odpowiedniego rozkładu w
funkcji poziomu istotności i liczby stopni
swobody (ttabl, Ftabl, Rtabl)

Reguła decyzyjna:
• jeżeli |tobl|< ttabl, nie ma podstaw do odrzucenia H0 (brak korelacji)
• jeżeli |tobl|> ttabl, odrzucamy H0 na korzyść H1 (korelacja istnieje)

TAK SAMO DLA
FiR

W przypadku regresji wielorakiej, gdy liczba zmiennych objaśniajacych
jest duża w porównaniu do liczby obserwacji, współczynnik determinacji
R2 może dawać zawyżoną ocenę stopnia wyjaśnienia zmienności zmiennej
objaśnianej; dlatego wprowadzono skorygowany współczynnik determinacji (i korelacji):
 ( yˆ i  y )

R

2

2

k
n

k

1


2
nk 1
(
y

y
)

i
n1

• adjusted coefficient of multiple
determination (wydruki komputerowe)

• jeśli k jest małe, nie ma większej różnicy
pomiędzy normalnym a skorygowanym R2

Matematyczne techniki zarządzania - 132
Skąd wziąć wartość odpowiedniej statystyki dla próbki i jak odczytywać jej wartości z tablic?
n2
r
t

r

t tabl  t  / 2 { n  2 }
TEST STUDENTA
obl
2
sr
1 r

F obl 

TEST FISHERA

Ź ró d ło z m ien n o śc i

MSTR
MSE



R

nk

2

1 R

2

L ic zb a sto p n i
sw o b o d y

Suma
k w a d ra tó w

Ś re d n i
k w a d ra t

M o d el (c z yn n ik i)
B łą d (re sz ta )

k1
nk

SSTR
SSE

MSTR
MSE

R azem

n1

SSTO

TEST WALLACE’A

R obl 

R

2

k 1

F tabl  F { k  1 , n  k }

S ta ty sty k a
F
F obl 

MSTR
MSE

NIE MYLIĆ
STOPNI SWOBODY LICZNIKA I MIANOWNIKA

R tabl  R { k , n  k }

Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

Matematyczne techniki zarządzania - 133
Odczyt Rtabl z tablicy testu R (SKRYPT s.161-162)

, k,  = n-k

S to pn ie
sw ob od y
8
18
28

2
0,05
0,632
0,444
0,361

0,01
0,765
0,561
0,463

L iczb a zm ien n ych
3
0,05
0,01
0,726
0,827
0,532
0,633
0,439
0,530

4
0,05
0,777
0,587
0,490

0,01
0,860
0,678
0,573

Wnioski dotyczące rozkładu R Wallace’a-Snedecora:
• tablica zawiera maksymalne wartości współczynnika korelacji w danej
sytuacji, jakich można oczekiwać, gdy nie ma korelacji w populacji
• im wyższy poziom istotności, tym niższe Rtabl

• im większa liczba zmiennych w modelu, tym wyższe Rtabl
• im wyższa liczba stopni swobody (większa próbka), tym niższe Rtabl
• tablica R powstała z przeliczenia tablic t oraz F (odwrócenie wzorów)
• tablica testu R jest najszybszym i nawygodniejszym narzędziem do
weryfikacji istotności korelacji

Werdykt z etapu I:

Matematyczne techniki zarządzania - 134

• jeżeli Robl>Rtabl, model jest poprawny, można przejść do etapu II
• jeżeli Roblzmiennych objaśniających albo jego postać matematyczną
ETAP I OBOWIĄZUJE DLA WSZYSTKICH MODELI
ETAP I PRZEPROWADZA SIĘ DLA TRANSFORMATY (dla postaci pierwotnej
można uzyskać R>1)
Rola współczynnika determinacji R2
• korelacja może być istotna przy małym R i bardzo małym R2 (r=0,4,
R2=0,16, co oznacza, że tylko 16% zmienności zmiennej Y jest
wyjaśnione przez zmienną objaśniającą)
• małe R2 oznacza niski stopień wyjaśnienia rzeczywistości i stanowi
zagrożenie dla modelu
• należy dążyć (poprzez odpowiedni dobór zmiennych-przyczyn i postaci
matematycznej modelu) do jak największego R2 (dla postaci pierwotnej)
• wysoka wartość R2 świadczy o dobrym poznaniu badanego zjawiska
• wysoka wartość R2 bardzo często wynika jednak ze złego dobrania
zmiennych objaśniających (silnie powiązane ze sobą — „masło maślane”)
KORELACJA POZORNA — jest zależność, ale jej nie ma? Przyczyny...
Trzeba unikać wartości bezwzględnych (ludność, liczba sklepów, wielkość produkcji)

6

9

12

8

11

12

11

15

9

18

9

11

11

18

15

Matematyczne techniki zarządzania - 135
Etap II. Badanie wyrazistości modelu
Y

Wyrazistość modelu dana jest wzorem

s( y )

ui

y

W obl 

s( y )

100 %

y

Celem etapu
jest kontrola
rozrzutu danych

Współczynnik Wobl<30%, w przeciwnym
przypadku rozrzut danych jest zbyt duży

y

Kłopoty: gdyy jest bliskie 0

x

X

Werdykt: model poprawny lub niepoprawny

ETAP II OBOWIĄZUJE DLA WSZYSTKICH MODELI (ale nie ma on charakteru
statystycznego)

ETAP II PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ (sprawdzamy, czy
nie występuje silny efekt „krzywego lustra”)
Etap III. Badanie istotności parametrów (współczynników) modelu
Celem etapu jest sprawdzenie:
• czy poszczególne zmienne objaśniające mają istotny wpływ na zmienną
objaśnianą?
• czy zmienne objaśniające są wybrane prawidłowo?

• czy wyraz wolny różni się istotnie od zera?

Matematyczne techniki zarządzania - 136
Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

Problem istotności parametrów ai można rozpatrywać (tak jak problem
średniej dla populacji) z dwu punktów widzenia:
• przedziału ufności dla nieznanej wartości i

• hipotez — zerowej H0: i=0 i alternatywnej H1: i 0

1
0

ai

1

i

ISTOTNY (W PRZEDZIALE NIE MA ZERA)

0

ai

i

NIEISTOTNY (W PRZEDZIALE JEST ZERO)

P ( a i  t / 2 { n  k } s ( a i )   i  a i  t / 2 { n  k } s ( a i )  1  

Z tablicy rozkładu Studenta, a nie z wydruku komputerowego!

Matematyczne techniki zarządzania - 137
Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

W praktyce posługujemy się raczej hipotezami:
Badanie istotności przeprowadza
się dla każdego i oddzielnie:

t obl ( a i ) 

ai  0
s(a i )

t tabl  t  / 2 { n  k }

• jeżeli |tobl(ai)|>ttabl(ai), odrzucamy hipotezę zerową; parametr jest istotny z błędem równym co najwyżej 
• jeżeli |tobl(ai)|parametr nie jest istotny
Praktycznie jest to bardzo łatwe:
• sprawdzamy, czy |t(ai)| jest większe czy mniejsze od około 2, a najlepiej
• porównujemy rzeczywisty poziom istotności P(ai) z przyjętym 
ODRZUCAMY H0, JEŻELI P(ai) JEST MNIEJSZE OD 

WTEDY ZMIENNA
Xi MA WPŁYW NA
ZMIENNĄ Y

Matematyczne techniki zarządzania - 138
W etapie III następuje ostateczna selekcja zmiennych objaśniających:
• jeżeli wszystkie ai okażą się istotne, model jest poprawny:
— model przyczynowo-skutkowy: do interpretacji
— model tendencji rozwojowej: do etapu IV
• jeżeli choć jedno ai okaże się nieistotne, model jest niepoprawny i wymaga poprawy przez usunięcie nieistotnych zmiennych:
— zmienne należy usuwać po jednej (ze względu na efekt katalityczny)
— usuwa się zawsze zmienną o najniższej wartości |t(ai)| [czyli o
najwyższej wartości P(ai)]
— usunięcie ostatniej zmiennej nieistotnej kończy proces selekcji
kandydatek na zmienne,

— selekcja nie jest ostateczna, gdyż zawsze istnieje możliwość zamiany zmiennych, które są powiązane ze sobą
Praktyczne znaczenie istotności wyrazu wolnego a0
To są jedne z możliwości dla populacji (p. plansza 106)

Y

W przypadku funkcji K=f(P) wyraz wolny wyznacza poziom kosztów stałych (rachunkowość zarządcza)
W przypadku zależności technicznej Q=f(h) wyraz
wolny oznacza, że przy miąższości pokładu h=0 wydajność produkcji Q też jest równa 0

0
X

Matematyczne techniki zarządzania - 139
Praktyczne znaczenie istotności współczynnika regresji ai



KRZYWE NEYMANA — PLANSZE 106-107
WSPÓŁCZ. ISTOTNY
WSPÓŁ. NIEISTOTNY

ETAP III OBOWIĄZUJE DLA WSZYSTKICH MODELI
ETAP III PRZEPROWADZA SIĘ DLA TRANSFORMATY
Etap IV. Badanie symetrii składnika losowego

Y

CZĘSTOŚĆ RESZT DODATNICH I UJEMNYCH MA BYĆ
ZBLIŻONA

Y

ASYMETRYCZNY
SYMETRYCZNY

t
t
Badanie symetrii przeprowadza się testem Studenta (St. Bartosiewicz
Ekonometria)
Brak symetrii wymaga zmiany matematycznej postaci modelu
ETAP IV OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ

ETAP IV PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ

Matematyczne techniki zarządzania - 140
Etap V. Badanie losowości składnika losowego

Y

Y
NIELOSOWY

LOSOWY

t
t
Badanie losowości przeprowadza się testem Studenta lub testem serii
(Ekonometria, praca zb. pod red. M. Krzysztofiaka)
Brak losowości wymaga zmiany matematycznej postaci modelu
ETAP V OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP V PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ
Etap VI. Badanie stacjonarności składnika losowego
W etapie tym chodzi o niezależność wariancji składnika losowego od
zmiennej objaśniającej t (plansza 127)

Bada się istotność współczynnika korelacji ru t , t
ETAP VI OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VI PRZEPROWADZA SIĘ DLA TRANSFORMATY

Matematyczne techniki zarządzania - 141
Etap VII. Badanie wartości oczekiwanej składnika losowego
Normalnie, gdy przeprowadzamy estymację postaci liniowej, parametry
składnika losowego E ( )  0
{ ui  0}
V ( )  const
Po retransformacji do postaci pierwotnej mamy nowe reszty u’, dla
których
'
'
ui  0
 ui  0
Celem etapu jest sprawdzenie, czy odchyłka od O nie jest zbyt duża
(służy do tego test Studenta)
ETAP VII OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VII PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ
Etap VIII. Badanie autokorelacji składnika losowego
Pojęcie autokorelacji opisano na planszy 128; chodzi o istotność korelacji ru , u
t

tk

Badanie autokorelacji można przeprowadzić:

• testem R istotności korelacji ru

t

,ut  k

d obl

• testem Durbina-Watsona
NIE MA AUTOK.

d1

?

d2 JEST AUTOKORELACJA

ETAP VIII OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VIII PRZEPROWADZA SIĘ DLA TRANSFORMATY

Matematyczne techniki zarządzania - 142
Etap IX. Badanie normalności składnika losowego
Celem etapu jest stwierdzenie, czy reszty mają rozkład normalny
Analiza reszt — oddzielny dział analizy regresji i korelacji
Jeżeli reszty mają rozkład normalny, statystyk otrzymuje „ulgi”
ETAP 6. PRAKTYCZNA INTERPRETACJA MODELU



Celem etapu jest wydobycie z modelu całej nowej wiedzy, której nie widać
„gołym okiem”
INTERPRETUJĄC MODEL (RÓWNANIE REGRESJI) NALEŻY UŻYWAĆ WYŁĄCZNIE
PROSTEJ TERMINOLOGII EKONOMICZNEJ ZROZUMIAŁEJ DLA KLIENTA
NIE NALEŻY UŻYWAĆ TERMINOLOGII MATEMATYCZNEJ ZROZUMIAŁEJ TYLKO DLA
TWÓRCÓW MODELU
INTERPRETOWAĆ WOLNO TYLKO MODEL ZWERYFIKOWANY
CAŁY TRUD MODELOWANIA NIE MOŻE BYĆ „SZTUKĄ DLA SZTUKI”, LECZ MA
SŁUŻYĆ UZYSKANIU KONKRETNYCH WNIOSKÓW PRAKTYCZNYCH

Interpretacja modelu przyczynowo-skutkowego

Polega ona na określeniu wpływu poszczególnych czynników na badane
zjawisko:
• podział wszystkich czynników na trzy grupy

Matematyczne techniki zarządzania - 143
A — czynniki nie mające wpływu na Y
B — czynniki mające wpływ na Y i wprowadzone do modelu
C — czynniki mające wpływ na Y, ale nie występujące w modelu
• ocena jakościowa wpływu czynników B i C
• ocena ilościowa wpływu czynników B i C
Ocena jakościowa



Na podstawie znaków stojących przy współczynnikach r oraz ai możemy
stwierdzić, że wpływ jest:

• dodatni (im lepsze zaliczenie, tym lepszy wynik egzaminu; im więcej
wydatków na reklamę, tym większy zysk; itd.)
• ujemny (im więcej zatrudnionych, tym gorszy wynik finansowy; im
mniej braków, tym wyższy zysk; im mniejsza absencja, tym wyższe
wynagrodzenie; itd.)

Ocena ilościowa
• model liniowy
Przykład 33. Zinterpretuj zweryfikowany model zależności miesięcznych
kosztów działalności przedsiębiorstwa (tys. zł) od wielkości produkcji
(sztuk) i liczby reklamacji:
y i  50 , 8  14 , 5 x 1  3 , 9 x 2  

Matematyczne techniki zarządzania - 144
a0 = 50,8

poziom kosztów stałych; jeśli firma nie będzie prowadzić
żadnej działalności, poniesie koszty w wysokości 50,8 tys. zł

a1 = 14,5

każda sztuka produktu firmy kosztuje ją przeciętnie 14,5
tys. zł; jeżeli firma zwiększy produkcję o 2 sztuki, koszty
wzrosną o 29,0 tys. zł

a2 = 3,9każda wniesiona reklamacja powiększa koszty przeciętnie o
3,9 tys. zł
• model potęgowy
Przykłąd 34. Zinterpretuj zweryfikowaną funkcję produkcji Cobba-Douglasa
0 , 65

Pi  45 , 2 M i

0 , 73

Zi

e

0 , 04



Funkcja produkcji to specjalny model, określający zależność pomiędzy
produkcją (P) a czynnikami produkcji: majątkiem trwałym (M) i nakładami
robocizny (Z).



Funkcje produkcji to modele umożliwiające „prześwietlenie”
przedsiębiorstwa (szereg czasowy) lub branży (dane przekrojowe) i określenie poziomu gospodarowania oraz postępu
technicznego i organizacyjnego.
Elastyczność  to współczynnik określający reakcję zmiany
jednej zmiennej na inną zmienną — na przykład elastyczność
cenowa popytu (jak popyt zmienia się wraz z ceną towaru).

EKSPERCI
ZACHODNI

Matematyczne techniki zarządzania - 145

 

y
y

:

x

FUNKCJA POTĘGOWA JEST JEDYNĄ FUNKCJĄ O STAŁEJ ELASTYCZNOŚCI

x

Izolinie funkcji produkcji

T1
M

Produkcję P można osiągnąć różnymi
kombinacjami majątku i robocizny:

T2

• T1— technika kapitałochłonna, np.
pełna automatyzacja
• T2 — pośredni poziom techniki

T3
P  const

• T3 — niski poziom techniki, produkcja
pracochłonna
P. LOWE

Z
Efekt poprawy zarządzania bez
zmiany techniki (lepsze wykorzystanie ludzi i sprzętu):

P2
M

ZARZĄDZANIE
TECHNOLOGIĄ

P1

T

• zmniejszenie kapitałochłonności

• zmniejszenie pracochłonności
• zwiększenie produkcji (przejście z
funkcji P1 na P2)

Można też rozpatrzyć łączne efekty
zmiany techniki i zarządzania

Z

Matematyczne techniki zarządzania - 146
Wszystkie informacje tego typu można odczytać w trakcie interpretacji
0 , 65
0 , 73 0 , 04
funkcji produkcji:
Pi  45 , 2 M i
Zi
e

• wartości 45,2 nie interpretuje się
• wartość 0,65 to współczynnik elastyczności majątkowej (kapitałowej)
produkcji: zmiana majątku o 10% daje średnio zmianę produkcji o 6,5%
• wartość 0,73 to współczynnik elastyczności zatrudnieniowej produkcji:
zmiana zatrudnienia o 10% daje zmianę produkcji średnio o 7,3%
• suma obu współczynników k=0,65+0,73=1,38 to współczynnik skali
produkcji:

— jeżeli k<1, to firma rozwija się ekstensywnie
— jeżeli k>1, to firma rozwija się intensywnie
• wartość  = 0,04 to współczynnik postępu organizacyjnego:
— jeżeli  >O, to miał miejsce postęp organizacyjny

— jeżeli  <0, to miał miejsce regres organizacyjny
Interpretacja modelu tendencji rozwojowej

DODAMY
TROCHĘ
TEORII

Przypomnienie: t — zmienna objaśniająca (stałe przyrosty)
y — zmienna objaśniana; rozdzielana w ogólności na trzy
części: trend, wahania okresowe, wahania losowe ()

Matematyczne techniki zarządzania - 147
Wykres z planszy 117 (zużycie energii elektrycznej przez WZ AGH)
WAHANIA OKRESOWE OKREŚLA SIĘ WZGLĘDEM TRENDU A
NIE WZGLĘDEM OSI CZASU

y

trend

t
1995

1996

1997

1998

1999

Te trzy części trzeba zidentyfikować, a potem złożyć razem w model:

• addytywny (jeśli amplituda wahań jest stała)
• multiplikatywny (jeśli amplituda wahań rośnie lub maleje regularnie)
Wyznaczanie trendu
Metody mechaniczne:

• wskaźniki bezwzględne (stały przyrost =
postęp arytmetyczny = funkcja liniowa)
• wskaźniki względne (przyrost o stały procent =
postęp geometryczny = funkcja potęgowa)
• średnia ruchoma (wygładzanie danych linią łamaną)

JAK OBLICZYĆ O
ILE PROCENT ROCZNIE SPADAŁA
ŚREDNIO LICZBA
WIDZÓW W
KINACH:
1982 - 193,7 MLN
1989 - 141,3 MLN

Matematyczne techniki zarządzania - 148
Średnia ruchoma: mając szereg czasowy y1, y2,....., yn, przyjmujemy
długość kroku k = 3, lub 5, lub 7 itd. i liczymy
y  ...  y k
y  ...  y k  1
y k / 2 0 ,5  1
a następnie y k / 2  1 , 5  2
itd.
k
k
y  y2  y3
y  y3  y4
dla k=3:
y2  1
y3  2
itd.
3
3
Przykład 35. Wyznacz trend metodą średniej ruchomej dla następujących
danych:
okres
t
wartość yt

1
5

2
4

3
7

4
6

5
8

12

y2 
10

y3 

y

8

y4 

6
4

y5 

2

y6 

0
0

1

2

3

4

5

czas, t

6

7

8

9

y7 

547

6
10

 5 , 67

CECHY
ŚREDNIEJ
RUCHOMEJ:

 7 , 00

• TRACI SIĘ
k-1 DANYCH

3
768

8
8

 5 , 33

3
476

7
9

3
6  8  10

 8 , 00

3
8  10  9

 9 , 00

3
10  9  8

 9 , 00

• IM
WIĘKSZE k,
TYM
BARDZIEJ
SZTYWNY
TREND

3

Metody statystyczne: analiza regresji i korelacji, różne funkcje oparte na
modelach ekonomii

Matematyczne techniki zarządzania - 149
Wyznaczanie wahań okresowych: dobowych, tygodniowych, miesięcznych,
kwartalnych, rocznych, wieloletnich
Trzy metody:

— metoda wskaźników sezonowości
— metoda zmiennych zero-jedynkowych (0-1)

— metoda harmoniczna
Wszystkie metody mają jeden cel:
uzyskanie przeciętnego obrazu jednego cyklu

+

Ws
[t ]
[%]
trend

I

II



III

IV

WADY:
• KONIECZNOŚĆ
KOREKTY
• BRAK
WERYFIKACJI
STATYSTYCZNEJ

Metoda wskaźników sezonowości

• obliczenie surowych wskaźników sezonowości (wyeliminowanie trendu):
y

S s  yt  yt
S s  t
yt
addytywny multiplikatywny
wynik: n wartości odchyleń od trendu

• obliczenie oczyszczonych wskaźników
sezonowości (wyeliminowanie wahań
losowych):
 Ss
So 
k-liczba okresów
k
jednoimiennych
m-długość cyklu wynik: m wartości śr. odchyleń od trendu

Matematyczne techniki zarządzania - 150
Metoda zmiennych zero-jedynkowych (0-1)
m

y t  a 0  a1 t   bi Q i  
i 1

bi — przeciętne odchylenie od trendu dla
okresu i-tego
Qi — zmienna 0-1

wahania losowe
trend

wahania okresowe

t
1
2
3
4
5
6
7
8
9

yt
y1
y2
y3
y4
y5
y6
y7
y8
y9

Q1
1
0
0
0
1
0
0
0
1

Q2
0
1
0
0
0
1
0
0
0

Q3
0
0
1
0
0
0
1
0
0

Q4
0
0
0
1
0
0
0
1
0

Metoda harmoniczna (szeregi Fouriera)
Wahania okresowe przedstawia się jako sumę określonej liczby drgań harmonicznych (sinusoid i cosinusoid) przesuniętych w fazie, lecz o jednakowym okresie
m /2
2 i m / 2
2 i
y t  a 0  a 1 t   b1 i sin
  b 2 i cos

m
m
i 1
i 1
Obie metody dają taki sam wynik, istnieje możliwość weryfikacji
statystycznej
W metodzie 0-1 dostajemy bi = Ws, natomiast w metodzie harmonicznej Ws
jest sumą wartości poszczególnych sinusoid dla danego momentu czasu


Slide 9

Matematyczne techniki zarządzania - 121
ETAP 2. GROMADZENIE DANYCH STATYSTYCZNYCH

!

ZA JAKOŚĆ DANYCH ODPOWIADA MODELUJĄCY
• rodzaje danych: dane przekrojowe i szeregi czasowe
• źródła danych: roczniki statystyczne, różne działy
przedsiębiorstwa, badania marketingowe, wywiady itd.
• wiarygodność danych: do jakiego celu zostały one
przygotowane?

MUSISZ
SPRAWDZAĆ
KAŻDE DANE

• porównywalność danych: inflacja (ceny bieżące a ceny
stałe), zmiany procesów technicznych
Wielkość
produkcji

• zmienność zjawisk: trzeba sprawdzić, czy
wybrana w etapie 1a zmienna jest rzeczywiście zmienną losową

Wx 

s( x )

nowy zakład

100 %

x

stary zakład

Wx musi wynosić co najmniej 30-40%
Wiek studenta może być dobrą zmiennąprzyczyną, ale nie w przypadku studiów
dziennych!

Zatrudnienie

Matematyczne techniki zarządzania - 122
ETAP 3. SELEKCJA ZMIENNYCH OBJAŚNIAJĄCYCH
KAŻDĄ ZMIENNĄ X WYTYPOWANĄ W ETAPIE 1a TRAKTUJEMY JAKO
KANDYDATKĘ NA ZMIENNĄ OBJAŚNIAJĄCĄ
Może być kilka przyczyn powodujących, że taka kandydatka nie może znaleźć się w modelu ekonometrycznym (w równaniu regresji):
• w modelu nie może być zbyt wielu zmiennych (nieczytelny)
• kandydatka może nie mieć wpływu na zmienną Y



• kandydatka może wnosić prawie tę samą informację o Y co inna
kandydatka

• dwie bardzo podobne kandydatki mogą sobie nawzajem przeszkadzać
(efekt katalityczny)
Kryteria, jakie musi spełniać kandydatka Xi, aby nadawała się do modelu:
• musi być silnie powiązana ze zmienną Y

• nie może być powiązana z inną kandydatką Xj
SSTO
x1
x4

x2
x3

reszta

R2=0,79

R2=0,66

x2
x1
x4

R2=0,48

x3
reszta

reszta

SSTO

SSTO

Matematyczne techniki zarządzania - 123
Efekt katalityczny
DWIE ZMIENNE DAJĄ
RAZEM MNIEJ INFORMACJI NIŻ KAŻDA Z
NICH Z OSOBNA

x1

x2

R2=0,25

x2

x1

R2=0,52

R2=0,66

Selekcja kandydatek ma na celu podzielenie ich na trzy grupy:
• zmienne wprowadzone do modelu
• zmienne nie wprowadzone do modelu, ale reprezentowane w nim przez
inne zmienne (możliwość wymiany)
• zmienne nie wprowadzone do modelu ze względu na fakt, że nie wnoszą
żadnej informacji o zmiennej Y
INFORMACJE potrzebne do selekcji: współczynniki r x i x j ,
Macierz współczynników korelacji
Y
Y
X1
X2
X3

0,52
0,64
- 0,21

X1
0,52
0,82
- 0,18

X2
0,64
0,82
0,08

X3
- 0,21
- 0,18
0,08

r yx

i

Przykład 32. Macierz powiązania
zmiennych ze sobą przedstawia
się następująco (n=20). Jak ją
można zinterpretować? Które
zmienne są powiązane ze sobą w
sposób istotny?

Matematyczne techniki zarządzania - 124
Testowanie istotności współczynnika korelacji
H0:  = 0

Można je przeprowadzić trzema testami: testem Studenta

H1:   0

(t), Fishera (F) i Wallace’a-Snedecora (R)

Fragment tablicy rozkładu Wallece’a-Snedecora (SKRYPT, tab. VII, s.161)
S to pn ie
sw ob od y

2
0,05
0,632
0,444
0,361

8
18
28

,

0,01
0,765
0,561
0,463

L iczb a zm ien n ych
3
0,05
0,01
0,726
0,827
0,532
0,633
0,439
0,530

4
0,05
0,777
0,587
0,490

0,01
0,860
0,678
0,573

Reguła decyzyjna: — jeżeli |Robl|>Rtabl, odrzucamy H0 (korelacja istotna)
— jeżeli |Robl|
W przykładzie 32, jeżeli przyjmiemy  = 0,05, to Rtabl = 0,444.
Y
Y
X1
X2
X3

0,52
0,64
- 0,21

X1
0,52
0,82
- 0,18

X2
0,64
0,82
0,08

X3
- 0,21
- 0,18
0,08

Pozostaną zatem tylko trzy
istotne powiązania:
y-x1, y-x2, x1-x2
BRAK ISTOTNEGO POWIĄZANIA Z Y NIE
OZNACZA, ŻE ZMIENNA NIE WNOSI
ŻADNEJ INFORMACJI O ZJAWISKU Y

Matematyczne techniki zarządzania - 125



Metody selekcji zmiennych objaśniających:
• grafowa
• Hellwiga (pojemności informacji)
• taksonomiczne (clustering)
Metoda grafowa
• obliczenie macierzy współczynników:

rx

i

xj

• wyłowienie z macierzy powiązań istotnych

, r yx

BUDOWA GRAFU
i

• graf spójny

• budowa grafu z powiązań istotnych
• wybranie zmiennych na podstawie grafu

x6

• graf zerowy
x1
x4

x9

DO MODELU WYBIERA SIĘ ZMIENNE:
• każdy graf zerowy (jeśli |ryx|>0,1)

istotne powiązanie

• po jednej reprezentantce grafu spójnego;

reprezentantką grafu jest zmienna, która ma najwięcej powiązań z
innymi kandydatkami
jeżeli kilka zmiennych ma tę samą maksymalną liczbę powiązań, wybiera
się z nich tę, która jest najsilniej powiązana za zmienną Y (max ryx)
jeżeli graf jest rozległy, może mieć dwie reprezentantki, ale muszą one
leżeć na przeciwległych stronach grafu

Matematyczne techniki zarządzania - 126
Przykład 32 cd. Wybierzemy
zmienną x2 (reprezentantka grafu
spójnego) i zmienną x3 (graf
zerowy)
Metoda Hellwiga

Y
Y
X1
X2
X3

0,52
0,64
- 0,21

• wypisujemy wszystkie możliwe kombinacje
kandydatek; jest ich K = 2m—1
• obliczamy pojemność informacji dla każdej
zmiennej w każdej kombinacji

h kl  f ( r yx , r x
i

ixj

)

• obliczamy pojemność całkowitą dla każdej
kombinacji
H l   h kl
k

• wybieramy kombinację o największej
pojemności Hl = max

X1
0,52
0,82
- 0,18

X2
0,64
0,82

X3
- 0,21
- 0,18
0,08

0,08

W przykładzie 32 mamy 7
możliwych kombinacji kandydatek:
1. x1
2. x2

3. x3

maximum:

H6 = 0,42

4. x1,x2
5. x1,x3

Hmax = R2

6. x2,x3
7. x1,x2,x3

Metody taksonomiczne
Taksonomia wrocławska (cluster analysis) to metoda grupowania obiektów (zmiennych) w grupy jednorodne pod względem n cech (wymiarów)
łącznie. Podstawą grupowania jest odległość euklidesowa, która w przypadku zmiennych d ij  f ( r x x )
WSZYSTKIE METODY TO SELEKCJA WSTĘPNA
i

j

Matematyczne techniki zarządzania - 127
ETAP 4. ESTYMACJA PARAMETRÓW MODELU
Cel etapu: wyznaczenie parametrów strukturalnych i stochastycznych
Estymacja: szacowanie parametrów populacji na podstawie próbki
Metody estymacji: analiza regresji i korelacji (KMNK i inne)

Założenia dla KMNK
1. Zmienne losowe są prawdziwymi zmiennymi, nie powiązanymi ze sobą
2. Składnik losowy  ma stałą wariancję, niezależną od zmiennej x lub t
3. Wartości reszt ui są niezależne od siebie

4. Składnik losowy  nie jest powiązany ze zmienną objaśniającą
Skutki niedotrzymania założeń i środki zaradcze
1. Model bez sensu, nieprzydatny; niekiedy absurdalny (źle uwarunkowane
dane)
Stosuje się: dużą próbkę (n>100), regresję grzbietową (ridge regression)
2.

Y

reszta ui

Lewa część zbioru ma dużą wariancję, a
prawa — wariancję małą
Stosuje się specjalny wariant MNK z
korektą na różne wariancje
X

Matematyczne techniki zarządzania - 128
3. Jeśli reszty ui są ze sobą powiązane (skorelowane), mówimy, że
występuje autokorelacja składnika losowego (zjawisko występuje przy
szeregach czasowych — sztywny porządek obserwacji)
Oznacza to, że istnieje istotna zależność u t  f ( u t  k )
Przyczyny autokorelacji: zakłócenia
(dodatnie lub ujemne) w jednym okresie
wpływają na poziom zjawiska w następnych
okresach (rolnictwo, produkcja, rynek)

t  1 , 2 ,...

u t  y t  yˆ t

u t 1

u1
u2
u3
u4
u5

Występowanie autokorelacji powoduje
nieprzydatność modelu


u1
u2
u3
u4

Istnienie autokorelacji sprawdza się testem
Durbina-Watsona d
Stosuje się metodę różniczki zupełnej

y  f (x )

yt  yt  ytk

4. Składnik losowy jest skorelowany ze zmienną objaśniającą, wtedy
gdy została pominięta jakaś ważna zmienna-przyczyna

Model taki nie ma żadnej wartości; trzeba dbać o jak najwyższy współczynnik determinacji (R2>0,9)
• zbiór danych rzeczywistych nigdy
nie spełnia tych wymagań

ESTYMACJĘ MODELU POWTARZA SIĘ WIELOKROTNIE
ponieważ dopiero weryfikacja zapewnia ostateczną selekcję
kandydatek na zmienne objaśniające

• ekonometria to analiza danych nie
spełniających tych założeń
• nie stosować statystyki bezmyślnie (na ślepo)

Matematyczne techniki zarządzania - 129
ETAP 5. WERYFIKACJA MODELU
Cele:

1. opis rzeczywistości (populacji generalnej)



2. dokładna (ostateczna) selekcja zmiennych objaśniających
3. poznanie składnika losowego (spełnienie założeń KMNK)
Narzędzia: hipotezy i testy statystyczne

Metodyka: każde równanie oddzielnie; weryfikacja obejmuje 9 etapów (od
najmniej do najbardziej pracochłonnego)
WYKAZ ETAPÓW WERYFIKACJI MODELU
I.
II.

Badanie istotności korelacji
Badanie wyrazistości modelu

III.

Badanie istotności parametrów

IV.

Badanie symetrii skł. losowego

V.
VI.
VII.
VIII.
IX.

Badanie losowości skł. losowego
Badanie stacjonarności skł. los.
Badanie wartości oczekiwanej skł. los.
Badanie autokorelacji skł. losowego
Badanie normalności skł. losowego

Opis każdego etapu weryfikacji
obejmuje:
• cel etapu
• sposób weryfikacji: wzory,
hipotezy, testy
• podanie których modeli dotyczy (przyczynowo-skutkowych
czy tendencji rozwojowej)
• podanie której postaci modeli
nieliniowych dotyczy (pierwotnej czy transformaty)

Matematyczne techniki zarządzania - 130
Etap I. Badanie istotności korelacji
7
2

8

9

11

12

17

19

23

21

5
2 etapu
9
16
7
9
15
14
Celem
jest
sprawdzenie,
czy
istnieje w populacji generalnej powiązanie pomiędzy zmienną Y i wszystkimi zmiennymi objaśniającymi

25

Przedział ufności dla
nieznanego współczynnika korelacji  dla populacji buduje się przy
użyciu błędu

populacja

zmienna Y

20
15
10

próbka

5
0
8
5

0 9

1011

2

9

20
12

30
17
16
7
zmienna X

25

1940
9

23 50
15

populacja

20

zmienna Y

7
2

15
10

próbka

5
0
0

10

20

30

zmienna X

40

50

21
14

sR 

1 R

0

Robl

2

nk

Istotność korelacji weryfikuje się przez postawienie
następujących hipotez dla
współczynnika korelacji dla
populacji generalnej:

1
R,|r|

H0 :   0

Brak korelacji, nie ma powiązania...

H1 :   0

Korelacja istotna, jest powiązanie...

,

Matematyczne techniki zarządzania - 131
Hipotezy te można weryfikować trzema równoważnymi testami:
• testem t Studenta (tylko dla regresji dwu zmiennych)
• testem F Fishera-Snedecora
• testem R Wallace’a-Snedecora

,

W każdym przypadku obliczamy wartość
statystyki dla próbki (tobl, Fobl, Robl) i porównujemy z wartością krytyczną odczytaną z tablicy odpowiedniego rozkładu w
funkcji poziomu istotności i liczby stopni
swobody (ttabl, Ftabl, Rtabl)

Reguła decyzyjna:
• jeżeli |tobl|< ttabl, nie ma podstaw do odrzucenia H0 (brak korelacji)
• jeżeli |tobl|> ttabl, odrzucamy H0 na korzyść H1 (korelacja istnieje)

TAK SAMO DLA
FiR

W przypadku regresji wielorakiej, gdy liczba zmiennych objaśniajacych
jest duża w porównaniu do liczby obserwacji, współczynnik determinacji
R2 może dawać zawyżoną ocenę stopnia wyjaśnienia zmienności zmiennej
objaśnianej; dlatego wprowadzono skorygowany współczynnik determinacji (i korelacji):
 ( yˆ i  y )

R

2

2

k
n

k

1


2
nk 1
(
y

y
)

i
n1

• adjusted coefficient of multiple
determination (wydruki komputerowe)

• jeśli k jest małe, nie ma większej różnicy
pomiędzy normalnym a skorygowanym R2

Matematyczne techniki zarządzania - 132
Skąd wziąć wartość odpowiedniej statystyki dla próbki i jak odczytywać jej wartości z tablic?
n2
r
t

r

t tabl  t  / 2 { n  2 }
TEST STUDENTA
obl
2
sr
1 r

F obl 

TEST FISHERA

Ź ró d ło z m ien n o śc i

MSTR
MSE



R

nk

2

1 R

2

L ic zb a sto p n i
sw o b o d y

Suma
k w a d ra tó w

Ś re d n i
k w a d ra t

M o d el (c z yn n ik i)
B łą d (re sz ta )

k1
nk

SSTR
SSE

MSTR
MSE

R azem

n1

SSTO

TEST WALLACE’A

R obl 

R

2

k 1

F tabl  F { k  1 , n  k }

S ta ty sty k a
F
F obl 

MSTR
MSE

NIE MYLIĆ
STOPNI SWOBODY LICZNIKA I MIANOWNIKA

R tabl  R { k , n  k }

Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

Matematyczne techniki zarządzania - 133
Odczyt Rtabl z tablicy testu R (SKRYPT s.161-162)

, k,  = n-k

S to pn ie
sw ob od y
8
18
28

2
0,05
0,632
0,444
0,361

0,01
0,765
0,561
0,463

L iczb a zm ien n ych
3
0,05
0,01
0,726
0,827
0,532
0,633
0,439
0,530

4
0,05
0,777
0,587
0,490

0,01
0,860
0,678
0,573

Wnioski dotyczące rozkładu R Wallace’a-Snedecora:
• tablica zawiera maksymalne wartości współczynnika korelacji w danej
sytuacji, jakich można oczekiwać, gdy nie ma korelacji w populacji
• im wyższy poziom istotności, tym niższe Rtabl

• im większa liczba zmiennych w modelu, tym wyższe Rtabl
• im wyższa liczba stopni swobody (większa próbka), tym niższe Rtabl
• tablica R powstała z przeliczenia tablic t oraz F (odwrócenie wzorów)
• tablica testu R jest najszybszym i nawygodniejszym narzędziem do
weryfikacji istotności korelacji

Werdykt z etapu I:

Matematyczne techniki zarządzania - 134

• jeżeli Robl>Rtabl, model jest poprawny, można przejść do etapu II
• jeżeli Roblzmiennych objaśniających albo jego postać matematyczną
ETAP I OBOWIĄZUJE DLA WSZYSTKICH MODELI
ETAP I PRZEPROWADZA SIĘ DLA TRANSFORMATY (dla postaci pierwotnej
można uzyskać R>1)
Rola współczynnika determinacji R2
• korelacja może być istotna przy małym R i bardzo małym R2 (r=0,4,
R2=0,16, co oznacza, że tylko 16% zmienności zmiennej Y jest
wyjaśnione przez zmienną objaśniającą)
• małe R2 oznacza niski stopień wyjaśnienia rzeczywistości i stanowi
zagrożenie dla modelu
• należy dążyć (poprzez odpowiedni dobór zmiennych-przyczyn i postaci
matematycznej modelu) do jak największego R2 (dla postaci pierwotnej)
• wysoka wartość R2 świadczy o dobrym poznaniu badanego zjawiska
• wysoka wartość R2 bardzo często wynika jednak ze złego dobrania
zmiennych objaśniających (silnie powiązane ze sobą — „masło maślane”)
KORELACJA POZORNA — jest zależność, ale jej nie ma? Przyczyny...
Trzeba unikać wartości bezwzględnych (ludność, liczba sklepów, wielkość produkcji)

6

9

12

8

11

12

11

15

9

18

9

11

11

18

15

Matematyczne techniki zarządzania - 135
Etap II. Badanie wyrazistości modelu
Y

Wyrazistość modelu dana jest wzorem

s( y )

ui

y

W obl 

s( y )

100 %

y

Celem etapu
jest kontrola
rozrzutu danych

Współczynnik Wobl<30%, w przeciwnym
przypadku rozrzut danych jest zbyt duży

y

Kłopoty: gdyy jest bliskie 0

x

X

Werdykt: model poprawny lub niepoprawny

ETAP II OBOWIĄZUJE DLA WSZYSTKICH MODELI (ale nie ma on charakteru
statystycznego)

ETAP II PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ (sprawdzamy, czy
nie występuje silny efekt „krzywego lustra”)
Etap III. Badanie istotności parametrów (współczynników) modelu
Celem etapu jest sprawdzenie:
• czy poszczególne zmienne objaśniające mają istotny wpływ na zmienną
objaśnianą?
• czy zmienne objaśniające są wybrane prawidłowo?

• czy wyraz wolny różni się istotnie od zera?

Matematyczne techniki zarządzania - 136
Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

Problem istotności parametrów ai można rozpatrywać (tak jak problem
średniej dla populacji) z dwu punktów widzenia:
• przedziału ufności dla nieznanej wartości i

• hipotez — zerowej H0: i=0 i alternatywnej H1: i 0

1
0

ai

1

i

ISTOTNY (W PRZEDZIALE NIE MA ZERA)

0

ai

i

NIEISTOTNY (W PRZEDZIALE JEST ZERO)

P ( a i  t / 2 { n  k } s ( a i )   i  a i  t / 2 { n  k } s ( a i )  1  

Z tablicy rozkładu Studenta, a nie z wydruku komputerowego!

Matematyczne techniki zarządzania - 137
Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

W praktyce posługujemy się raczej hipotezami:
Badanie istotności przeprowadza
się dla każdego i oddzielnie:

t obl ( a i ) 

ai  0
s(a i )

t tabl  t  / 2 { n  k }

• jeżeli |tobl(ai)|>ttabl(ai), odrzucamy hipotezę zerową; parametr jest istotny z błędem równym co najwyżej 
• jeżeli |tobl(ai)|parametr nie jest istotny
Praktycznie jest to bardzo łatwe:
• sprawdzamy, czy |t(ai)| jest większe czy mniejsze od około 2, a najlepiej
• porównujemy rzeczywisty poziom istotności P(ai) z przyjętym 
ODRZUCAMY H0, JEŻELI P(ai) JEST MNIEJSZE OD 

WTEDY ZMIENNA
Xi MA WPŁYW NA
ZMIENNĄ Y

Matematyczne techniki zarządzania - 138
W etapie III następuje ostateczna selekcja zmiennych objaśniających:
• jeżeli wszystkie ai okażą się istotne, model jest poprawny:
— model przyczynowo-skutkowy: do interpretacji
— model tendencji rozwojowej: do etapu IV
• jeżeli choć jedno ai okaże się nieistotne, model jest niepoprawny i wymaga poprawy przez usunięcie nieistotnych zmiennych:
— zmienne należy usuwać po jednej (ze względu na efekt katalityczny)
— usuwa się zawsze zmienną o najniższej wartości |t(ai)| [czyli o
najwyższej wartości P(ai)]
— usunięcie ostatniej zmiennej nieistotnej kończy proces selekcji
kandydatek na zmienne,

— selekcja nie jest ostateczna, gdyż zawsze istnieje możliwość zamiany zmiennych, które są powiązane ze sobą
Praktyczne znaczenie istotności wyrazu wolnego a0
To są jedne z możliwości dla populacji (p. plansza 106)

Y

W przypadku funkcji K=f(P) wyraz wolny wyznacza poziom kosztów stałych (rachunkowość zarządcza)
W przypadku zależności technicznej Q=f(h) wyraz
wolny oznacza, że przy miąższości pokładu h=0 wydajność produkcji Q też jest równa 0

0
X

Matematyczne techniki zarządzania - 139
Praktyczne znaczenie istotności współczynnika regresji ai



KRZYWE NEYMANA — PLANSZE 106-107
WSPÓŁCZ. ISTOTNY
WSPÓŁ. NIEISTOTNY

ETAP III OBOWIĄZUJE DLA WSZYSTKICH MODELI
ETAP III PRZEPROWADZA SIĘ DLA TRANSFORMATY
Etap IV. Badanie symetrii składnika losowego

Y

CZĘSTOŚĆ RESZT DODATNICH I UJEMNYCH MA BYĆ
ZBLIŻONA

Y

ASYMETRYCZNY
SYMETRYCZNY

t
t
Badanie symetrii przeprowadza się testem Studenta (St. Bartosiewicz
Ekonometria)
Brak symetrii wymaga zmiany matematycznej postaci modelu
ETAP IV OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ

ETAP IV PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ

Matematyczne techniki zarządzania - 140
Etap V. Badanie losowości składnika losowego

Y

Y
NIELOSOWY

LOSOWY

t
t
Badanie losowości przeprowadza się testem Studenta lub testem serii
(Ekonometria, praca zb. pod red. M. Krzysztofiaka)
Brak losowości wymaga zmiany matematycznej postaci modelu
ETAP V OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP V PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ
Etap VI. Badanie stacjonarności składnika losowego
W etapie tym chodzi o niezależność wariancji składnika losowego od
zmiennej objaśniającej t (plansza 127)

Bada się istotność współczynnika korelacji ru t , t
ETAP VI OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VI PRZEPROWADZA SIĘ DLA TRANSFORMATY

Matematyczne techniki zarządzania - 141
Etap VII. Badanie wartości oczekiwanej składnika losowego
Normalnie, gdy przeprowadzamy estymację postaci liniowej, parametry
składnika losowego E ( )  0
{ ui  0}
V ( )  const
Po retransformacji do postaci pierwotnej mamy nowe reszty u’, dla
których
'
'
ui  0
 ui  0
Celem etapu jest sprawdzenie, czy odchyłka od O nie jest zbyt duża
(służy do tego test Studenta)
ETAP VII OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VII PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ
Etap VIII. Badanie autokorelacji składnika losowego
Pojęcie autokorelacji opisano na planszy 128; chodzi o istotność korelacji ru , u
t

tk

Badanie autokorelacji można przeprowadzić:

• testem R istotności korelacji ru

t

,ut  k

d obl

• testem Durbina-Watsona
NIE MA AUTOK.

d1

?

d2 JEST AUTOKORELACJA

ETAP VIII OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VIII PRZEPROWADZA SIĘ DLA TRANSFORMATY

Matematyczne techniki zarządzania - 142
Etap IX. Badanie normalności składnika losowego
Celem etapu jest stwierdzenie, czy reszty mają rozkład normalny
Analiza reszt — oddzielny dział analizy regresji i korelacji
Jeżeli reszty mają rozkład normalny, statystyk otrzymuje „ulgi”
ETAP 6. PRAKTYCZNA INTERPRETACJA MODELU



Celem etapu jest wydobycie z modelu całej nowej wiedzy, której nie widać
„gołym okiem”
INTERPRETUJĄC MODEL (RÓWNANIE REGRESJI) NALEŻY UŻYWAĆ WYŁĄCZNIE
PROSTEJ TERMINOLOGII EKONOMICZNEJ ZROZUMIAŁEJ DLA KLIENTA
NIE NALEŻY UŻYWAĆ TERMINOLOGII MATEMATYCZNEJ ZROZUMIAŁEJ TYLKO DLA
TWÓRCÓW MODELU
INTERPRETOWAĆ WOLNO TYLKO MODEL ZWERYFIKOWANY
CAŁY TRUD MODELOWANIA NIE MOŻE BYĆ „SZTUKĄ DLA SZTUKI”, LECZ MA
SŁUŻYĆ UZYSKANIU KONKRETNYCH WNIOSKÓW PRAKTYCZNYCH

Interpretacja modelu przyczynowo-skutkowego

Polega ona na określeniu wpływu poszczególnych czynników na badane
zjawisko:
• podział wszystkich czynników na trzy grupy

Matematyczne techniki zarządzania - 143
A — czynniki nie mające wpływu na Y
B — czynniki mające wpływ na Y i wprowadzone do modelu
C — czynniki mające wpływ na Y, ale nie występujące w modelu
• ocena jakościowa wpływu czynników B i C
• ocena ilościowa wpływu czynników B i C
Ocena jakościowa



Na podstawie znaków stojących przy współczynnikach r oraz ai możemy
stwierdzić, że wpływ jest:

• dodatni (im lepsze zaliczenie, tym lepszy wynik egzaminu; im więcej
wydatków na reklamę, tym większy zysk; itd.)
• ujemny (im więcej zatrudnionych, tym gorszy wynik finansowy; im
mniej braków, tym wyższy zysk; im mniejsza absencja, tym wyższe
wynagrodzenie; itd.)

Ocena ilościowa
• model liniowy
Przykład 33. Zinterpretuj zweryfikowany model zależności miesięcznych
kosztów działalności przedsiębiorstwa (tys. zł) od wielkości produkcji
(sztuk) i liczby reklamacji:
y i  50 , 8  14 , 5 x 1  3 , 9 x 2  

Matematyczne techniki zarządzania - 144
a0 = 50,8

poziom kosztów stałych; jeśli firma nie będzie prowadzić
żadnej działalności, poniesie koszty w wysokości 50,8 tys. zł

a1 = 14,5

każda sztuka produktu firmy kosztuje ją przeciętnie 14,5
tys. zł; jeżeli firma zwiększy produkcję o 2 sztuki, koszty
wzrosną o 29,0 tys. zł

a2 = 3,9każda wniesiona reklamacja powiększa koszty przeciętnie o
3,9 tys. zł
• model potęgowy
Przykłąd 34. Zinterpretuj zweryfikowaną funkcję produkcji Cobba-Douglasa
0 , 65

Pi  45 , 2 M i

0 , 73

Zi

e

0 , 04



Funkcja produkcji to specjalny model, określający zależność pomiędzy
produkcją (P) a czynnikami produkcji: majątkiem trwałym (M) i nakładami
robocizny (Z).



Funkcje produkcji to modele umożliwiające „prześwietlenie”
przedsiębiorstwa (szereg czasowy) lub branży (dane przekrojowe) i określenie poziomu gospodarowania oraz postępu
technicznego i organizacyjnego.
Elastyczność  to współczynnik określający reakcję zmiany
jednej zmiennej na inną zmienną — na przykład elastyczność
cenowa popytu (jak popyt zmienia się wraz z ceną towaru).

EKSPERCI
ZACHODNI

Matematyczne techniki zarządzania - 145

 

y
y

:

x

FUNKCJA POTĘGOWA JEST JEDYNĄ FUNKCJĄ O STAŁEJ ELASTYCZNOŚCI

x

Izolinie funkcji produkcji

T1
M

Produkcję P można osiągnąć różnymi
kombinacjami majątku i robocizny:

T2

• T1— technika kapitałochłonna, np.
pełna automatyzacja
• T2 — pośredni poziom techniki

T3
P  const

• T3 — niski poziom techniki, produkcja
pracochłonna
P. LOWE

Z
Efekt poprawy zarządzania bez
zmiany techniki (lepsze wykorzystanie ludzi i sprzętu):

P2
M

ZARZĄDZANIE
TECHNOLOGIĄ

P1

T

• zmniejszenie kapitałochłonności

• zmniejszenie pracochłonności
• zwiększenie produkcji (przejście z
funkcji P1 na P2)

Można też rozpatrzyć łączne efekty
zmiany techniki i zarządzania

Z

Matematyczne techniki zarządzania - 146
Wszystkie informacje tego typu można odczytać w trakcie interpretacji
0 , 65
0 , 73 0 , 04
funkcji produkcji:
Pi  45 , 2 M i
Zi
e

• wartości 45,2 nie interpretuje się
• wartość 0,65 to współczynnik elastyczności majątkowej (kapitałowej)
produkcji: zmiana majątku o 10% daje średnio zmianę produkcji o 6,5%
• wartość 0,73 to współczynnik elastyczności zatrudnieniowej produkcji:
zmiana zatrudnienia o 10% daje zmianę produkcji średnio o 7,3%
• suma obu współczynników k=0,65+0,73=1,38 to współczynnik skali
produkcji:

— jeżeli k<1, to firma rozwija się ekstensywnie
— jeżeli k>1, to firma rozwija się intensywnie
• wartość  = 0,04 to współczynnik postępu organizacyjnego:
— jeżeli  >O, to miał miejsce postęp organizacyjny

— jeżeli  <0, to miał miejsce regres organizacyjny
Interpretacja modelu tendencji rozwojowej

DODAMY
TROCHĘ
TEORII

Przypomnienie: t — zmienna objaśniająca (stałe przyrosty)
y — zmienna objaśniana; rozdzielana w ogólności na trzy
części: trend, wahania okresowe, wahania losowe ()

Matematyczne techniki zarządzania - 147
Wykres z planszy 117 (zużycie energii elektrycznej przez WZ AGH)
WAHANIA OKRESOWE OKREŚLA SIĘ WZGLĘDEM TRENDU A
NIE WZGLĘDEM OSI CZASU

y

trend

t
1995

1996

1997

1998

1999

Te trzy części trzeba zidentyfikować, a potem złożyć razem w model:

• addytywny (jeśli amplituda wahań jest stała)
• multiplikatywny (jeśli amplituda wahań rośnie lub maleje regularnie)
Wyznaczanie trendu
Metody mechaniczne:

• wskaźniki bezwzględne (stały przyrost =
postęp arytmetyczny = funkcja liniowa)
• wskaźniki względne (przyrost o stały procent =
postęp geometryczny = funkcja potęgowa)
• średnia ruchoma (wygładzanie danych linią łamaną)

JAK OBLICZYĆ O
ILE PROCENT ROCZNIE SPADAŁA
ŚREDNIO LICZBA
WIDZÓW W
KINACH:
1982 - 193,7 MLN
1989 - 141,3 MLN

Matematyczne techniki zarządzania - 148
Średnia ruchoma: mając szereg czasowy y1, y2,....., yn, przyjmujemy
długość kroku k = 3, lub 5, lub 7 itd. i liczymy
y  ...  y k
y  ...  y k  1
y k / 2 0 ,5  1
a następnie y k / 2  1 , 5  2
itd.
k
k
y  y2  y3
y  y3  y4
dla k=3:
y2  1
y3  2
itd.
3
3
Przykład 35. Wyznacz trend metodą średniej ruchomej dla następujących
danych:
okres
t
wartość yt

1
5

2
4

3
7

4
6

5
8

12

y2 
10

y3 

y

8

y4 

6
4

y5 

2

y6 

0
0

1

2

3

4

5

czas, t

6

7

8

9

y7 

547

6
10

 5 , 67

CECHY
ŚREDNIEJ
RUCHOMEJ:

 7 , 00

• TRACI SIĘ
k-1 DANYCH

3
768

8
8

 5 , 33

3
476

7
9

3
6  8  10

 8 , 00

3
8  10  9

 9 , 00

3
10  9  8

 9 , 00

• IM
WIĘKSZE k,
TYM
BARDZIEJ
SZTYWNY
TREND

3

Metody statystyczne: analiza regresji i korelacji, różne funkcje oparte na
modelach ekonomii

Matematyczne techniki zarządzania - 149
Wyznaczanie wahań okresowych: dobowych, tygodniowych, miesięcznych,
kwartalnych, rocznych, wieloletnich
Trzy metody:

— metoda wskaźników sezonowości
— metoda zmiennych zero-jedynkowych (0-1)

— metoda harmoniczna
Wszystkie metody mają jeden cel:
uzyskanie przeciętnego obrazu jednego cyklu

+

Ws
[t ]
[%]
trend

I

II



III

IV

WADY:
• KONIECZNOŚĆ
KOREKTY
• BRAK
WERYFIKACJI
STATYSTYCZNEJ

Metoda wskaźników sezonowości

• obliczenie surowych wskaźników sezonowości (wyeliminowanie trendu):
y

S s  yt  yt
S s  t
yt
addytywny multiplikatywny
wynik: n wartości odchyleń od trendu

• obliczenie oczyszczonych wskaźników
sezonowości (wyeliminowanie wahań
losowych):
 Ss
So 
k-liczba okresów
k
jednoimiennych
m-długość cyklu wynik: m wartości śr. odchyleń od trendu

Matematyczne techniki zarządzania - 150
Metoda zmiennych zero-jedynkowych (0-1)
m

y t  a 0  a1 t   bi Q i  
i 1

bi — przeciętne odchylenie od trendu dla
okresu i-tego
Qi — zmienna 0-1

wahania losowe
trend

wahania okresowe

t
1
2
3
4
5
6
7
8
9

yt
y1
y2
y3
y4
y5
y6
y7
y8
y9

Q1
1
0
0
0
1
0
0
0
1

Q2
0
1
0
0
0
1
0
0
0

Q3
0
0
1
0
0
0
1
0
0

Q4
0
0
0
1
0
0
0
1
0

Metoda harmoniczna (szeregi Fouriera)
Wahania okresowe przedstawia się jako sumę określonej liczby drgań harmonicznych (sinusoid i cosinusoid) przesuniętych w fazie, lecz o jednakowym okresie
m /2
2 i m / 2
2 i
y t  a 0  a 1 t   b1 i sin
  b 2 i cos

m
m
i 1
i 1
Obie metody dają taki sam wynik, istnieje możliwość weryfikacji
statystycznej
W metodzie 0-1 dostajemy bi = Ws, natomiast w metodzie harmonicznej Ws
jest sumą wartości poszczególnych sinusoid dla danego momentu czasu


Slide 10

Matematyczne techniki zarządzania - 121
ETAP 2. GROMADZENIE DANYCH STATYSTYCZNYCH

!

ZA JAKOŚĆ DANYCH ODPOWIADA MODELUJĄCY
• rodzaje danych: dane przekrojowe i szeregi czasowe
• źródła danych: roczniki statystyczne, różne działy
przedsiębiorstwa, badania marketingowe, wywiady itd.
• wiarygodność danych: do jakiego celu zostały one
przygotowane?

MUSISZ
SPRAWDZAĆ
KAŻDE DANE

• porównywalność danych: inflacja (ceny bieżące a ceny
stałe), zmiany procesów technicznych
Wielkość
produkcji

• zmienność zjawisk: trzeba sprawdzić, czy
wybrana w etapie 1a zmienna jest rzeczywiście zmienną losową

Wx 

s( x )

nowy zakład

100 %

x

stary zakład

Wx musi wynosić co najmniej 30-40%
Wiek studenta może być dobrą zmiennąprzyczyną, ale nie w przypadku studiów
dziennych!

Zatrudnienie

Matematyczne techniki zarządzania - 122
ETAP 3. SELEKCJA ZMIENNYCH OBJAŚNIAJĄCYCH
KAŻDĄ ZMIENNĄ X WYTYPOWANĄ W ETAPIE 1a TRAKTUJEMY JAKO
KANDYDATKĘ NA ZMIENNĄ OBJAŚNIAJĄCĄ
Może być kilka przyczyn powodujących, że taka kandydatka nie może znaleźć się w modelu ekonometrycznym (w równaniu regresji):
• w modelu nie może być zbyt wielu zmiennych (nieczytelny)
• kandydatka może nie mieć wpływu na zmienną Y



• kandydatka może wnosić prawie tę samą informację o Y co inna
kandydatka

• dwie bardzo podobne kandydatki mogą sobie nawzajem przeszkadzać
(efekt katalityczny)
Kryteria, jakie musi spełniać kandydatka Xi, aby nadawała się do modelu:
• musi być silnie powiązana ze zmienną Y

• nie może być powiązana z inną kandydatką Xj
SSTO
x1
x4

x2
x3

reszta

R2=0,79

R2=0,66

x2
x1
x4

R2=0,48

x3
reszta

reszta

SSTO

SSTO

Matematyczne techniki zarządzania - 123
Efekt katalityczny
DWIE ZMIENNE DAJĄ
RAZEM MNIEJ INFORMACJI NIŻ KAŻDA Z
NICH Z OSOBNA

x1

x2

R2=0,25

x2

x1

R2=0,52

R2=0,66

Selekcja kandydatek ma na celu podzielenie ich na trzy grupy:
• zmienne wprowadzone do modelu
• zmienne nie wprowadzone do modelu, ale reprezentowane w nim przez
inne zmienne (możliwość wymiany)
• zmienne nie wprowadzone do modelu ze względu na fakt, że nie wnoszą
żadnej informacji o zmiennej Y
INFORMACJE potrzebne do selekcji: współczynniki r x i x j ,
Macierz współczynników korelacji
Y
Y
X1
X2
X3

0,52
0,64
- 0,21

X1
0,52
0,82
- 0,18

X2
0,64
0,82
0,08

X3
- 0,21
- 0,18
0,08

r yx

i

Przykład 32. Macierz powiązania
zmiennych ze sobą przedstawia
się następująco (n=20). Jak ją
można zinterpretować? Które
zmienne są powiązane ze sobą w
sposób istotny?

Matematyczne techniki zarządzania - 124
Testowanie istotności współczynnika korelacji
H0:  = 0

Można je przeprowadzić trzema testami: testem Studenta

H1:   0

(t), Fishera (F) i Wallace’a-Snedecora (R)

Fragment tablicy rozkładu Wallece’a-Snedecora (SKRYPT, tab. VII, s.161)
S to pn ie
sw ob od y

2
0,05
0,632
0,444
0,361

8
18
28

,

0,01
0,765
0,561
0,463

L iczb a zm ien n ych
3
0,05
0,01
0,726
0,827
0,532
0,633
0,439
0,530

4
0,05
0,777
0,587
0,490

0,01
0,860
0,678
0,573

Reguła decyzyjna: — jeżeli |Robl|>Rtabl, odrzucamy H0 (korelacja istotna)
— jeżeli |Robl|
W przykładzie 32, jeżeli przyjmiemy  = 0,05, to Rtabl = 0,444.
Y
Y
X1
X2
X3

0,52
0,64
- 0,21

X1
0,52
0,82
- 0,18

X2
0,64
0,82
0,08

X3
- 0,21
- 0,18
0,08

Pozostaną zatem tylko trzy
istotne powiązania:
y-x1, y-x2, x1-x2
BRAK ISTOTNEGO POWIĄZANIA Z Y NIE
OZNACZA, ŻE ZMIENNA NIE WNOSI
ŻADNEJ INFORMACJI O ZJAWISKU Y

Matematyczne techniki zarządzania - 125



Metody selekcji zmiennych objaśniających:
• grafowa
• Hellwiga (pojemności informacji)
• taksonomiczne (clustering)
Metoda grafowa
• obliczenie macierzy współczynników:

rx

i

xj

• wyłowienie z macierzy powiązań istotnych

, r yx

BUDOWA GRAFU
i

• graf spójny

• budowa grafu z powiązań istotnych
• wybranie zmiennych na podstawie grafu

x6

• graf zerowy
x1
x4

x9

DO MODELU WYBIERA SIĘ ZMIENNE:
• każdy graf zerowy (jeśli |ryx|>0,1)

istotne powiązanie

• po jednej reprezentantce grafu spójnego;

reprezentantką grafu jest zmienna, która ma najwięcej powiązań z
innymi kandydatkami
jeżeli kilka zmiennych ma tę samą maksymalną liczbę powiązań, wybiera
się z nich tę, która jest najsilniej powiązana za zmienną Y (max ryx)
jeżeli graf jest rozległy, może mieć dwie reprezentantki, ale muszą one
leżeć na przeciwległych stronach grafu

Matematyczne techniki zarządzania - 126
Przykład 32 cd. Wybierzemy
zmienną x2 (reprezentantka grafu
spójnego) i zmienną x3 (graf
zerowy)
Metoda Hellwiga

Y
Y
X1
X2
X3

0,52
0,64
- 0,21

• wypisujemy wszystkie możliwe kombinacje
kandydatek; jest ich K = 2m—1
• obliczamy pojemność informacji dla każdej
zmiennej w każdej kombinacji

h kl  f ( r yx , r x
i

ixj

)

• obliczamy pojemność całkowitą dla każdej
kombinacji
H l   h kl
k

• wybieramy kombinację o największej
pojemności Hl = max

X1
0,52
0,82
- 0,18

X2
0,64
0,82

X3
- 0,21
- 0,18
0,08

0,08

W przykładzie 32 mamy 7
możliwych kombinacji kandydatek:
1. x1
2. x2

3. x3

maximum:

H6 = 0,42

4. x1,x2
5. x1,x3

Hmax = R2

6. x2,x3
7. x1,x2,x3

Metody taksonomiczne
Taksonomia wrocławska (cluster analysis) to metoda grupowania obiektów (zmiennych) w grupy jednorodne pod względem n cech (wymiarów)
łącznie. Podstawą grupowania jest odległość euklidesowa, która w przypadku zmiennych d ij  f ( r x x )
WSZYSTKIE METODY TO SELEKCJA WSTĘPNA
i

j

Matematyczne techniki zarządzania - 127
ETAP 4. ESTYMACJA PARAMETRÓW MODELU
Cel etapu: wyznaczenie parametrów strukturalnych i stochastycznych
Estymacja: szacowanie parametrów populacji na podstawie próbki
Metody estymacji: analiza regresji i korelacji (KMNK i inne)

Założenia dla KMNK
1. Zmienne losowe są prawdziwymi zmiennymi, nie powiązanymi ze sobą
2. Składnik losowy  ma stałą wariancję, niezależną od zmiennej x lub t
3. Wartości reszt ui są niezależne od siebie

4. Składnik losowy  nie jest powiązany ze zmienną objaśniającą
Skutki niedotrzymania założeń i środki zaradcze
1. Model bez sensu, nieprzydatny; niekiedy absurdalny (źle uwarunkowane
dane)
Stosuje się: dużą próbkę (n>100), regresję grzbietową (ridge regression)
2.

Y

reszta ui

Lewa część zbioru ma dużą wariancję, a
prawa — wariancję małą
Stosuje się specjalny wariant MNK z
korektą na różne wariancje
X

Matematyczne techniki zarządzania - 128
3. Jeśli reszty ui są ze sobą powiązane (skorelowane), mówimy, że
występuje autokorelacja składnika losowego (zjawisko występuje przy
szeregach czasowych — sztywny porządek obserwacji)
Oznacza to, że istnieje istotna zależność u t  f ( u t  k )
Przyczyny autokorelacji: zakłócenia
(dodatnie lub ujemne) w jednym okresie
wpływają na poziom zjawiska w następnych
okresach (rolnictwo, produkcja, rynek)

t  1 , 2 ,...

u t  y t  yˆ t

u t 1

u1
u2
u3
u4
u5

Występowanie autokorelacji powoduje
nieprzydatność modelu


u1
u2
u3
u4

Istnienie autokorelacji sprawdza się testem
Durbina-Watsona d
Stosuje się metodę różniczki zupełnej

y  f (x )

yt  yt  ytk

4. Składnik losowy jest skorelowany ze zmienną objaśniającą, wtedy
gdy została pominięta jakaś ważna zmienna-przyczyna

Model taki nie ma żadnej wartości; trzeba dbać o jak najwyższy współczynnik determinacji (R2>0,9)
• zbiór danych rzeczywistych nigdy
nie spełnia tych wymagań

ESTYMACJĘ MODELU POWTARZA SIĘ WIELOKROTNIE
ponieważ dopiero weryfikacja zapewnia ostateczną selekcję
kandydatek na zmienne objaśniające

• ekonometria to analiza danych nie
spełniających tych założeń
• nie stosować statystyki bezmyślnie (na ślepo)

Matematyczne techniki zarządzania - 129
ETAP 5. WERYFIKACJA MODELU
Cele:

1. opis rzeczywistości (populacji generalnej)



2. dokładna (ostateczna) selekcja zmiennych objaśniających
3. poznanie składnika losowego (spełnienie założeń KMNK)
Narzędzia: hipotezy i testy statystyczne

Metodyka: każde równanie oddzielnie; weryfikacja obejmuje 9 etapów (od
najmniej do najbardziej pracochłonnego)
WYKAZ ETAPÓW WERYFIKACJI MODELU
I.
II.

Badanie istotności korelacji
Badanie wyrazistości modelu

III.

Badanie istotności parametrów

IV.

Badanie symetrii skł. losowego

V.
VI.
VII.
VIII.
IX.

Badanie losowości skł. losowego
Badanie stacjonarności skł. los.
Badanie wartości oczekiwanej skł. los.
Badanie autokorelacji skł. losowego
Badanie normalności skł. losowego

Opis każdego etapu weryfikacji
obejmuje:
• cel etapu
• sposób weryfikacji: wzory,
hipotezy, testy
• podanie których modeli dotyczy (przyczynowo-skutkowych
czy tendencji rozwojowej)
• podanie której postaci modeli
nieliniowych dotyczy (pierwotnej czy transformaty)

Matematyczne techniki zarządzania - 130
Etap I. Badanie istotności korelacji
7
2

8

9

11

12

17

19

23

21

5
2 etapu
9
16
7
9
15
14
Celem
jest
sprawdzenie,
czy
istnieje w populacji generalnej powiązanie pomiędzy zmienną Y i wszystkimi zmiennymi objaśniającymi

25

Przedział ufności dla
nieznanego współczynnika korelacji  dla populacji buduje się przy
użyciu błędu

populacja

zmienna Y

20
15
10

próbka

5
0
8
5

0 9

1011

2

9

20
12

30
17
16
7
zmienna X

25

1940
9

23 50
15

populacja

20

zmienna Y

7
2

15
10

próbka

5
0
0

10

20

30

zmienna X

40

50

21
14

sR 

1 R

0

Robl

2

nk

Istotność korelacji weryfikuje się przez postawienie
następujących hipotez dla
współczynnika korelacji dla
populacji generalnej:

1
R,|r|

H0 :   0

Brak korelacji, nie ma powiązania...

H1 :   0

Korelacja istotna, jest powiązanie...

,

Matematyczne techniki zarządzania - 131
Hipotezy te można weryfikować trzema równoważnymi testami:
• testem t Studenta (tylko dla regresji dwu zmiennych)
• testem F Fishera-Snedecora
• testem R Wallace’a-Snedecora

,

W każdym przypadku obliczamy wartość
statystyki dla próbki (tobl, Fobl, Robl) i porównujemy z wartością krytyczną odczytaną z tablicy odpowiedniego rozkładu w
funkcji poziomu istotności i liczby stopni
swobody (ttabl, Ftabl, Rtabl)

Reguła decyzyjna:
• jeżeli |tobl|< ttabl, nie ma podstaw do odrzucenia H0 (brak korelacji)
• jeżeli |tobl|> ttabl, odrzucamy H0 na korzyść H1 (korelacja istnieje)

TAK SAMO DLA
FiR

W przypadku regresji wielorakiej, gdy liczba zmiennych objaśniajacych
jest duża w porównaniu do liczby obserwacji, współczynnik determinacji
R2 może dawać zawyżoną ocenę stopnia wyjaśnienia zmienności zmiennej
objaśnianej; dlatego wprowadzono skorygowany współczynnik determinacji (i korelacji):
 ( yˆ i  y )

R

2

2

k
n

k

1


2
nk 1
(
y

y
)

i
n1

• adjusted coefficient of multiple
determination (wydruki komputerowe)

• jeśli k jest małe, nie ma większej różnicy
pomiędzy normalnym a skorygowanym R2

Matematyczne techniki zarządzania - 132
Skąd wziąć wartość odpowiedniej statystyki dla próbki i jak odczytywać jej wartości z tablic?
n2
r
t

r

t tabl  t  / 2 { n  2 }
TEST STUDENTA
obl
2
sr
1 r

F obl 

TEST FISHERA

Ź ró d ło z m ien n o śc i

MSTR
MSE



R

nk

2

1 R

2

L ic zb a sto p n i
sw o b o d y

Suma
k w a d ra tó w

Ś re d n i
k w a d ra t

M o d el (c z yn n ik i)
B łą d (re sz ta )

k1
nk

SSTR
SSE

MSTR
MSE

R azem

n1

SSTO

TEST WALLACE’A

R obl 

R

2

k 1

F tabl  F { k  1 , n  k }

S ta ty sty k a
F
F obl 

MSTR
MSE

NIE MYLIĆ
STOPNI SWOBODY LICZNIKA I MIANOWNIKA

R tabl  R { k , n  k }

Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

Matematyczne techniki zarządzania - 133
Odczyt Rtabl z tablicy testu R (SKRYPT s.161-162)

, k,  = n-k

S to pn ie
sw ob od y
8
18
28

2
0,05
0,632
0,444
0,361

0,01
0,765
0,561
0,463

L iczb a zm ien n ych
3
0,05
0,01
0,726
0,827
0,532
0,633
0,439
0,530

4
0,05
0,777
0,587
0,490

0,01
0,860
0,678
0,573

Wnioski dotyczące rozkładu R Wallace’a-Snedecora:
• tablica zawiera maksymalne wartości współczynnika korelacji w danej
sytuacji, jakich można oczekiwać, gdy nie ma korelacji w populacji
• im wyższy poziom istotności, tym niższe Rtabl

• im większa liczba zmiennych w modelu, tym wyższe Rtabl
• im wyższa liczba stopni swobody (większa próbka), tym niższe Rtabl
• tablica R powstała z przeliczenia tablic t oraz F (odwrócenie wzorów)
• tablica testu R jest najszybszym i nawygodniejszym narzędziem do
weryfikacji istotności korelacji

Werdykt z etapu I:

Matematyczne techniki zarządzania - 134

• jeżeli Robl>Rtabl, model jest poprawny, można przejść do etapu II
• jeżeli Roblzmiennych objaśniających albo jego postać matematyczną
ETAP I OBOWIĄZUJE DLA WSZYSTKICH MODELI
ETAP I PRZEPROWADZA SIĘ DLA TRANSFORMATY (dla postaci pierwotnej
można uzyskać R>1)
Rola współczynnika determinacji R2
• korelacja może być istotna przy małym R i bardzo małym R2 (r=0,4,
R2=0,16, co oznacza, że tylko 16% zmienności zmiennej Y jest
wyjaśnione przez zmienną objaśniającą)
• małe R2 oznacza niski stopień wyjaśnienia rzeczywistości i stanowi
zagrożenie dla modelu
• należy dążyć (poprzez odpowiedni dobór zmiennych-przyczyn i postaci
matematycznej modelu) do jak największego R2 (dla postaci pierwotnej)
• wysoka wartość R2 świadczy o dobrym poznaniu badanego zjawiska
• wysoka wartość R2 bardzo często wynika jednak ze złego dobrania
zmiennych objaśniających (silnie powiązane ze sobą — „masło maślane”)
KORELACJA POZORNA — jest zależność, ale jej nie ma? Przyczyny...
Trzeba unikać wartości bezwzględnych (ludność, liczba sklepów, wielkość produkcji)

6

9

12

8

11

12

11

15

9

18

9

11

11

18

15

Matematyczne techniki zarządzania - 135
Etap II. Badanie wyrazistości modelu
Y

Wyrazistość modelu dana jest wzorem

s( y )

ui

y

W obl 

s( y )

100 %

y

Celem etapu
jest kontrola
rozrzutu danych

Współczynnik Wobl<30%, w przeciwnym
przypadku rozrzut danych jest zbyt duży

y

Kłopoty: gdyy jest bliskie 0

x

X

Werdykt: model poprawny lub niepoprawny

ETAP II OBOWIĄZUJE DLA WSZYSTKICH MODELI (ale nie ma on charakteru
statystycznego)

ETAP II PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ (sprawdzamy, czy
nie występuje silny efekt „krzywego lustra”)
Etap III. Badanie istotności parametrów (współczynników) modelu
Celem etapu jest sprawdzenie:
• czy poszczególne zmienne objaśniające mają istotny wpływ na zmienną
objaśnianą?
• czy zmienne objaśniające są wybrane prawidłowo?

• czy wyraz wolny różni się istotnie od zera?

Matematyczne techniki zarządzania - 136
Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

Problem istotności parametrów ai można rozpatrywać (tak jak problem
średniej dla populacji) z dwu punktów widzenia:
• przedziału ufności dla nieznanej wartości i

• hipotez — zerowej H0: i=0 i alternatywnej H1: i 0

1
0

ai

1

i

ISTOTNY (W PRZEDZIALE NIE MA ZERA)

0

ai

i

NIEISTOTNY (W PRZEDZIALE JEST ZERO)

P ( a i  t / 2 { n  k } s ( a i )   i  a i  t / 2 { n  k } s ( a i )  1  

Z tablicy rozkładu Studenta, a nie z wydruku komputerowego!

Matematyczne techniki zarządzania - 137
Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

W praktyce posługujemy się raczej hipotezami:
Badanie istotności przeprowadza
się dla każdego i oddzielnie:

t obl ( a i ) 

ai  0
s(a i )

t tabl  t  / 2 { n  k }

• jeżeli |tobl(ai)|>ttabl(ai), odrzucamy hipotezę zerową; parametr jest istotny z błędem równym co najwyżej 
• jeżeli |tobl(ai)|parametr nie jest istotny
Praktycznie jest to bardzo łatwe:
• sprawdzamy, czy |t(ai)| jest większe czy mniejsze od około 2, a najlepiej
• porównujemy rzeczywisty poziom istotności P(ai) z przyjętym 
ODRZUCAMY H0, JEŻELI P(ai) JEST MNIEJSZE OD 

WTEDY ZMIENNA
Xi MA WPŁYW NA
ZMIENNĄ Y

Matematyczne techniki zarządzania - 138
W etapie III następuje ostateczna selekcja zmiennych objaśniających:
• jeżeli wszystkie ai okażą się istotne, model jest poprawny:
— model przyczynowo-skutkowy: do interpretacji
— model tendencji rozwojowej: do etapu IV
• jeżeli choć jedno ai okaże się nieistotne, model jest niepoprawny i wymaga poprawy przez usunięcie nieistotnych zmiennych:
— zmienne należy usuwać po jednej (ze względu na efekt katalityczny)
— usuwa się zawsze zmienną o najniższej wartości |t(ai)| [czyli o
najwyższej wartości P(ai)]
— usunięcie ostatniej zmiennej nieistotnej kończy proces selekcji
kandydatek na zmienne,

— selekcja nie jest ostateczna, gdyż zawsze istnieje możliwość zamiany zmiennych, które są powiązane ze sobą
Praktyczne znaczenie istotności wyrazu wolnego a0
To są jedne z możliwości dla populacji (p. plansza 106)

Y

W przypadku funkcji K=f(P) wyraz wolny wyznacza poziom kosztów stałych (rachunkowość zarządcza)
W przypadku zależności technicznej Q=f(h) wyraz
wolny oznacza, że przy miąższości pokładu h=0 wydajność produkcji Q też jest równa 0

0
X

Matematyczne techniki zarządzania - 139
Praktyczne znaczenie istotności współczynnika regresji ai



KRZYWE NEYMANA — PLANSZE 106-107
WSPÓŁCZ. ISTOTNY
WSPÓŁ. NIEISTOTNY

ETAP III OBOWIĄZUJE DLA WSZYSTKICH MODELI
ETAP III PRZEPROWADZA SIĘ DLA TRANSFORMATY
Etap IV. Badanie symetrii składnika losowego

Y

CZĘSTOŚĆ RESZT DODATNICH I UJEMNYCH MA BYĆ
ZBLIŻONA

Y

ASYMETRYCZNY
SYMETRYCZNY

t
t
Badanie symetrii przeprowadza się testem Studenta (St. Bartosiewicz
Ekonometria)
Brak symetrii wymaga zmiany matematycznej postaci modelu
ETAP IV OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ

ETAP IV PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ

Matematyczne techniki zarządzania - 140
Etap V. Badanie losowości składnika losowego

Y

Y
NIELOSOWY

LOSOWY

t
t
Badanie losowości przeprowadza się testem Studenta lub testem serii
(Ekonometria, praca zb. pod red. M. Krzysztofiaka)
Brak losowości wymaga zmiany matematycznej postaci modelu
ETAP V OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP V PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ
Etap VI. Badanie stacjonarności składnika losowego
W etapie tym chodzi o niezależność wariancji składnika losowego od
zmiennej objaśniającej t (plansza 127)

Bada się istotność współczynnika korelacji ru t , t
ETAP VI OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VI PRZEPROWADZA SIĘ DLA TRANSFORMATY

Matematyczne techniki zarządzania - 141
Etap VII. Badanie wartości oczekiwanej składnika losowego
Normalnie, gdy przeprowadzamy estymację postaci liniowej, parametry
składnika losowego E ( )  0
{ ui  0}
V ( )  const
Po retransformacji do postaci pierwotnej mamy nowe reszty u’, dla
których
'
'
ui  0
 ui  0
Celem etapu jest sprawdzenie, czy odchyłka od O nie jest zbyt duża
(służy do tego test Studenta)
ETAP VII OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VII PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ
Etap VIII. Badanie autokorelacji składnika losowego
Pojęcie autokorelacji opisano na planszy 128; chodzi o istotność korelacji ru , u
t

tk

Badanie autokorelacji można przeprowadzić:

• testem R istotności korelacji ru

t

,ut  k

d obl

• testem Durbina-Watsona
NIE MA AUTOK.

d1

?

d2 JEST AUTOKORELACJA

ETAP VIII OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VIII PRZEPROWADZA SIĘ DLA TRANSFORMATY

Matematyczne techniki zarządzania - 142
Etap IX. Badanie normalności składnika losowego
Celem etapu jest stwierdzenie, czy reszty mają rozkład normalny
Analiza reszt — oddzielny dział analizy regresji i korelacji
Jeżeli reszty mają rozkład normalny, statystyk otrzymuje „ulgi”
ETAP 6. PRAKTYCZNA INTERPRETACJA MODELU



Celem etapu jest wydobycie z modelu całej nowej wiedzy, której nie widać
„gołym okiem”
INTERPRETUJĄC MODEL (RÓWNANIE REGRESJI) NALEŻY UŻYWAĆ WYŁĄCZNIE
PROSTEJ TERMINOLOGII EKONOMICZNEJ ZROZUMIAŁEJ DLA KLIENTA
NIE NALEŻY UŻYWAĆ TERMINOLOGII MATEMATYCZNEJ ZROZUMIAŁEJ TYLKO DLA
TWÓRCÓW MODELU
INTERPRETOWAĆ WOLNO TYLKO MODEL ZWERYFIKOWANY
CAŁY TRUD MODELOWANIA NIE MOŻE BYĆ „SZTUKĄ DLA SZTUKI”, LECZ MA
SŁUŻYĆ UZYSKANIU KONKRETNYCH WNIOSKÓW PRAKTYCZNYCH

Interpretacja modelu przyczynowo-skutkowego

Polega ona na określeniu wpływu poszczególnych czynników na badane
zjawisko:
• podział wszystkich czynników na trzy grupy

Matematyczne techniki zarządzania - 143
A — czynniki nie mające wpływu na Y
B — czynniki mające wpływ na Y i wprowadzone do modelu
C — czynniki mające wpływ na Y, ale nie występujące w modelu
• ocena jakościowa wpływu czynników B i C
• ocena ilościowa wpływu czynników B i C
Ocena jakościowa



Na podstawie znaków stojących przy współczynnikach r oraz ai możemy
stwierdzić, że wpływ jest:

• dodatni (im lepsze zaliczenie, tym lepszy wynik egzaminu; im więcej
wydatków na reklamę, tym większy zysk; itd.)
• ujemny (im więcej zatrudnionych, tym gorszy wynik finansowy; im
mniej braków, tym wyższy zysk; im mniejsza absencja, tym wyższe
wynagrodzenie; itd.)

Ocena ilościowa
• model liniowy
Przykład 33. Zinterpretuj zweryfikowany model zależności miesięcznych
kosztów działalności przedsiębiorstwa (tys. zł) od wielkości produkcji
(sztuk) i liczby reklamacji:
y i  50 , 8  14 , 5 x 1  3 , 9 x 2  

Matematyczne techniki zarządzania - 144
a0 = 50,8

poziom kosztów stałych; jeśli firma nie będzie prowadzić
żadnej działalności, poniesie koszty w wysokości 50,8 tys. zł

a1 = 14,5

każda sztuka produktu firmy kosztuje ją przeciętnie 14,5
tys. zł; jeżeli firma zwiększy produkcję o 2 sztuki, koszty
wzrosną o 29,0 tys. zł

a2 = 3,9każda wniesiona reklamacja powiększa koszty przeciętnie o
3,9 tys. zł
• model potęgowy
Przykłąd 34. Zinterpretuj zweryfikowaną funkcję produkcji Cobba-Douglasa
0 , 65

Pi  45 , 2 M i

0 , 73

Zi

e

0 , 04



Funkcja produkcji to specjalny model, określający zależność pomiędzy
produkcją (P) a czynnikami produkcji: majątkiem trwałym (M) i nakładami
robocizny (Z).



Funkcje produkcji to modele umożliwiające „prześwietlenie”
przedsiębiorstwa (szereg czasowy) lub branży (dane przekrojowe) i określenie poziomu gospodarowania oraz postępu
technicznego i organizacyjnego.
Elastyczność  to współczynnik określający reakcję zmiany
jednej zmiennej na inną zmienną — na przykład elastyczność
cenowa popytu (jak popyt zmienia się wraz z ceną towaru).

EKSPERCI
ZACHODNI

Matematyczne techniki zarządzania - 145

 

y
y

:

x

FUNKCJA POTĘGOWA JEST JEDYNĄ FUNKCJĄ O STAŁEJ ELASTYCZNOŚCI

x

Izolinie funkcji produkcji

T1
M

Produkcję P można osiągnąć różnymi
kombinacjami majątku i robocizny:

T2

• T1— technika kapitałochłonna, np.
pełna automatyzacja
• T2 — pośredni poziom techniki

T3
P  const

• T3 — niski poziom techniki, produkcja
pracochłonna
P. LOWE

Z
Efekt poprawy zarządzania bez
zmiany techniki (lepsze wykorzystanie ludzi i sprzętu):

P2
M

ZARZĄDZANIE
TECHNOLOGIĄ

P1

T

• zmniejszenie kapitałochłonności

• zmniejszenie pracochłonności
• zwiększenie produkcji (przejście z
funkcji P1 na P2)

Można też rozpatrzyć łączne efekty
zmiany techniki i zarządzania

Z

Matematyczne techniki zarządzania - 146
Wszystkie informacje tego typu można odczytać w trakcie interpretacji
0 , 65
0 , 73 0 , 04
funkcji produkcji:
Pi  45 , 2 M i
Zi
e

• wartości 45,2 nie interpretuje się
• wartość 0,65 to współczynnik elastyczności majątkowej (kapitałowej)
produkcji: zmiana majątku o 10% daje średnio zmianę produkcji o 6,5%
• wartość 0,73 to współczynnik elastyczności zatrudnieniowej produkcji:
zmiana zatrudnienia o 10% daje zmianę produkcji średnio o 7,3%
• suma obu współczynników k=0,65+0,73=1,38 to współczynnik skali
produkcji:

— jeżeli k<1, to firma rozwija się ekstensywnie
— jeżeli k>1, to firma rozwija się intensywnie
• wartość  = 0,04 to współczynnik postępu organizacyjnego:
— jeżeli  >O, to miał miejsce postęp organizacyjny

— jeżeli  <0, to miał miejsce regres organizacyjny
Interpretacja modelu tendencji rozwojowej

DODAMY
TROCHĘ
TEORII

Przypomnienie: t — zmienna objaśniająca (stałe przyrosty)
y — zmienna objaśniana; rozdzielana w ogólności na trzy
części: trend, wahania okresowe, wahania losowe ()

Matematyczne techniki zarządzania - 147
Wykres z planszy 117 (zużycie energii elektrycznej przez WZ AGH)
WAHANIA OKRESOWE OKREŚLA SIĘ WZGLĘDEM TRENDU A
NIE WZGLĘDEM OSI CZASU

y

trend

t
1995

1996

1997

1998

1999

Te trzy części trzeba zidentyfikować, a potem złożyć razem w model:

• addytywny (jeśli amplituda wahań jest stała)
• multiplikatywny (jeśli amplituda wahań rośnie lub maleje regularnie)
Wyznaczanie trendu
Metody mechaniczne:

• wskaźniki bezwzględne (stały przyrost =
postęp arytmetyczny = funkcja liniowa)
• wskaźniki względne (przyrost o stały procent =
postęp geometryczny = funkcja potęgowa)
• średnia ruchoma (wygładzanie danych linią łamaną)

JAK OBLICZYĆ O
ILE PROCENT ROCZNIE SPADAŁA
ŚREDNIO LICZBA
WIDZÓW W
KINACH:
1982 - 193,7 MLN
1989 - 141,3 MLN

Matematyczne techniki zarządzania - 148
Średnia ruchoma: mając szereg czasowy y1, y2,....., yn, przyjmujemy
długość kroku k = 3, lub 5, lub 7 itd. i liczymy
y  ...  y k
y  ...  y k  1
y k / 2 0 ,5  1
a następnie y k / 2  1 , 5  2
itd.
k
k
y  y2  y3
y  y3  y4
dla k=3:
y2  1
y3  2
itd.
3
3
Przykład 35. Wyznacz trend metodą średniej ruchomej dla następujących
danych:
okres
t
wartość yt

1
5

2
4

3
7

4
6

5
8

12

y2 
10

y3 

y

8

y4 

6
4

y5 

2

y6 

0
0

1

2

3

4

5

czas, t

6

7

8

9

y7 

547

6
10

 5 , 67

CECHY
ŚREDNIEJ
RUCHOMEJ:

 7 , 00

• TRACI SIĘ
k-1 DANYCH

3
768

8
8

 5 , 33

3
476

7
9

3
6  8  10

 8 , 00

3
8  10  9

 9 , 00

3
10  9  8

 9 , 00

• IM
WIĘKSZE k,
TYM
BARDZIEJ
SZTYWNY
TREND

3

Metody statystyczne: analiza regresji i korelacji, różne funkcje oparte na
modelach ekonomii

Matematyczne techniki zarządzania - 149
Wyznaczanie wahań okresowych: dobowych, tygodniowych, miesięcznych,
kwartalnych, rocznych, wieloletnich
Trzy metody:

— metoda wskaźników sezonowości
— metoda zmiennych zero-jedynkowych (0-1)

— metoda harmoniczna
Wszystkie metody mają jeden cel:
uzyskanie przeciętnego obrazu jednego cyklu

+

Ws
[t ]
[%]
trend

I

II



III

IV

WADY:
• KONIECZNOŚĆ
KOREKTY
• BRAK
WERYFIKACJI
STATYSTYCZNEJ

Metoda wskaźników sezonowości

• obliczenie surowych wskaźników sezonowości (wyeliminowanie trendu):
y

S s  yt  yt
S s  t
yt
addytywny multiplikatywny
wynik: n wartości odchyleń od trendu

• obliczenie oczyszczonych wskaźników
sezonowości (wyeliminowanie wahań
losowych):
 Ss
So 
k-liczba okresów
k
jednoimiennych
m-długość cyklu wynik: m wartości śr. odchyleń od trendu

Matematyczne techniki zarządzania - 150
Metoda zmiennych zero-jedynkowych (0-1)
m

y t  a 0  a1 t   bi Q i  
i 1

bi — przeciętne odchylenie od trendu dla
okresu i-tego
Qi — zmienna 0-1

wahania losowe
trend

wahania okresowe

t
1
2
3
4
5
6
7
8
9

yt
y1
y2
y3
y4
y5
y6
y7
y8
y9

Q1
1
0
0
0
1
0
0
0
1

Q2
0
1
0
0
0
1
0
0
0

Q3
0
0
1
0
0
0
1
0
0

Q4
0
0
0
1
0
0
0
1
0

Metoda harmoniczna (szeregi Fouriera)
Wahania okresowe przedstawia się jako sumę określonej liczby drgań harmonicznych (sinusoid i cosinusoid) przesuniętych w fazie, lecz o jednakowym okresie
m /2
2 i m / 2
2 i
y t  a 0  a 1 t   b1 i sin
  b 2 i cos

m
m
i 1
i 1
Obie metody dają taki sam wynik, istnieje możliwość weryfikacji
statystycznej
W metodzie 0-1 dostajemy bi = Ws, natomiast w metodzie harmonicznej Ws
jest sumą wartości poszczególnych sinusoid dla danego momentu czasu


Slide 11

Matematyczne techniki zarządzania - 121
ETAP 2. GROMADZENIE DANYCH STATYSTYCZNYCH

!

ZA JAKOŚĆ DANYCH ODPOWIADA MODELUJĄCY
• rodzaje danych: dane przekrojowe i szeregi czasowe
• źródła danych: roczniki statystyczne, różne działy
przedsiębiorstwa, badania marketingowe, wywiady itd.
• wiarygodność danych: do jakiego celu zostały one
przygotowane?

MUSISZ
SPRAWDZAĆ
KAŻDE DANE

• porównywalność danych: inflacja (ceny bieżące a ceny
stałe), zmiany procesów technicznych
Wielkość
produkcji

• zmienność zjawisk: trzeba sprawdzić, czy
wybrana w etapie 1a zmienna jest rzeczywiście zmienną losową

Wx 

s( x )

nowy zakład

100 %

x

stary zakład

Wx musi wynosić co najmniej 30-40%
Wiek studenta może być dobrą zmiennąprzyczyną, ale nie w przypadku studiów
dziennych!

Zatrudnienie

Matematyczne techniki zarządzania - 122
ETAP 3. SELEKCJA ZMIENNYCH OBJAŚNIAJĄCYCH
KAŻDĄ ZMIENNĄ X WYTYPOWANĄ W ETAPIE 1a TRAKTUJEMY JAKO
KANDYDATKĘ NA ZMIENNĄ OBJAŚNIAJĄCĄ
Może być kilka przyczyn powodujących, że taka kandydatka nie może znaleźć się w modelu ekonometrycznym (w równaniu regresji):
• w modelu nie może być zbyt wielu zmiennych (nieczytelny)
• kandydatka może nie mieć wpływu na zmienną Y



• kandydatka może wnosić prawie tę samą informację o Y co inna
kandydatka

• dwie bardzo podobne kandydatki mogą sobie nawzajem przeszkadzać
(efekt katalityczny)
Kryteria, jakie musi spełniać kandydatka Xi, aby nadawała się do modelu:
• musi być silnie powiązana ze zmienną Y

• nie może być powiązana z inną kandydatką Xj
SSTO
x1
x4

x2
x3

reszta

R2=0,79

R2=0,66

x2
x1
x4

R2=0,48

x3
reszta

reszta

SSTO

SSTO

Matematyczne techniki zarządzania - 123
Efekt katalityczny
DWIE ZMIENNE DAJĄ
RAZEM MNIEJ INFORMACJI NIŻ KAŻDA Z
NICH Z OSOBNA

x1

x2

R2=0,25

x2

x1

R2=0,52

R2=0,66

Selekcja kandydatek ma na celu podzielenie ich na trzy grupy:
• zmienne wprowadzone do modelu
• zmienne nie wprowadzone do modelu, ale reprezentowane w nim przez
inne zmienne (możliwość wymiany)
• zmienne nie wprowadzone do modelu ze względu na fakt, że nie wnoszą
żadnej informacji o zmiennej Y
INFORMACJE potrzebne do selekcji: współczynniki r x i x j ,
Macierz współczynników korelacji
Y
Y
X1
X2
X3

0,52
0,64
- 0,21

X1
0,52
0,82
- 0,18

X2
0,64
0,82
0,08

X3
- 0,21
- 0,18
0,08

r yx

i

Przykład 32. Macierz powiązania
zmiennych ze sobą przedstawia
się następująco (n=20). Jak ją
można zinterpretować? Które
zmienne są powiązane ze sobą w
sposób istotny?

Matematyczne techniki zarządzania - 124
Testowanie istotności współczynnika korelacji
H0:  = 0

Można je przeprowadzić trzema testami: testem Studenta

H1:   0

(t), Fishera (F) i Wallace’a-Snedecora (R)

Fragment tablicy rozkładu Wallece’a-Snedecora (SKRYPT, tab. VII, s.161)
S to pn ie
sw ob od y

2
0,05
0,632
0,444
0,361

8
18
28

,

0,01
0,765
0,561
0,463

L iczb a zm ien n ych
3
0,05
0,01
0,726
0,827
0,532
0,633
0,439
0,530

4
0,05
0,777
0,587
0,490

0,01
0,860
0,678
0,573

Reguła decyzyjna: — jeżeli |Robl|>Rtabl, odrzucamy H0 (korelacja istotna)
— jeżeli |Robl|
W przykładzie 32, jeżeli przyjmiemy  = 0,05, to Rtabl = 0,444.
Y
Y
X1
X2
X3

0,52
0,64
- 0,21

X1
0,52
0,82
- 0,18

X2
0,64
0,82
0,08

X3
- 0,21
- 0,18
0,08

Pozostaną zatem tylko trzy
istotne powiązania:
y-x1, y-x2, x1-x2
BRAK ISTOTNEGO POWIĄZANIA Z Y NIE
OZNACZA, ŻE ZMIENNA NIE WNOSI
ŻADNEJ INFORMACJI O ZJAWISKU Y

Matematyczne techniki zarządzania - 125



Metody selekcji zmiennych objaśniających:
• grafowa
• Hellwiga (pojemności informacji)
• taksonomiczne (clustering)
Metoda grafowa
• obliczenie macierzy współczynników:

rx

i

xj

• wyłowienie z macierzy powiązań istotnych

, r yx

BUDOWA GRAFU
i

• graf spójny

• budowa grafu z powiązań istotnych
• wybranie zmiennych na podstawie grafu

x6

• graf zerowy
x1
x4

x9

DO MODELU WYBIERA SIĘ ZMIENNE:
• każdy graf zerowy (jeśli |ryx|>0,1)

istotne powiązanie

• po jednej reprezentantce grafu spójnego;

reprezentantką grafu jest zmienna, która ma najwięcej powiązań z
innymi kandydatkami
jeżeli kilka zmiennych ma tę samą maksymalną liczbę powiązań, wybiera
się z nich tę, która jest najsilniej powiązana za zmienną Y (max ryx)
jeżeli graf jest rozległy, może mieć dwie reprezentantki, ale muszą one
leżeć na przeciwległych stronach grafu

Matematyczne techniki zarządzania - 126
Przykład 32 cd. Wybierzemy
zmienną x2 (reprezentantka grafu
spójnego) i zmienną x3 (graf
zerowy)
Metoda Hellwiga

Y
Y
X1
X2
X3

0,52
0,64
- 0,21

• wypisujemy wszystkie możliwe kombinacje
kandydatek; jest ich K = 2m—1
• obliczamy pojemność informacji dla każdej
zmiennej w każdej kombinacji

h kl  f ( r yx , r x
i

ixj

)

• obliczamy pojemność całkowitą dla każdej
kombinacji
H l   h kl
k

• wybieramy kombinację o największej
pojemności Hl = max

X1
0,52
0,82
- 0,18

X2
0,64
0,82

X3
- 0,21
- 0,18
0,08

0,08

W przykładzie 32 mamy 7
możliwych kombinacji kandydatek:
1. x1
2. x2

3. x3

maximum:

H6 = 0,42

4. x1,x2
5. x1,x3

Hmax = R2

6. x2,x3
7. x1,x2,x3

Metody taksonomiczne
Taksonomia wrocławska (cluster analysis) to metoda grupowania obiektów (zmiennych) w grupy jednorodne pod względem n cech (wymiarów)
łącznie. Podstawą grupowania jest odległość euklidesowa, która w przypadku zmiennych d ij  f ( r x x )
WSZYSTKIE METODY TO SELEKCJA WSTĘPNA
i

j

Matematyczne techniki zarządzania - 127
ETAP 4. ESTYMACJA PARAMETRÓW MODELU
Cel etapu: wyznaczenie parametrów strukturalnych i stochastycznych
Estymacja: szacowanie parametrów populacji na podstawie próbki
Metody estymacji: analiza regresji i korelacji (KMNK i inne)

Założenia dla KMNK
1. Zmienne losowe są prawdziwymi zmiennymi, nie powiązanymi ze sobą
2. Składnik losowy  ma stałą wariancję, niezależną od zmiennej x lub t
3. Wartości reszt ui są niezależne od siebie

4. Składnik losowy  nie jest powiązany ze zmienną objaśniającą
Skutki niedotrzymania założeń i środki zaradcze
1. Model bez sensu, nieprzydatny; niekiedy absurdalny (źle uwarunkowane
dane)
Stosuje się: dużą próbkę (n>100), regresję grzbietową (ridge regression)
2.

Y

reszta ui

Lewa część zbioru ma dużą wariancję, a
prawa — wariancję małą
Stosuje się specjalny wariant MNK z
korektą na różne wariancje
X

Matematyczne techniki zarządzania - 128
3. Jeśli reszty ui są ze sobą powiązane (skorelowane), mówimy, że
występuje autokorelacja składnika losowego (zjawisko występuje przy
szeregach czasowych — sztywny porządek obserwacji)
Oznacza to, że istnieje istotna zależność u t  f ( u t  k )
Przyczyny autokorelacji: zakłócenia
(dodatnie lub ujemne) w jednym okresie
wpływają na poziom zjawiska w następnych
okresach (rolnictwo, produkcja, rynek)

t  1 , 2 ,...

u t  y t  yˆ t

u t 1

u1
u2
u3
u4
u5

Występowanie autokorelacji powoduje
nieprzydatność modelu


u1
u2
u3
u4

Istnienie autokorelacji sprawdza się testem
Durbina-Watsona d
Stosuje się metodę różniczki zupełnej

y  f (x )

yt  yt  ytk

4. Składnik losowy jest skorelowany ze zmienną objaśniającą, wtedy
gdy została pominięta jakaś ważna zmienna-przyczyna

Model taki nie ma żadnej wartości; trzeba dbać o jak najwyższy współczynnik determinacji (R2>0,9)
• zbiór danych rzeczywistych nigdy
nie spełnia tych wymagań

ESTYMACJĘ MODELU POWTARZA SIĘ WIELOKROTNIE
ponieważ dopiero weryfikacja zapewnia ostateczną selekcję
kandydatek na zmienne objaśniające

• ekonometria to analiza danych nie
spełniających tych założeń
• nie stosować statystyki bezmyślnie (na ślepo)

Matematyczne techniki zarządzania - 129
ETAP 5. WERYFIKACJA MODELU
Cele:

1. opis rzeczywistości (populacji generalnej)



2. dokładna (ostateczna) selekcja zmiennych objaśniających
3. poznanie składnika losowego (spełnienie założeń KMNK)
Narzędzia: hipotezy i testy statystyczne

Metodyka: każde równanie oddzielnie; weryfikacja obejmuje 9 etapów (od
najmniej do najbardziej pracochłonnego)
WYKAZ ETAPÓW WERYFIKACJI MODELU
I.
II.

Badanie istotności korelacji
Badanie wyrazistości modelu

III.

Badanie istotności parametrów

IV.

Badanie symetrii skł. losowego

V.
VI.
VII.
VIII.
IX.

Badanie losowości skł. losowego
Badanie stacjonarności skł. los.
Badanie wartości oczekiwanej skł. los.
Badanie autokorelacji skł. losowego
Badanie normalności skł. losowego

Opis każdego etapu weryfikacji
obejmuje:
• cel etapu
• sposób weryfikacji: wzory,
hipotezy, testy
• podanie których modeli dotyczy (przyczynowo-skutkowych
czy tendencji rozwojowej)
• podanie której postaci modeli
nieliniowych dotyczy (pierwotnej czy transformaty)

Matematyczne techniki zarządzania - 130
Etap I. Badanie istotności korelacji
7
2

8

9

11

12

17

19

23

21

5
2 etapu
9
16
7
9
15
14
Celem
jest
sprawdzenie,
czy
istnieje w populacji generalnej powiązanie pomiędzy zmienną Y i wszystkimi zmiennymi objaśniającymi

25

Przedział ufności dla
nieznanego współczynnika korelacji  dla populacji buduje się przy
użyciu błędu

populacja

zmienna Y

20
15
10

próbka

5
0
8
5

0 9

1011

2

9

20
12

30
17
16
7
zmienna X

25

1940
9

23 50
15

populacja

20

zmienna Y

7
2

15
10

próbka

5
0
0

10

20

30

zmienna X

40

50

21
14

sR 

1 R

0

Robl

2

nk

Istotność korelacji weryfikuje się przez postawienie
następujących hipotez dla
współczynnika korelacji dla
populacji generalnej:

1
R,|r|

H0 :   0

Brak korelacji, nie ma powiązania...

H1 :   0

Korelacja istotna, jest powiązanie...

,

Matematyczne techniki zarządzania - 131
Hipotezy te można weryfikować trzema równoważnymi testami:
• testem t Studenta (tylko dla regresji dwu zmiennych)
• testem F Fishera-Snedecora
• testem R Wallace’a-Snedecora

,

W każdym przypadku obliczamy wartość
statystyki dla próbki (tobl, Fobl, Robl) i porównujemy z wartością krytyczną odczytaną z tablicy odpowiedniego rozkładu w
funkcji poziomu istotności i liczby stopni
swobody (ttabl, Ftabl, Rtabl)

Reguła decyzyjna:
• jeżeli |tobl|< ttabl, nie ma podstaw do odrzucenia H0 (brak korelacji)
• jeżeli |tobl|> ttabl, odrzucamy H0 na korzyść H1 (korelacja istnieje)

TAK SAMO DLA
FiR

W przypadku regresji wielorakiej, gdy liczba zmiennych objaśniajacych
jest duża w porównaniu do liczby obserwacji, współczynnik determinacji
R2 może dawać zawyżoną ocenę stopnia wyjaśnienia zmienności zmiennej
objaśnianej; dlatego wprowadzono skorygowany współczynnik determinacji (i korelacji):
 ( yˆ i  y )

R

2

2

k
n

k

1


2
nk 1
(
y

y
)

i
n1

• adjusted coefficient of multiple
determination (wydruki komputerowe)

• jeśli k jest małe, nie ma większej różnicy
pomiędzy normalnym a skorygowanym R2

Matematyczne techniki zarządzania - 132
Skąd wziąć wartość odpowiedniej statystyki dla próbki i jak odczytywać jej wartości z tablic?
n2
r
t

r

t tabl  t  / 2 { n  2 }
TEST STUDENTA
obl
2
sr
1 r

F obl 

TEST FISHERA

Ź ró d ło z m ien n o śc i

MSTR
MSE



R

nk

2

1 R

2

L ic zb a sto p n i
sw o b o d y

Suma
k w a d ra tó w

Ś re d n i
k w a d ra t

M o d el (c z yn n ik i)
B łą d (re sz ta )

k1
nk

SSTR
SSE

MSTR
MSE

R azem

n1

SSTO

TEST WALLACE’A

R obl 

R

2

k 1

F tabl  F { k  1 , n  k }

S ta ty sty k a
F
F obl 

MSTR
MSE

NIE MYLIĆ
STOPNI SWOBODY LICZNIKA I MIANOWNIKA

R tabl  R { k , n  k }

Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

Matematyczne techniki zarządzania - 133
Odczyt Rtabl z tablicy testu R (SKRYPT s.161-162)

, k,  = n-k

S to pn ie
sw ob od y
8
18
28

2
0,05
0,632
0,444
0,361

0,01
0,765
0,561
0,463

L iczb a zm ien n ych
3
0,05
0,01
0,726
0,827
0,532
0,633
0,439
0,530

4
0,05
0,777
0,587
0,490

0,01
0,860
0,678
0,573

Wnioski dotyczące rozkładu R Wallace’a-Snedecora:
• tablica zawiera maksymalne wartości współczynnika korelacji w danej
sytuacji, jakich można oczekiwać, gdy nie ma korelacji w populacji
• im wyższy poziom istotności, tym niższe Rtabl

• im większa liczba zmiennych w modelu, tym wyższe Rtabl
• im wyższa liczba stopni swobody (większa próbka), tym niższe Rtabl
• tablica R powstała z przeliczenia tablic t oraz F (odwrócenie wzorów)
• tablica testu R jest najszybszym i nawygodniejszym narzędziem do
weryfikacji istotności korelacji

Werdykt z etapu I:

Matematyczne techniki zarządzania - 134

• jeżeli Robl>Rtabl, model jest poprawny, można przejść do etapu II
• jeżeli Roblzmiennych objaśniających albo jego postać matematyczną
ETAP I OBOWIĄZUJE DLA WSZYSTKICH MODELI
ETAP I PRZEPROWADZA SIĘ DLA TRANSFORMATY (dla postaci pierwotnej
można uzyskać R>1)
Rola współczynnika determinacji R2
• korelacja może być istotna przy małym R i bardzo małym R2 (r=0,4,
R2=0,16, co oznacza, że tylko 16% zmienności zmiennej Y jest
wyjaśnione przez zmienną objaśniającą)
• małe R2 oznacza niski stopień wyjaśnienia rzeczywistości i stanowi
zagrożenie dla modelu
• należy dążyć (poprzez odpowiedni dobór zmiennych-przyczyn i postaci
matematycznej modelu) do jak największego R2 (dla postaci pierwotnej)
• wysoka wartość R2 świadczy o dobrym poznaniu badanego zjawiska
• wysoka wartość R2 bardzo często wynika jednak ze złego dobrania
zmiennych objaśniających (silnie powiązane ze sobą — „masło maślane”)
KORELACJA POZORNA — jest zależność, ale jej nie ma? Przyczyny...
Trzeba unikać wartości bezwzględnych (ludność, liczba sklepów, wielkość produkcji)

6

9

12

8

11

12

11

15

9

18

9

11

11

18

15

Matematyczne techniki zarządzania - 135
Etap II. Badanie wyrazistości modelu
Y

Wyrazistość modelu dana jest wzorem

s( y )

ui

y

W obl 

s( y )

100 %

y

Celem etapu
jest kontrola
rozrzutu danych

Współczynnik Wobl<30%, w przeciwnym
przypadku rozrzut danych jest zbyt duży

y

Kłopoty: gdyy jest bliskie 0

x

X

Werdykt: model poprawny lub niepoprawny

ETAP II OBOWIĄZUJE DLA WSZYSTKICH MODELI (ale nie ma on charakteru
statystycznego)

ETAP II PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ (sprawdzamy, czy
nie występuje silny efekt „krzywego lustra”)
Etap III. Badanie istotności parametrów (współczynników) modelu
Celem etapu jest sprawdzenie:
• czy poszczególne zmienne objaśniające mają istotny wpływ na zmienną
objaśnianą?
• czy zmienne objaśniające są wybrane prawidłowo?

• czy wyraz wolny różni się istotnie od zera?

Matematyczne techniki zarządzania - 136
Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

Problem istotności parametrów ai można rozpatrywać (tak jak problem
średniej dla populacji) z dwu punktów widzenia:
• przedziału ufności dla nieznanej wartości i

• hipotez — zerowej H0: i=0 i alternatywnej H1: i 0

1
0

ai

1

i

ISTOTNY (W PRZEDZIALE NIE MA ZERA)

0

ai

i

NIEISTOTNY (W PRZEDZIALE JEST ZERO)

P ( a i  t / 2 { n  k } s ( a i )   i  a i  t / 2 { n  k } s ( a i )  1  

Z tablicy rozkładu Studenta, a nie z wydruku komputerowego!

Matematyczne techniki zarządzania - 137
Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

W praktyce posługujemy się raczej hipotezami:
Badanie istotności przeprowadza
się dla każdego i oddzielnie:

t obl ( a i ) 

ai  0
s(a i )

t tabl  t  / 2 { n  k }

• jeżeli |tobl(ai)|>ttabl(ai), odrzucamy hipotezę zerową; parametr jest istotny z błędem równym co najwyżej 
• jeżeli |tobl(ai)|parametr nie jest istotny
Praktycznie jest to bardzo łatwe:
• sprawdzamy, czy |t(ai)| jest większe czy mniejsze od około 2, a najlepiej
• porównujemy rzeczywisty poziom istotności P(ai) z przyjętym 
ODRZUCAMY H0, JEŻELI P(ai) JEST MNIEJSZE OD 

WTEDY ZMIENNA
Xi MA WPŁYW NA
ZMIENNĄ Y

Matematyczne techniki zarządzania - 138
W etapie III następuje ostateczna selekcja zmiennych objaśniających:
• jeżeli wszystkie ai okażą się istotne, model jest poprawny:
— model przyczynowo-skutkowy: do interpretacji
— model tendencji rozwojowej: do etapu IV
• jeżeli choć jedno ai okaże się nieistotne, model jest niepoprawny i wymaga poprawy przez usunięcie nieistotnych zmiennych:
— zmienne należy usuwać po jednej (ze względu na efekt katalityczny)
— usuwa się zawsze zmienną o najniższej wartości |t(ai)| [czyli o
najwyższej wartości P(ai)]
— usunięcie ostatniej zmiennej nieistotnej kończy proces selekcji
kandydatek na zmienne,

— selekcja nie jest ostateczna, gdyż zawsze istnieje możliwość zamiany zmiennych, które są powiązane ze sobą
Praktyczne znaczenie istotności wyrazu wolnego a0
To są jedne z możliwości dla populacji (p. plansza 106)

Y

W przypadku funkcji K=f(P) wyraz wolny wyznacza poziom kosztów stałych (rachunkowość zarządcza)
W przypadku zależności technicznej Q=f(h) wyraz
wolny oznacza, że przy miąższości pokładu h=0 wydajność produkcji Q też jest równa 0

0
X

Matematyczne techniki zarządzania - 139
Praktyczne znaczenie istotności współczynnika regresji ai



KRZYWE NEYMANA — PLANSZE 106-107
WSPÓŁCZ. ISTOTNY
WSPÓŁ. NIEISTOTNY

ETAP III OBOWIĄZUJE DLA WSZYSTKICH MODELI
ETAP III PRZEPROWADZA SIĘ DLA TRANSFORMATY
Etap IV. Badanie symetrii składnika losowego

Y

CZĘSTOŚĆ RESZT DODATNICH I UJEMNYCH MA BYĆ
ZBLIŻONA

Y

ASYMETRYCZNY
SYMETRYCZNY

t
t
Badanie symetrii przeprowadza się testem Studenta (St. Bartosiewicz
Ekonometria)
Brak symetrii wymaga zmiany matematycznej postaci modelu
ETAP IV OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ

ETAP IV PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ

Matematyczne techniki zarządzania - 140
Etap V. Badanie losowości składnika losowego

Y

Y
NIELOSOWY

LOSOWY

t
t
Badanie losowości przeprowadza się testem Studenta lub testem serii
(Ekonometria, praca zb. pod red. M. Krzysztofiaka)
Brak losowości wymaga zmiany matematycznej postaci modelu
ETAP V OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP V PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ
Etap VI. Badanie stacjonarności składnika losowego
W etapie tym chodzi o niezależność wariancji składnika losowego od
zmiennej objaśniającej t (plansza 127)

Bada się istotność współczynnika korelacji ru t , t
ETAP VI OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VI PRZEPROWADZA SIĘ DLA TRANSFORMATY

Matematyczne techniki zarządzania - 141
Etap VII. Badanie wartości oczekiwanej składnika losowego
Normalnie, gdy przeprowadzamy estymację postaci liniowej, parametry
składnika losowego E ( )  0
{ ui  0}
V ( )  const
Po retransformacji do postaci pierwotnej mamy nowe reszty u’, dla
których
'
'
ui  0
 ui  0
Celem etapu jest sprawdzenie, czy odchyłka od O nie jest zbyt duża
(służy do tego test Studenta)
ETAP VII OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VII PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ
Etap VIII. Badanie autokorelacji składnika losowego
Pojęcie autokorelacji opisano na planszy 128; chodzi o istotność korelacji ru , u
t

tk

Badanie autokorelacji można przeprowadzić:

• testem R istotności korelacji ru

t

,ut  k

d obl

• testem Durbina-Watsona
NIE MA AUTOK.

d1

?

d2 JEST AUTOKORELACJA

ETAP VIII OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VIII PRZEPROWADZA SIĘ DLA TRANSFORMATY

Matematyczne techniki zarządzania - 142
Etap IX. Badanie normalności składnika losowego
Celem etapu jest stwierdzenie, czy reszty mają rozkład normalny
Analiza reszt — oddzielny dział analizy regresji i korelacji
Jeżeli reszty mają rozkład normalny, statystyk otrzymuje „ulgi”
ETAP 6. PRAKTYCZNA INTERPRETACJA MODELU



Celem etapu jest wydobycie z modelu całej nowej wiedzy, której nie widać
„gołym okiem”
INTERPRETUJĄC MODEL (RÓWNANIE REGRESJI) NALEŻY UŻYWAĆ WYŁĄCZNIE
PROSTEJ TERMINOLOGII EKONOMICZNEJ ZROZUMIAŁEJ DLA KLIENTA
NIE NALEŻY UŻYWAĆ TERMINOLOGII MATEMATYCZNEJ ZROZUMIAŁEJ TYLKO DLA
TWÓRCÓW MODELU
INTERPRETOWAĆ WOLNO TYLKO MODEL ZWERYFIKOWANY
CAŁY TRUD MODELOWANIA NIE MOŻE BYĆ „SZTUKĄ DLA SZTUKI”, LECZ MA
SŁUŻYĆ UZYSKANIU KONKRETNYCH WNIOSKÓW PRAKTYCZNYCH

Interpretacja modelu przyczynowo-skutkowego

Polega ona na określeniu wpływu poszczególnych czynników na badane
zjawisko:
• podział wszystkich czynników na trzy grupy

Matematyczne techniki zarządzania - 143
A — czynniki nie mające wpływu na Y
B — czynniki mające wpływ na Y i wprowadzone do modelu
C — czynniki mające wpływ na Y, ale nie występujące w modelu
• ocena jakościowa wpływu czynników B i C
• ocena ilościowa wpływu czynników B i C
Ocena jakościowa



Na podstawie znaków stojących przy współczynnikach r oraz ai możemy
stwierdzić, że wpływ jest:

• dodatni (im lepsze zaliczenie, tym lepszy wynik egzaminu; im więcej
wydatków na reklamę, tym większy zysk; itd.)
• ujemny (im więcej zatrudnionych, tym gorszy wynik finansowy; im
mniej braków, tym wyższy zysk; im mniejsza absencja, tym wyższe
wynagrodzenie; itd.)

Ocena ilościowa
• model liniowy
Przykład 33. Zinterpretuj zweryfikowany model zależności miesięcznych
kosztów działalności przedsiębiorstwa (tys. zł) od wielkości produkcji
(sztuk) i liczby reklamacji:
y i  50 , 8  14 , 5 x 1  3 , 9 x 2  

Matematyczne techniki zarządzania - 144
a0 = 50,8

poziom kosztów stałych; jeśli firma nie będzie prowadzić
żadnej działalności, poniesie koszty w wysokości 50,8 tys. zł

a1 = 14,5

każda sztuka produktu firmy kosztuje ją przeciętnie 14,5
tys. zł; jeżeli firma zwiększy produkcję o 2 sztuki, koszty
wzrosną o 29,0 tys. zł

a2 = 3,9każda wniesiona reklamacja powiększa koszty przeciętnie o
3,9 tys. zł
• model potęgowy
Przykłąd 34. Zinterpretuj zweryfikowaną funkcję produkcji Cobba-Douglasa
0 , 65

Pi  45 , 2 M i

0 , 73

Zi

e

0 , 04



Funkcja produkcji to specjalny model, określający zależność pomiędzy
produkcją (P) a czynnikami produkcji: majątkiem trwałym (M) i nakładami
robocizny (Z).



Funkcje produkcji to modele umożliwiające „prześwietlenie”
przedsiębiorstwa (szereg czasowy) lub branży (dane przekrojowe) i określenie poziomu gospodarowania oraz postępu
technicznego i organizacyjnego.
Elastyczność  to współczynnik określający reakcję zmiany
jednej zmiennej na inną zmienną — na przykład elastyczność
cenowa popytu (jak popyt zmienia się wraz z ceną towaru).

EKSPERCI
ZACHODNI

Matematyczne techniki zarządzania - 145

 

y
y

:

x

FUNKCJA POTĘGOWA JEST JEDYNĄ FUNKCJĄ O STAŁEJ ELASTYCZNOŚCI

x

Izolinie funkcji produkcji

T1
M

Produkcję P można osiągnąć różnymi
kombinacjami majątku i robocizny:

T2

• T1— technika kapitałochłonna, np.
pełna automatyzacja
• T2 — pośredni poziom techniki

T3
P  const

• T3 — niski poziom techniki, produkcja
pracochłonna
P. LOWE

Z
Efekt poprawy zarządzania bez
zmiany techniki (lepsze wykorzystanie ludzi i sprzętu):

P2
M

ZARZĄDZANIE
TECHNOLOGIĄ

P1

T

• zmniejszenie kapitałochłonności

• zmniejszenie pracochłonności
• zwiększenie produkcji (przejście z
funkcji P1 na P2)

Można też rozpatrzyć łączne efekty
zmiany techniki i zarządzania

Z

Matematyczne techniki zarządzania - 146
Wszystkie informacje tego typu można odczytać w trakcie interpretacji
0 , 65
0 , 73 0 , 04
funkcji produkcji:
Pi  45 , 2 M i
Zi
e

• wartości 45,2 nie interpretuje się
• wartość 0,65 to współczynnik elastyczności majątkowej (kapitałowej)
produkcji: zmiana majątku o 10% daje średnio zmianę produkcji o 6,5%
• wartość 0,73 to współczynnik elastyczności zatrudnieniowej produkcji:
zmiana zatrudnienia o 10% daje zmianę produkcji średnio o 7,3%
• suma obu współczynników k=0,65+0,73=1,38 to współczynnik skali
produkcji:

— jeżeli k<1, to firma rozwija się ekstensywnie
— jeżeli k>1, to firma rozwija się intensywnie
• wartość  = 0,04 to współczynnik postępu organizacyjnego:
— jeżeli  >O, to miał miejsce postęp organizacyjny

— jeżeli  <0, to miał miejsce regres organizacyjny
Interpretacja modelu tendencji rozwojowej

DODAMY
TROCHĘ
TEORII

Przypomnienie: t — zmienna objaśniająca (stałe przyrosty)
y — zmienna objaśniana; rozdzielana w ogólności na trzy
części: trend, wahania okresowe, wahania losowe ()

Matematyczne techniki zarządzania - 147
Wykres z planszy 117 (zużycie energii elektrycznej przez WZ AGH)
WAHANIA OKRESOWE OKREŚLA SIĘ WZGLĘDEM TRENDU A
NIE WZGLĘDEM OSI CZASU

y

trend

t
1995

1996

1997

1998

1999

Te trzy części trzeba zidentyfikować, a potem złożyć razem w model:

• addytywny (jeśli amplituda wahań jest stała)
• multiplikatywny (jeśli amplituda wahań rośnie lub maleje regularnie)
Wyznaczanie trendu
Metody mechaniczne:

• wskaźniki bezwzględne (stały przyrost =
postęp arytmetyczny = funkcja liniowa)
• wskaźniki względne (przyrost o stały procent =
postęp geometryczny = funkcja potęgowa)
• średnia ruchoma (wygładzanie danych linią łamaną)

JAK OBLICZYĆ O
ILE PROCENT ROCZNIE SPADAŁA
ŚREDNIO LICZBA
WIDZÓW W
KINACH:
1982 - 193,7 MLN
1989 - 141,3 MLN

Matematyczne techniki zarządzania - 148
Średnia ruchoma: mając szereg czasowy y1, y2,....., yn, przyjmujemy
długość kroku k = 3, lub 5, lub 7 itd. i liczymy
y  ...  y k
y  ...  y k  1
y k / 2 0 ,5  1
a następnie y k / 2  1 , 5  2
itd.
k
k
y  y2  y3
y  y3  y4
dla k=3:
y2  1
y3  2
itd.
3
3
Przykład 35. Wyznacz trend metodą średniej ruchomej dla następujących
danych:
okres
t
wartość yt

1
5

2
4

3
7

4
6

5
8

12

y2 
10

y3 

y

8

y4 

6
4

y5 

2

y6 

0
0

1

2

3

4

5

czas, t

6

7

8

9

y7 

547

6
10

 5 , 67

CECHY
ŚREDNIEJ
RUCHOMEJ:

 7 , 00

• TRACI SIĘ
k-1 DANYCH

3
768

8
8

 5 , 33

3
476

7
9

3
6  8  10

 8 , 00

3
8  10  9

 9 , 00

3
10  9  8

 9 , 00

• IM
WIĘKSZE k,
TYM
BARDZIEJ
SZTYWNY
TREND

3

Metody statystyczne: analiza regresji i korelacji, różne funkcje oparte na
modelach ekonomii

Matematyczne techniki zarządzania - 149
Wyznaczanie wahań okresowych: dobowych, tygodniowych, miesięcznych,
kwartalnych, rocznych, wieloletnich
Trzy metody:

— metoda wskaźników sezonowości
— metoda zmiennych zero-jedynkowych (0-1)

— metoda harmoniczna
Wszystkie metody mają jeden cel:
uzyskanie przeciętnego obrazu jednego cyklu

+

Ws
[t ]
[%]
trend

I

II



III

IV

WADY:
• KONIECZNOŚĆ
KOREKTY
• BRAK
WERYFIKACJI
STATYSTYCZNEJ

Metoda wskaźników sezonowości

• obliczenie surowych wskaźników sezonowości (wyeliminowanie trendu):
y

S s  yt  yt
S s  t
yt
addytywny multiplikatywny
wynik: n wartości odchyleń od trendu

• obliczenie oczyszczonych wskaźników
sezonowości (wyeliminowanie wahań
losowych):
 Ss
So 
k-liczba okresów
k
jednoimiennych
m-długość cyklu wynik: m wartości śr. odchyleń od trendu

Matematyczne techniki zarządzania - 150
Metoda zmiennych zero-jedynkowych (0-1)
m

y t  a 0  a1 t   bi Q i  
i 1

bi — przeciętne odchylenie od trendu dla
okresu i-tego
Qi — zmienna 0-1

wahania losowe
trend

wahania okresowe

t
1
2
3
4
5
6
7
8
9

yt
y1
y2
y3
y4
y5
y6
y7
y8
y9

Q1
1
0
0
0
1
0
0
0
1

Q2
0
1
0
0
0
1
0
0
0

Q3
0
0
1
0
0
0
1
0
0

Q4
0
0
0
1
0
0
0
1
0

Metoda harmoniczna (szeregi Fouriera)
Wahania okresowe przedstawia się jako sumę określonej liczby drgań harmonicznych (sinusoid i cosinusoid) przesuniętych w fazie, lecz o jednakowym okresie
m /2
2 i m / 2
2 i
y t  a 0  a 1 t   b1 i sin
  b 2 i cos

m
m
i 1
i 1
Obie metody dają taki sam wynik, istnieje możliwość weryfikacji
statystycznej
W metodzie 0-1 dostajemy bi = Ws, natomiast w metodzie harmonicznej Ws
jest sumą wartości poszczególnych sinusoid dla danego momentu czasu


Slide 12

Matematyczne techniki zarządzania - 121
ETAP 2. GROMADZENIE DANYCH STATYSTYCZNYCH

!

ZA JAKOŚĆ DANYCH ODPOWIADA MODELUJĄCY
• rodzaje danych: dane przekrojowe i szeregi czasowe
• źródła danych: roczniki statystyczne, różne działy
przedsiębiorstwa, badania marketingowe, wywiady itd.
• wiarygodność danych: do jakiego celu zostały one
przygotowane?

MUSISZ
SPRAWDZAĆ
KAŻDE DANE

• porównywalność danych: inflacja (ceny bieżące a ceny
stałe), zmiany procesów technicznych
Wielkość
produkcji

• zmienność zjawisk: trzeba sprawdzić, czy
wybrana w etapie 1a zmienna jest rzeczywiście zmienną losową

Wx 

s( x )

nowy zakład

100 %

x

stary zakład

Wx musi wynosić co najmniej 30-40%
Wiek studenta może być dobrą zmiennąprzyczyną, ale nie w przypadku studiów
dziennych!

Zatrudnienie

Matematyczne techniki zarządzania - 122
ETAP 3. SELEKCJA ZMIENNYCH OBJAŚNIAJĄCYCH
KAŻDĄ ZMIENNĄ X WYTYPOWANĄ W ETAPIE 1a TRAKTUJEMY JAKO
KANDYDATKĘ NA ZMIENNĄ OBJAŚNIAJĄCĄ
Może być kilka przyczyn powodujących, że taka kandydatka nie może znaleźć się w modelu ekonometrycznym (w równaniu regresji):
• w modelu nie może być zbyt wielu zmiennych (nieczytelny)
• kandydatka może nie mieć wpływu na zmienną Y



• kandydatka może wnosić prawie tę samą informację o Y co inna
kandydatka

• dwie bardzo podobne kandydatki mogą sobie nawzajem przeszkadzać
(efekt katalityczny)
Kryteria, jakie musi spełniać kandydatka Xi, aby nadawała się do modelu:
• musi być silnie powiązana ze zmienną Y

• nie może być powiązana z inną kandydatką Xj
SSTO
x1
x4

x2
x3

reszta

R2=0,79

R2=0,66

x2
x1
x4

R2=0,48

x3
reszta

reszta

SSTO

SSTO

Matematyczne techniki zarządzania - 123
Efekt katalityczny
DWIE ZMIENNE DAJĄ
RAZEM MNIEJ INFORMACJI NIŻ KAŻDA Z
NICH Z OSOBNA

x1

x2

R2=0,25

x2

x1

R2=0,52

R2=0,66

Selekcja kandydatek ma na celu podzielenie ich na trzy grupy:
• zmienne wprowadzone do modelu
• zmienne nie wprowadzone do modelu, ale reprezentowane w nim przez
inne zmienne (możliwość wymiany)
• zmienne nie wprowadzone do modelu ze względu na fakt, że nie wnoszą
żadnej informacji o zmiennej Y
INFORMACJE potrzebne do selekcji: współczynniki r x i x j ,
Macierz współczynników korelacji
Y
Y
X1
X2
X3

0,52
0,64
- 0,21

X1
0,52
0,82
- 0,18

X2
0,64
0,82
0,08

X3
- 0,21
- 0,18
0,08

r yx

i

Przykład 32. Macierz powiązania
zmiennych ze sobą przedstawia
się następująco (n=20). Jak ją
można zinterpretować? Które
zmienne są powiązane ze sobą w
sposób istotny?

Matematyczne techniki zarządzania - 124
Testowanie istotności współczynnika korelacji
H0:  = 0

Można je przeprowadzić trzema testami: testem Studenta

H1:   0

(t), Fishera (F) i Wallace’a-Snedecora (R)

Fragment tablicy rozkładu Wallece’a-Snedecora (SKRYPT, tab. VII, s.161)
S to pn ie
sw ob od y

2
0,05
0,632
0,444
0,361

8
18
28

,

0,01
0,765
0,561
0,463

L iczb a zm ien n ych
3
0,05
0,01
0,726
0,827
0,532
0,633
0,439
0,530

4
0,05
0,777
0,587
0,490

0,01
0,860
0,678
0,573

Reguła decyzyjna: — jeżeli |Robl|>Rtabl, odrzucamy H0 (korelacja istotna)
— jeżeli |Robl|
W przykładzie 32, jeżeli przyjmiemy  = 0,05, to Rtabl = 0,444.
Y
Y
X1
X2
X3

0,52
0,64
- 0,21

X1
0,52
0,82
- 0,18

X2
0,64
0,82
0,08

X3
- 0,21
- 0,18
0,08

Pozostaną zatem tylko trzy
istotne powiązania:
y-x1, y-x2, x1-x2
BRAK ISTOTNEGO POWIĄZANIA Z Y NIE
OZNACZA, ŻE ZMIENNA NIE WNOSI
ŻADNEJ INFORMACJI O ZJAWISKU Y

Matematyczne techniki zarządzania - 125



Metody selekcji zmiennych objaśniających:
• grafowa
• Hellwiga (pojemności informacji)
• taksonomiczne (clustering)
Metoda grafowa
• obliczenie macierzy współczynników:

rx

i

xj

• wyłowienie z macierzy powiązań istotnych

, r yx

BUDOWA GRAFU
i

• graf spójny

• budowa grafu z powiązań istotnych
• wybranie zmiennych na podstawie grafu

x6

• graf zerowy
x1
x4

x9

DO MODELU WYBIERA SIĘ ZMIENNE:
• każdy graf zerowy (jeśli |ryx|>0,1)

istotne powiązanie

• po jednej reprezentantce grafu spójnego;

reprezentantką grafu jest zmienna, która ma najwięcej powiązań z
innymi kandydatkami
jeżeli kilka zmiennych ma tę samą maksymalną liczbę powiązań, wybiera
się z nich tę, która jest najsilniej powiązana za zmienną Y (max ryx)
jeżeli graf jest rozległy, może mieć dwie reprezentantki, ale muszą one
leżeć na przeciwległych stronach grafu

Matematyczne techniki zarządzania - 126
Przykład 32 cd. Wybierzemy
zmienną x2 (reprezentantka grafu
spójnego) i zmienną x3 (graf
zerowy)
Metoda Hellwiga

Y
Y
X1
X2
X3

0,52
0,64
- 0,21

• wypisujemy wszystkie możliwe kombinacje
kandydatek; jest ich K = 2m—1
• obliczamy pojemność informacji dla każdej
zmiennej w każdej kombinacji

h kl  f ( r yx , r x
i

ixj

)

• obliczamy pojemność całkowitą dla każdej
kombinacji
H l   h kl
k

• wybieramy kombinację o największej
pojemności Hl = max

X1
0,52
0,82
- 0,18

X2
0,64
0,82

X3
- 0,21
- 0,18
0,08

0,08

W przykładzie 32 mamy 7
możliwych kombinacji kandydatek:
1. x1
2. x2

3. x3

maximum:

H6 = 0,42

4. x1,x2
5. x1,x3

Hmax = R2

6. x2,x3
7. x1,x2,x3

Metody taksonomiczne
Taksonomia wrocławska (cluster analysis) to metoda grupowania obiektów (zmiennych) w grupy jednorodne pod względem n cech (wymiarów)
łącznie. Podstawą grupowania jest odległość euklidesowa, która w przypadku zmiennych d ij  f ( r x x )
WSZYSTKIE METODY TO SELEKCJA WSTĘPNA
i

j

Matematyczne techniki zarządzania - 127
ETAP 4. ESTYMACJA PARAMETRÓW MODELU
Cel etapu: wyznaczenie parametrów strukturalnych i stochastycznych
Estymacja: szacowanie parametrów populacji na podstawie próbki
Metody estymacji: analiza regresji i korelacji (KMNK i inne)

Założenia dla KMNK
1. Zmienne losowe są prawdziwymi zmiennymi, nie powiązanymi ze sobą
2. Składnik losowy  ma stałą wariancję, niezależną od zmiennej x lub t
3. Wartości reszt ui są niezależne od siebie

4. Składnik losowy  nie jest powiązany ze zmienną objaśniającą
Skutki niedotrzymania założeń i środki zaradcze
1. Model bez sensu, nieprzydatny; niekiedy absurdalny (źle uwarunkowane
dane)
Stosuje się: dużą próbkę (n>100), regresję grzbietową (ridge regression)
2.

Y

reszta ui

Lewa część zbioru ma dużą wariancję, a
prawa — wariancję małą
Stosuje się specjalny wariant MNK z
korektą na różne wariancje
X

Matematyczne techniki zarządzania - 128
3. Jeśli reszty ui są ze sobą powiązane (skorelowane), mówimy, że
występuje autokorelacja składnika losowego (zjawisko występuje przy
szeregach czasowych — sztywny porządek obserwacji)
Oznacza to, że istnieje istotna zależność u t  f ( u t  k )
Przyczyny autokorelacji: zakłócenia
(dodatnie lub ujemne) w jednym okresie
wpływają na poziom zjawiska w następnych
okresach (rolnictwo, produkcja, rynek)

t  1 , 2 ,...

u t  y t  yˆ t

u t 1

u1
u2
u3
u4
u5

Występowanie autokorelacji powoduje
nieprzydatność modelu


u1
u2
u3
u4

Istnienie autokorelacji sprawdza się testem
Durbina-Watsona d
Stosuje się metodę różniczki zupełnej

y  f (x )

yt  yt  ytk

4. Składnik losowy jest skorelowany ze zmienną objaśniającą, wtedy
gdy została pominięta jakaś ważna zmienna-przyczyna

Model taki nie ma żadnej wartości; trzeba dbać o jak najwyższy współczynnik determinacji (R2>0,9)
• zbiór danych rzeczywistych nigdy
nie spełnia tych wymagań

ESTYMACJĘ MODELU POWTARZA SIĘ WIELOKROTNIE
ponieważ dopiero weryfikacja zapewnia ostateczną selekcję
kandydatek na zmienne objaśniające

• ekonometria to analiza danych nie
spełniających tych założeń
• nie stosować statystyki bezmyślnie (na ślepo)

Matematyczne techniki zarządzania - 129
ETAP 5. WERYFIKACJA MODELU
Cele:

1. opis rzeczywistości (populacji generalnej)



2. dokładna (ostateczna) selekcja zmiennych objaśniających
3. poznanie składnika losowego (spełnienie założeń KMNK)
Narzędzia: hipotezy i testy statystyczne

Metodyka: każde równanie oddzielnie; weryfikacja obejmuje 9 etapów (od
najmniej do najbardziej pracochłonnego)
WYKAZ ETAPÓW WERYFIKACJI MODELU
I.
II.

Badanie istotności korelacji
Badanie wyrazistości modelu

III.

Badanie istotności parametrów

IV.

Badanie symetrii skł. losowego

V.
VI.
VII.
VIII.
IX.

Badanie losowości skł. losowego
Badanie stacjonarności skł. los.
Badanie wartości oczekiwanej skł. los.
Badanie autokorelacji skł. losowego
Badanie normalności skł. losowego

Opis każdego etapu weryfikacji
obejmuje:
• cel etapu
• sposób weryfikacji: wzory,
hipotezy, testy
• podanie których modeli dotyczy (przyczynowo-skutkowych
czy tendencji rozwojowej)
• podanie której postaci modeli
nieliniowych dotyczy (pierwotnej czy transformaty)

Matematyczne techniki zarządzania - 130
Etap I. Badanie istotności korelacji
7
2

8

9

11

12

17

19

23

21

5
2 etapu
9
16
7
9
15
14
Celem
jest
sprawdzenie,
czy
istnieje w populacji generalnej powiązanie pomiędzy zmienną Y i wszystkimi zmiennymi objaśniającymi

25

Przedział ufności dla
nieznanego współczynnika korelacji  dla populacji buduje się przy
użyciu błędu

populacja

zmienna Y

20
15
10

próbka

5
0
8
5

0 9

1011

2

9

20
12

30
17
16
7
zmienna X

25

1940
9

23 50
15

populacja

20

zmienna Y

7
2

15
10

próbka

5
0
0

10

20

30

zmienna X

40

50

21
14

sR 

1 R

0

Robl

2

nk

Istotność korelacji weryfikuje się przez postawienie
następujących hipotez dla
współczynnika korelacji dla
populacji generalnej:

1
R,|r|

H0 :   0

Brak korelacji, nie ma powiązania...

H1 :   0

Korelacja istotna, jest powiązanie...

,

Matematyczne techniki zarządzania - 131
Hipotezy te można weryfikować trzema równoważnymi testami:
• testem t Studenta (tylko dla regresji dwu zmiennych)
• testem F Fishera-Snedecora
• testem R Wallace’a-Snedecora

,

W każdym przypadku obliczamy wartość
statystyki dla próbki (tobl, Fobl, Robl) i porównujemy z wartością krytyczną odczytaną z tablicy odpowiedniego rozkładu w
funkcji poziomu istotności i liczby stopni
swobody (ttabl, Ftabl, Rtabl)

Reguła decyzyjna:
• jeżeli |tobl|< ttabl, nie ma podstaw do odrzucenia H0 (brak korelacji)
• jeżeli |tobl|> ttabl, odrzucamy H0 na korzyść H1 (korelacja istnieje)

TAK SAMO DLA
FiR

W przypadku regresji wielorakiej, gdy liczba zmiennych objaśniajacych
jest duża w porównaniu do liczby obserwacji, współczynnik determinacji
R2 może dawać zawyżoną ocenę stopnia wyjaśnienia zmienności zmiennej
objaśnianej; dlatego wprowadzono skorygowany współczynnik determinacji (i korelacji):
 ( yˆ i  y )

R

2

2

k
n

k

1


2
nk 1
(
y

y
)

i
n1

• adjusted coefficient of multiple
determination (wydruki komputerowe)

• jeśli k jest małe, nie ma większej różnicy
pomiędzy normalnym a skorygowanym R2

Matematyczne techniki zarządzania - 132
Skąd wziąć wartość odpowiedniej statystyki dla próbki i jak odczytywać jej wartości z tablic?
n2
r
t

r

t tabl  t  / 2 { n  2 }
TEST STUDENTA
obl
2
sr
1 r

F obl 

TEST FISHERA

Ź ró d ło z m ien n o śc i

MSTR
MSE



R

nk

2

1 R

2

L ic zb a sto p n i
sw o b o d y

Suma
k w a d ra tó w

Ś re d n i
k w a d ra t

M o d el (c z yn n ik i)
B łą d (re sz ta )

k1
nk

SSTR
SSE

MSTR
MSE

R azem

n1

SSTO

TEST WALLACE’A

R obl 

R

2

k 1

F tabl  F { k  1 , n  k }

S ta ty sty k a
F
F obl 

MSTR
MSE

NIE MYLIĆ
STOPNI SWOBODY LICZNIKA I MIANOWNIKA

R tabl  R { k , n  k }

Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

Matematyczne techniki zarządzania - 133
Odczyt Rtabl z tablicy testu R (SKRYPT s.161-162)

, k,  = n-k

S to pn ie
sw ob od y
8
18
28

2
0,05
0,632
0,444
0,361

0,01
0,765
0,561
0,463

L iczb a zm ien n ych
3
0,05
0,01
0,726
0,827
0,532
0,633
0,439
0,530

4
0,05
0,777
0,587
0,490

0,01
0,860
0,678
0,573

Wnioski dotyczące rozkładu R Wallace’a-Snedecora:
• tablica zawiera maksymalne wartości współczynnika korelacji w danej
sytuacji, jakich można oczekiwać, gdy nie ma korelacji w populacji
• im wyższy poziom istotności, tym niższe Rtabl

• im większa liczba zmiennych w modelu, tym wyższe Rtabl
• im wyższa liczba stopni swobody (większa próbka), tym niższe Rtabl
• tablica R powstała z przeliczenia tablic t oraz F (odwrócenie wzorów)
• tablica testu R jest najszybszym i nawygodniejszym narzędziem do
weryfikacji istotności korelacji

Werdykt z etapu I:

Matematyczne techniki zarządzania - 134

• jeżeli Robl>Rtabl, model jest poprawny, można przejść do etapu II
• jeżeli Roblzmiennych objaśniających albo jego postać matematyczną
ETAP I OBOWIĄZUJE DLA WSZYSTKICH MODELI
ETAP I PRZEPROWADZA SIĘ DLA TRANSFORMATY (dla postaci pierwotnej
można uzyskać R>1)
Rola współczynnika determinacji R2
• korelacja może być istotna przy małym R i bardzo małym R2 (r=0,4,
R2=0,16, co oznacza, że tylko 16% zmienności zmiennej Y jest
wyjaśnione przez zmienną objaśniającą)
• małe R2 oznacza niski stopień wyjaśnienia rzeczywistości i stanowi
zagrożenie dla modelu
• należy dążyć (poprzez odpowiedni dobór zmiennych-przyczyn i postaci
matematycznej modelu) do jak największego R2 (dla postaci pierwotnej)
• wysoka wartość R2 świadczy o dobrym poznaniu badanego zjawiska
• wysoka wartość R2 bardzo często wynika jednak ze złego dobrania
zmiennych objaśniających (silnie powiązane ze sobą — „masło maślane”)
KORELACJA POZORNA — jest zależność, ale jej nie ma? Przyczyny...
Trzeba unikać wartości bezwzględnych (ludność, liczba sklepów, wielkość produkcji)

6

9

12

8

11

12

11

15

9

18

9

11

11

18

15

Matematyczne techniki zarządzania - 135
Etap II. Badanie wyrazistości modelu
Y

Wyrazistość modelu dana jest wzorem

s( y )

ui

y

W obl 

s( y )

100 %

y

Celem etapu
jest kontrola
rozrzutu danych

Współczynnik Wobl<30%, w przeciwnym
przypadku rozrzut danych jest zbyt duży

y

Kłopoty: gdyy jest bliskie 0

x

X

Werdykt: model poprawny lub niepoprawny

ETAP II OBOWIĄZUJE DLA WSZYSTKICH MODELI (ale nie ma on charakteru
statystycznego)

ETAP II PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ (sprawdzamy, czy
nie występuje silny efekt „krzywego lustra”)
Etap III. Badanie istotności parametrów (współczynników) modelu
Celem etapu jest sprawdzenie:
• czy poszczególne zmienne objaśniające mają istotny wpływ na zmienną
objaśnianą?
• czy zmienne objaśniające są wybrane prawidłowo?

• czy wyraz wolny różni się istotnie od zera?

Matematyczne techniki zarządzania - 136
Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

Problem istotności parametrów ai można rozpatrywać (tak jak problem
średniej dla populacji) z dwu punktów widzenia:
• przedziału ufności dla nieznanej wartości i

• hipotez — zerowej H0: i=0 i alternatywnej H1: i 0

1
0

ai

1

i

ISTOTNY (W PRZEDZIALE NIE MA ZERA)

0

ai

i

NIEISTOTNY (W PRZEDZIALE JEST ZERO)

P ( a i  t / 2 { n  k } s ( a i )   i  a i  t / 2 { n  k } s ( a i )  1  

Z tablicy rozkładu Studenta, a nie z wydruku komputerowego!

Matematyczne techniki zarządzania - 137
Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

W praktyce posługujemy się raczej hipotezami:
Badanie istotności przeprowadza
się dla każdego i oddzielnie:

t obl ( a i ) 

ai  0
s(a i )

t tabl  t  / 2 { n  k }

• jeżeli |tobl(ai)|>ttabl(ai), odrzucamy hipotezę zerową; parametr jest istotny z błędem równym co najwyżej 
• jeżeli |tobl(ai)|parametr nie jest istotny
Praktycznie jest to bardzo łatwe:
• sprawdzamy, czy |t(ai)| jest większe czy mniejsze od około 2, a najlepiej
• porównujemy rzeczywisty poziom istotności P(ai) z przyjętym 
ODRZUCAMY H0, JEŻELI P(ai) JEST MNIEJSZE OD 

WTEDY ZMIENNA
Xi MA WPŁYW NA
ZMIENNĄ Y

Matematyczne techniki zarządzania - 138
W etapie III następuje ostateczna selekcja zmiennych objaśniających:
• jeżeli wszystkie ai okażą się istotne, model jest poprawny:
— model przyczynowo-skutkowy: do interpretacji
— model tendencji rozwojowej: do etapu IV
• jeżeli choć jedno ai okaże się nieistotne, model jest niepoprawny i wymaga poprawy przez usunięcie nieistotnych zmiennych:
— zmienne należy usuwać po jednej (ze względu na efekt katalityczny)
— usuwa się zawsze zmienną o najniższej wartości |t(ai)| [czyli o
najwyższej wartości P(ai)]
— usunięcie ostatniej zmiennej nieistotnej kończy proces selekcji
kandydatek na zmienne,

— selekcja nie jest ostateczna, gdyż zawsze istnieje możliwość zamiany zmiennych, które są powiązane ze sobą
Praktyczne znaczenie istotności wyrazu wolnego a0
To są jedne z możliwości dla populacji (p. plansza 106)

Y

W przypadku funkcji K=f(P) wyraz wolny wyznacza poziom kosztów stałych (rachunkowość zarządcza)
W przypadku zależności technicznej Q=f(h) wyraz
wolny oznacza, że przy miąższości pokładu h=0 wydajność produkcji Q też jest równa 0

0
X

Matematyczne techniki zarządzania - 139
Praktyczne znaczenie istotności współczynnika regresji ai



KRZYWE NEYMANA — PLANSZE 106-107
WSPÓŁCZ. ISTOTNY
WSPÓŁ. NIEISTOTNY

ETAP III OBOWIĄZUJE DLA WSZYSTKICH MODELI
ETAP III PRZEPROWADZA SIĘ DLA TRANSFORMATY
Etap IV. Badanie symetrii składnika losowego

Y

CZĘSTOŚĆ RESZT DODATNICH I UJEMNYCH MA BYĆ
ZBLIŻONA

Y

ASYMETRYCZNY
SYMETRYCZNY

t
t
Badanie symetrii przeprowadza się testem Studenta (St. Bartosiewicz
Ekonometria)
Brak symetrii wymaga zmiany matematycznej postaci modelu
ETAP IV OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ

ETAP IV PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ

Matematyczne techniki zarządzania - 140
Etap V. Badanie losowości składnika losowego

Y

Y
NIELOSOWY

LOSOWY

t
t
Badanie losowości przeprowadza się testem Studenta lub testem serii
(Ekonometria, praca zb. pod red. M. Krzysztofiaka)
Brak losowości wymaga zmiany matematycznej postaci modelu
ETAP V OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP V PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ
Etap VI. Badanie stacjonarności składnika losowego
W etapie tym chodzi o niezależność wariancji składnika losowego od
zmiennej objaśniającej t (plansza 127)

Bada się istotność współczynnika korelacji ru t , t
ETAP VI OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VI PRZEPROWADZA SIĘ DLA TRANSFORMATY

Matematyczne techniki zarządzania - 141
Etap VII. Badanie wartości oczekiwanej składnika losowego
Normalnie, gdy przeprowadzamy estymację postaci liniowej, parametry
składnika losowego E ( )  0
{ ui  0}
V ( )  const
Po retransformacji do postaci pierwotnej mamy nowe reszty u’, dla
których
'
'
ui  0
 ui  0
Celem etapu jest sprawdzenie, czy odchyłka od O nie jest zbyt duża
(służy do tego test Studenta)
ETAP VII OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VII PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ
Etap VIII. Badanie autokorelacji składnika losowego
Pojęcie autokorelacji opisano na planszy 128; chodzi o istotność korelacji ru , u
t

tk

Badanie autokorelacji można przeprowadzić:

• testem R istotności korelacji ru

t

,ut  k

d obl

• testem Durbina-Watsona
NIE MA AUTOK.

d1

?

d2 JEST AUTOKORELACJA

ETAP VIII OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VIII PRZEPROWADZA SIĘ DLA TRANSFORMATY

Matematyczne techniki zarządzania - 142
Etap IX. Badanie normalności składnika losowego
Celem etapu jest stwierdzenie, czy reszty mają rozkład normalny
Analiza reszt — oddzielny dział analizy regresji i korelacji
Jeżeli reszty mają rozkład normalny, statystyk otrzymuje „ulgi”
ETAP 6. PRAKTYCZNA INTERPRETACJA MODELU



Celem etapu jest wydobycie z modelu całej nowej wiedzy, której nie widać
„gołym okiem”
INTERPRETUJĄC MODEL (RÓWNANIE REGRESJI) NALEŻY UŻYWAĆ WYŁĄCZNIE
PROSTEJ TERMINOLOGII EKONOMICZNEJ ZROZUMIAŁEJ DLA KLIENTA
NIE NALEŻY UŻYWAĆ TERMINOLOGII MATEMATYCZNEJ ZROZUMIAŁEJ TYLKO DLA
TWÓRCÓW MODELU
INTERPRETOWAĆ WOLNO TYLKO MODEL ZWERYFIKOWANY
CAŁY TRUD MODELOWANIA NIE MOŻE BYĆ „SZTUKĄ DLA SZTUKI”, LECZ MA
SŁUŻYĆ UZYSKANIU KONKRETNYCH WNIOSKÓW PRAKTYCZNYCH

Interpretacja modelu przyczynowo-skutkowego

Polega ona na określeniu wpływu poszczególnych czynników na badane
zjawisko:
• podział wszystkich czynników na trzy grupy

Matematyczne techniki zarządzania - 143
A — czynniki nie mające wpływu na Y
B — czynniki mające wpływ na Y i wprowadzone do modelu
C — czynniki mające wpływ na Y, ale nie występujące w modelu
• ocena jakościowa wpływu czynników B i C
• ocena ilościowa wpływu czynników B i C
Ocena jakościowa



Na podstawie znaków stojących przy współczynnikach r oraz ai możemy
stwierdzić, że wpływ jest:

• dodatni (im lepsze zaliczenie, tym lepszy wynik egzaminu; im więcej
wydatków na reklamę, tym większy zysk; itd.)
• ujemny (im więcej zatrudnionych, tym gorszy wynik finansowy; im
mniej braków, tym wyższy zysk; im mniejsza absencja, tym wyższe
wynagrodzenie; itd.)

Ocena ilościowa
• model liniowy
Przykład 33. Zinterpretuj zweryfikowany model zależności miesięcznych
kosztów działalności przedsiębiorstwa (tys. zł) od wielkości produkcji
(sztuk) i liczby reklamacji:
y i  50 , 8  14 , 5 x 1  3 , 9 x 2  

Matematyczne techniki zarządzania - 144
a0 = 50,8

poziom kosztów stałych; jeśli firma nie będzie prowadzić
żadnej działalności, poniesie koszty w wysokości 50,8 tys. zł

a1 = 14,5

każda sztuka produktu firmy kosztuje ją przeciętnie 14,5
tys. zł; jeżeli firma zwiększy produkcję o 2 sztuki, koszty
wzrosną o 29,0 tys. zł

a2 = 3,9każda wniesiona reklamacja powiększa koszty przeciętnie o
3,9 tys. zł
• model potęgowy
Przykłąd 34. Zinterpretuj zweryfikowaną funkcję produkcji Cobba-Douglasa
0 , 65

Pi  45 , 2 M i

0 , 73

Zi

e

0 , 04



Funkcja produkcji to specjalny model, określający zależność pomiędzy
produkcją (P) a czynnikami produkcji: majątkiem trwałym (M) i nakładami
robocizny (Z).



Funkcje produkcji to modele umożliwiające „prześwietlenie”
przedsiębiorstwa (szereg czasowy) lub branży (dane przekrojowe) i określenie poziomu gospodarowania oraz postępu
technicznego i organizacyjnego.
Elastyczność  to współczynnik określający reakcję zmiany
jednej zmiennej na inną zmienną — na przykład elastyczność
cenowa popytu (jak popyt zmienia się wraz z ceną towaru).

EKSPERCI
ZACHODNI

Matematyczne techniki zarządzania - 145

 

y
y

:

x

FUNKCJA POTĘGOWA JEST JEDYNĄ FUNKCJĄ O STAŁEJ ELASTYCZNOŚCI

x

Izolinie funkcji produkcji

T1
M

Produkcję P można osiągnąć różnymi
kombinacjami majątku i robocizny:

T2

• T1— technika kapitałochłonna, np.
pełna automatyzacja
• T2 — pośredni poziom techniki

T3
P  const

• T3 — niski poziom techniki, produkcja
pracochłonna
P. LOWE

Z
Efekt poprawy zarządzania bez
zmiany techniki (lepsze wykorzystanie ludzi i sprzętu):

P2
M

ZARZĄDZANIE
TECHNOLOGIĄ

P1

T

• zmniejszenie kapitałochłonności

• zmniejszenie pracochłonności
• zwiększenie produkcji (przejście z
funkcji P1 na P2)

Można też rozpatrzyć łączne efekty
zmiany techniki i zarządzania

Z

Matematyczne techniki zarządzania - 146
Wszystkie informacje tego typu można odczytać w trakcie interpretacji
0 , 65
0 , 73 0 , 04
funkcji produkcji:
Pi  45 , 2 M i
Zi
e

• wartości 45,2 nie interpretuje się
• wartość 0,65 to współczynnik elastyczności majątkowej (kapitałowej)
produkcji: zmiana majątku o 10% daje średnio zmianę produkcji o 6,5%
• wartość 0,73 to współczynnik elastyczności zatrudnieniowej produkcji:
zmiana zatrudnienia o 10% daje zmianę produkcji średnio o 7,3%
• suma obu współczynników k=0,65+0,73=1,38 to współczynnik skali
produkcji:

— jeżeli k<1, to firma rozwija się ekstensywnie
— jeżeli k>1, to firma rozwija się intensywnie
• wartość  = 0,04 to współczynnik postępu organizacyjnego:
— jeżeli  >O, to miał miejsce postęp organizacyjny

— jeżeli  <0, to miał miejsce regres organizacyjny
Interpretacja modelu tendencji rozwojowej

DODAMY
TROCHĘ
TEORII

Przypomnienie: t — zmienna objaśniająca (stałe przyrosty)
y — zmienna objaśniana; rozdzielana w ogólności na trzy
części: trend, wahania okresowe, wahania losowe ()

Matematyczne techniki zarządzania - 147
Wykres z planszy 117 (zużycie energii elektrycznej przez WZ AGH)
WAHANIA OKRESOWE OKREŚLA SIĘ WZGLĘDEM TRENDU A
NIE WZGLĘDEM OSI CZASU

y

trend

t
1995

1996

1997

1998

1999

Te trzy części trzeba zidentyfikować, a potem złożyć razem w model:

• addytywny (jeśli amplituda wahań jest stała)
• multiplikatywny (jeśli amplituda wahań rośnie lub maleje regularnie)
Wyznaczanie trendu
Metody mechaniczne:

• wskaźniki bezwzględne (stały przyrost =
postęp arytmetyczny = funkcja liniowa)
• wskaźniki względne (przyrost o stały procent =
postęp geometryczny = funkcja potęgowa)
• średnia ruchoma (wygładzanie danych linią łamaną)

JAK OBLICZYĆ O
ILE PROCENT ROCZNIE SPADAŁA
ŚREDNIO LICZBA
WIDZÓW W
KINACH:
1982 - 193,7 MLN
1989 - 141,3 MLN

Matematyczne techniki zarządzania - 148
Średnia ruchoma: mając szereg czasowy y1, y2,....., yn, przyjmujemy
długość kroku k = 3, lub 5, lub 7 itd. i liczymy
y  ...  y k
y  ...  y k  1
y k / 2 0 ,5  1
a następnie y k / 2  1 , 5  2
itd.
k
k
y  y2  y3
y  y3  y4
dla k=3:
y2  1
y3  2
itd.
3
3
Przykład 35. Wyznacz trend metodą średniej ruchomej dla następujących
danych:
okres
t
wartość yt

1
5

2
4

3
7

4
6

5
8

12

y2 
10

y3 

y

8

y4 

6
4

y5 

2

y6 

0
0

1

2

3

4

5

czas, t

6

7

8

9

y7 

547

6
10

 5 , 67

CECHY
ŚREDNIEJ
RUCHOMEJ:

 7 , 00

• TRACI SIĘ
k-1 DANYCH

3
768

8
8

 5 , 33

3
476

7
9

3
6  8  10

 8 , 00

3
8  10  9

 9 , 00

3
10  9  8

 9 , 00

• IM
WIĘKSZE k,
TYM
BARDZIEJ
SZTYWNY
TREND

3

Metody statystyczne: analiza regresji i korelacji, różne funkcje oparte na
modelach ekonomii

Matematyczne techniki zarządzania - 149
Wyznaczanie wahań okresowych: dobowych, tygodniowych, miesięcznych,
kwartalnych, rocznych, wieloletnich
Trzy metody:

— metoda wskaźników sezonowości
— metoda zmiennych zero-jedynkowych (0-1)

— metoda harmoniczna
Wszystkie metody mają jeden cel:
uzyskanie przeciętnego obrazu jednego cyklu

+

Ws
[t ]
[%]
trend

I

II



III

IV

WADY:
• KONIECZNOŚĆ
KOREKTY
• BRAK
WERYFIKACJI
STATYSTYCZNEJ

Metoda wskaźników sezonowości

• obliczenie surowych wskaźników sezonowości (wyeliminowanie trendu):
y

S s  yt  yt
S s  t
yt
addytywny multiplikatywny
wynik: n wartości odchyleń od trendu

• obliczenie oczyszczonych wskaźników
sezonowości (wyeliminowanie wahań
losowych):
 Ss
So 
k-liczba okresów
k
jednoimiennych
m-długość cyklu wynik: m wartości śr. odchyleń od trendu

Matematyczne techniki zarządzania - 150
Metoda zmiennych zero-jedynkowych (0-1)
m

y t  a 0  a1 t   bi Q i  
i 1

bi — przeciętne odchylenie od trendu dla
okresu i-tego
Qi — zmienna 0-1

wahania losowe
trend

wahania okresowe

t
1
2
3
4
5
6
7
8
9

yt
y1
y2
y3
y4
y5
y6
y7
y8
y9

Q1
1
0
0
0
1
0
0
0
1

Q2
0
1
0
0
0
1
0
0
0

Q3
0
0
1
0
0
0
1
0
0

Q4
0
0
0
1
0
0
0
1
0

Metoda harmoniczna (szeregi Fouriera)
Wahania okresowe przedstawia się jako sumę określonej liczby drgań harmonicznych (sinusoid i cosinusoid) przesuniętych w fazie, lecz o jednakowym okresie
m /2
2 i m / 2
2 i
y t  a 0  a 1 t   b1 i sin
  b 2 i cos

m
m
i 1
i 1
Obie metody dają taki sam wynik, istnieje możliwość weryfikacji
statystycznej
W metodzie 0-1 dostajemy bi = Ws, natomiast w metodzie harmonicznej Ws
jest sumą wartości poszczególnych sinusoid dla danego momentu czasu


Slide 13

Matematyczne techniki zarządzania - 121
ETAP 2. GROMADZENIE DANYCH STATYSTYCZNYCH

!

ZA JAKOŚĆ DANYCH ODPOWIADA MODELUJĄCY
• rodzaje danych: dane przekrojowe i szeregi czasowe
• źródła danych: roczniki statystyczne, różne działy
przedsiębiorstwa, badania marketingowe, wywiady itd.
• wiarygodność danych: do jakiego celu zostały one
przygotowane?

MUSISZ
SPRAWDZAĆ
KAŻDE DANE

• porównywalność danych: inflacja (ceny bieżące a ceny
stałe), zmiany procesów technicznych
Wielkość
produkcji

• zmienność zjawisk: trzeba sprawdzić, czy
wybrana w etapie 1a zmienna jest rzeczywiście zmienną losową

Wx 

s( x )

nowy zakład

100 %

x

stary zakład

Wx musi wynosić co najmniej 30-40%
Wiek studenta może być dobrą zmiennąprzyczyną, ale nie w przypadku studiów
dziennych!

Zatrudnienie

Matematyczne techniki zarządzania - 122
ETAP 3. SELEKCJA ZMIENNYCH OBJAŚNIAJĄCYCH
KAŻDĄ ZMIENNĄ X WYTYPOWANĄ W ETAPIE 1a TRAKTUJEMY JAKO
KANDYDATKĘ NA ZMIENNĄ OBJAŚNIAJĄCĄ
Może być kilka przyczyn powodujących, że taka kandydatka nie może znaleźć się w modelu ekonometrycznym (w równaniu regresji):
• w modelu nie może być zbyt wielu zmiennych (nieczytelny)
• kandydatka może nie mieć wpływu na zmienną Y



• kandydatka może wnosić prawie tę samą informację o Y co inna
kandydatka

• dwie bardzo podobne kandydatki mogą sobie nawzajem przeszkadzać
(efekt katalityczny)
Kryteria, jakie musi spełniać kandydatka Xi, aby nadawała się do modelu:
• musi być silnie powiązana ze zmienną Y

• nie może być powiązana z inną kandydatką Xj
SSTO
x1
x4

x2
x3

reszta

R2=0,79

R2=0,66

x2
x1
x4

R2=0,48

x3
reszta

reszta

SSTO

SSTO

Matematyczne techniki zarządzania - 123
Efekt katalityczny
DWIE ZMIENNE DAJĄ
RAZEM MNIEJ INFORMACJI NIŻ KAŻDA Z
NICH Z OSOBNA

x1

x2

R2=0,25

x2

x1

R2=0,52

R2=0,66

Selekcja kandydatek ma na celu podzielenie ich na trzy grupy:
• zmienne wprowadzone do modelu
• zmienne nie wprowadzone do modelu, ale reprezentowane w nim przez
inne zmienne (możliwość wymiany)
• zmienne nie wprowadzone do modelu ze względu na fakt, że nie wnoszą
żadnej informacji o zmiennej Y
INFORMACJE potrzebne do selekcji: współczynniki r x i x j ,
Macierz współczynników korelacji
Y
Y
X1
X2
X3

0,52
0,64
- 0,21

X1
0,52
0,82
- 0,18

X2
0,64
0,82
0,08

X3
- 0,21
- 0,18
0,08

r yx

i

Przykład 32. Macierz powiązania
zmiennych ze sobą przedstawia
się następująco (n=20). Jak ją
można zinterpretować? Które
zmienne są powiązane ze sobą w
sposób istotny?

Matematyczne techniki zarządzania - 124
Testowanie istotności współczynnika korelacji
H0:  = 0

Można je przeprowadzić trzema testami: testem Studenta

H1:   0

(t), Fishera (F) i Wallace’a-Snedecora (R)

Fragment tablicy rozkładu Wallece’a-Snedecora (SKRYPT, tab. VII, s.161)
S to pn ie
sw ob od y

2
0,05
0,632
0,444
0,361

8
18
28

,

0,01
0,765
0,561
0,463

L iczb a zm ien n ych
3
0,05
0,01
0,726
0,827
0,532
0,633
0,439
0,530

4
0,05
0,777
0,587
0,490

0,01
0,860
0,678
0,573

Reguła decyzyjna: — jeżeli |Robl|>Rtabl, odrzucamy H0 (korelacja istotna)
— jeżeli |Robl|
W przykładzie 32, jeżeli przyjmiemy  = 0,05, to Rtabl = 0,444.
Y
Y
X1
X2
X3

0,52
0,64
- 0,21

X1
0,52
0,82
- 0,18

X2
0,64
0,82
0,08

X3
- 0,21
- 0,18
0,08

Pozostaną zatem tylko trzy
istotne powiązania:
y-x1, y-x2, x1-x2
BRAK ISTOTNEGO POWIĄZANIA Z Y NIE
OZNACZA, ŻE ZMIENNA NIE WNOSI
ŻADNEJ INFORMACJI O ZJAWISKU Y

Matematyczne techniki zarządzania - 125



Metody selekcji zmiennych objaśniających:
• grafowa
• Hellwiga (pojemności informacji)
• taksonomiczne (clustering)
Metoda grafowa
• obliczenie macierzy współczynników:

rx

i

xj

• wyłowienie z macierzy powiązań istotnych

, r yx

BUDOWA GRAFU
i

• graf spójny

• budowa grafu z powiązań istotnych
• wybranie zmiennych na podstawie grafu

x6

• graf zerowy
x1
x4

x9

DO MODELU WYBIERA SIĘ ZMIENNE:
• każdy graf zerowy (jeśli |ryx|>0,1)

istotne powiązanie

• po jednej reprezentantce grafu spójnego;

reprezentantką grafu jest zmienna, która ma najwięcej powiązań z
innymi kandydatkami
jeżeli kilka zmiennych ma tę samą maksymalną liczbę powiązań, wybiera
się z nich tę, która jest najsilniej powiązana za zmienną Y (max ryx)
jeżeli graf jest rozległy, może mieć dwie reprezentantki, ale muszą one
leżeć na przeciwległych stronach grafu

Matematyczne techniki zarządzania - 126
Przykład 32 cd. Wybierzemy
zmienną x2 (reprezentantka grafu
spójnego) i zmienną x3 (graf
zerowy)
Metoda Hellwiga

Y
Y
X1
X2
X3

0,52
0,64
- 0,21

• wypisujemy wszystkie możliwe kombinacje
kandydatek; jest ich K = 2m—1
• obliczamy pojemność informacji dla każdej
zmiennej w każdej kombinacji

h kl  f ( r yx , r x
i

ixj

)

• obliczamy pojemność całkowitą dla każdej
kombinacji
H l   h kl
k

• wybieramy kombinację o największej
pojemności Hl = max

X1
0,52
0,82
- 0,18

X2
0,64
0,82

X3
- 0,21
- 0,18
0,08

0,08

W przykładzie 32 mamy 7
możliwych kombinacji kandydatek:
1. x1
2. x2

3. x3

maximum:

H6 = 0,42

4. x1,x2
5. x1,x3

Hmax = R2

6. x2,x3
7. x1,x2,x3

Metody taksonomiczne
Taksonomia wrocławska (cluster analysis) to metoda grupowania obiektów (zmiennych) w grupy jednorodne pod względem n cech (wymiarów)
łącznie. Podstawą grupowania jest odległość euklidesowa, która w przypadku zmiennych d ij  f ( r x x )
WSZYSTKIE METODY TO SELEKCJA WSTĘPNA
i

j

Matematyczne techniki zarządzania - 127
ETAP 4. ESTYMACJA PARAMETRÓW MODELU
Cel etapu: wyznaczenie parametrów strukturalnych i stochastycznych
Estymacja: szacowanie parametrów populacji na podstawie próbki
Metody estymacji: analiza regresji i korelacji (KMNK i inne)

Założenia dla KMNK
1. Zmienne losowe są prawdziwymi zmiennymi, nie powiązanymi ze sobą
2. Składnik losowy  ma stałą wariancję, niezależną od zmiennej x lub t
3. Wartości reszt ui są niezależne od siebie

4. Składnik losowy  nie jest powiązany ze zmienną objaśniającą
Skutki niedotrzymania założeń i środki zaradcze
1. Model bez sensu, nieprzydatny; niekiedy absurdalny (źle uwarunkowane
dane)
Stosuje się: dużą próbkę (n>100), regresję grzbietową (ridge regression)
2.

Y

reszta ui

Lewa część zbioru ma dużą wariancję, a
prawa — wariancję małą
Stosuje się specjalny wariant MNK z
korektą na różne wariancje
X

Matematyczne techniki zarządzania - 128
3. Jeśli reszty ui są ze sobą powiązane (skorelowane), mówimy, że
występuje autokorelacja składnika losowego (zjawisko występuje przy
szeregach czasowych — sztywny porządek obserwacji)
Oznacza to, że istnieje istotna zależność u t  f ( u t  k )
Przyczyny autokorelacji: zakłócenia
(dodatnie lub ujemne) w jednym okresie
wpływają na poziom zjawiska w następnych
okresach (rolnictwo, produkcja, rynek)

t  1 , 2 ,...

u t  y t  yˆ t

u t 1

u1
u2
u3
u4
u5

Występowanie autokorelacji powoduje
nieprzydatność modelu


u1
u2
u3
u4

Istnienie autokorelacji sprawdza się testem
Durbina-Watsona d
Stosuje się metodę różniczki zupełnej

y  f (x )

yt  yt  ytk

4. Składnik losowy jest skorelowany ze zmienną objaśniającą, wtedy
gdy została pominięta jakaś ważna zmienna-przyczyna

Model taki nie ma żadnej wartości; trzeba dbać o jak najwyższy współczynnik determinacji (R2>0,9)
• zbiór danych rzeczywistych nigdy
nie spełnia tych wymagań

ESTYMACJĘ MODELU POWTARZA SIĘ WIELOKROTNIE
ponieważ dopiero weryfikacja zapewnia ostateczną selekcję
kandydatek na zmienne objaśniające

• ekonometria to analiza danych nie
spełniających tych założeń
• nie stosować statystyki bezmyślnie (na ślepo)

Matematyczne techniki zarządzania - 129
ETAP 5. WERYFIKACJA MODELU
Cele:

1. opis rzeczywistości (populacji generalnej)



2. dokładna (ostateczna) selekcja zmiennych objaśniających
3. poznanie składnika losowego (spełnienie założeń KMNK)
Narzędzia: hipotezy i testy statystyczne

Metodyka: każde równanie oddzielnie; weryfikacja obejmuje 9 etapów (od
najmniej do najbardziej pracochłonnego)
WYKAZ ETAPÓW WERYFIKACJI MODELU
I.
II.

Badanie istotności korelacji
Badanie wyrazistości modelu

III.

Badanie istotności parametrów

IV.

Badanie symetrii skł. losowego

V.
VI.
VII.
VIII.
IX.

Badanie losowości skł. losowego
Badanie stacjonarności skł. los.
Badanie wartości oczekiwanej skł. los.
Badanie autokorelacji skł. losowego
Badanie normalności skł. losowego

Opis każdego etapu weryfikacji
obejmuje:
• cel etapu
• sposób weryfikacji: wzory,
hipotezy, testy
• podanie których modeli dotyczy (przyczynowo-skutkowych
czy tendencji rozwojowej)
• podanie której postaci modeli
nieliniowych dotyczy (pierwotnej czy transformaty)

Matematyczne techniki zarządzania - 130
Etap I. Badanie istotności korelacji
7
2

8

9

11

12

17

19

23

21

5
2 etapu
9
16
7
9
15
14
Celem
jest
sprawdzenie,
czy
istnieje w populacji generalnej powiązanie pomiędzy zmienną Y i wszystkimi zmiennymi objaśniającymi

25

Przedział ufności dla
nieznanego współczynnika korelacji  dla populacji buduje się przy
użyciu błędu

populacja

zmienna Y

20
15
10

próbka

5
0
8
5

0 9

1011

2

9

20
12

30
17
16
7
zmienna X

25

1940
9

23 50
15

populacja

20

zmienna Y

7
2

15
10

próbka

5
0
0

10

20

30

zmienna X

40

50

21
14

sR 

1 R

0

Robl

2

nk

Istotność korelacji weryfikuje się przez postawienie
następujących hipotez dla
współczynnika korelacji dla
populacji generalnej:

1
R,|r|

H0 :   0

Brak korelacji, nie ma powiązania...

H1 :   0

Korelacja istotna, jest powiązanie...

,

Matematyczne techniki zarządzania - 131
Hipotezy te można weryfikować trzema równoważnymi testami:
• testem t Studenta (tylko dla regresji dwu zmiennych)
• testem F Fishera-Snedecora
• testem R Wallace’a-Snedecora

,

W każdym przypadku obliczamy wartość
statystyki dla próbki (tobl, Fobl, Robl) i porównujemy z wartością krytyczną odczytaną z tablicy odpowiedniego rozkładu w
funkcji poziomu istotności i liczby stopni
swobody (ttabl, Ftabl, Rtabl)

Reguła decyzyjna:
• jeżeli |tobl|< ttabl, nie ma podstaw do odrzucenia H0 (brak korelacji)
• jeżeli |tobl|> ttabl, odrzucamy H0 na korzyść H1 (korelacja istnieje)

TAK SAMO DLA
FiR

W przypadku regresji wielorakiej, gdy liczba zmiennych objaśniajacych
jest duża w porównaniu do liczby obserwacji, współczynnik determinacji
R2 może dawać zawyżoną ocenę stopnia wyjaśnienia zmienności zmiennej
objaśnianej; dlatego wprowadzono skorygowany współczynnik determinacji (i korelacji):
 ( yˆ i  y )

R

2

2

k
n

k

1


2
nk 1
(
y

y
)

i
n1

• adjusted coefficient of multiple
determination (wydruki komputerowe)

• jeśli k jest małe, nie ma większej różnicy
pomiędzy normalnym a skorygowanym R2

Matematyczne techniki zarządzania - 132
Skąd wziąć wartość odpowiedniej statystyki dla próbki i jak odczytywać jej wartości z tablic?
n2
r
t

r

t tabl  t  / 2 { n  2 }
TEST STUDENTA
obl
2
sr
1 r

F obl 

TEST FISHERA

Ź ró d ło z m ien n o śc i

MSTR
MSE



R

nk

2

1 R

2

L ic zb a sto p n i
sw o b o d y

Suma
k w a d ra tó w

Ś re d n i
k w a d ra t

M o d el (c z yn n ik i)
B łą d (re sz ta )

k1
nk

SSTR
SSE

MSTR
MSE

R azem

n1

SSTO

TEST WALLACE’A

R obl 

R

2

k 1

F tabl  F { k  1 , n  k }

S ta ty sty k a
F
F obl 

MSTR
MSE

NIE MYLIĆ
STOPNI SWOBODY LICZNIKA I MIANOWNIKA

R tabl  R { k , n  k }

Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

Matematyczne techniki zarządzania - 133
Odczyt Rtabl z tablicy testu R (SKRYPT s.161-162)

, k,  = n-k

S to pn ie
sw ob od y
8
18
28

2
0,05
0,632
0,444
0,361

0,01
0,765
0,561
0,463

L iczb a zm ien n ych
3
0,05
0,01
0,726
0,827
0,532
0,633
0,439
0,530

4
0,05
0,777
0,587
0,490

0,01
0,860
0,678
0,573

Wnioski dotyczące rozkładu R Wallace’a-Snedecora:
• tablica zawiera maksymalne wartości współczynnika korelacji w danej
sytuacji, jakich można oczekiwać, gdy nie ma korelacji w populacji
• im wyższy poziom istotności, tym niższe Rtabl

• im większa liczba zmiennych w modelu, tym wyższe Rtabl
• im wyższa liczba stopni swobody (większa próbka), tym niższe Rtabl
• tablica R powstała z przeliczenia tablic t oraz F (odwrócenie wzorów)
• tablica testu R jest najszybszym i nawygodniejszym narzędziem do
weryfikacji istotności korelacji

Werdykt z etapu I:

Matematyczne techniki zarządzania - 134

• jeżeli Robl>Rtabl, model jest poprawny, można przejść do etapu II
• jeżeli Roblzmiennych objaśniających albo jego postać matematyczną
ETAP I OBOWIĄZUJE DLA WSZYSTKICH MODELI
ETAP I PRZEPROWADZA SIĘ DLA TRANSFORMATY (dla postaci pierwotnej
można uzyskać R>1)
Rola współczynnika determinacji R2
• korelacja może być istotna przy małym R i bardzo małym R2 (r=0,4,
R2=0,16, co oznacza, że tylko 16% zmienności zmiennej Y jest
wyjaśnione przez zmienną objaśniającą)
• małe R2 oznacza niski stopień wyjaśnienia rzeczywistości i stanowi
zagrożenie dla modelu
• należy dążyć (poprzez odpowiedni dobór zmiennych-przyczyn i postaci
matematycznej modelu) do jak największego R2 (dla postaci pierwotnej)
• wysoka wartość R2 świadczy o dobrym poznaniu badanego zjawiska
• wysoka wartość R2 bardzo często wynika jednak ze złego dobrania
zmiennych objaśniających (silnie powiązane ze sobą — „masło maślane”)
KORELACJA POZORNA — jest zależność, ale jej nie ma? Przyczyny...
Trzeba unikać wartości bezwzględnych (ludność, liczba sklepów, wielkość produkcji)

6

9

12

8

11

12

11

15

9

18

9

11

11

18

15

Matematyczne techniki zarządzania - 135
Etap II. Badanie wyrazistości modelu
Y

Wyrazistość modelu dana jest wzorem

s( y )

ui

y

W obl 

s( y )

100 %

y

Celem etapu
jest kontrola
rozrzutu danych

Współczynnik Wobl<30%, w przeciwnym
przypadku rozrzut danych jest zbyt duży

y

Kłopoty: gdyy jest bliskie 0

x

X

Werdykt: model poprawny lub niepoprawny

ETAP II OBOWIĄZUJE DLA WSZYSTKICH MODELI (ale nie ma on charakteru
statystycznego)

ETAP II PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ (sprawdzamy, czy
nie występuje silny efekt „krzywego lustra”)
Etap III. Badanie istotności parametrów (współczynników) modelu
Celem etapu jest sprawdzenie:
• czy poszczególne zmienne objaśniające mają istotny wpływ na zmienną
objaśnianą?
• czy zmienne objaśniające są wybrane prawidłowo?

• czy wyraz wolny różni się istotnie od zera?

Matematyczne techniki zarządzania - 136
Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

Problem istotności parametrów ai można rozpatrywać (tak jak problem
średniej dla populacji) z dwu punktów widzenia:
• przedziału ufności dla nieznanej wartości i

• hipotez — zerowej H0: i=0 i alternatywnej H1: i 0

1
0

ai

1

i

ISTOTNY (W PRZEDZIALE NIE MA ZERA)

0

ai

i

NIEISTOTNY (W PRZEDZIALE JEST ZERO)

P ( a i  t / 2 { n  k } s ( a i )   i  a i  t / 2 { n  k } s ( a i )  1  

Z tablicy rozkładu Studenta, a nie z wydruku komputerowego!

Matematyczne techniki zarządzania - 137
Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

W praktyce posługujemy się raczej hipotezami:
Badanie istotności przeprowadza
się dla każdego i oddzielnie:

t obl ( a i ) 

ai  0
s(a i )

t tabl  t  / 2 { n  k }

• jeżeli |tobl(ai)|>ttabl(ai), odrzucamy hipotezę zerową; parametr jest istotny z błędem równym co najwyżej 
• jeżeli |tobl(ai)|parametr nie jest istotny
Praktycznie jest to bardzo łatwe:
• sprawdzamy, czy |t(ai)| jest większe czy mniejsze od około 2, a najlepiej
• porównujemy rzeczywisty poziom istotności P(ai) z przyjętym 
ODRZUCAMY H0, JEŻELI P(ai) JEST MNIEJSZE OD 

WTEDY ZMIENNA
Xi MA WPŁYW NA
ZMIENNĄ Y

Matematyczne techniki zarządzania - 138
W etapie III następuje ostateczna selekcja zmiennych objaśniających:
• jeżeli wszystkie ai okażą się istotne, model jest poprawny:
— model przyczynowo-skutkowy: do interpretacji
— model tendencji rozwojowej: do etapu IV
• jeżeli choć jedno ai okaże się nieistotne, model jest niepoprawny i wymaga poprawy przez usunięcie nieistotnych zmiennych:
— zmienne należy usuwać po jednej (ze względu na efekt katalityczny)
— usuwa się zawsze zmienną o najniższej wartości |t(ai)| [czyli o
najwyższej wartości P(ai)]
— usunięcie ostatniej zmiennej nieistotnej kończy proces selekcji
kandydatek na zmienne,

— selekcja nie jest ostateczna, gdyż zawsze istnieje możliwość zamiany zmiennych, które są powiązane ze sobą
Praktyczne znaczenie istotności wyrazu wolnego a0
To są jedne z możliwości dla populacji (p. plansza 106)

Y

W przypadku funkcji K=f(P) wyraz wolny wyznacza poziom kosztów stałych (rachunkowość zarządcza)
W przypadku zależności technicznej Q=f(h) wyraz
wolny oznacza, że przy miąższości pokładu h=0 wydajność produkcji Q też jest równa 0

0
X

Matematyczne techniki zarządzania - 139
Praktyczne znaczenie istotności współczynnika regresji ai



KRZYWE NEYMANA — PLANSZE 106-107
WSPÓŁCZ. ISTOTNY
WSPÓŁ. NIEISTOTNY

ETAP III OBOWIĄZUJE DLA WSZYSTKICH MODELI
ETAP III PRZEPROWADZA SIĘ DLA TRANSFORMATY
Etap IV. Badanie symetrii składnika losowego

Y

CZĘSTOŚĆ RESZT DODATNICH I UJEMNYCH MA BYĆ
ZBLIŻONA

Y

ASYMETRYCZNY
SYMETRYCZNY

t
t
Badanie symetrii przeprowadza się testem Studenta (St. Bartosiewicz
Ekonometria)
Brak symetrii wymaga zmiany matematycznej postaci modelu
ETAP IV OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ

ETAP IV PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ

Matematyczne techniki zarządzania - 140
Etap V. Badanie losowości składnika losowego

Y

Y
NIELOSOWY

LOSOWY

t
t
Badanie losowości przeprowadza się testem Studenta lub testem serii
(Ekonometria, praca zb. pod red. M. Krzysztofiaka)
Brak losowości wymaga zmiany matematycznej postaci modelu
ETAP V OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP V PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ
Etap VI. Badanie stacjonarności składnika losowego
W etapie tym chodzi o niezależność wariancji składnika losowego od
zmiennej objaśniającej t (plansza 127)

Bada się istotność współczynnika korelacji ru t , t
ETAP VI OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VI PRZEPROWADZA SIĘ DLA TRANSFORMATY

Matematyczne techniki zarządzania - 141
Etap VII. Badanie wartości oczekiwanej składnika losowego
Normalnie, gdy przeprowadzamy estymację postaci liniowej, parametry
składnika losowego E ( )  0
{ ui  0}
V ( )  const
Po retransformacji do postaci pierwotnej mamy nowe reszty u’, dla
których
'
'
ui  0
 ui  0
Celem etapu jest sprawdzenie, czy odchyłka od O nie jest zbyt duża
(służy do tego test Studenta)
ETAP VII OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VII PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ
Etap VIII. Badanie autokorelacji składnika losowego
Pojęcie autokorelacji opisano na planszy 128; chodzi o istotność korelacji ru , u
t

tk

Badanie autokorelacji można przeprowadzić:

• testem R istotności korelacji ru

t

,ut  k

d obl

• testem Durbina-Watsona
NIE MA AUTOK.

d1

?

d2 JEST AUTOKORELACJA

ETAP VIII OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VIII PRZEPROWADZA SIĘ DLA TRANSFORMATY

Matematyczne techniki zarządzania - 142
Etap IX. Badanie normalności składnika losowego
Celem etapu jest stwierdzenie, czy reszty mają rozkład normalny
Analiza reszt — oddzielny dział analizy regresji i korelacji
Jeżeli reszty mają rozkład normalny, statystyk otrzymuje „ulgi”
ETAP 6. PRAKTYCZNA INTERPRETACJA MODELU



Celem etapu jest wydobycie z modelu całej nowej wiedzy, której nie widać
„gołym okiem”
INTERPRETUJĄC MODEL (RÓWNANIE REGRESJI) NALEŻY UŻYWAĆ WYŁĄCZNIE
PROSTEJ TERMINOLOGII EKONOMICZNEJ ZROZUMIAŁEJ DLA KLIENTA
NIE NALEŻY UŻYWAĆ TERMINOLOGII MATEMATYCZNEJ ZROZUMIAŁEJ TYLKO DLA
TWÓRCÓW MODELU
INTERPRETOWAĆ WOLNO TYLKO MODEL ZWERYFIKOWANY
CAŁY TRUD MODELOWANIA NIE MOŻE BYĆ „SZTUKĄ DLA SZTUKI”, LECZ MA
SŁUŻYĆ UZYSKANIU KONKRETNYCH WNIOSKÓW PRAKTYCZNYCH

Interpretacja modelu przyczynowo-skutkowego

Polega ona na określeniu wpływu poszczególnych czynników na badane
zjawisko:
• podział wszystkich czynników na trzy grupy

Matematyczne techniki zarządzania - 143
A — czynniki nie mające wpływu na Y
B — czynniki mające wpływ na Y i wprowadzone do modelu
C — czynniki mające wpływ na Y, ale nie występujące w modelu
• ocena jakościowa wpływu czynników B i C
• ocena ilościowa wpływu czynników B i C
Ocena jakościowa



Na podstawie znaków stojących przy współczynnikach r oraz ai możemy
stwierdzić, że wpływ jest:

• dodatni (im lepsze zaliczenie, tym lepszy wynik egzaminu; im więcej
wydatków na reklamę, tym większy zysk; itd.)
• ujemny (im więcej zatrudnionych, tym gorszy wynik finansowy; im
mniej braków, tym wyższy zysk; im mniejsza absencja, tym wyższe
wynagrodzenie; itd.)

Ocena ilościowa
• model liniowy
Przykład 33. Zinterpretuj zweryfikowany model zależności miesięcznych
kosztów działalności przedsiębiorstwa (tys. zł) od wielkości produkcji
(sztuk) i liczby reklamacji:
y i  50 , 8  14 , 5 x 1  3 , 9 x 2  

Matematyczne techniki zarządzania - 144
a0 = 50,8

poziom kosztów stałych; jeśli firma nie będzie prowadzić
żadnej działalności, poniesie koszty w wysokości 50,8 tys. zł

a1 = 14,5

każda sztuka produktu firmy kosztuje ją przeciętnie 14,5
tys. zł; jeżeli firma zwiększy produkcję o 2 sztuki, koszty
wzrosną o 29,0 tys. zł

a2 = 3,9każda wniesiona reklamacja powiększa koszty przeciętnie o
3,9 tys. zł
• model potęgowy
Przykłąd 34. Zinterpretuj zweryfikowaną funkcję produkcji Cobba-Douglasa
0 , 65

Pi  45 , 2 M i

0 , 73

Zi

e

0 , 04



Funkcja produkcji to specjalny model, określający zależność pomiędzy
produkcją (P) a czynnikami produkcji: majątkiem trwałym (M) i nakładami
robocizny (Z).



Funkcje produkcji to modele umożliwiające „prześwietlenie”
przedsiębiorstwa (szereg czasowy) lub branży (dane przekrojowe) i określenie poziomu gospodarowania oraz postępu
technicznego i organizacyjnego.
Elastyczność  to współczynnik określający reakcję zmiany
jednej zmiennej na inną zmienną — na przykład elastyczność
cenowa popytu (jak popyt zmienia się wraz z ceną towaru).

EKSPERCI
ZACHODNI

Matematyczne techniki zarządzania - 145

 

y
y

:

x

FUNKCJA POTĘGOWA JEST JEDYNĄ FUNKCJĄ O STAŁEJ ELASTYCZNOŚCI

x

Izolinie funkcji produkcji

T1
M

Produkcję P można osiągnąć różnymi
kombinacjami majątku i robocizny:

T2

• T1— technika kapitałochłonna, np.
pełna automatyzacja
• T2 — pośredni poziom techniki

T3
P  const

• T3 — niski poziom techniki, produkcja
pracochłonna
P. LOWE

Z
Efekt poprawy zarządzania bez
zmiany techniki (lepsze wykorzystanie ludzi i sprzętu):

P2
M

ZARZĄDZANIE
TECHNOLOGIĄ

P1

T

• zmniejszenie kapitałochłonności

• zmniejszenie pracochłonności
• zwiększenie produkcji (przejście z
funkcji P1 na P2)

Można też rozpatrzyć łączne efekty
zmiany techniki i zarządzania

Z

Matematyczne techniki zarządzania - 146
Wszystkie informacje tego typu można odczytać w trakcie interpretacji
0 , 65
0 , 73 0 , 04
funkcji produkcji:
Pi  45 , 2 M i
Zi
e

• wartości 45,2 nie interpretuje się
• wartość 0,65 to współczynnik elastyczności majątkowej (kapitałowej)
produkcji: zmiana majątku o 10% daje średnio zmianę produkcji o 6,5%
• wartość 0,73 to współczynnik elastyczności zatrudnieniowej produkcji:
zmiana zatrudnienia o 10% daje zmianę produkcji średnio o 7,3%
• suma obu współczynników k=0,65+0,73=1,38 to współczynnik skali
produkcji:

— jeżeli k<1, to firma rozwija się ekstensywnie
— jeżeli k>1, to firma rozwija się intensywnie
• wartość  = 0,04 to współczynnik postępu organizacyjnego:
— jeżeli  >O, to miał miejsce postęp organizacyjny

— jeżeli  <0, to miał miejsce regres organizacyjny
Interpretacja modelu tendencji rozwojowej

DODAMY
TROCHĘ
TEORII

Przypomnienie: t — zmienna objaśniająca (stałe przyrosty)
y — zmienna objaśniana; rozdzielana w ogólności na trzy
części: trend, wahania okresowe, wahania losowe ()

Matematyczne techniki zarządzania - 147
Wykres z planszy 117 (zużycie energii elektrycznej przez WZ AGH)
WAHANIA OKRESOWE OKREŚLA SIĘ WZGLĘDEM TRENDU A
NIE WZGLĘDEM OSI CZASU

y

trend

t
1995

1996

1997

1998

1999

Te trzy części trzeba zidentyfikować, a potem złożyć razem w model:

• addytywny (jeśli amplituda wahań jest stała)
• multiplikatywny (jeśli amplituda wahań rośnie lub maleje regularnie)
Wyznaczanie trendu
Metody mechaniczne:

• wskaźniki bezwzględne (stały przyrost =
postęp arytmetyczny = funkcja liniowa)
• wskaźniki względne (przyrost o stały procent =
postęp geometryczny = funkcja potęgowa)
• średnia ruchoma (wygładzanie danych linią łamaną)

JAK OBLICZYĆ O
ILE PROCENT ROCZNIE SPADAŁA
ŚREDNIO LICZBA
WIDZÓW W
KINACH:
1982 - 193,7 MLN
1989 - 141,3 MLN

Matematyczne techniki zarządzania - 148
Średnia ruchoma: mając szereg czasowy y1, y2,....., yn, przyjmujemy
długość kroku k = 3, lub 5, lub 7 itd. i liczymy
y  ...  y k
y  ...  y k  1
y k / 2 0 ,5  1
a następnie y k / 2  1 , 5  2
itd.
k
k
y  y2  y3
y  y3  y4
dla k=3:
y2  1
y3  2
itd.
3
3
Przykład 35. Wyznacz trend metodą średniej ruchomej dla następujących
danych:
okres
t
wartość yt

1
5

2
4

3
7

4
6

5
8

12

y2 
10

y3 

y

8

y4 

6
4

y5 

2

y6 

0
0

1

2

3

4

5

czas, t

6

7

8

9

y7 

547

6
10

 5 , 67

CECHY
ŚREDNIEJ
RUCHOMEJ:

 7 , 00

• TRACI SIĘ
k-1 DANYCH

3
768

8
8

 5 , 33

3
476

7
9

3
6  8  10

 8 , 00

3
8  10  9

 9 , 00

3
10  9  8

 9 , 00

• IM
WIĘKSZE k,
TYM
BARDZIEJ
SZTYWNY
TREND

3

Metody statystyczne: analiza regresji i korelacji, różne funkcje oparte na
modelach ekonomii

Matematyczne techniki zarządzania - 149
Wyznaczanie wahań okresowych: dobowych, tygodniowych, miesięcznych,
kwartalnych, rocznych, wieloletnich
Trzy metody:

— metoda wskaźników sezonowości
— metoda zmiennych zero-jedynkowych (0-1)

— metoda harmoniczna
Wszystkie metody mają jeden cel:
uzyskanie przeciętnego obrazu jednego cyklu

+

Ws
[t ]
[%]
trend

I

II



III

IV

WADY:
• KONIECZNOŚĆ
KOREKTY
• BRAK
WERYFIKACJI
STATYSTYCZNEJ

Metoda wskaźników sezonowości

• obliczenie surowych wskaźników sezonowości (wyeliminowanie trendu):
y

S s  yt  yt
S s  t
yt
addytywny multiplikatywny
wynik: n wartości odchyleń od trendu

• obliczenie oczyszczonych wskaźników
sezonowości (wyeliminowanie wahań
losowych):
 Ss
So 
k-liczba okresów
k
jednoimiennych
m-długość cyklu wynik: m wartości śr. odchyleń od trendu

Matematyczne techniki zarządzania - 150
Metoda zmiennych zero-jedynkowych (0-1)
m

y t  a 0  a1 t   bi Q i  
i 1

bi — przeciętne odchylenie od trendu dla
okresu i-tego
Qi — zmienna 0-1

wahania losowe
trend

wahania okresowe

t
1
2
3
4
5
6
7
8
9

yt
y1
y2
y3
y4
y5
y6
y7
y8
y9

Q1
1
0
0
0
1
0
0
0
1

Q2
0
1
0
0
0
1
0
0
0

Q3
0
0
1
0
0
0
1
0
0

Q4
0
0
0
1
0
0
0
1
0

Metoda harmoniczna (szeregi Fouriera)
Wahania okresowe przedstawia się jako sumę określonej liczby drgań harmonicznych (sinusoid i cosinusoid) przesuniętych w fazie, lecz o jednakowym okresie
m /2
2 i m / 2
2 i
y t  a 0  a 1 t   b1 i sin
  b 2 i cos

m
m
i 1
i 1
Obie metody dają taki sam wynik, istnieje możliwość weryfikacji
statystycznej
W metodzie 0-1 dostajemy bi = Ws, natomiast w metodzie harmonicznej Ws
jest sumą wartości poszczególnych sinusoid dla danego momentu czasu


Slide 14

Matematyczne techniki zarządzania - 121
ETAP 2. GROMADZENIE DANYCH STATYSTYCZNYCH

!

ZA JAKOŚĆ DANYCH ODPOWIADA MODELUJĄCY
• rodzaje danych: dane przekrojowe i szeregi czasowe
• źródła danych: roczniki statystyczne, różne działy
przedsiębiorstwa, badania marketingowe, wywiady itd.
• wiarygodność danych: do jakiego celu zostały one
przygotowane?

MUSISZ
SPRAWDZAĆ
KAŻDE DANE

• porównywalność danych: inflacja (ceny bieżące a ceny
stałe), zmiany procesów technicznych
Wielkość
produkcji

• zmienność zjawisk: trzeba sprawdzić, czy
wybrana w etapie 1a zmienna jest rzeczywiście zmienną losową

Wx 

s( x )

nowy zakład

100 %

x

stary zakład

Wx musi wynosić co najmniej 30-40%
Wiek studenta może być dobrą zmiennąprzyczyną, ale nie w przypadku studiów
dziennych!

Zatrudnienie

Matematyczne techniki zarządzania - 122
ETAP 3. SELEKCJA ZMIENNYCH OBJAŚNIAJĄCYCH
KAŻDĄ ZMIENNĄ X WYTYPOWANĄ W ETAPIE 1a TRAKTUJEMY JAKO
KANDYDATKĘ NA ZMIENNĄ OBJAŚNIAJĄCĄ
Może być kilka przyczyn powodujących, że taka kandydatka nie może znaleźć się w modelu ekonometrycznym (w równaniu regresji):
• w modelu nie może być zbyt wielu zmiennych (nieczytelny)
• kandydatka może nie mieć wpływu na zmienną Y



• kandydatka może wnosić prawie tę samą informację o Y co inna
kandydatka

• dwie bardzo podobne kandydatki mogą sobie nawzajem przeszkadzać
(efekt katalityczny)
Kryteria, jakie musi spełniać kandydatka Xi, aby nadawała się do modelu:
• musi być silnie powiązana ze zmienną Y

• nie może być powiązana z inną kandydatką Xj
SSTO
x1
x4

x2
x3

reszta

R2=0,79

R2=0,66

x2
x1
x4

R2=0,48

x3
reszta

reszta

SSTO

SSTO

Matematyczne techniki zarządzania - 123
Efekt katalityczny
DWIE ZMIENNE DAJĄ
RAZEM MNIEJ INFORMACJI NIŻ KAŻDA Z
NICH Z OSOBNA

x1

x2

R2=0,25

x2

x1

R2=0,52

R2=0,66

Selekcja kandydatek ma na celu podzielenie ich na trzy grupy:
• zmienne wprowadzone do modelu
• zmienne nie wprowadzone do modelu, ale reprezentowane w nim przez
inne zmienne (możliwość wymiany)
• zmienne nie wprowadzone do modelu ze względu na fakt, że nie wnoszą
żadnej informacji o zmiennej Y
INFORMACJE potrzebne do selekcji: współczynniki r x i x j ,
Macierz współczynników korelacji
Y
Y
X1
X2
X3

0,52
0,64
- 0,21

X1
0,52
0,82
- 0,18

X2
0,64
0,82
0,08

X3
- 0,21
- 0,18
0,08

r yx

i

Przykład 32. Macierz powiązania
zmiennych ze sobą przedstawia
się następująco (n=20). Jak ją
można zinterpretować? Które
zmienne są powiązane ze sobą w
sposób istotny?

Matematyczne techniki zarządzania - 124
Testowanie istotności współczynnika korelacji
H0:  = 0

Można je przeprowadzić trzema testami: testem Studenta

H1:   0

(t), Fishera (F) i Wallace’a-Snedecora (R)

Fragment tablicy rozkładu Wallece’a-Snedecora (SKRYPT, tab. VII, s.161)
S to pn ie
sw ob od y

2
0,05
0,632
0,444
0,361

8
18
28

,

0,01
0,765
0,561
0,463

L iczb a zm ien n ych
3
0,05
0,01
0,726
0,827
0,532
0,633
0,439
0,530

4
0,05
0,777
0,587
0,490

0,01
0,860
0,678
0,573

Reguła decyzyjna: — jeżeli |Robl|>Rtabl, odrzucamy H0 (korelacja istotna)
— jeżeli |Robl|
W przykładzie 32, jeżeli przyjmiemy  = 0,05, to Rtabl = 0,444.
Y
Y
X1
X2
X3

0,52
0,64
- 0,21

X1
0,52
0,82
- 0,18

X2
0,64
0,82
0,08

X3
- 0,21
- 0,18
0,08

Pozostaną zatem tylko trzy
istotne powiązania:
y-x1, y-x2, x1-x2
BRAK ISTOTNEGO POWIĄZANIA Z Y NIE
OZNACZA, ŻE ZMIENNA NIE WNOSI
ŻADNEJ INFORMACJI O ZJAWISKU Y

Matematyczne techniki zarządzania - 125



Metody selekcji zmiennych objaśniających:
• grafowa
• Hellwiga (pojemności informacji)
• taksonomiczne (clustering)
Metoda grafowa
• obliczenie macierzy współczynników:

rx

i

xj

• wyłowienie z macierzy powiązań istotnych

, r yx

BUDOWA GRAFU
i

• graf spójny

• budowa grafu z powiązań istotnych
• wybranie zmiennych na podstawie grafu

x6

• graf zerowy
x1
x4

x9

DO MODELU WYBIERA SIĘ ZMIENNE:
• każdy graf zerowy (jeśli |ryx|>0,1)

istotne powiązanie

• po jednej reprezentantce grafu spójnego;

reprezentantką grafu jest zmienna, która ma najwięcej powiązań z
innymi kandydatkami
jeżeli kilka zmiennych ma tę samą maksymalną liczbę powiązań, wybiera
się z nich tę, która jest najsilniej powiązana za zmienną Y (max ryx)
jeżeli graf jest rozległy, może mieć dwie reprezentantki, ale muszą one
leżeć na przeciwległych stronach grafu

Matematyczne techniki zarządzania - 126
Przykład 32 cd. Wybierzemy
zmienną x2 (reprezentantka grafu
spójnego) i zmienną x3 (graf
zerowy)
Metoda Hellwiga

Y
Y
X1
X2
X3

0,52
0,64
- 0,21

• wypisujemy wszystkie możliwe kombinacje
kandydatek; jest ich K = 2m—1
• obliczamy pojemność informacji dla każdej
zmiennej w każdej kombinacji

h kl  f ( r yx , r x
i

ixj

)

• obliczamy pojemność całkowitą dla każdej
kombinacji
H l   h kl
k

• wybieramy kombinację o największej
pojemności Hl = max

X1
0,52
0,82
- 0,18

X2
0,64
0,82

X3
- 0,21
- 0,18
0,08

0,08

W przykładzie 32 mamy 7
możliwych kombinacji kandydatek:
1. x1
2. x2

3. x3

maximum:

H6 = 0,42

4. x1,x2
5. x1,x3

Hmax = R2

6. x2,x3
7. x1,x2,x3

Metody taksonomiczne
Taksonomia wrocławska (cluster analysis) to metoda grupowania obiektów (zmiennych) w grupy jednorodne pod względem n cech (wymiarów)
łącznie. Podstawą grupowania jest odległość euklidesowa, która w przypadku zmiennych d ij  f ( r x x )
WSZYSTKIE METODY TO SELEKCJA WSTĘPNA
i

j

Matematyczne techniki zarządzania - 127
ETAP 4. ESTYMACJA PARAMETRÓW MODELU
Cel etapu: wyznaczenie parametrów strukturalnych i stochastycznych
Estymacja: szacowanie parametrów populacji na podstawie próbki
Metody estymacji: analiza regresji i korelacji (KMNK i inne)

Założenia dla KMNK
1. Zmienne losowe są prawdziwymi zmiennymi, nie powiązanymi ze sobą
2. Składnik losowy  ma stałą wariancję, niezależną od zmiennej x lub t
3. Wartości reszt ui są niezależne od siebie

4. Składnik losowy  nie jest powiązany ze zmienną objaśniającą
Skutki niedotrzymania założeń i środki zaradcze
1. Model bez sensu, nieprzydatny; niekiedy absurdalny (źle uwarunkowane
dane)
Stosuje się: dużą próbkę (n>100), regresję grzbietową (ridge regression)
2.

Y

reszta ui

Lewa część zbioru ma dużą wariancję, a
prawa — wariancję małą
Stosuje się specjalny wariant MNK z
korektą na różne wariancje
X

Matematyczne techniki zarządzania - 128
3. Jeśli reszty ui są ze sobą powiązane (skorelowane), mówimy, że
występuje autokorelacja składnika losowego (zjawisko występuje przy
szeregach czasowych — sztywny porządek obserwacji)
Oznacza to, że istnieje istotna zależność u t  f ( u t  k )
Przyczyny autokorelacji: zakłócenia
(dodatnie lub ujemne) w jednym okresie
wpływają na poziom zjawiska w następnych
okresach (rolnictwo, produkcja, rynek)

t  1 , 2 ,...

u t  y t  yˆ t

u t 1

u1
u2
u3
u4
u5

Występowanie autokorelacji powoduje
nieprzydatność modelu


u1
u2
u3
u4

Istnienie autokorelacji sprawdza się testem
Durbina-Watsona d
Stosuje się metodę różniczki zupełnej

y  f (x )

yt  yt  ytk

4. Składnik losowy jest skorelowany ze zmienną objaśniającą, wtedy
gdy została pominięta jakaś ważna zmienna-przyczyna

Model taki nie ma żadnej wartości; trzeba dbać o jak najwyższy współczynnik determinacji (R2>0,9)
• zbiór danych rzeczywistych nigdy
nie spełnia tych wymagań

ESTYMACJĘ MODELU POWTARZA SIĘ WIELOKROTNIE
ponieważ dopiero weryfikacja zapewnia ostateczną selekcję
kandydatek na zmienne objaśniające

• ekonometria to analiza danych nie
spełniających tych założeń
• nie stosować statystyki bezmyślnie (na ślepo)

Matematyczne techniki zarządzania - 129
ETAP 5. WERYFIKACJA MODELU
Cele:

1. opis rzeczywistości (populacji generalnej)



2. dokładna (ostateczna) selekcja zmiennych objaśniających
3. poznanie składnika losowego (spełnienie założeń KMNK)
Narzędzia: hipotezy i testy statystyczne

Metodyka: każde równanie oddzielnie; weryfikacja obejmuje 9 etapów (od
najmniej do najbardziej pracochłonnego)
WYKAZ ETAPÓW WERYFIKACJI MODELU
I.
II.

Badanie istotności korelacji
Badanie wyrazistości modelu

III.

Badanie istotności parametrów

IV.

Badanie symetrii skł. losowego

V.
VI.
VII.
VIII.
IX.

Badanie losowości skł. losowego
Badanie stacjonarności skł. los.
Badanie wartości oczekiwanej skł. los.
Badanie autokorelacji skł. losowego
Badanie normalności skł. losowego

Opis każdego etapu weryfikacji
obejmuje:
• cel etapu
• sposób weryfikacji: wzory,
hipotezy, testy
• podanie których modeli dotyczy (przyczynowo-skutkowych
czy tendencji rozwojowej)
• podanie której postaci modeli
nieliniowych dotyczy (pierwotnej czy transformaty)

Matematyczne techniki zarządzania - 130
Etap I. Badanie istotności korelacji
7
2

8

9

11

12

17

19

23

21

5
2 etapu
9
16
7
9
15
14
Celem
jest
sprawdzenie,
czy
istnieje w populacji generalnej powiązanie pomiędzy zmienną Y i wszystkimi zmiennymi objaśniającymi

25

Przedział ufności dla
nieznanego współczynnika korelacji  dla populacji buduje się przy
użyciu błędu

populacja

zmienna Y

20
15
10

próbka

5
0
8
5

0 9

1011

2

9

20
12

30
17
16
7
zmienna X

25

1940
9

23 50
15

populacja

20

zmienna Y

7
2

15
10

próbka

5
0
0

10

20

30

zmienna X

40

50

21
14

sR 

1 R

0

Robl

2

nk

Istotność korelacji weryfikuje się przez postawienie
następujących hipotez dla
współczynnika korelacji dla
populacji generalnej:

1
R,|r|

H0 :   0

Brak korelacji, nie ma powiązania...

H1 :   0

Korelacja istotna, jest powiązanie...

,

Matematyczne techniki zarządzania - 131
Hipotezy te można weryfikować trzema równoważnymi testami:
• testem t Studenta (tylko dla regresji dwu zmiennych)
• testem F Fishera-Snedecora
• testem R Wallace’a-Snedecora

,

W każdym przypadku obliczamy wartość
statystyki dla próbki (tobl, Fobl, Robl) i porównujemy z wartością krytyczną odczytaną z tablicy odpowiedniego rozkładu w
funkcji poziomu istotności i liczby stopni
swobody (ttabl, Ftabl, Rtabl)

Reguła decyzyjna:
• jeżeli |tobl|< ttabl, nie ma podstaw do odrzucenia H0 (brak korelacji)
• jeżeli |tobl|> ttabl, odrzucamy H0 na korzyść H1 (korelacja istnieje)

TAK SAMO DLA
FiR

W przypadku regresji wielorakiej, gdy liczba zmiennych objaśniajacych
jest duża w porównaniu do liczby obserwacji, współczynnik determinacji
R2 może dawać zawyżoną ocenę stopnia wyjaśnienia zmienności zmiennej
objaśnianej; dlatego wprowadzono skorygowany współczynnik determinacji (i korelacji):
 ( yˆ i  y )

R

2

2

k
n

k

1


2
nk 1
(
y

y
)

i
n1

• adjusted coefficient of multiple
determination (wydruki komputerowe)

• jeśli k jest małe, nie ma większej różnicy
pomiędzy normalnym a skorygowanym R2

Matematyczne techniki zarządzania - 132
Skąd wziąć wartość odpowiedniej statystyki dla próbki i jak odczytywać jej wartości z tablic?
n2
r
t

r

t tabl  t  / 2 { n  2 }
TEST STUDENTA
obl
2
sr
1 r

F obl 

TEST FISHERA

Ź ró d ło z m ien n o śc i

MSTR
MSE



R

nk

2

1 R

2

L ic zb a sto p n i
sw o b o d y

Suma
k w a d ra tó w

Ś re d n i
k w a d ra t

M o d el (c z yn n ik i)
B łą d (re sz ta )

k1
nk

SSTR
SSE

MSTR
MSE

R azem

n1

SSTO

TEST WALLACE’A

R obl 

R

2

k 1

F tabl  F { k  1 , n  k }

S ta ty sty k a
F
F obl 

MSTR
MSE

NIE MYLIĆ
STOPNI SWOBODY LICZNIKA I MIANOWNIKA

R tabl  R { k , n  k }

Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

Matematyczne techniki zarządzania - 133
Odczyt Rtabl z tablicy testu R (SKRYPT s.161-162)

, k,  = n-k

S to pn ie
sw ob od y
8
18
28

2
0,05
0,632
0,444
0,361

0,01
0,765
0,561
0,463

L iczb a zm ien n ych
3
0,05
0,01
0,726
0,827
0,532
0,633
0,439
0,530

4
0,05
0,777
0,587
0,490

0,01
0,860
0,678
0,573

Wnioski dotyczące rozkładu R Wallace’a-Snedecora:
• tablica zawiera maksymalne wartości współczynnika korelacji w danej
sytuacji, jakich można oczekiwać, gdy nie ma korelacji w populacji
• im wyższy poziom istotności, tym niższe Rtabl

• im większa liczba zmiennych w modelu, tym wyższe Rtabl
• im wyższa liczba stopni swobody (większa próbka), tym niższe Rtabl
• tablica R powstała z przeliczenia tablic t oraz F (odwrócenie wzorów)
• tablica testu R jest najszybszym i nawygodniejszym narzędziem do
weryfikacji istotności korelacji

Werdykt z etapu I:

Matematyczne techniki zarządzania - 134

• jeżeli Robl>Rtabl, model jest poprawny, można przejść do etapu II
• jeżeli Roblzmiennych objaśniających albo jego postać matematyczną
ETAP I OBOWIĄZUJE DLA WSZYSTKICH MODELI
ETAP I PRZEPROWADZA SIĘ DLA TRANSFORMATY (dla postaci pierwotnej
można uzyskać R>1)
Rola współczynnika determinacji R2
• korelacja może być istotna przy małym R i bardzo małym R2 (r=0,4,
R2=0,16, co oznacza, że tylko 16% zmienności zmiennej Y jest
wyjaśnione przez zmienną objaśniającą)
• małe R2 oznacza niski stopień wyjaśnienia rzeczywistości i stanowi
zagrożenie dla modelu
• należy dążyć (poprzez odpowiedni dobór zmiennych-przyczyn i postaci
matematycznej modelu) do jak największego R2 (dla postaci pierwotnej)
• wysoka wartość R2 świadczy o dobrym poznaniu badanego zjawiska
• wysoka wartość R2 bardzo często wynika jednak ze złego dobrania
zmiennych objaśniających (silnie powiązane ze sobą — „masło maślane”)
KORELACJA POZORNA — jest zależność, ale jej nie ma? Przyczyny...
Trzeba unikać wartości bezwzględnych (ludność, liczba sklepów, wielkość produkcji)

6

9

12

8

11

12

11

15

9

18

9

11

11

18

15

Matematyczne techniki zarządzania - 135
Etap II. Badanie wyrazistości modelu
Y

Wyrazistość modelu dana jest wzorem

s( y )

ui

y

W obl 

s( y )

100 %

y

Celem etapu
jest kontrola
rozrzutu danych

Współczynnik Wobl<30%, w przeciwnym
przypadku rozrzut danych jest zbyt duży

y

Kłopoty: gdyy jest bliskie 0

x

X

Werdykt: model poprawny lub niepoprawny

ETAP II OBOWIĄZUJE DLA WSZYSTKICH MODELI (ale nie ma on charakteru
statystycznego)

ETAP II PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ (sprawdzamy, czy
nie występuje silny efekt „krzywego lustra”)
Etap III. Badanie istotności parametrów (współczynników) modelu
Celem etapu jest sprawdzenie:
• czy poszczególne zmienne objaśniające mają istotny wpływ na zmienną
objaśnianą?
• czy zmienne objaśniające są wybrane prawidłowo?

• czy wyraz wolny różni się istotnie od zera?

Matematyczne techniki zarządzania - 136
Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

Problem istotności parametrów ai można rozpatrywać (tak jak problem
średniej dla populacji) z dwu punktów widzenia:
• przedziału ufności dla nieznanej wartości i

• hipotez — zerowej H0: i=0 i alternatywnej H1: i 0

1
0

ai

1

i

ISTOTNY (W PRZEDZIALE NIE MA ZERA)

0

ai

i

NIEISTOTNY (W PRZEDZIALE JEST ZERO)

P ( a i  t / 2 { n  k } s ( a i )   i  a i  t / 2 { n  k } s ( a i )  1  

Z tablicy rozkładu Studenta, a nie z wydruku komputerowego!

Matematyczne techniki zarządzania - 137
Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

W praktyce posługujemy się raczej hipotezami:
Badanie istotności przeprowadza
się dla każdego i oddzielnie:

t obl ( a i ) 

ai  0
s(a i )

t tabl  t  / 2 { n  k }

• jeżeli |tobl(ai)|>ttabl(ai), odrzucamy hipotezę zerową; parametr jest istotny z błędem równym co najwyżej 
• jeżeli |tobl(ai)|parametr nie jest istotny
Praktycznie jest to bardzo łatwe:
• sprawdzamy, czy |t(ai)| jest większe czy mniejsze od około 2, a najlepiej
• porównujemy rzeczywisty poziom istotności P(ai) z przyjętym 
ODRZUCAMY H0, JEŻELI P(ai) JEST MNIEJSZE OD 

WTEDY ZMIENNA
Xi MA WPŁYW NA
ZMIENNĄ Y

Matematyczne techniki zarządzania - 138
W etapie III następuje ostateczna selekcja zmiennych objaśniających:
• jeżeli wszystkie ai okażą się istotne, model jest poprawny:
— model przyczynowo-skutkowy: do interpretacji
— model tendencji rozwojowej: do etapu IV
• jeżeli choć jedno ai okaże się nieistotne, model jest niepoprawny i wymaga poprawy przez usunięcie nieistotnych zmiennych:
— zmienne należy usuwać po jednej (ze względu na efekt katalityczny)
— usuwa się zawsze zmienną o najniższej wartości |t(ai)| [czyli o
najwyższej wartości P(ai)]
— usunięcie ostatniej zmiennej nieistotnej kończy proces selekcji
kandydatek na zmienne,

— selekcja nie jest ostateczna, gdyż zawsze istnieje możliwość zamiany zmiennych, które są powiązane ze sobą
Praktyczne znaczenie istotności wyrazu wolnego a0
To są jedne z możliwości dla populacji (p. plansza 106)

Y

W przypadku funkcji K=f(P) wyraz wolny wyznacza poziom kosztów stałych (rachunkowość zarządcza)
W przypadku zależności technicznej Q=f(h) wyraz
wolny oznacza, że przy miąższości pokładu h=0 wydajność produkcji Q też jest równa 0

0
X

Matematyczne techniki zarządzania - 139
Praktyczne znaczenie istotności współczynnika regresji ai



KRZYWE NEYMANA — PLANSZE 106-107
WSPÓŁCZ. ISTOTNY
WSPÓŁ. NIEISTOTNY

ETAP III OBOWIĄZUJE DLA WSZYSTKICH MODELI
ETAP III PRZEPROWADZA SIĘ DLA TRANSFORMATY
Etap IV. Badanie symetrii składnika losowego

Y

CZĘSTOŚĆ RESZT DODATNICH I UJEMNYCH MA BYĆ
ZBLIŻONA

Y

ASYMETRYCZNY
SYMETRYCZNY

t
t
Badanie symetrii przeprowadza się testem Studenta (St. Bartosiewicz
Ekonometria)
Brak symetrii wymaga zmiany matematycznej postaci modelu
ETAP IV OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ

ETAP IV PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ

Matematyczne techniki zarządzania - 140
Etap V. Badanie losowości składnika losowego

Y

Y
NIELOSOWY

LOSOWY

t
t
Badanie losowości przeprowadza się testem Studenta lub testem serii
(Ekonometria, praca zb. pod red. M. Krzysztofiaka)
Brak losowości wymaga zmiany matematycznej postaci modelu
ETAP V OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP V PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ
Etap VI. Badanie stacjonarności składnika losowego
W etapie tym chodzi o niezależność wariancji składnika losowego od
zmiennej objaśniającej t (plansza 127)

Bada się istotność współczynnika korelacji ru t , t
ETAP VI OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VI PRZEPROWADZA SIĘ DLA TRANSFORMATY

Matematyczne techniki zarządzania - 141
Etap VII. Badanie wartości oczekiwanej składnika losowego
Normalnie, gdy przeprowadzamy estymację postaci liniowej, parametry
składnika losowego E ( )  0
{ ui  0}
V ( )  const
Po retransformacji do postaci pierwotnej mamy nowe reszty u’, dla
których
'
'
ui  0
 ui  0
Celem etapu jest sprawdzenie, czy odchyłka od O nie jest zbyt duża
(służy do tego test Studenta)
ETAP VII OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VII PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ
Etap VIII. Badanie autokorelacji składnika losowego
Pojęcie autokorelacji opisano na planszy 128; chodzi o istotność korelacji ru , u
t

tk

Badanie autokorelacji można przeprowadzić:

• testem R istotności korelacji ru

t

,ut  k

d obl

• testem Durbina-Watsona
NIE MA AUTOK.

d1

?

d2 JEST AUTOKORELACJA

ETAP VIII OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VIII PRZEPROWADZA SIĘ DLA TRANSFORMATY

Matematyczne techniki zarządzania - 142
Etap IX. Badanie normalności składnika losowego
Celem etapu jest stwierdzenie, czy reszty mają rozkład normalny
Analiza reszt — oddzielny dział analizy regresji i korelacji
Jeżeli reszty mają rozkład normalny, statystyk otrzymuje „ulgi”
ETAP 6. PRAKTYCZNA INTERPRETACJA MODELU



Celem etapu jest wydobycie z modelu całej nowej wiedzy, której nie widać
„gołym okiem”
INTERPRETUJĄC MODEL (RÓWNANIE REGRESJI) NALEŻY UŻYWAĆ WYŁĄCZNIE
PROSTEJ TERMINOLOGII EKONOMICZNEJ ZROZUMIAŁEJ DLA KLIENTA
NIE NALEŻY UŻYWAĆ TERMINOLOGII MATEMATYCZNEJ ZROZUMIAŁEJ TYLKO DLA
TWÓRCÓW MODELU
INTERPRETOWAĆ WOLNO TYLKO MODEL ZWERYFIKOWANY
CAŁY TRUD MODELOWANIA NIE MOŻE BYĆ „SZTUKĄ DLA SZTUKI”, LECZ MA
SŁUŻYĆ UZYSKANIU KONKRETNYCH WNIOSKÓW PRAKTYCZNYCH

Interpretacja modelu przyczynowo-skutkowego

Polega ona na określeniu wpływu poszczególnych czynników na badane
zjawisko:
• podział wszystkich czynników na trzy grupy

Matematyczne techniki zarządzania - 143
A — czynniki nie mające wpływu na Y
B — czynniki mające wpływ na Y i wprowadzone do modelu
C — czynniki mające wpływ na Y, ale nie występujące w modelu
• ocena jakościowa wpływu czynników B i C
• ocena ilościowa wpływu czynników B i C
Ocena jakościowa



Na podstawie znaków stojących przy współczynnikach r oraz ai możemy
stwierdzić, że wpływ jest:

• dodatni (im lepsze zaliczenie, tym lepszy wynik egzaminu; im więcej
wydatków na reklamę, tym większy zysk; itd.)
• ujemny (im więcej zatrudnionych, tym gorszy wynik finansowy; im
mniej braków, tym wyższy zysk; im mniejsza absencja, tym wyższe
wynagrodzenie; itd.)

Ocena ilościowa
• model liniowy
Przykład 33. Zinterpretuj zweryfikowany model zależności miesięcznych
kosztów działalności przedsiębiorstwa (tys. zł) od wielkości produkcji
(sztuk) i liczby reklamacji:
y i  50 , 8  14 , 5 x 1  3 , 9 x 2  

Matematyczne techniki zarządzania - 144
a0 = 50,8

poziom kosztów stałych; jeśli firma nie będzie prowadzić
żadnej działalności, poniesie koszty w wysokości 50,8 tys. zł

a1 = 14,5

każda sztuka produktu firmy kosztuje ją przeciętnie 14,5
tys. zł; jeżeli firma zwiększy produkcję o 2 sztuki, koszty
wzrosną o 29,0 tys. zł

a2 = 3,9każda wniesiona reklamacja powiększa koszty przeciętnie o
3,9 tys. zł
• model potęgowy
Przykłąd 34. Zinterpretuj zweryfikowaną funkcję produkcji Cobba-Douglasa
0 , 65

Pi  45 , 2 M i

0 , 73

Zi

e

0 , 04



Funkcja produkcji to specjalny model, określający zależność pomiędzy
produkcją (P) a czynnikami produkcji: majątkiem trwałym (M) i nakładami
robocizny (Z).



Funkcje produkcji to modele umożliwiające „prześwietlenie”
przedsiębiorstwa (szereg czasowy) lub branży (dane przekrojowe) i określenie poziomu gospodarowania oraz postępu
technicznego i organizacyjnego.
Elastyczność  to współczynnik określający reakcję zmiany
jednej zmiennej na inną zmienną — na przykład elastyczność
cenowa popytu (jak popyt zmienia się wraz z ceną towaru).

EKSPERCI
ZACHODNI

Matematyczne techniki zarządzania - 145

 

y
y

:

x

FUNKCJA POTĘGOWA JEST JEDYNĄ FUNKCJĄ O STAŁEJ ELASTYCZNOŚCI

x

Izolinie funkcji produkcji

T1
M

Produkcję P można osiągnąć różnymi
kombinacjami majątku i robocizny:

T2

• T1— technika kapitałochłonna, np.
pełna automatyzacja
• T2 — pośredni poziom techniki

T3
P  const

• T3 — niski poziom techniki, produkcja
pracochłonna
P. LOWE

Z
Efekt poprawy zarządzania bez
zmiany techniki (lepsze wykorzystanie ludzi i sprzętu):

P2
M

ZARZĄDZANIE
TECHNOLOGIĄ

P1

T

• zmniejszenie kapitałochłonności

• zmniejszenie pracochłonności
• zwiększenie produkcji (przejście z
funkcji P1 na P2)

Można też rozpatrzyć łączne efekty
zmiany techniki i zarządzania

Z

Matematyczne techniki zarządzania - 146
Wszystkie informacje tego typu można odczytać w trakcie interpretacji
0 , 65
0 , 73 0 , 04
funkcji produkcji:
Pi  45 , 2 M i
Zi
e

• wartości 45,2 nie interpretuje się
• wartość 0,65 to współczynnik elastyczności majątkowej (kapitałowej)
produkcji: zmiana majątku o 10% daje średnio zmianę produkcji o 6,5%
• wartość 0,73 to współczynnik elastyczności zatrudnieniowej produkcji:
zmiana zatrudnienia o 10% daje zmianę produkcji średnio o 7,3%
• suma obu współczynników k=0,65+0,73=1,38 to współczynnik skali
produkcji:

— jeżeli k<1, to firma rozwija się ekstensywnie
— jeżeli k>1, to firma rozwija się intensywnie
• wartość  = 0,04 to współczynnik postępu organizacyjnego:
— jeżeli  >O, to miał miejsce postęp organizacyjny

— jeżeli  <0, to miał miejsce regres organizacyjny
Interpretacja modelu tendencji rozwojowej

DODAMY
TROCHĘ
TEORII

Przypomnienie: t — zmienna objaśniająca (stałe przyrosty)
y — zmienna objaśniana; rozdzielana w ogólności na trzy
części: trend, wahania okresowe, wahania losowe ()

Matematyczne techniki zarządzania - 147
Wykres z planszy 117 (zużycie energii elektrycznej przez WZ AGH)
WAHANIA OKRESOWE OKREŚLA SIĘ WZGLĘDEM TRENDU A
NIE WZGLĘDEM OSI CZASU

y

trend

t
1995

1996

1997

1998

1999

Te trzy części trzeba zidentyfikować, a potem złożyć razem w model:

• addytywny (jeśli amplituda wahań jest stała)
• multiplikatywny (jeśli amplituda wahań rośnie lub maleje regularnie)
Wyznaczanie trendu
Metody mechaniczne:

• wskaźniki bezwzględne (stały przyrost =
postęp arytmetyczny = funkcja liniowa)
• wskaźniki względne (przyrost o stały procent =
postęp geometryczny = funkcja potęgowa)
• średnia ruchoma (wygładzanie danych linią łamaną)

JAK OBLICZYĆ O
ILE PROCENT ROCZNIE SPADAŁA
ŚREDNIO LICZBA
WIDZÓW W
KINACH:
1982 - 193,7 MLN
1989 - 141,3 MLN

Matematyczne techniki zarządzania - 148
Średnia ruchoma: mając szereg czasowy y1, y2,....., yn, przyjmujemy
długość kroku k = 3, lub 5, lub 7 itd. i liczymy
y  ...  y k
y  ...  y k  1
y k / 2 0 ,5  1
a następnie y k / 2  1 , 5  2
itd.
k
k
y  y2  y3
y  y3  y4
dla k=3:
y2  1
y3  2
itd.
3
3
Przykład 35. Wyznacz trend metodą średniej ruchomej dla następujących
danych:
okres
t
wartość yt

1
5

2
4

3
7

4
6

5
8

12

y2 
10

y3 

y

8

y4 

6
4

y5 

2

y6 

0
0

1

2

3

4

5

czas, t

6

7

8

9

y7 

547

6
10

 5 , 67

CECHY
ŚREDNIEJ
RUCHOMEJ:

 7 , 00

• TRACI SIĘ
k-1 DANYCH

3
768

8
8

 5 , 33

3
476

7
9

3
6  8  10

 8 , 00

3
8  10  9

 9 , 00

3
10  9  8

 9 , 00

• IM
WIĘKSZE k,
TYM
BARDZIEJ
SZTYWNY
TREND

3

Metody statystyczne: analiza regresji i korelacji, różne funkcje oparte na
modelach ekonomii

Matematyczne techniki zarządzania - 149
Wyznaczanie wahań okresowych: dobowych, tygodniowych, miesięcznych,
kwartalnych, rocznych, wieloletnich
Trzy metody:

— metoda wskaźników sezonowości
— metoda zmiennych zero-jedynkowych (0-1)

— metoda harmoniczna
Wszystkie metody mają jeden cel:
uzyskanie przeciętnego obrazu jednego cyklu

+

Ws
[t ]
[%]
trend

I

II



III

IV

WADY:
• KONIECZNOŚĆ
KOREKTY
• BRAK
WERYFIKACJI
STATYSTYCZNEJ

Metoda wskaźników sezonowości

• obliczenie surowych wskaźników sezonowości (wyeliminowanie trendu):
y

S s  yt  yt
S s  t
yt
addytywny multiplikatywny
wynik: n wartości odchyleń od trendu

• obliczenie oczyszczonych wskaźników
sezonowości (wyeliminowanie wahań
losowych):
 Ss
So 
k-liczba okresów
k
jednoimiennych
m-długość cyklu wynik: m wartości śr. odchyleń od trendu

Matematyczne techniki zarządzania - 150
Metoda zmiennych zero-jedynkowych (0-1)
m

y t  a 0  a1 t   bi Q i  
i 1

bi — przeciętne odchylenie od trendu dla
okresu i-tego
Qi — zmienna 0-1

wahania losowe
trend

wahania okresowe

t
1
2
3
4
5
6
7
8
9

yt
y1
y2
y3
y4
y5
y6
y7
y8
y9

Q1
1
0
0
0
1
0
0
0
1

Q2
0
1
0
0
0
1
0
0
0

Q3
0
0
1
0
0
0
1
0
0

Q4
0
0
0
1
0
0
0
1
0

Metoda harmoniczna (szeregi Fouriera)
Wahania okresowe przedstawia się jako sumę określonej liczby drgań harmonicznych (sinusoid i cosinusoid) przesuniętych w fazie, lecz o jednakowym okresie
m /2
2 i m / 2
2 i
y t  a 0  a 1 t   b1 i sin
  b 2 i cos

m
m
i 1
i 1
Obie metody dają taki sam wynik, istnieje możliwość weryfikacji
statystycznej
W metodzie 0-1 dostajemy bi = Ws, natomiast w metodzie harmonicznej Ws
jest sumą wartości poszczególnych sinusoid dla danego momentu czasu


Slide 15

Matematyczne techniki zarządzania - 121
ETAP 2. GROMADZENIE DANYCH STATYSTYCZNYCH

!

ZA JAKOŚĆ DANYCH ODPOWIADA MODELUJĄCY
• rodzaje danych: dane przekrojowe i szeregi czasowe
• źródła danych: roczniki statystyczne, różne działy
przedsiębiorstwa, badania marketingowe, wywiady itd.
• wiarygodność danych: do jakiego celu zostały one
przygotowane?

MUSISZ
SPRAWDZAĆ
KAŻDE DANE

• porównywalność danych: inflacja (ceny bieżące a ceny
stałe), zmiany procesów technicznych
Wielkość
produkcji

• zmienność zjawisk: trzeba sprawdzić, czy
wybrana w etapie 1a zmienna jest rzeczywiście zmienną losową

Wx 

s( x )

nowy zakład

100 %

x

stary zakład

Wx musi wynosić co najmniej 30-40%
Wiek studenta może być dobrą zmiennąprzyczyną, ale nie w przypadku studiów
dziennych!

Zatrudnienie

Matematyczne techniki zarządzania - 122
ETAP 3. SELEKCJA ZMIENNYCH OBJAŚNIAJĄCYCH
KAŻDĄ ZMIENNĄ X WYTYPOWANĄ W ETAPIE 1a TRAKTUJEMY JAKO
KANDYDATKĘ NA ZMIENNĄ OBJAŚNIAJĄCĄ
Może być kilka przyczyn powodujących, że taka kandydatka nie może znaleźć się w modelu ekonometrycznym (w równaniu regresji):
• w modelu nie może być zbyt wielu zmiennych (nieczytelny)
• kandydatka może nie mieć wpływu na zmienną Y



• kandydatka może wnosić prawie tę samą informację o Y co inna
kandydatka

• dwie bardzo podobne kandydatki mogą sobie nawzajem przeszkadzać
(efekt katalityczny)
Kryteria, jakie musi spełniać kandydatka Xi, aby nadawała się do modelu:
• musi być silnie powiązana ze zmienną Y

• nie może być powiązana z inną kandydatką Xj
SSTO
x1
x4

x2
x3

reszta

R2=0,79

R2=0,66

x2
x1
x4

R2=0,48

x3
reszta

reszta

SSTO

SSTO

Matematyczne techniki zarządzania - 123
Efekt katalityczny
DWIE ZMIENNE DAJĄ
RAZEM MNIEJ INFORMACJI NIŻ KAŻDA Z
NICH Z OSOBNA

x1

x2

R2=0,25

x2

x1

R2=0,52

R2=0,66

Selekcja kandydatek ma na celu podzielenie ich na trzy grupy:
• zmienne wprowadzone do modelu
• zmienne nie wprowadzone do modelu, ale reprezentowane w nim przez
inne zmienne (możliwość wymiany)
• zmienne nie wprowadzone do modelu ze względu na fakt, że nie wnoszą
żadnej informacji o zmiennej Y
INFORMACJE potrzebne do selekcji: współczynniki r x i x j ,
Macierz współczynników korelacji
Y
Y
X1
X2
X3

0,52
0,64
- 0,21

X1
0,52
0,82
- 0,18

X2
0,64
0,82
0,08

X3
- 0,21
- 0,18
0,08

r yx

i

Przykład 32. Macierz powiązania
zmiennych ze sobą przedstawia
się następująco (n=20). Jak ją
można zinterpretować? Które
zmienne są powiązane ze sobą w
sposób istotny?

Matematyczne techniki zarządzania - 124
Testowanie istotności współczynnika korelacji
H0:  = 0

Można je przeprowadzić trzema testami: testem Studenta

H1:   0

(t), Fishera (F) i Wallace’a-Snedecora (R)

Fragment tablicy rozkładu Wallece’a-Snedecora (SKRYPT, tab. VII, s.161)
S to pn ie
sw ob od y

2
0,05
0,632
0,444
0,361

8
18
28

,

0,01
0,765
0,561
0,463

L iczb a zm ien n ych
3
0,05
0,01
0,726
0,827
0,532
0,633
0,439
0,530

4
0,05
0,777
0,587
0,490

0,01
0,860
0,678
0,573

Reguła decyzyjna: — jeżeli |Robl|>Rtabl, odrzucamy H0 (korelacja istotna)
— jeżeli |Robl|
W przykładzie 32, jeżeli przyjmiemy  = 0,05, to Rtabl = 0,444.
Y
Y
X1
X2
X3

0,52
0,64
- 0,21

X1
0,52
0,82
- 0,18

X2
0,64
0,82
0,08

X3
- 0,21
- 0,18
0,08

Pozostaną zatem tylko trzy
istotne powiązania:
y-x1, y-x2, x1-x2
BRAK ISTOTNEGO POWIĄZANIA Z Y NIE
OZNACZA, ŻE ZMIENNA NIE WNOSI
ŻADNEJ INFORMACJI O ZJAWISKU Y

Matematyczne techniki zarządzania - 125



Metody selekcji zmiennych objaśniających:
• grafowa
• Hellwiga (pojemności informacji)
• taksonomiczne (clustering)
Metoda grafowa
• obliczenie macierzy współczynników:

rx

i

xj

• wyłowienie z macierzy powiązań istotnych

, r yx

BUDOWA GRAFU
i

• graf spójny

• budowa grafu z powiązań istotnych
• wybranie zmiennych na podstawie grafu

x6

• graf zerowy
x1
x4

x9

DO MODELU WYBIERA SIĘ ZMIENNE:
• każdy graf zerowy (jeśli |ryx|>0,1)

istotne powiązanie

• po jednej reprezentantce grafu spójnego;

reprezentantką grafu jest zmienna, która ma najwięcej powiązań z
innymi kandydatkami
jeżeli kilka zmiennych ma tę samą maksymalną liczbę powiązań, wybiera
się z nich tę, która jest najsilniej powiązana za zmienną Y (max ryx)
jeżeli graf jest rozległy, może mieć dwie reprezentantki, ale muszą one
leżeć na przeciwległych stronach grafu

Matematyczne techniki zarządzania - 126
Przykład 32 cd. Wybierzemy
zmienną x2 (reprezentantka grafu
spójnego) i zmienną x3 (graf
zerowy)
Metoda Hellwiga

Y
Y
X1
X2
X3

0,52
0,64
- 0,21

• wypisujemy wszystkie możliwe kombinacje
kandydatek; jest ich K = 2m—1
• obliczamy pojemność informacji dla każdej
zmiennej w każdej kombinacji

h kl  f ( r yx , r x
i

ixj

)

• obliczamy pojemność całkowitą dla każdej
kombinacji
H l   h kl
k

• wybieramy kombinację o największej
pojemności Hl = max

X1
0,52
0,82
- 0,18

X2
0,64
0,82

X3
- 0,21
- 0,18
0,08

0,08

W przykładzie 32 mamy 7
możliwych kombinacji kandydatek:
1. x1
2. x2

3. x3

maximum:

H6 = 0,42

4. x1,x2
5. x1,x3

Hmax = R2

6. x2,x3
7. x1,x2,x3

Metody taksonomiczne
Taksonomia wrocławska (cluster analysis) to metoda grupowania obiektów (zmiennych) w grupy jednorodne pod względem n cech (wymiarów)
łącznie. Podstawą grupowania jest odległość euklidesowa, która w przypadku zmiennych d ij  f ( r x x )
WSZYSTKIE METODY TO SELEKCJA WSTĘPNA
i

j

Matematyczne techniki zarządzania - 127
ETAP 4. ESTYMACJA PARAMETRÓW MODELU
Cel etapu: wyznaczenie parametrów strukturalnych i stochastycznych
Estymacja: szacowanie parametrów populacji na podstawie próbki
Metody estymacji: analiza regresji i korelacji (KMNK i inne)

Założenia dla KMNK
1. Zmienne losowe są prawdziwymi zmiennymi, nie powiązanymi ze sobą
2. Składnik losowy  ma stałą wariancję, niezależną od zmiennej x lub t
3. Wartości reszt ui są niezależne od siebie

4. Składnik losowy  nie jest powiązany ze zmienną objaśniającą
Skutki niedotrzymania założeń i środki zaradcze
1. Model bez sensu, nieprzydatny; niekiedy absurdalny (źle uwarunkowane
dane)
Stosuje się: dużą próbkę (n>100), regresję grzbietową (ridge regression)
2.

Y

reszta ui

Lewa część zbioru ma dużą wariancję, a
prawa — wariancję małą
Stosuje się specjalny wariant MNK z
korektą na różne wariancje
X

Matematyczne techniki zarządzania - 128
3. Jeśli reszty ui są ze sobą powiązane (skorelowane), mówimy, że
występuje autokorelacja składnika losowego (zjawisko występuje przy
szeregach czasowych — sztywny porządek obserwacji)
Oznacza to, że istnieje istotna zależność u t  f ( u t  k )
Przyczyny autokorelacji: zakłócenia
(dodatnie lub ujemne) w jednym okresie
wpływają na poziom zjawiska w następnych
okresach (rolnictwo, produkcja, rynek)

t  1 , 2 ,...

u t  y t  yˆ t

u t 1

u1
u2
u3
u4
u5

Występowanie autokorelacji powoduje
nieprzydatność modelu


u1
u2
u3
u4

Istnienie autokorelacji sprawdza się testem
Durbina-Watsona d
Stosuje się metodę różniczki zupełnej

y  f (x )

yt  yt  ytk

4. Składnik losowy jest skorelowany ze zmienną objaśniającą, wtedy
gdy została pominięta jakaś ważna zmienna-przyczyna

Model taki nie ma żadnej wartości; trzeba dbać o jak najwyższy współczynnik determinacji (R2>0,9)
• zbiór danych rzeczywistych nigdy
nie spełnia tych wymagań

ESTYMACJĘ MODELU POWTARZA SIĘ WIELOKROTNIE
ponieważ dopiero weryfikacja zapewnia ostateczną selekcję
kandydatek na zmienne objaśniające

• ekonometria to analiza danych nie
spełniających tych założeń
• nie stosować statystyki bezmyślnie (na ślepo)

Matematyczne techniki zarządzania - 129
ETAP 5. WERYFIKACJA MODELU
Cele:

1. opis rzeczywistości (populacji generalnej)



2. dokładna (ostateczna) selekcja zmiennych objaśniających
3. poznanie składnika losowego (spełnienie założeń KMNK)
Narzędzia: hipotezy i testy statystyczne

Metodyka: każde równanie oddzielnie; weryfikacja obejmuje 9 etapów (od
najmniej do najbardziej pracochłonnego)
WYKAZ ETAPÓW WERYFIKACJI MODELU
I.
II.

Badanie istotności korelacji
Badanie wyrazistości modelu

III.

Badanie istotności parametrów

IV.

Badanie symetrii skł. losowego

V.
VI.
VII.
VIII.
IX.

Badanie losowości skł. losowego
Badanie stacjonarności skł. los.
Badanie wartości oczekiwanej skł. los.
Badanie autokorelacji skł. losowego
Badanie normalności skł. losowego

Opis każdego etapu weryfikacji
obejmuje:
• cel etapu
• sposób weryfikacji: wzory,
hipotezy, testy
• podanie których modeli dotyczy (przyczynowo-skutkowych
czy tendencji rozwojowej)
• podanie której postaci modeli
nieliniowych dotyczy (pierwotnej czy transformaty)

Matematyczne techniki zarządzania - 130
Etap I. Badanie istotności korelacji
7
2

8

9

11

12

17

19

23

21

5
2 etapu
9
16
7
9
15
14
Celem
jest
sprawdzenie,
czy
istnieje w populacji generalnej powiązanie pomiędzy zmienną Y i wszystkimi zmiennymi objaśniającymi

25

Przedział ufności dla
nieznanego współczynnika korelacji  dla populacji buduje się przy
użyciu błędu

populacja

zmienna Y

20
15
10

próbka

5
0
8
5

0 9

1011

2

9

20
12

30
17
16
7
zmienna X

25

1940
9

23 50
15

populacja

20

zmienna Y

7
2

15
10

próbka

5
0
0

10

20

30

zmienna X

40

50

21
14

sR 

1 R

0

Robl

2

nk

Istotność korelacji weryfikuje się przez postawienie
następujących hipotez dla
współczynnika korelacji dla
populacji generalnej:

1
R,|r|

H0 :   0

Brak korelacji, nie ma powiązania...

H1 :   0

Korelacja istotna, jest powiązanie...

,

Matematyczne techniki zarządzania - 131
Hipotezy te można weryfikować trzema równoważnymi testami:
• testem t Studenta (tylko dla regresji dwu zmiennych)
• testem F Fishera-Snedecora
• testem R Wallace’a-Snedecora

,

W każdym przypadku obliczamy wartość
statystyki dla próbki (tobl, Fobl, Robl) i porównujemy z wartością krytyczną odczytaną z tablicy odpowiedniego rozkładu w
funkcji poziomu istotności i liczby stopni
swobody (ttabl, Ftabl, Rtabl)

Reguła decyzyjna:
• jeżeli |tobl|< ttabl, nie ma podstaw do odrzucenia H0 (brak korelacji)
• jeżeli |tobl|> ttabl, odrzucamy H0 na korzyść H1 (korelacja istnieje)

TAK SAMO DLA
FiR

W przypadku regresji wielorakiej, gdy liczba zmiennych objaśniajacych
jest duża w porównaniu do liczby obserwacji, współczynnik determinacji
R2 może dawać zawyżoną ocenę stopnia wyjaśnienia zmienności zmiennej
objaśnianej; dlatego wprowadzono skorygowany współczynnik determinacji (i korelacji):
 ( yˆ i  y )

R

2

2

k
n

k

1


2
nk 1
(
y

y
)

i
n1

• adjusted coefficient of multiple
determination (wydruki komputerowe)

• jeśli k jest małe, nie ma większej różnicy
pomiędzy normalnym a skorygowanym R2

Matematyczne techniki zarządzania - 132
Skąd wziąć wartość odpowiedniej statystyki dla próbki i jak odczytywać jej wartości z tablic?
n2
r
t

r

t tabl  t  / 2 { n  2 }
TEST STUDENTA
obl
2
sr
1 r

F obl 

TEST FISHERA

Ź ró d ło z m ien n o śc i

MSTR
MSE



R

nk

2

1 R

2

L ic zb a sto p n i
sw o b o d y

Suma
k w a d ra tó w

Ś re d n i
k w a d ra t

M o d el (c z yn n ik i)
B łą d (re sz ta )

k1
nk

SSTR
SSE

MSTR
MSE

R azem

n1

SSTO

TEST WALLACE’A

R obl 

R

2

k 1

F tabl  F { k  1 , n  k }

S ta ty sty k a
F
F obl 

MSTR
MSE

NIE MYLIĆ
STOPNI SWOBODY LICZNIKA I MIANOWNIKA

R tabl  R { k , n  k }

Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

Matematyczne techniki zarządzania - 133
Odczyt Rtabl z tablicy testu R (SKRYPT s.161-162)

, k,  = n-k

S to pn ie
sw ob od y
8
18
28

2
0,05
0,632
0,444
0,361

0,01
0,765
0,561
0,463

L iczb a zm ien n ych
3
0,05
0,01
0,726
0,827
0,532
0,633
0,439
0,530

4
0,05
0,777
0,587
0,490

0,01
0,860
0,678
0,573

Wnioski dotyczące rozkładu R Wallace’a-Snedecora:
• tablica zawiera maksymalne wartości współczynnika korelacji w danej
sytuacji, jakich można oczekiwać, gdy nie ma korelacji w populacji
• im wyższy poziom istotności, tym niższe Rtabl

• im większa liczba zmiennych w modelu, tym wyższe Rtabl
• im wyższa liczba stopni swobody (większa próbka), tym niższe Rtabl
• tablica R powstała z przeliczenia tablic t oraz F (odwrócenie wzorów)
• tablica testu R jest najszybszym i nawygodniejszym narzędziem do
weryfikacji istotności korelacji

Werdykt z etapu I:

Matematyczne techniki zarządzania - 134

• jeżeli Robl>Rtabl, model jest poprawny, można przejść do etapu II
• jeżeli Roblzmiennych objaśniających albo jego postać matematyczną
ETAP I OBOWIĄZUJE DLA WSZYSTKICH MODELI
ETAP I PRZEPROWADZA SIĘ DLA TRANSFORMATY (dla postaci pierwotnej
można uzyskać R>1)
Rola współczynnika determinacji R2
• korelacja może być istotna przy małym R i bardzo małym R2 (r=0,4,
R2=0,16, co oznacza, że tylko 16% zmienności zmiennej Y jest
wyjaśnione przez zmienną objaśniającą)
• małe R2 oznacza niski stopień wyjaśnienia rzeczywistości i stanowi
zagrożenie dla modelu
• należy dążyć (poprzez odpowiedni dobór zmiennych-przyczyn i postaci
matematycznej modelu) do jak największego R2 (dla postaci pierwotnej)
• wysoka wartość R2 świadczy o dobrym poznaniu badanego zjawiska
• wysoka wartość R2 bardzo często wynika jednak ze złego dobrania
zmiennych objaśniających (silnie powiązane ze sobą — „masło maślane”)
KORELACJA POZORNA — jest zależność, ale jej nie ma? Przyczyny...
Trzeba unikać wartości bezwzględnych (ludność, liczba sklepów, wielkość produkcji)

6

9

12

8

11

12

11

15

9

18

9

11

11

18

15

Matematyczne techniki zarządzania - 135
Etap II. Badanie wyrazistości modelu
Y

Wyrazistość modelu dana jest wzorem

s( y )

ui

y

W obl 

s( y )

100 %

y

Celem etapu
jest kontrola
rozrzutu danych

Współczynnik Wobl<30%, w przeciwnym
przypadku rozrzut danych jest zbyt duży

y

Kłopoty: gdyy jest bliskie 0

x

X

Werdykt: model poprawny lub niepoprawny

ETAP II OBOWIĄZUJE DLA WSZYSTKICH MODELI (ale nie ma on charakteru
statystycznego)

ETAP II PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ (sprawdzamy, czy
nie występuje silny efekt „krzywego lustra”)
Etap III. Badanie istotności parametrów (współczynników) modelu
Celem etapu jest sprawdzenie:
• czy poszczególne zmienne objaśniające mają istotny wpływ na zmienną
objaśnianą?
• czy zmienne objaśniające są wybrane prawidłowo?

• czy wyraz wolny różni się istotnie od zera?

Matematyczne techniki zarządzania - 136
Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

Problem istotności parametrów ai można rozpatrywać (tak jak problem
średniej dla populacji) z dwu punktów widzenia:
• przedziału ufności dla nieznanej wartości i

• hipotez — zerowej H0: i=0 i alternatywnej H1: i 0

1
0

ai

1

i

ISTOTNY (W PRZEDZIALE NIE MA ZERA)

0

ai

i

NIEISTOTNY (W PRZEDZIALE JEST ZERO)

P ( a i  t / 2 { n  k } s ( a i )   i  a i  t / 2 { n  k } s ( a i )  1  

Z tablicy rozkładu Studenta, a nie z wydruku komputerowego!

Matematyczne techniki zarządzania - 137
Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

W praktyce posługujemy się raczej hipotezami:
Badanie istotności przeprowadza
się dla każdego i oddzielnie:

t obl ( a i ) 

ai  0
s(a i )

t tabl  t  / 2 { n  k }

• jeżeli |tobl(ai)|>ttabl(ai), odrzucamy hipotezę zerową; parametr jest istotny z błędem równym co najwyżej 
• jeżeli |tobl(ai)|parametr nie jest istotny
Praktycznie jest to bardzo łatwe:
• sprawdzamy, czy |t(ai)| jest większe czy mniejsze od około 2, a najlepiej
• porównujemy rzeczywisty poziom istotności P(ai) z przyjętym 
ODRZUCAMY H0, JEŻELI P(ai) JEST MNIEJSZE OD 

WTEDY ZMIENNA
Xi MA WPŁYW NA
ZMIENNĄ Y

Matematyczne techniki zarządzania - 138
W etapie III następuje ostateczna selekcja zmiennych objaśniających:
• jeżeli wszystkie ai okażą się istotne, model jest poprawny:
— model przyczynowo-skutkowy: do interpretacji
— model tendencji rozwojowej: do etapu IV
• jeżeli choć jedno ai okaże się nieistotne, model jest niepoprawny i wymaga poprawy przez usunięcie nieistotnych zmiennych:
— zmienne należy usuwać po jednej (ze względu na efekt katalityczny)
— usuwa się zawsze zmienną o najniższej wartości |t(ai)| [czyli o
najwyższej wartości P(ai)]
— usunięcie ostatniej zmiennej nieistotnej kończy proces selekcji
kandydatek na zmienne,

— selekcja nie jest ostateczna, gdyż zawsze istnieje możliwość zamiany zmiennych, które są powiązane ze sobą
Praktyczne znaczenie istotności wyrazu wolnego a0
To są jedne z możliwości dla populacji (p. plansza 106)

Y

W przypadku funkcji K=f(P) wyraz wolny wyznacza poziom kosztów stałych (rachunkowość zarządcza)
W przypadku zależności technicznej Q=f(h) wyraz
wolny oznacza, że przy miąższości pokładu h=0 wydajność produkcji Q też jest równa 0

0
X

Matematyczne techniki zarządzania - 139
Praktyczne znaczenie istotności współczynnika regresji ai



KRZYWE NEYMANA — PLANSZE 106-107
WSPÓŁCZ. ISTOTNY
WSPÓŁ. NIEISTOTNY

ETAP III OBOWIĄZUJE DLA WSZYSTKICH MODELI
ETAP III PRZEPROWADZA SIĘ DLA TRANSFORMATY
Etap IV. Badanie symetrii składnika losowego

Y

CZĘSTOŚĆ RESZT DODATNICH I UJEMNYCH MA BYĆ
ZBLIŻONA

Y

ASYMETRYCZNY
SYMETRYCZNY

t
t
Badanie symetrii przeprowadza się testem Studenta (St. Bartosiewicz
Ekonometria)
Brak symetrii wymaga zmiany matematycznej postaci modelu
ETAP IV OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ

ETAP IV PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ

Matematyczne techniki zarządzania - 140
Etap V. Badanie losowości składnika losowego

Y

Y
NIELOSOWY

LOSOWY

t
t
Badanie losowości przeprowadza się testem Studenta lub testem serii
(Ekonometria, praca zb. pod red. M. Krzysztofiaka)
Brak losowości wymaga zmiany matematycznej postaci modelu
ETAP V OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP V PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ
Etap VI. Badanie stacjonarności składnika losowego
W etapie tym chodzi o niezależność wariancji składnika losowego od
zmiennej objaśniającej t (plansza 127)

Bada się istotność współczynnika korelacji ru t , t
ETAP VI OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VI PRZEPROWADZA SIĘ DLA TRANSFORMATY

Matematyczne techniki zarządzania - 141
Etap VII. Badanie wartości oczekiwanej składnika losowego
Normalnie, gdy przeprowadzamy estymację postaci liniowej, parametry
składnika losowego E ( )  0
{ ui  0}
V ( )  const
Po retransformacji do postaci pierwotnej mamy nowe reszty u’, dla
których
'
'
ui  0
 ui  0
Celem etapu jest sprawdzenie, czy odchyłka od O nie jest zbyt duża
(służy do tego test Studenta)
ETAP VII OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VII PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ
Etap VIII. Badanie autokorelacji składnika losowego
Pojęcie autokorelacji opisano na planszy 128; chodzi o istotność korelacji ru , u
t

tk

Badanie autokorelacji można przeprowadzić:

• testem R istotności korelacji ru

t

,ut  k

d obl

• testem Durbina-Watsona
NIE MA AUTOK.

d1

?

d2 JEST AUTOKORELACJA

ETAP VIII OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VIII PRZEPROWADZA SIĘ DLA TRANSFORMATY

Matematyczne techniki zarządzania - 142
Etap IX. Badanie normalności składnika losowego
Celem etapu jest stwierdzenie, czy reszty mają rozkład normalny
Analiza reszt — oddzielny dział analizy regresji i korelacji
Jeżeli reszty mają rozkład normalny, statystyk otrzymuje „ulgi”
ETAP 6. PRAKTYCZNA INTERPRETACJA MODELU



Celem etapu jest wydobycie z modelu całej nowej wiedzy, której nie widać
„gołym okiem”
INTERPRETUJĄC MODEL (RÓWNANIE REGRESJI) NALEŻY UŻYWAĆ WYŁĄCZNIE
PROSTEJ TERMINOLOGII EKONOMICZNEJ ZROZUMIAŁEJ DLA KLIENTA
NIE NALEŻY UŻYWAĆ TERMINOLOGII MATEMATYCZNEJ ZROZUMIAŁEJ TYLKO DLA
TWÓRCÓW MODELU
INTERPRETOWAĆ WOLNO TYLKO MODEL ZWERYFIKOWANY
CAŁY TRUD MODELOWANIA NIE MOŻE BYĆ „SZTUKĄ DLA SZTUKI”, LECZ MA
SŁUŻYĆ UZYSKANIU KONKRETNYCH WNIOSKÓW PRAKTYCZNYCH

Interpretacja modelu przyczynowo-skutkowego

Polega ona na określeniu wpływu poszczególnych czynników na badane
zjawisko:
• podział wszystkich czynników na trzy grupy

Matematyczne techniki zarządzania - 143
A — czynniki nie mające wpływu na Y
B — czynniki mające wpływ na Y i wprowadzone do modelu
C — czynniki mające wpływ na Y, ale nie występujące w modelu
• ocena jakościowa wpływu czynników B i C
• ocena ilościowa wpływu czynników B i C
Ocena jakościowa



Na podstawie znaków stojących przy współczynnikach r oraz ai możemy
stwierdzić, że wpływ jest:

• dodatni (im lepsze zaliczenie, tym lepszy wynik egzaminu; im więcej
wydatków na reklamę, tym większy zysk; itd.)
• ujemny (im więcej zatrudnionych, tym gorszy wynik finansowy; im
mniej braków, tym wyższy zysk; im mniejsza absencja, tym wyższe
wynagrodzenie; itd.)

Ocena ilościowa
• model liniowy
Przykład 33. Zinterpretuj zweryfikowany model zależności miesięcznych
kosztów działalności przedsiębiorstwa (tys. zł) od wielkości produkcji
(sztuk) i liczby reklamacji:
y i  50 , 8  14 , 5 x 1  3 , 9 x 2  

Matematyczne techniki zarządzania - 144
a0 = 50,8

poziom kosztów stałych; jeśli firma nie będzie prowadzić
żadnej działalności, poniesie koszty w wysokości 50,8 tys. zł

a1 = 14,5

każda sztuka produktu firmy kosztuje ją przeciętnie 14,5
tys. zł; jeżeli firma zwiększy produkcję o 2 sztuki, koszty
wzrosną o 29,0 tys. zł

a2 = 3,9każda wniesiona reklamacja powiększa koszty przeciętnie o
3,9 tys. zł
• model potęgowy
Przykłąd 34. Zinterpretuj zweryfikowaną funkcję produkcji Cobba-Douglasa
0 , 65

Pi  45 , 2 M i

0 , 73

Zi

e

0 , 04



Funkcja produkcji to specjalny model, określający zależność pomiędzy
produkcją (P) a czynnikami produkcji: majątkiem trwałym (M) i nakładami
robocizny (Z).



Funkcje produkcji to modele umożliwiające „prześwietlenie”
przedsiębiorstwa (szereg czasowy) lub branży (dane przekrojowe) i określenie poziomu gospodarowania oraz postępu
technicznego i organizacyjnego.
Elastyczność  to współczynnik określający reakcję zmiany
jednej zmiennej na inną zmienną — na przykład elastyczność
cenowa popytu (jak popyt zmienia się wraz z ceną towaru).

EKSPERCI
ZACHODNI

Matematyczne techniki zarządzania - 145

 

y
y

:

x

FUNKCJA POTĘGOWA JEST JEDYNĄ FUNKCJĄ O STAŁEJ ELASTYCZNOŚCI

x

Izolinie funkcji produkcji

T1
M

Produkcję P można osiągnąć różnymi
kombinacjami majątku i robocizny:

T2

• T1— technika kapitałochłonna, np.
pełna automatyzacja
• T2 — pośredni poziom techniki

T3
P  const

• T3 — niski poziom techniki, produkcja
pracochłonna
P. LOWE

Z
Efekt poprawy zarządzania bez
zmiany techniki (lepsze wykorzystanie ludzi i sprzętu):

P2
M

ZARZĄDZANIE
TECHNOLOGIĄ

P1

T

• zmniejszenie kapitałochłonności

• zmniejszenie pracochłonności
• zwiększenie produkcji (przejście z
funkcji P1 na P2)

Można też rozpatrzyć łączne efekty
zmiany techniki i zarządzania

Z

Matematyczne techniki zarządzania - 146
Wszystkie informacje tego typu można odczytać w trakcie interpretacji
0 , 65
0 , 73 0 , 04
funkcji produkcji:
Pi  45 , 2 M i
Zi
e

• wartości 45,2 nie interpretuje się
• wartość 0,65 to współczynnik elastyczności majątkowej (kapitałowej)
produkcji: zmiana majątku o 10% daje średnio zmianę produkcji o 6,5%
• wartość 0,73 to współczynnik elastyczności zatrudnieniowej produkcji:
zmiana zatrudnienia o 10% daje zmianę produkcji średnio o 7,3%
• suma obu współczynników k=0,65+0,73=1,38 to współczynnik skali
produkcji:

— jeżeli k<1, to firma rozwija się ekstensywnie
— jeżeli k>1, to firma rozwija się intensywnie
• wartość  = 0,04 to współczynnik postępu organizacyjnego:
— jeżeli  >O, to miał miejsce postęp organizacyjny

— jeżeli  <0, to miał miejsce regres organizacyjny
Interpretacja modelu tendencji rozwojowej

DODAMY
TROCHĘ
TEORII

Przypomnienie: t — zmienna objaśniająca (stałe przyrosty)
y — zmienna objaśniana; rozdzielana w ogólności na trzy
części: trend, wahania okresowe, wahania losowe ()

Matematyczne techniki zarządzania - 147
Wykres z planszy 117 (zużycie energii elektrycznej przez WZ AGH)
WAHANIA OKRESOWE OKREŚLA SIĘ WZGLĘDEM TRENDU A
NIE WZGLĘDEM OSI CZASU

y

trend

t
1995

1996

1997

1998

1999

Te trzy części trzeba zidentyfikować, a potem złożyć razem w model:

• addytywny (jeśli amplituda wahań jest stała)
• multiplikatywny (jeśli amplituda wahań rośnie lub maleje regularnie)
Wyznaczanie trendu
Metody mechaniczne:

• wskaźniki bezwzględne (stały przyrost =
postęp arytmetyczny = funkcja liniowa)
• wskaźniki względne (przyrost o stały procent =
postęp geometryczny = funkcja potęgowa)
• średnia ruchoma (wygładzanie danych linią łamaną)

JAK OBLICZYĆ O
ILE PROCENT ROCZNIE SPADAŁA
ŚREDNIO LICZBA
WIDZÓW W
KINACH:
1982 - 193,7 MLN
1989 - 141,3 MLN

Matematyczne techniki zarządzania - 148
Średnia ruchoma: mając szereg czasowy y1, y2,....., yn, przyjmujemy
długość kroku k = 3, lub 5, lub 7 itd. i liczymy
y  ...  y k
y  ...  y k  1
y k / 2 0 ,5  1
a następnie y k / 2  1 , 5  2
itd.
k
k
y  y2  y3
y  y3  y4
dla k=3:
y2  1
y3  2
itd.
3
3
Przykład 35. Wyznacz trend metodą średniej ruchomej dla następujących
danych:
okres
t
wartość yt

1
5

2
4

3
7

4
6

5
8

12

y2 
10

y3 

y

8

y4 

6
4

y5 

2

y6 

0
0

1

2

3

4

5

czas, t

6

7

8

9

y7 

547

6
10

 5 , 67

CECHY
ŚREDNIEJ
RUCHOMEJ:

 7 , 00

• TRACI SIĘ
k-1 DANYCH

3
768

8
8

 5 , 33

3
476

7
9

3
6  8  10

 8 , 00

3
8  10  9

 9 , 00

3
10  9  8

 9 , 00

• IM
WIĘKSZE k,
TYM
BARDZIEJ
SZTYWNY
TREND

3

Metody statystyczne: analiza regresji i korelacji, różne funkcje oparte na
modelach ekonomii

Matematyczne techniki zarządzania - 149
Wyznaczanie wahań okresowych: dobowych, tygodniowych, miesięcznych,
kwartalnych, rocznych, wieloletnich
Trzy metody:

— metoda wskaźników sezonowości
— metoda zmiennych zero-jedynkowych (0-1)

— metoda harmoniczna
Wszystkie metody mają jeden cel:
uzyskanie przeciętnego obrazu jednego cyklu

+

Ws
[t ]
[%]
trend

I

II



III

IV

WADY:
• KONIECZNOŚĆ
KOREKTY
• BRAK
WERYFIKACJI
STATYSTYCZNEJ

Metoda wskaźników sezonowości

• obliczenie surowych wskaźników sezonowości (wyeliminowanie trendu):
y

S s  yt  yt
S s  t
yt
addytywny multiplikatywny
wynik: n wartości odchyleń od trendu

• obliczenie oczyszczonych wskaźników
sezonowości (wyeliminowanie wahań
losowych):
 Ss
So 
k-liczba okresów
k
jednoimiennych
m-długość cyklu wynik: m wartości śr. odchyleń od trendu

Matematyczne techniki zarządzania - 150
Metoda zmiennych zero-jedynkowych (0-1)
m

y t  a 0  a1 t   bi Q i  
i 1

bi — przeciętne odchylenie od trendu dla
okresu i-tego
Qi — zmienna 0-1

wahania losowe
trend

wahania okresowe

t
1
2
3
4
5
6
7
8
9

yt
y1
y2
y3
y4
y5
y6
y7
y8
y9

Q1
1
0
0
0
1
0
0
0
1

Q2
0
1
0
0
0
1
0
0
0

Q3
0
0
1
0
0
0
1
0
0

Q4
0
0
0
1
0
0
0
1
0

Metoda harmoniczna (szeregi Fouriera)
Wahania okresowe przedstawia się jako sumę określonej liczby drgań harmonicznych (sinusoid i cosinusoid) przesuniętych w fazie, lecz o jednakowym okresie
m /2
2 i m / 2
2 i
y t  a 0  a 1 t   b1 i sin
  b 2 i cos

m
m
i 1
i 1
Obie metody dają taki sam wynik, istnieje możliwość weryfikacji
statystycznej
W metodzie 0-1 dostajemy bi = Ws, natomiast w metodzie harmonicznej Ws
jest sumą wartości poszczególnych sinusoid dla danego momentu czasu


Slide 16

Matematyczne techniki zarządzania - 121
ETAP 2. GROMADZENIE DANYCH STATYSTYCZNYCH

!

ZA JAKOŚĆ DANYCH ODPOWIADA MODELUJĄCY
• rodzaje danych: dane przekrojowe i szeregi czasowe
• źródła danych: roczniki statystyczne, różne działy
przedsiębiorstwa, badania marketingowe, wywiady itd.
• wiarygodność danych: do jakiego celu zostały one
przygotowane?

MUSISZ
SPRAWDZAĆ
KAŻDE DANE

• porównywalność danych: inflacja (ceny bieżące a ceny
stałe), zmiany procesów technicznych
Wielkość
produkcji

• zmienność zjawisk: trzeba sprawdzić, czy
wybrana w etapie 1a zmienna jest rzeczywiście zmienną losową

Wx 

s( x )

nowy zakład

100 %

x

stary zakład

Wx musi wynosić co najmniej 30-40%
Wiek studenta może być dobrą zmiennąprzyczyną, ale nie w przypadku studiów
dziennych!

Zatrudnienie

Matematyczne techniki zarządzania - 122
ETAP 3. SELEKCJA ZMIENNYCH OBJAŚNIAJĄCYCH
KAŻDĄ ZMIENNĄ X WYTYPOWANĄ W ETAPIE 1a TRAKTUJEMY JAKO
KANDYDATKĘ NA ZMIENNĄ OBJAŚNIAJĄCĄ
Może być kilka przyczyn powodujących, że taka kandydatka nie może znaleźć się w modelu ekonometrycznym (w równaniu regresji):
• w modelu nie może być zbyt wielu zmiennych (nieczytelny)
• kandydatka może nie mieć wpływu na zmienną Y



• kandydatka może wnosić prawie tę samą informację o Y co inna
kandydatka

• dwie bardzo podobne kandydatki mogą sobie nawzajem przeszkadzać
(efekt katalityczny)
Kryteria, jakie musi spełniać kandydatka Xi, aby nadawała się do modelu:
• musi być silnie powiązana ze zmienną Y

• nie może być powiązana z inną kandydatką Xj
SSTO
x1
x4

x2
x3

reszta

R2=0,79

R2=0,66

x2
x1
x4

R2=0,48

x3
reszta

reszta

SSTO

SSTO

Matematyczne techniki zarządzania - 123
Efekt katalityczny
DWIE ZMIENNE DAJĄ
RAZEM MNIEJ INFORMACJI NIŻ KAŻDA Z
NICH Z OSOBNA

x1

x2

R2=0,25

x2

x1

R2=0,52

R2=0,66

Selekcja kandydatek ma na celu podzielenie ich na trzy grupy:
• zmienne wprowadzone do modelu
• zmienne nie wprowadzone do modelu, ale reprezentowane w nim przez
inne zmienne (możliwość wymiany)
• zmienne nie wprowadzone do modelu ze względu na fakt, że nie wnoszą
żadnej informacji o zmiennej Y
INFORMACJE potrzebne do selekcji: współczynniki r x i x j ,
Macierz współczynników korelacji
Y
Y
X1
X2
X3

0,52
0,64
- 0,21

X1
0,52
0,82
- 0,18

X2
0,64
0,82
0,08

X3
- 0,21
- 0,18
0,08

r yx

i

Przykład 32. Macierz powiązania
zmiennych ze sobą przedstawia
się następująco (n=20). Jak ją
można zinterpretować? Które
zmienne są powiązane ze sobą w
sposób istotny?

Matematyczne techniki zarządzania - 124
Testowanie istotności współczynnika korelacji
H0:  = 0

Można je przeprowadzić trzema testami: testem Studenta

H1:   0

(t), Fishera (F) i Wallace’a-Snedecora (R)

Fragment tablicy rozkładu Wallece’a-Snedecora (SKRYPT, tab. VII, s.161)
S to pn ie
sw ob od y

2
0,05
0,632
0,444
0,361

8
18
28

,

0,01
0,765
0,561
0,463

L iczb a zm ien n ych
3
0,05
0,01
0,726
0,827
0,532
0,633
0,439
0,530

4
0,05
0,777
0,587
0,490

0,01
0,860
0,678
0,573

Reguła decyzyjna: — jeżeli |Robl|>Rtabl, odrzucamy H0 (korelacja istotna)
— jeżeli |Robl|
W przykładzie 32, jeżeli przyjmiemy  = 0,05, to Rtabl = 0,444.
Y
Y
X1
X2
X3

0,52
0,64
- 0,21

X1
0,52
0,82
- 0,18

X2
0,64
0,82
0,08

X3
- 0,21
- 0,18
0,08

Pozostaną zatem tylko trzy
istotne powiązania:
y-x1, y-x2, x1-x2
BRAK ISTOTNEGO POWIĄZANIA Z Y NIE
OZNACZA, ŻE ZMIENNA NIE WNOSI
ŻADNEJ INFORMACJI O ZJAWISKU Y

Matematyczne techniki zarządzania - 125



Metody selekcji zmiennych objaśniających:
• grafowa
• Hellwiga (pojemności informacji)
• taksonomiczne (clustering)
Metoda grafowa
• obliczenie macierzy współczynników:

rx

i

xj

• wyłowienie z macierzy powiązań istotnych

, r yx

BUDOWA GRAFU
i

• graf spójny

• budowa grafu z powiązań istotnych
• wybranie zmiennych na podstawie grafu

x6

• graf zerowy
x1
x4

x9

DO MODELU WYBIERA SIĘ ZMIENNE:
• każdy graf zerowy (jeśli |ryx|>0,1)

istotne powiązanie

• po jednej reprezentantce grafu spójnego;

reprezentantką grafu jest zmienna, która ma najwięcej powiązań z
innymi kandydatkami
jeżeli kilka zmiennych ma tę samą maksymalną liczbę powiązań, wybiera
się z nich tę, która jest najsilniej powiązana za zmienną Y (max ryx)
jeżeli graf jest rozległy, może mieć dwie reprezentantki, ale muszą one
leżeć na przeciwległych stronach grafu

Matematyczne techniki zarządzania - 126
Przykład 32 cd. Wybierzemy
zmienną x2 (reprezentantka grafu
spójnego) i zmienną x3 (graf
zerowy)
Metoda Hellwiga

Y
Y
X1
X2
X3

0,52
0,64
- 0,21

• wypisujemy wszystkie możliwe kombinacje
kandydatek; jest ich K = 2m—1
• obliczamy pojemność informacji dla każdej
zmiennej w każdej kombinacji

h kl  f ( r yx , r x
i

ixj

)

• obliczamy pojemność całkowitą dla każdej
kombinacji
H l   h kl
k

• wybieramy kombinację o największej
pojemności Hl = max

X1
0,52
0,82
- 0,18

X2
0,64
0,82

X3
- 0,21
- 0,18
0,08

0,08

W przykładzie 32 mamy 7
możliwych kombinacji kandydatek:
1. x1
2. x2

3. x3

maximum:

H6 = 0,42

4. x1,x2
5. x1,x3

Hmax = R2

6. x2,x3
7. x1,x2,x3

Metody taksonomiczne
Taksonomia wrocławska (cluster analysis) to metoda grupowania obiektów (zmiennych) w grupy jednorodne pod względem n cech (wymiarów)
łącznie. Podstawą grupowania jest odległość euklidesowa, która w przypadku zmiennych d ij  f ( r x x )
WSZYSTKIE METODY TO SELEKCJA WSTĘPNA
i

j

Matematyczne techniki zarządzania - 127
ETAP 4. ESTYMACJA PARAMETRÓW MODELU
Cel etapu: wyznaczenie parametrów strukturalnych i stochastycznych
Estymacja: szacowanie parametrów populacji na podstawie próbki
Metody estymacji: analiza regresji i korelacji (KMNK i inne)

Założenia dla KMNK
1. Zmienne losowe są prawdziwymi zmiennymi, nie powiązanymi ze sobą
2. Składnik losowy  ma stałą wariancję, niezależną od zmiennej x lub t
3. Wartości reszt ui są niezależne od siebie

4. Składnik losowy  nie jest powiązany ze zmienną objaśniającą
Skutki niedotrzymania założeń i środki zaradcze
1. Model bez sensu, nieprzydatny; niekiedy absurdalny (źle uwarunkowane
dane)
Stosuje się: dużą próbkę (n>100), regresję grzbietową (ridge regression)
2.

Y

reszta ui

Lewa część zbioru ma dużą wariancję, a
prawa — wariancję małą
Stosuje się specjalny wariant MNK z
korektą na różne wariancje
X

Matematyczne techniki zarządzania - 128
3. Jeśli reszty ui są ze sobą powiązane (skorelowane), mówimy, że
występuje autokorelacja składnika losowego (zjawisko występuje przy
szeregach czasowych — sztywny porządek obserwacji)
Oznacza to, że istnieje istotna zależność u t  f ( u t  k )
Przyczyny autokorelacji: zakłócenia
(dodatnie lub ujemne) w jednym okresie
wpływają na poziom zjawiska w następnych
okresach (rolnictwo, produkcja, rynek)

t  1 , 2 ,...

u t  y t  yˆ t

u t 1

u1
u2
u3
u4
u5

Występowanie autokorelacji powoduje
nieprzydatność modelu


u1
u2
u3
u4

Istnienie autokorelacji sprawdza się testem
Durbina-Watsona d
Stosuje się metodę różniczki zupełnej

y  f (x )

yt  yt  ytk

4. Składnik losowy jest skorelowany ze zmienną objaśniającą, wtedy
gdy została pominięta jakaś ważna zmienna-przyczyna

Model taki nie ma żadnej wartości; trzeba dbać o jak najwyższy współczynnik determinacji (R2>0,9)
• zbiór danych rzeczywistych nigdy
nie spełnia tych wymagań

ESTYMACJĘ MODELU POWTARZA SIĘ WIELOKROTNIE
ponieważ dopiero weryfikacja zapewnia ostateczną selekcję
kandydatek na zmienne objaśniające

• ekonometria to analiza danych nie
spełniających tych założeń
• nie stosować statystyki bezmyślnie (na ślepo)

Matematyczne techniki zarządzania - 129
ETAP 5. WERYFIKACJA MODELU
Cele:

1. opis rzeczywistości (populacji generalnej)



2. dokładna (ostateczna) selekcja zmiennych objaśniających
3. poznanie składnika losowego (spełnienie założeń KMNK)
Narzędzia: hipotezy i testy statystyczne

Metodyka: każde równanie oddzielnie; weryfikacja obejmuje 9 etapów (od
najmniej do najbardziej pracochłonnego)
WYKAZ ETAPÓW WERYFIKACJI MODELU
I.
II.

Badanie istotności korelacji
Badanie wyrazistości modelu

III.

Badanie istotności parametrów

IV.

Badanie symetrii skł. losowego

V.
VI.
VII.
VIII.
IX.

Badanie losowości skł. losowego
Badanie stacjonarności skł. los.
Badanie wartości oczekiwanej skł. los.
Badanie autokorelacji skł. losowego
Badanie normalności skł. losowego

Opis każdego etapu weryfikacji
obejmuje:
• cel etapu
• sposób weryfikacji: wzory,
hipotezy, testy
• podanie których modeli dotyczy (przyczynowo-skutkowych
czy tendencji rozwojowej)
• podanie której postaci modeli
nieliniowych dotyczy (pierwotnej czy transformaty)

Matematyczne techniki zarządzania - 130
Etap I. Badanie istotności korelacji
7
2

8

9

11

12

17

19

23

21

5
2 etapu
9
16
7
9
15
14
Celem
jest
sprawdzenie,
czy
istnieje w populacji generalnej powiązanie pomiędzy zmienną Y i wszystkimi zmiennymi objaśniającymi

25

Przedział ufności dla
nieznanego współczynnika korelacji  dla populacji buduje się przy
użyciu błędu

populacja

zmienna Y

20
15
10

próbka

5
0
8
5

0 9

1011

2

9

20
12

30
17
16
7
zmienna X

25

1940
9

23 50
15

populacja

20

zmienna Y

7
2

15
10

próbka

5
0
0

10

20

30

zmienna X

40

50

21
14

sR 

1 R

0

Robl

2

nk

Istotność korelacji weryfikuje się przez postawienie
następujących hipotez dla
współczynnika korelacji dla
populacji generalnej:

1
R,|r|

H0 :   0

Brak korelacji, nie ma powiązania...

H1 :   0

Korelacja istotna, jest powiązanie...

,

Matematyczne techniki zarządzania - 131
Hipotezy te można weryfikować trzema równoważnymi testami:
• testem t Studenta (tylko dla regresji dwu zmiennych)
• testem F Fishera-Snedecora
• testem R Wallace’a-Snedecora

,

W każdym przypadku obliczamy wartość
statystyki dla próbki (tobl, Fobl, Robl) i porównujemy z wartością krytyczną odczytaną z tablicy odpowiedniego rozkładu w
funkcji poziomu istotności i liczby stopni
swobody (ttabl, Ftabl, Rtabl)

Reguła decyzyjna:
• jeżeli |tobl|< ttabl, nie ma podstaw do odrzucenia H0 (brak korelacji)
• jeżeli |tobl|> ttabl, odrzucamy H0 na korzyść H1 (korelacja istnieje)

TAK SAMO DLA
FiR

W przypadku regresji wielorakiej, gdy liczba zmiennych objaśniajacych
jest duża w porównaniu do liczby obserwacji, współczynnik determinacji
R2 może dawać zawyżoną ocenę stopnia wyjaśnienia zmienności zmiennej
objaśnianej; dlatego wprowadzono skorygowany współczynnik determinacji (i korelacji):
 ( yˆ i  y )

R

2

2

k
n

k

1


2
nk 1
(
y

y
)

i
n1

• adjusted coefficient of multiple
determination (wydruki komputerowe)

• jeśli k jest małe, nie ma większej różnicy
pomiędzy normalnym a skorygowanym R2

Matematyczne techniki zarządzania - 132
Skąd wziąć wartość odpowiedniej statystyki dla próbki i jak odczytywać jej wartości z tablic?
n2
r
t

r

t tabl  t  / 2 { n  2 }
TEST STUDENTA
obl
2
sr
1 r

F obl 

TEST FISHERA

Ź ró d ło z m ien n o śc i

MSTR
MSE



R

nk

2

1 R

2

L ic zb a sto p n i
sw o b o d y

Suma
k w a d ra tó w

Ś re d n i
k w a d ra t

M o d el (c z yn n ik i)
B łą d (re sz ta )

k1
nk

SSTR
SSE

MSTR
MSE

R azem

n1

SSTO

TEST WALLACE’A

R obl 

R

2

k 1

F tabl  F { k  1 , n  k }

S ta ty sty k a
F
F obl 

MSTR
MSE

NIE MYLIĆ
STOPNI SWOBODY LICZNIKA I MIANOWNIKA

R tabl  R { k , n  k }

Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

Matematyczne techniki zarządzania - 133
Odczyt Rtabl z tablicy testu R (SKRYPT s.161-162)

, k,  = n-k

S to pn ie
sw ob od y
8
18
28

2
0,05
0,632
0,444
0,361

0,01
0,765
0,561
0,463

L iczb a zm ien n ych
3
0,05
0,01
0,726
0,827
0,532
0,633
0,439
0,530

4
0,05
0,777
0,587
0,490

0,01
0,860
0,678
0,573

Wnioski dotyczące rozkładu R Wallace’a-Snedecora:
• tablica zawiera maksymalne wartości współczynnika korelacji w danej
sytuacji, jakich można oczekiwać, gdy nie ma korelacji w populacji
• im wyższy poziom istotności, tym niższe Rtabl

• im większa liczba zmiennych w modelu, tym wyższe Rtabl
• im wyższa liczba stopni swobody (większa próbka), tym niższe Rtabl
• tablica R powstała z przeliczenia tablic t oraz F (odwrócenie wzorów)
• tablica testu R jest najszybszym i nawygodniejszym narzędziem do
weryfikacji istotności korelacji

Werdykt z etapu I:

Matematyczne techniki zarządzania - 134

• jeżeli Robl>Rtabl, model jest poprawny, można przejść do etapu II
• jeżeli Roblzmiennych objaśniających albo jego postać matematyczną
ETAP I OBOWIĄZUJE DLA WSZYSTKICH MODELI
ETAP I PRZEPROWADZA SIĘ DLA TRANSFORMATY (dla postaci pierwotnej
można uzyskać R>1)
Rola współczynnika determinacji R2
• korelacja może być istotna przy małym R i bardzo małym R2 (r=0,4,
R2=0,16, co oznacza, że tylko 16% zmienności zmiennej Y jest
wyjaśnione przez zmienną objaśniającą)
• małe R2 oznacza niski stopień wyjaśnienia rzeczywistości i stanowi
zagrożenie dla modelu
• należy dążyć (poprzez odpowiedni dobór zmiennych-przyczyn i postaci
matematycznej modelu) do jak największego R2 (dla postaci pierwotnej)
• wysoka wartość R2 świadczy o dobrym poznaniu badanego zjawiska
• wysoka wartość R2 bardzo często wynika jednak ze złego dobrania
zmiennych objaśniających (silnie powiązane ze sobą — „masło maślane”)
KORELACJA POZORNA — jest zależność, ale jej nie ma? Przyczyny...
Trzeba unikać wartości bezwzględnych (ludność, liczba sklepów, wielkość produkcji)

6

9

12

8

11

12

11

15

9

18

9

11

11

18

15

Matematyczne techniki zarządzania - 135
Etap II. Badanie wyrazistości modelu
Y

Wyrazistość modelu dana jest wzorem

s( y )

ui

y

W obl 

s( y )

100 %

y

Celem etapu
jest kontrola
rozrzutu danych

Współczynnik Wobl<30%, w przeciwnym
przypadku rozrzut danych jest zbyt duży

y

Kłopoty: gdyy jest bliskie 0

x

X

Werdykt: model poprawny lub niepoprawny

ETAP II OBOWIĄZUJE DLA WSZYSTKICH MODELI (ale nie ma on charakteru
statystycznego)

ETAP II PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ (sprawdzamy, czy
nie występuje silny efekt „krzywego lustra”)
Etap III. Badanie istotności parametrów (współczynników) modelu
Celem etapu jest sprawdzenie:
• czy poszczególne zmienne objaśniające mają istotny wpływ na zmienną
objaśnianą?
• czy zmienne objaśniające są wybrane prawidłowo?

• czy wyraz wolny różni się istotnie od zera?

Matematyczne techniki zarządzania - 136
Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

Problem istotności parametrów ai można rozpatrywać (tak jak problem
średniej dla populacji) z dwu punktów widzenia:
• przedziału ufności dla nieznanej wartości i

• hipotez — zerowej H0: i=0 i alternatywnej H1: i 0

1
0

ai

1

i

ISTOTNY (W PRZEDZIALE NIE MA ZERA)

0

ai

i

NIEISTOTNY (W PRZEDZIALE JEST ZERO)

P ( a i  t / 2 { n  k } s ( a i )   i  a i  t / 2 { n  k } s ( a i )  1  

Z tablicy rozkładu Studenta, a nie z wydruku komputerowego!

Matematyczne techniki zarządzania - 137
Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

W praktyce posługujemy się raczej hipotezami:
Badanie istotności przeprowadza
się dla każdego i oddzielnie:

t obl ( a i ) 

ai  0
s(a i )

t tabl  t  / 2 { n  k }

• jeżeli |tobl(ai)|>ttabl(ai), odrzucamy hipotezę zerową; parametr jest istotny z błędem równym co najwyżej 
• jeżeli |tobl(ai)|parametr nie jest istotny
Praktycznie jest to bardzo łatwe:
• sprawdzamy, czy |t(ai)| jest większe czy mniejsze od około 2, a najlepiej
• porównujemy rzeczywisty poziom istotności P(ai) z przyjętym 
ODRZUCAMY H0, JEŻELI P(ai) JEST MNIEJSZE OD 

WTEDY ZMIENNA
Xi MA WPŁYW NA
ZMIENNĄ Y

Matematyczne techniki zarządzania - 138
W etapie III następuje ostateczna selekcja zmiennych objaśniających:
• jeżeli wszystkie ai okażą się istotne, model jest poprawny:
— model przyczynowo-skutkowy: do interpretacji
— model tendencji rozwojowej: do etapu IV
• jeżeli choć jedno ai okaże się nieistotne, model jest niepoprawny i wymaga poprawy przez usunięcie nieistotnych zmiennych:
— zmienne należy usuwać po jednej (ze względu na efekt katalityczny)
— usuwa się zawsze zmienną o najniższej wartości |t(ai)| [czyli o
najwyższej wartości P(ai)]
— usunięcie ostatniej zmiennej nieistotnej kończy proces selekcji
kandydatek na zmienne,

— selekcja nie jest ostateczna, gdyż zawsze istnieje możliwość zamiany zmiennych, które są powiązane ze sobą
Praktyczne znaczenie istotności wyrazu wolnego a0
To są jedne z możliwości dla populacji (p. plansza 106)

Y

W przypadku funkcji K=f(P) wyraz wolny wyznacza poziom kosztów stałych (rachunkowość zarządcza)
W przypadku zależności technicznej Q=f(h) wyraz
wolny oznacza, że przy miąższości pokładu h=0 wydajność produkcji Q też jest równa 0

0
X

Matematyczne techniki zarządzania - 139
Praktyczne znaczenie istotności współczynnika regresji ai



KRZYWE NEYMANA — PLANSZE 106-107
WSPÓŁCZ. ISTOTNY
WSPÓŁ. NIEISTOTNY

ETAP III OBOWIĄZUJE DLA WSZYSTKICH MODELI
ETAP III PRZEPROWADZA SIĘ DLA TRANSFORMATY
Etap IV. Badanie symetrii składnika losowego

Y

CZĘSTOŚĆ RESZT DODATNICH I UJEMNYCH MA BYĆ
ZBLIŻONA

Y

ASYMETRYCZNY
SYMETRYCZNY

t
t
Badanie symetrii przeprowadza się testem Studenta (St. Bartosiewicz
Ekonometria)
Brak symetrii wymaga zmiany matematycznej postaci modelu
ETAP IV OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ

ETAP IV PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ

Matematyczne techniki zarządzania - 140
Etap V. Badanie losowości składnika losowego

Y

Y
NIELOSOWY

LOSOWY

t
t
Badanie losowości przeprowadza się testem Studenta lub testem serii
(Ekonometria, praca zb. pod red. M. Krzysztofiaka)
Brak losowości wymaga zmiany matematycznej postaci modelu
ETAP V OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP V PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ
Etap VI. Badanie stacjonarności składnika losowego
W etapie tym chodzi o niezależność wariancji składnika losowego od
zmiennej objaśniającej t (plansza 127)

Bada się istotność współczynnika korelacji ru t , t
ETAP VI OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VI PRZEPROWADZA SIĘ DLA TRANSFORMATY

Matematyczne techniki zarządzania - 141
Etap VII. Badanie wartości oczekiwanej składnika losowego
Normalnie, gdy przeprowadzamy estymację postaci liniowej, parametry
składnika losowego E ( )  0
{ ui  0}
V ( )  const
Po retransformacji do postaci pierwotnej mamy nowe reszty u’, dla
których
'
'
ui  0
 ui  0
Celem etapu jest sprawdzenie, czy odchyłka od O nie jest zbyt duża
(służy do tego test Studenta)
ETAP VII OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VII PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ
Etap VIII. Badanie autokorelacji składnika losowego
Pojęcie autokorelacji opisano na planszy 128; chodzi o istotność korelacji ru , u
t

tk

Badanie autokorelacji można przeprowadzić:

• testem R istotności korelacji ru

t

,ut  k

d obl

• testem Durbina-Watsona
NIE MA AUTOK.

d1

?

d2 JEST AUTOKORELACJA

ETAP VIII OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VIII PRZEPROWADZA SIĘ DLA TRANSFORMATY

Matematyczne techniki zarządzania - 142
Etap IX. Badanie normalności składnika losowego
Celem etapu jest stwierdzenie, czy reszty mają rozkład normalny
Analiza reszt — oddzielny dział analizy regresji i korelacji
Jeżeli reszty mają rozkład normalny, statystyk otrzymuje „ulgi”
ETAP 6. PRAKTYCZNA INTERPRETACJA MODELU



Celem etapu jest wydobycie z modelu całej nowej wiedzy, której nie widać
„gołym okiem”
INTERPRETUJĄC MODEL (RÓWNANIE REGRESJI) NALEŻY UŻYWAĆ WYŁĄCZNIE
PROSTEJ TERMINOLOGII EKONOMICZNEJ ZROZUMIAŁEJ DLA KLIENTA
NIE NALEŻY UŻYWAĆ TERMINOLOGII MATEMATYCZNEJ ZROZUMIAŁEJ TYLKO DLA
TWÓRCÓW MODELU
INTERPRETOWAĆ WOLNO TYLKO MODEL ZWERYFIKOWANY
CAŁY TRUD MODELOWANIA NIE MOŻE BYĆ „SZTUKĄ DLA SZTUKI”, LECZ MA
SŁUŻYĆ UZYSKANIU KONKRETNYCH WNIOSKÓW PRAKTYCZNYCH

Interpretacja modelu przyczynowo-skutkowego

Polega ona na określeniu wpływu poszczególnych czynników na badane
zjawisko:
• podział wszystkich czynników na trzy grupy

Matematyczne techniki zarządzania - 143
A — czynniki nie mające wpływu na Y
B — czynniki mające wpływ na Y i wprowadzone do modelu
C — czynniki mające wpływ na Y, ale nie występujące w modelu
• ocena jakościowa wpływu czynników B i C
• ocena ilościowa wpływu czynników B i C
Ocena jakościowa



Na podstawie znaków stojących przy współczynnikach r oraz ai możemy
stwierdzić, że wpływ jest:

• dodatni (im lepsze zaliczenie, tym lepszy wynik egzaminu; im więcej
wydatków na reklamę, tym większy zysk; itd.)
• ujemny (im więcej zatrudnionych, tym gorszy wynik finansowy; im
mniej braków, tym wyższy zysk; im mniejsza absencja, tym wyższe
wynagrodzenie; itd.)

Ocena ilościowa
• model liniowy
Przykład 33. Zinterpretuj zweryfikowany model zależności miesięcznych
kosztów działalności przedsiębiorstwa (tys. zł) od wielkości produkcji
(sztuk) i liczby reklamacji:
y i  50 , 8  14 , 5 x 1  3 , 9 x 2  

Matematyczne techniki zarządzania - 144
a0 = 50,8

poziom kosztów stałych; jeśli firma nie będzie prowadzić
żadnej działalności, poniesie koszty w wysokości 50,8 tys. zł

a1 = 14,5

każda sztuka produktu firmy kosztuje ją przeciętnie 14,5
tys. zł; jeżeli firma zwiększy produkcję o 2 sztuki, koszty
wzrosną o 29,0 tys. zł

a2 = 3,9każda wniesiona reklamacja powiększa koszty przeciętnie o
3,9 tys. zł
• model potęgowy
Przykłąd 34. Zinterpretuj zweryfikowaną funkcję produkcji Cobba-Douglasa
0 , 65

Pi  45 , 2 M i

0 , 73

Zi

e

0 , 04



Funkcja produkcji to specjalny model, określający zależność pomiędzy
produkcją (P) a czynnikami produkcji: majątkiem trwałym (M) i nakładami
robocizny (Z).



Funkcje produkcji to modele umożliwiające „prześwietlenie”
przedsiębiorstwa (szereg czasowy) lub branży (dane przekrojowe) i określenie poziomu gospodarowania oraz postępu
technicznego i organizacyjnego.
Elastyczność  to współczynnik określający reakcję zmiany
jednej zmiennej na inną zmienną — na przykład elastyczność
cenowa popytu (jak popyt zmienia się wraz z ceną towaru).

EKSPERCI
ZACHODNI

Matematyczne techniki zarządzania - 145

 

y
y

:

x

FUNKCJA POTĘGOWA JEST JEDYNĄ FUNKCJĄ O STAŁEJ ELASTYCZNOŚCI

x

Izolinie funkcji produkcji

T1
M

Produkcję P można osiągnąć różnymi
kombinacjami majątku i robocizny:

T2

• T1— technika kapitałochłonna, np.
pełna automatyzacja
• T2 — pośredni poziom techniki

T3
P  const

• T3 — niski poziom techniki, produkcja
pracochłonna
P. LOWE

Z
Efekt poprawy zarządzania bez
zmiany techniki (lepsze wykorzystanie ludzi i sprzętu):

P2
M

ZARZĄDZANIE
TECHNOLOGIĄ

P1

T

• zmniejszenie kapitałochłonności

• zmniejszenie pracochłonności
• zwiększenie produkcji (przejście z
funkcji P1 na P2)

Można też rozpatrzyć łączne efekty
zmiany techniki i zarządzania

Z

Matematyczne techniki zarządzania - 146
Wszystkie informacje tego typu można odczytać w trakcie interpretacji
0 , 65
0 , 73 0 , 04
funkcji produkcji:
Pi  45 , 2 M i
Zi
e

• wartości 45,2 nie interpretuje się
• wartość 0,65 to współczynnik elastyczności majątkowej (kapitałowej)
produkcji: zmiana majątku o 10% daje średnio zmianę produkcji o 6,5%
• wartość 0,73 to współczynnik elastyczności zatrudnieniowej produkcji:
zmiana zatrudnienia o 10% daje zmianę produkcji średnio o 7,3%
• suma obu współczynników k=0,65+0,73=1,38 to współczynnik skali
produkcji:

— jeżeli k<1, to firma rozwija się ekstensywnie
— jeżeli k>1, to firma rozwija się intensywnie
• wartość  = 0,04 to współczynnik postępu organizacyjnego:
— jeżeli  >O, to miał miejsce postęp organizacyjny

— jeżeli  <0, to miał miejsce regres organizacyjny
Interpretacja modelu tendencji rozwojowej

DODAMY
TROCHĘ
TEORII

Przypomnienie: t — zmienna objaśniająca (stałe przyrosty)
y — zmienna objaśniana; rozdzielana w ogólności na trzy
części: trend, wahania okresowe, wahania losowe ()

Matematyczne techniki zarządzania - 147
Wykres z planszy 117 (zużycie energii elektrycznej przez WZ AGH)
WAHANIA OKRESOWE OKREŚLA SIĘ WZGLĘDEM TRENDU A
NIE WZGLĘDEM OSI CZASU

y

trend

t
1995

1996

1997

1998

1999

Te trzy części trzeba zidentyfikować, a potem złożyć razem w model:

• addytywny (jeśli amplituda wahań jest stała)
• multiplikatywny (jeśli amplituda wahań rośnie lub maleje regularnie)
Wyznaczanie trendu
Metody mechaniczne:

• wskaźniki bezwzględne (stały przyrost =
postęp arytmetyczny = funkcja liniowa)
• wskaźniki względne (przyrost o stały procent =
postęp geometryczny = funkcja potęgowa)
• średnia ruchoma (wygładzanie danych linią łamaną)

JAK OBLICZYĆ O
ILE PROCENT ROCZNIE SPADAŁA
ŚREDNIO LICZBA
WIDZÓW W
KINACH:
1982 - 193,7 MLN
1989 - 141,3 MLN

Matematyczne techniki zarządzania - 148
Średnia ruchoma: mając szereg czasowy y1, y2,....., yn, przyjmujemy
długość kroku k = 3, lub 5, lub 7 itd. i liczymy
y  ...  y k
y  ...  y k  1
y k / 2 0 ,5  1
a następnie y k / 2  1 , 5  2
itd.
k
k
y  y2  y3
y  y3  y4
dla k=3:
y2  1
y3  2
itd.
3
3
Przykład 35. Wyznacz trend metodą średniej ruchomej dla następujących
danych:
okres
t
wartość yt

1
5

2
4

3
7

4
6

5
8

12

y2 
10

y3 

y

8

y4 

6
4

y5 

2

y6 

0
0

1

2

3

4

5

czas, t

6

7

8

9

y7 

547

6
10

 5 , 67

CECHY
ŚREDNIEJ
RUCHOMEJ:

 7 , 00

• TRACI SIĘ
k-1 DANYCH

3
768

8
8

 5 , 33

3
476

7
9

3
6  8  10

 8 , 00

3
8  10  9

 9 , 00

3
10  9  8

 9 , 00

• IM
WIĘKSZE k,
TYM
BARDZIEJ
SZTYWNY
TREND

3

Metody statystyczne: analiza regresji i korelacji, różne funkcje oparte na
modelach ekonomii

Matematyczne techniki zarządzania - 149
Wyznaczanie wahań okresowych: dobowych, tygodniowych, miesięcznych,
kwartalnych, rocznych, wieloletnich
Trzy metody:

— metoda wskaźników sezonowości
— metoda zmiennych zero-jedynkowych (0-1)

— metoda harmoniczna
Wszystkie metody mają jeden cel:
uzyskanie przeciętnego obrazu jednego cyklu

+

Ws
[t ]
[%]
trend

I

II



III

IV

WADY:
• KONIECZNOŚĆ
KOREKTY
• BRAK
WERYFIKACJI
STATYSTYCZNEJ

Metoda wskaźników sezonowości

• obliczenie surowych wskaźników sezonowości (wyeliminowanie trendu):
y

S s  yt  yt
S s  t
yt
addytywny multiplikatywny
wynik: n wartości odchyleń od trendu

• obliczenie oczyszczonych wskaźników
sezonowości (wyeliminowanie wahań
losowych):
 Ss
So 
k-liczba okresów
k
jednoimiennych
m-długość cyklu wynik: m wartości śr. odchyleń od trendu

Matematyczne techniki zarządzania - 150
Metoda zmiennych zero-jedynkowych (0-1)
m

y t  a 0  a1 t   bi Q i  
i 1

bi — przeciętne odchylenie od trendu dla
okresu i-tego
Qi — zmienna 0-1

wahania losowe
trend

wahania okresowe

t
1
2
3
4
5
6
7
8
9

yt
y1
y2
y3
y4
y5
y6
y7
y8
y9

Q1
1
0
0
0
1
0
0
0
1

Q2
0
1
0
0
0
1
0
0
0

Q3
0
0
1
0
0
0
1
0
0

Q4
0
0
0
1
0
0
0
1
0

Metoda harmoniczna (szeregi Fouriera)
Wahania okresowe przedstawia się jako sumę określonej liczby drgań harmonicznych (sinusoid i cosinusoid) przesuniętych w fazie, lecz o jednakowym okresie
m /2
2 i m / 2
2 i
y t  a 0  a 1 t   b1 i sin
  b 2 i cos

m
m
i 1
i 1
Obie metody dają taki sam wynik, istnieje możliwość weryfikacji
statystycznej
W metodzie 0-1 dostajemy bi = Ws, natomiast w metodzie harmonicznej Ws
jest sumą wartości poszczególnych sinusoid dla danego momentu czasu


Slide 17

Matematyczne techniki zarządzania - 121
ETAP 2. GROMADZENIE DANYCH STATYSTYCZNYCH

!

ZA JAKOŚĆ DANYCH ODPOWIADA MODELUJĄCY
• rodzaje danych: dane przekrojowe i szeregi czasowe
• źródła danych: roczniki statystyczne, różne działy
przedsiębiorstwa, badania marketingowe, wywiady itd.
• wiarygodność danych: do jakiego celu zostały one
przygotowane?

MUSISZ
SPRAWDZAĆ
KAŻDE DANE

• porównywalność danych: inflacja (ceny bieżące a ceny
stałe), zmiany procesów technicznych
Wielkość
produkcji

• zmienność zjawisk: trzeba sprawdzić, czy
wybrana w etapie 1a zmienna jest rzeczywiście zmienną losową

Wx 

s( x )

nowy zakład

100 %

x

stary zakład

Wx musi wynosić co najmniej 30-40%
Wiek studenta może być dobrą zmiennąprzyczyną, ale nie w przypadku studiów
dziennych!

Zatrudnienie

Matematyczne techniki zarządzania - 122
ETAP 3. SELEKCJA ZMIENNYCH OBJAŚNIAJĄCYCH
KAŻDĄ ZMIENNĄ X WYTYPOWANĄ W ETAPIE 1a TRAKTUJEMY JAKO
KANDYDATKĘ NA ZMIENNĄ OBJAŚNIAJĄCĄ
Może być kilka przyczyn powodujących, że taka kandydatka nie może znaleźć się w modelu ekonometrycznym (w równaniu regresji):
• w modelu nie może być zbyt wielu zmiennych (nieczytelny)
• kandydatka może nie mieć wpływu na zmienną Y



• kandydatka może wnosić prawie tę samą informację o Y co inna
kandydatka

• dwie bardzo podobne kandydatki mogą sobie nawzajem przeszkadzać
(efekt katalityczny)
Kryteria, jakie musi spełniać kandydatka Xi, aby nadawała się do modelu:
• musi być silnie powiązana ze zmienną Y

• nie może być powiązana z inną kandydatką Xj
SSTO
x1
x4

x2
x3

reszta

R2=0,79

R2=0,66

x2
x1
x4

R2=0,48

x3
reszta

reszta

SSTO

SSTO

Matematyczne techniki zarządzania - 123
Efekt katalityczny
DWIE ZMIENNE DAJĄ
RAZEM MNIEJ INFORMACJI NIŻ KAŻDA Z
NICH Z OSOBNA

x1

x2

R2=0,25

x2

x1

R2=0,52

R2=0,66

Selekcja kandydatek ma na celu podzielenie ich na trzy grupy:
• zmienne wprowadzone do modelu
• zmienne nie wprowadzone do modelu, ale reprezentowane w nim przez
inne zmienne (możliwość wymiany)
• zmienne nie wprowadzone do modelu ze względu na fakt, że nie wnoszą
żadnej informacji o zmiennej Y
INFORMACJE potrzebne do selekcji: współczynniki r x i x j ,
Macierz współczynników korelacji
Y
Y
X1
X2
X3

0,52
0,64
- 0,21

X1
0,52
0,82
- 0,18

X2
0,64
0,82
0,08

X3
- 0,21
- 0,18
0,08

r yx

i

Przykład 32. Macierz powiązania
zmiennych ze sobą przedstawia
się następująco (n=20). Jak ją
można zinterpretować? Które
zmienne są powiązane ze sobą w
sposób istotny?

Matematyczne techniki zarządzania - 124
Testowanie istotności współczynnika korelacji
H0:  = 0

Można je przeprowadzić trzema testami: testem Studenta

H1:   0

(t), Fishera (F) i Wallace’a-Snedecora (R)

Fragment tablicy rozkładu Wallece’a-Snedecora (SKRYPT, tab. VII, s.161)
S to pn ie
sw ob od y

2
0,05
0,632
0,444
0,361

8
18
28

,

0,01
0,765
0,561
0,463

L iczb a zm ien n ych
3
0,05
0,01
0,726
0,827
0,532
0,633
0,439
0,530

4
0,05
0,777
0,587
0,490

0,01
0,860
0,678
0,573

Reguła decyzyjna: — jeżeli |Robl|>Rtabl, odrzucamy H0 (korelacja istotna)
— jeżeli |Robl|
W przykładzie 32, jeżeli przyjmiemy  = 0,05, to Rtabl = 0,444.
Y
Y
X1
X2
X3

0,52
0,64
- 0,21

X1
0,52
0,82
- 0,18

X2
0,64
0,82
0,08

X3
- 0,21
- 0,18
0,08

Pozostaną zatem tylko trzy
istotne powiązania:
y-x1, y-x2, x1-x2
BRAK ISTOTNEGO POWIĄZANIA Z Y NIE
OZNACZA, ŻE ZMIENNA NIE WNOSI
ŻADNEJ INFORMACJI O ZJAWISKU Y

Matematyczne techniki zarządzania - 125



Metody selekcji zmiennych objaśniających:
• grafowa
• Hellwiga (pojemności informacji)
• taksonomiczne (clustering)
Metoda grafowa
• obliczenie macierzy współczynników:

rx

i

xj

• wyłowienie z macierzy powiązań istotnych

, r yx

BUDOWA GRAFU
i

• graf spójny

• budowa grafu z powiązań istotnych
• wybranie zmiennych na podstawie grafu

x6

• graf zerowy
x1
x4

x9

DO MODELU WYBIERA SIĘ ZMIENNE:
• każdy graf zerowy (jeśli |ryx|>0,1)

istotne powiązanie

• po jednej reprezentantce grafu spójnego;

reprezentantką grafu jest zmienna, która ma najwięcej powiązań z
innymi kandydatkami
jeżeli kilka zmiennych ma tę samą maksymalną liczbę powiązań, wybiera
się z nich tę, która jest najsilniej powiązana za zmienną Y (max ryx)
jeżeli graf jest rozległy, może mieć dwie reprezentantki, ale muszą one
leżeć na przeciwległych stronach grafu

Matematyczne techniki zarządzania - 126
Przykład 32 cd. Wybierzemy
zmienną x2 (reprezentantka grafu
spójnego) i zmienną x3 (graf
zerowy)
Metoda Hellwiga

Y
Y
X1
X2
X3

0,52
0,64
- 0,21

• wypisujemy wszystkie możliwe kombinacje
kandydatek; jest ich K = 2m—1
• obliczamy pojemność informacji dla każdej
zmiennej w każdej kombinacji

h kl  f ( r yx , r x
i

ixj

)

• obliczamy pojemność całkowitą dla każdej
kombinacji
H l   h kl
k

• wybieramy kombinację o największej
pojemności Hl = max

X1
0,52
0,82
- 0,18

X2
0,64
0,82

X3
- 0,21
- 0,18
0,08

0,08

W przykładzie 32 mamy 7
możliwych kombinacji kandydatek:
1. x1
2. x2

3. x3

maximum:

H6 = 0,42

4. x1,x2
5. x1,x3

Hmax = R2

6. x2,x3
7. x1,x2,x3

Metody taksonomiczne
Taksonomia wrocławska (cluster analysis) to metoda grupowania obiektów (zmiennych) w grupy jednorodne pod względem n cech (wymiarów)
łącznie. Podstawą grupowania jest odległość euklidesowa, która w przypadku zmiennych d ij  f ( r x x )
WSZYSTKIE METODY TO SELEKCJA WSTĘPNA
i

j

Matematyczne techniki zarządzania - 127
ETAP 4. ESTYMACJA PARAMETRÓW MODELU
Cel etapu: wyznaczenie parametrów strukturalnych i stochastycznych
Estymacja: szacowanie parametrów populacji na podstawie próbki
Metody estymacji: analiza regresji i korelacji (KMNK i inne)

Założenia dla KMNK
1. Zmienne losowe są prawdziwymi zmiennymi, nie powiązanymi ze sobą
2. Składnik losowy  ma stałą wariancję, niezależną od zmiennej x lub t
3. Wartości reszt ui są niezależne od siebie

4. Składnik losowy  nie jest powiązany ze zmienną objaśniającą
Skutki niedotrzymania założeń i środki zaradcze
1. Model bez sensu, nieprzydatny; niekiedy absurdalny (źle uwarunkowane
dane)
Stosuje się: dużą próbkę (n>100), regresję grzbietową (ridge regression)
2.

Y

reszta ui

Lewa część zbioru ma dużą wariancję, a
prawa — wariancję małą
Stosuje się specjalny wariant MNK z
korektą na różne wariancje
X

Matematyczne techniki zarządzania - 128
3. Jeśli reszty ui są ze sobą powiązane (skorelowane), mówimy, że
występuje autokorelacja składnika losowego (zjawisko występuje przy
szeregach czasowych — sztywny porządek obserwacji)
Oznacza to, że istnieje istotna zależność u t  f ( u t  k )
Przyczyny autokorelacji: zakłócenia
(dodatnie lub ujemne) w jednym okresie
wpływają na poziom zjawiska w następnych
okresach (rolnictwo, produkcja, rynek)

t  1 , 2 ,...

u t  y t  yˆ t

u t 1

u1
u2
u3
u4
u5

Występowanie autokorelacji powoduje
nieprzydatność modelu


u1
u2
u3
u4

Istnienie autokorelacji sprawdza się testem
Durbina-Watsona d
Stosuje się metodę różniczki zupełnej

y  f (x )

yt  yt  ytk

4. Składnik losowy jest skorelowany ze zmienną objaśniającą, wtedy
gdy została pominięta jakaś ważna zmienna-przyczyna

Model taki nie ma żadnej wartości; trzeba dbać o jak najwyższy współczynnik determinacji (R2>0,9)
• zbiór danych rzeczywistych nigdy
nie spełnia tych wymagań

ESTYMACJĘ MODELU POWTARZA SIĘ WIELOKROTNIE
ponieważ dopiero weryfikacja zapewnia ostateczną selekcję
kandydatek na zmienne objaśniające

• ekonometria to analiza danych nie
spełniających tych założeń
• nie stosować statystyki bezmyślnie (na ślepo)

Matematyczne techniki zarządzania - 129
ETAP 5. WERYFIKACJA MODELU
Cele:

1. opis rzeczywistości (populacji generalnej)



2. dokładna (ostateczna) selekcja zmiennych objaśniających
3. poznanie składnika losowego (spełnienie założeń KMNK)
Narzędzia: hipotezy i testy statystyczne

Metodyka: każde równanie oddzielnie; weryfikacja obejmuje 9 etapów (od
najmniej do najbardziej pracochłonnego)
WYKAZ ETAPÓW WERYFIKACJI MODELU
I.
II.

Badanie istotności korelacji
Badanie wyrazistości modelu

III.

Badanie istotności parametrów

IV.

Badanie symetrii skł. losowego

V.
VI.
VII.
VIII.
IX.

Badanie losowości skł. losowego
Badanie stacjonarności skł. los.
Badanie wartości oczekiwanej skł. los.
Badanie autokorelacji skł. losowego
Badanie normalności skł. losowego

Opis każdego etapu weryfikacji
obejmuje:
• cel etapu
• sposób weryfikacji: wzory,
hipotezy, testy
• podanie których modeli dotyczy (przyczynowo-skutkowych
czy tendencji rozwojowej)
• podanie której postaci modeli
nieliniowych dotyczy (pierwotnej czy transformaty)

Matematyczne techniki zarządzania - 130
Etap I. Badanie istotności korelacji
7
2

8

9

11

12

17

19

23

21

5
2 etapu
9
16
7
9
15
14
Celem
jest
sprawdzenie,
czy
istnieje w populacji generalnej powiązanie pomiędzy zmienną Y i wszystkimi zmiennymi objaśniającymi

25

Przedział ufności dla
nieznanego współczynnika korelacji  dla populacji buduje się przy
użyciu błędu

populacja

zmienna Y

20
15
10

próbka

5
0
8
5

0 9

1011

2

9

20
12

30
17
16
7
zmienna X

25

1940
9

23 50
15

populacja

20

zmienna Y

7
2

15
10

próbka

5
0
0

10

20

30

zmienna X

40

50

21
14

sR 

1 R

0

Robl

2

nk

Istotność korelacji weryfikuje się przez postawienie
następujących hipotez dla
współczynnika korelacji dla
populacji generalnej:

1
R,|r|

H0 :   0

Brak korelacji, nie ma powiązania...

H1 :   0

Korelacja istotna, jest powiązanie...

,

Matematyczne techniki zarządzania - 131
Hipotezy te można weryfikować trzema równoważnymi testami:
• testem t Studenta (tylko dla regresji dwu zmiennych)
• testem F Fishera-Snedecora
• testem R Wallace’a-Snedecora

,

W każdym przypadku obliczamy wartość
statystyki dla próbki (tobl, Fobl, Robl) i porównujemy z wartością krytyczną odczytaną z tablicy odpowiedniego rozkładu w
funkcji poziomu istotności i liczby stopni
swobody (ttabl, Ftabl, Rtabl)

Reguła decyzyjna:
• jeżeli |tobl|< ttabl, nie ma podstaw do odrzucenia H0 (brak korelacji)
• jeżeli |tobl|> ttabl, odrzucamy H0 na korzyść H1 (korelacja istnieje)

TAK SAMO DLA
FiR

W przypadku regresji wielorakiej, gdy liczba zmiennych objaśniajacych
jest duża w porównaniu do liczby obserwacji, współczynnik determinacji
R2 może dawać zawyżoną ocenę stopnia wyjaśnienia zmienności zmiennej
objaśnianej; dlatego wprowadzono skorygowany współczynnik determinacji (i korelacji):
 ( yˆ i  y )

R

2

2

k
n

k

1


2
nk 1
(
y

y
)

i
n1

• adjusted coefficient of multiple
determination (wydruki komputerowe)

• jeśli k jest małe, nie ma większej różnicy
pomiędzy normalnym a skorygowanym R2

Matematyczne techniki zarządzania - 132
Skąd wziąć wartość odpowiedniej statystyki dla próbki i jak odczytywać jej wartości z tablic?
n2
r
t

r

t tabl  t  / 2 { n  2 }
TEST STUDENTA
obl
2
sr
1 r

F obl 

TEST FISHERA

Ź ró d ło z m ien n o śc i

MSTR
MSE



R

nk

2

1 R

2

L ic zb a sto p n i
sw o b o d y

Suma
k w a d ra tó w

Ś re d n i
k w a d ra t

M o d el (c z yn n ik i)
B łą d (re sz ta )

k1
nk

SSTR
SSE

MSTR
MSE

R azem

n1

SSTO

TEST WALLACE’A

R obl 

R

2

k 1

F tabl  F { k  1 , n  k }

S ta ty sty k a
F
F obl 

MSTR
MSE

NIE MYLIĆ
STOPNI SWOBODY LICZNIKA I MIANOWNIKA

R tabl  R { k , n  k }

Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

Matematyczne techniki zarządzania - 133
Odczyt Rtabl z tablicy testu R (SKRYPT s.161-162)

, k,  = n-k

S to pn ie
sw ob od y
8
18
28

2
0,05
0,632
0,444
0,361

0,01
0,765
0,561
0,463

L iczb a zm ien n ych
3
0,05
0,01
0,726
0,827
0,532
0,633
0,439
0,530

4
0,05
0,777
0,587
0,490

0,01
0,860
0,678
0,573

Wnioski dotyczące rozkładu R Wallace’a-Snedecora:
• tablica zawiera maksymalne wartości współczynnika korelacji w danej
sytuacji, jakich można oczekiwać, gdy nie ma korelacji w populacji
• im wyższy poziom istotności, tym niższe Rtabl

• im większa liczba zmiennych w modelu, tym wyższe Rtabl
• im wyższa liczba stopni swobody (większa próbka), tym niższe Rtabl
• tablica R powstała z przeliczenia tablic t oraz F (odwrócenie wzorów)
• tablica testu R jest najszybszym i nawygodniejszym narzędziem do
weryfikacji istotności korelacji

Werdykt z etapu I:

Matematyczne techniki zarządzania - 134

• jeżeli Robl>Rtabl, model jest poprawny, można przejść do etapu II
• jeżeli Roblzmiennych objaśniających albo jego postać matematyczną
ETAP I OBOWIĄZUJE DLA WSZYSTKICH MODELI
ETAP I PRZEPROWADZA SIĘ DLA TRANSFORMATY (dla postaci pierwotnej
można uzyskać R>1)
Rola współczynnika determinacji R2
• korelacja może być istotna przy małym R i bardzo małym R2 (r=0,4,
R2=0,16, co oznacza, że tylko 16% zmienności zmiennej Y jest
wyjaśnione przez zmienną objaśniającą)
• małe R2 oznacza niski stopień wyjaśnienia rzeczywistości i stanowi
zagrożenie dla modelu
• należy dążyć (poprzez odpowiedni dobór zmiennych-przyczyn i postaci
matematycznej modelu) do jak największego R2 (dla postaci pierwotnej)
• wysoka wartość R2 świadczy o dobrym poznaniu badanego zjawiska
• wysoka wartość R2 bardzo często wynika jednak ze złego dobrania
zmiennych objaśniających (silnie powiązane ze sobą — „masło maślane”)
KORELACJA POZORNA — jest zależność, ale jej nie ma? Przyczyny...
Trzeba unikać wartości bezwzględnych (ludność, liczba sklepów, wielkość produkcji)

6

9

12

8

11

12

11

15

9

18

9

11

11

18

15

Matematyczne techniki zarządzania - 135
Etap II. Badanie wyrazistości modelu
Y

Wyrazistość modelu dana jest wzorem

s( y )

ui

y

W obl 

s( y )

100 %

y

Celem etapu
jest kontrola
rozrzutu danych

Współczynnik Wobl<30%, w przeciwnym
przypadku rozrzut danych jest zbyt duży

y

Kłopoty: gdyy jest bliskie 0

x

X

Werdykt: model poprawny lub niepoprawny

ETAP II OBOWIĄZUJE DLA WSZYSTKICH MODELI (ale nie ma on charakteru
statystycznego)

ETAP II PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ (sprawdzamy, czy
nie występuje silny efekt „krzywego lustra”)
Etap III. Badanie istotności parametrów (współczynników) modelu
Celem etapu jest sprawdzenie:
• czy poszczególne zmienne objaśniające mają istotny wpływ na zmienną
objaśnianą?
• czy zmienne objaśniające są wybrane prawidłowo?

• czy wyraz wolny różni się istotnie od zera?

Matematyczne techniki zarządzania - 136
Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

Problem istotności parametrów ai można rozpatrywać (tak jak problem
średniej dla populacji) z dwu punktów widzenia:
• przedziału ufności dla nieznanej wartości i

• hipotez — zerowej H0: i=0 i alternatywnej H1: i 0

1
0

ai

1

i

ISTOTNY (W PRZEDZIALE NIE MA ZERA)

0

ai

i

NIEISTOTNY (W PRZEDZIALE JEST ZERO)

P ( a i  t / 2 { n  k } s ( a i )   i  a i  t / 2 { n  k } s ( a i )  1  

Z tablicy rozkładu Studenta, a nie z wydruku komputerowego!

Matematyczne techniki zarządzania - 137
Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

W praktyce posługujemy się raczej hipotezami:
Badanie istotności przeprowadza
się dla każdego i oddzielnie:

t obl ( a i ) 

ai  0
s(a i )

t tabl  t  / 2 { n  k }

• jeżeli |tobl(ai)|>ttabl(ai), odrzucamy hipotezę zerową; parametr jest istotny z błędem równym co najwyżej 
• jeżeli |tobl(ai)|parametr nie jest istotny
Praktycznie jest to bardzo łatwe:
• sprawdzamy, czy |t(ai)| jest większe czy mniejsze od około 2, a najlepiej
• porównujemy rzeczywisty poziom istotności P(ai) z przyjętym 
ODRZUCAMY H0, JEŻELI P(ai) JEST MNIEJSZE OD 

WTEDY ZMIENNA
Xi MA WPŁYW NA
ZMIENNĄ Y

Matematyczne techniki zarządzania - 138
W etapie III następuje ostateczna selekcja zmiennych objaśniających:
• jeżeli wszystkie ai okażą się istotne, model jest poprawny:
— model przyczynowo-skutkowy: do interpretacji
— model tendencji rozwojowej: do etapu IV
• jeżeli choć jedno ai okaże się nieistotne, model jest niepoprawny i wymaga poprawy przez usunięcie nieistotnych zmiennych:
— zmienne należy usuwać po jednej (ze względu na efekt katalityczny)
— usuwa się zawsze zmienną o najniższej wartości |t(ai)| [czyli o
najwyższej wartości P(ai)]
— usunięcie ostatniej zmiennej nieistotnej kończy proces selekcji
kandydatek na zmienne,

— selekcja nie jest ostateczna, gdyż zawsze istnieje możliwość zamiany zmiennych, które są powiązane ze sobą
Praktyczne znaczenie istotności wyrazu wolnego a0
To są jedne z możliwości dla populacji (p. plansza 106)

Y

W przypadku funkcji K=f(P) wyraz wolny wyznacza poziom kosztów stałych (rachunkowość zarządcza)
W przypadku zależności technicznej Q=f(h) wyraz
wolny oznacza, że przy miąższości pokładu h=0 wydajność produkcji Q też jest równa 0

0
X

Matematyczne techniki zarządzania - 139
Praktyczne znaczenie istotności współczynnika regresji ai



KRZYWE NEYMANA — PLANSZE 106-107
WSPÓŁCZ. ISTOTNY
WSPÓŁ. NIEISTOTNY

ETAP III OBOWIĄZUJE DLA WSZYSTKICH MODELI
ETAP III PRZEPROWADZA SIĘ DLA TRANSFORMATY
Etap IV. Badanie symetrii składnika losowego

Y

CZĘSTOŚĆ RESZT DODATNICH I UJEMNYCH MA BYĆ
ZBLIŻONA

Y

ASYMETRYCZNY
SYMETRYCZNY

t
t
Badanie symetrii przeprowadza się testem Studenta (St. Bartosiewicz
Ekonometria)
Brak symetrii wymaga zmiany matematycznej postaci modelu
ETAP IV OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ

ETAP IV PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ

Matematyczne techniki zarządzania - 140
Etap V. Badanie losowości składnika losowego

Y

Y
NIELOSOWY

LOSOWY

t
t
Badanie losowości przeprowadza się testem Studenta lub testem serii
(Ekonometria, praca zb. pod red. M. Krzysztofiaka)
Brak losowości wymaga zmiany matematycznej postaci modelu
ETAP V OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP V PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ
Etap VI. Badanie stacjonarności składnika losowego
W etapie tym chodzi o niezależność wariancji składnika losowego od
zmiennej objaśniającej t (plansza 127)

Bada się istotność współczynnika korelacji ru t , t
ETAP VI OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VI PRZEPROWADZA SIĘ DLA TRANSFORMATY

Matematyczne techniki zarządzania - 141
Etap VII. Badanie wartości oczekiwanej składnika losowego
Normalnie, gdy przeprowadzamy estymację postaci liniowej, parametry
składnika losowego E ( )  0
{ ui  0}
V ( )  const
Po retransformacji do postaci pierwotnej mamy nowe reszty u’, dla
których
'
'
ui  0
 ui  0
Celem etapu jest sprawdzenie, czy odchyłka od O nie jest zbyt duża
(służy do tego test Studenta)
ETAP VII OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VII PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ
Etap VIII. Badanie autokorelacji składnika losowego
Pojęcie autokorelacji opisano na planszy 128; chodzi o istotność korelacji ru , u
t

tk

Badanie autokorelacji można przeprowadzić:

• testem R istotności korelacji ru

t

,ut  k

d obl

• testem Durbina-Watsona
NIE MA AUTOK.

d1

?

d2 JEST AUTOKORELACJA

ETAP VIII OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VIII PRZEPROWADZA SIĘ DLA TRANSFORMATY

Matematyczne techniki zarządzania - 142
Etap IX. Badanie normalności składnika losowego
Celem etapu jest stwierdzenie, czy reszty mają rozkład normalny
Analiza reszt — oddzielny dział analizy regresji i korelacji
Jeżeli reszty mają rozkład normalny, statystyk otrzymuje „ulgi”
ETAP 6. PRAKTYCZNA INTERPRETACJA MODELU



Celem etapu jest wydobycie z modelu całej nowej wiedzy, której nie widać
„gołym okiem”
INTERPRETUJĄC MODEL (RÓWNANIE REGRESJI) NALEŻY UŻYWAĆ WYŁĄCZNIE
PROSTEJ TERMINOLOGII EKONOMICZNEJ ZROZUMIAŁEJ DLA KLIENTA
NIE NALEŻY UŻYWAĆ TERMINOLOGII MATEMATYCZNEJ ZROZUMIAŁEJ TYLKO DLA
TWÓRCÓW MODELU
INTERPRETOWAĆ WOLNO TYLKO MODEL ZWERYFIKOWANY
CAŁY TRUD MODELOWANIA NIE MOŻE BYĆ „SZTUKĄ DLA SZTUKI”, LECZ MA
SŁUŻYĆ UZYSKANIU KONKRETNYCH WNIOSKÓW PRAKTYCZNYCH

Interpretacja modelu przyczynowo-skutkowego

Polega ona na określeniu wpływu poszczególnych czynników na badane
zjawisko:
• podział wszystkich czynników na trzy grupy

Matematyczne techniki zarządzania - 143
A — czynniki nie mające wpływu na Y
B — czynniki mające wpływ na Y i wprowadzone do modelu
C — czynniki mające wpływ na Y, ale nie występujące w modelu
• ocena jakościowa wpływu czynników B i C
• ocena ilościowa wpływu czynników B i C
Ocena jakościowa



Na podstawie znaków stojących przy współczynnikach r oraz ai możemy
stwierdzić, że wpływ jest:

• dodatni (im lepsze zaliczenie, tym lepszy wynik egzaminu; im więcej
wydatków na reklamę, tym większy zysk; itd.)
• ujemny (im więcej zatrudnionych, tym gorszy wynik finansowy; im
mniej braków, tym wyższy zysk; im mniejsza absencja, tym wyższe
wynagrodzenie; itd.)

Ocena ilościowa
• model liniowy
Przykład 33. Zinterpretuj zweryfikowany model zależności miesięcznych
kosztów działalności przedsiębiorstwa (tys. zł) od wielkości produkcji
(sztuk) i liczby reklamacji:
y i  50 , 8  14 , 5 x 1  3 , 9 x 2  

Matematyczne techniki zarządzania - 144
a0 = 50,8

poziom kosztów stałych; jeśli firma nie będzie prowadzić
żadnej działalności, poniesie koszty w wysokości 50,8 tys. zł

a1 = 14,5

każda sztuka produktu firmy kosztuje ją przeciętnie 14,5
tys. zł; jeżeli firma zwiększy produkcję o 2 sztuki, koszty
wzrosną o 29,0 tys. zł

a2 = 3,9każda wniesiona reklamacja powiększa koszty przeciętnie o
3,9 tys. zł
• model potęgowy
Przykłąd 34. Zinterpretuj zweryfikowaną funkcję produkcji Cobba-Douglasa
0 , 65

Pi  45 , 2 M i

0 , 73

Zi

e

0 , 04



Funkcja produkcji to specjalny model, określający zależność pomiędzy
produkcją (P) a czynnikami produkcji: majątkiem trwałym (M) i nakładami
robocizny (Z).



Funkcje produkcji to modele umożliwiające „prześwietlenie”
przedsiębiorstwa (szereg czasowy) lub branży (dane przekrojowe) i określenie poziomu gospodarowania oraz postępu
technicznego i organizacyjnego.
Elastyczność  to współczynnik określający reakcję zmiany
jednej zmiennej na inną zmienną — na przykład elastyczność
cenowa popytu (jak popyt zmienia się wraz z ceną towaru).

EKSPERCI
ZACHODNI

Matematyczne techniki zarządzania - 145

 

y
y

:

x

FUNKCJA POTĘGOWA JEST JEDYNĄ FUNKCJĄ O STAŁEJ ELASTYCZNOŚCI

x

Izolinie funkcji produkcji

T1
M

Produkcję P można osiągnąć różnymi
kombinacjami majątku i robocizny:

T2

• T1— technika kapitałochłonna, np.
pełna automatyzacja
• T2 — pośredni poziom techniki

T3
P  const

• T3 — niski poziom techniki, produkcja
pracochłonna
P. LOWE

Z
Efekt poprawy zarządzania bez
zmiany techniki (lepsze wykorzystanie ludzi i sprzętu):

P2
M

ZARZĄDZANIE
TECHNOLOGIĄ

P1

T

• zmniejszenie kapitałochłonności

• zmniejszenie pracochłonności
• zwiększenie produkcji (przejście z
funkcji P1 na P2)

Można też rozpatrzyć łączne efekty
zmiany techniki i zarządzania

Z

Matematyczne techniki zarządzania - 146
Wszystkie informacje tego typu można odczytać w trakcie interpretacji
0 , 65
0 , 73 0 , 04
funkcji produkcji:
Pi  45 , 2 M i
Zi
e

• wartości 45,2 nie interpretuje się
• wartość 0,65 to współczynnik elastyczności majątkowej (kapitałowej)
produkcji: zmiana majątku o 10% daje średnio zmianę produkcji o 6,5%
• wartość 0,73 to współczynnik elastyczności zatrudnieniowej produkcji:
zmiana zatrudnienia o 10% daje zmianę produkcji średnio o 7,3%
• suma obu współczynników k=0,65+0,73=1,38 to współczynnik skali
produkcji:

— jeżeli k<1, to firma rozwija się ekstensywnie
— jeżeli k>1, to firma rozwija się intensywnie
• wartość  = 0,04 to współczynnik postępu organizacyjnego:
— jeżeli  >O, to miał miejsce postęp organizacyjny

— jeżeli  <0, to miał miejsce regres organizacyjny
Interpretacja modelu tendencji rozwojowej

DODAMY
TROCHĘ
TEORII

Przypomnienie: t — zmienna objaśniająca (stałe przyrosty)
y — zmienna objaśniana; rozdzielana w ogólności na trzy
części: trend, wahania okresowe, wahania losowe ()

Matematyczne techniki zarządzania - 147
Wykres z planszy 117 (zużycie energii elektrycznej przez WZ AGH)
WAHANIA OKRESOWE OKREŚLA SIĘ WZGLĘDEM TRENDU A
NIE WZGLĘDEM OSI CZASU

y

trend

t
1995

1996

1997

1998

1999

Te trzy części trzeba zidentyfikować, a potem złożyć razem w model:

• addytywny (jeśli amplituda wahań jest stała)
• multiplikatywny (jeśli amplituda wahań rośnie lub maleje regularnie)
Wyznaczanie trendu
Metody mechaniczne:

• wskaźniki bezwzględne (stały przyrost =
postęp arytmetyczny = funkcja liniowa)
• wskaźniki względne (przyrost o stały procent =
postęp geometryczny = funkcja potęgowa)
• średnia ruchoma (wygładzanie danych linią łamaną)

JAK OBLICZYĆ O
ILE PROCENT ROCZNIE SPADAŁA
ŚREDNIO LICZBA
WIDZÓW W
KINACH:
1982 - 193,7 MLN
1989 - 141,3 MLN

Matematyczne techniki zarządzania - 148
Średnia ruchoma: mając szereg czasowy y1, y2,....., yn, przyjmujemy
długość kroku k = 3, lub 5, lub 7 itd. i liczymy
y  ...  y k
y  ...  y k  1
y k / 2 0 ,5  1
a następnie y k / 2  1 , 5  2
itd.
k
k
y  y2  y3
y  y3  y4
dla k=3:
y2  1
y3  2
itd.
3
3
Przykład 35. Wyznacz trend metodą średniej ruchomej dla następujących
danych:
okres
t
wartość yt

1
5

2
4

3
7

4
6

5
8

12

y2 
10

y3 

y

8

y4 

6
4

y5 

2

y6 

0
0

1

2

3

4

5

czas, t

6

7

8

9

y7 

547

6
10

 5 , 67

CECHY
ŚREDNIEJ
RUCHOMEJ:

 7 , 00

• TRACI SIĘ
k-1 DANYCH

3
768

8
8

 5 , 33

3
476

7
9

3
6  8  10

 8 , 00

3
8  10  9

 9 , 00

3
10  9  8

 9 , 00

• IM
WIĘKSZE k,
TYM
BARDZIEJ
SZTYWNY
TREND

3

Metody statystyczne: analiza regresji i korelacji, różne funkcje oparte na
modelach ekonomii

Matematyczne techniki zarządzania - 149
Wyznaczanie wahań okresowych: dobowych, tygodniowych, miesięcznych,
kwartalnych, rocznych, wieloletnich
Trzy metody:

— metoda wskaźników sezonowości
— metoda zmiennych zero-jedynkowych (0-1)

— metoda harmoniczna
Wszystkie metody mają jeden cel:
uzyskanie przeciętnego obrazu jednego cyklu

+

Ws
[t ]
[%]
trend

I

II



III

IV

WADY:
• KONIECZNOŚĆ
KOREKTY
• BRAK
WERYFIKACJI
STATYSTYCZNEJ

Metoda wskaźników sezonowości

• obliczenie surowych wskaźników sezonowości (wyeliminowanie trendu):
y

S s  yt  yt
S s  t
yt
addytywny multiplikatywny
wynik: n wartości odchyleń od trendu

• obliczenie oczyszczonych wskaźników
sezonowości (wyeliminowanie wahań
losowych):
 Ss
So 
k-liczba okresów
k
jednoimiennych
m-długość cyklu wynik: m wartości śr. odchyleń od trendu

Matematyczne techniki zarządzania - 150
Metoda zmiennych zero-jedynkowych (0-1)
m

y t  a 0  a1 t   bi Q i  
i 1

bi — przeciętne odchylenie od trendu dla
okresu i-tego
Qi — zmienna 0-1

wahania losowe
trend

wahania okresowe

t
1
2
3
4
5
6
7
8
9

yt
y1
y2
y3
y4
y5
y6
y7
y8
y9

Q1
1
0
0
0
1
0
0
0
1

Q2
0
1
0
0
0
1
0
0
0

Q3
0
0
1
0
0
0
1
0
0

Q4
0
0
0
1
0
0
0
1
0

Metoda harmoniczna (szeregi Fouriera)
Wahania okresowe przedstawia się jako sumę określonej liczby drgań harmonicznych (sinusoid i cosinusoid) przesuniętych w fazie, lecz o jednakowym okresie
m /2
2 i m / 2
2 i
y t  a 0  a 1 t   b1 i sin
  b 2 i cos

m
m
i 1
i 1
Obie metody dają taki sam wynik, istnieje możliwość weryfikacji
statystycznej
W metodzie 0-1 dostajemy bi = Ws, natomiast w metodzie harmonicznej Ws
jest sumą wartości poszczególnych sinusoid dla danego momentu czasu


Slide 18

Matematyczne techniki zarządzania - 121
ETAP 2. GROMADZENIE DANYCH STATYSTYCZNYCH

!

ZA JAKOŚĆ DANYCH ODPOWIADA MODELUJĄCY
• rodzaje danych: dane przekrojowe i szeregi czasowe
• źródła danych: roczniki statystyczne, różne działy
przedsiębiorstwa, badania marketingowe, wywiady itd.
• wiarygodność danych: do jakiego celu zostały one
przygotowane?

MUSISZ
SPRAWDZAĆ
KAŻDE DANE

• porównywalność danych: inflacja (ceny bieżące a ceny
stałe), zmiany procesów technicznych
Wielkość
produkcji

• zmienność zjawisk: trzeba sprawdzić, czy
wybrana w etapie 1a zmienna jest rzeczywiście zmienną losową

Wx 

s( x )

nowy zakład

100 %

x

stary zakład

Wx musi wynosić co najmniej 30-40%
Wiek studenta może być dobrą zmiennąprzyczyną, ale nie w przypadku studiów
dziennych!

Zatrudnienie

Matematyczne techniki zarządzania - 122
ETAP 3. SELEKCJA ZMIENNYCH OBJAŚNIAJĄCYCH
KAŻDĄ ZMIENNĄ X WYTYPOWANĄ W ETAPIE 1a TRAKTUJEMY JAKO
KANDYDATKĘ NA ZMIENNĄ OBJAŚNIAJĄCĄ
Może być kilka przyczyn powodujących, że taka kandydatka nie może znaleźć się w modelu ekonometrycznym (w równaniu regresji):
• w modelu nie może być zbyt wielu zmiennych (nieczytelny)
• kandydatka może nie mieć wpływu na zmienną Y



• kandydatka może wnosić prawie tę samą informację o Y co inna
kandydatka

• dwie bardzo podobne kandydatki mogą sobie nawzajem przeszkadzać
(efekt katalityczny)
Kryteria, jakie musi spełniać kandydatka Xi, aby nadawała się do modelu:
• musi być silnie powiązana ze zmienną Y

• nie może być powiązana z inną kandydatką Xj
SSTO
x1
x4

x2
x3

reszta

R2=0,79

R2=0,66

x2
x1
x4

R2=0,48

x3
reszta

reszta

SSTO

SSTO

Matematyczne techniki zarządzania - 123
Efekt katalityczny
DWIE ZMIENNE DAJĄ
RAZEM MNIEJ INFORMACJI NIŻ KAŻDA Z
NICH Z OSOBNA

x1

x2

R2=0,25

x2

x1

R2=0,52

R2=0,66

Selekcja kandydatek ma na celu podzielenie ich na trzy grupy:
• zmienne wprowadzone do modelu
• zmienne nie wprowadzone do modelu, ale reprezentowane w nim przez
inne zmienne (możliwość wymiany)
• zmienne nie wprowadzone do modelu ze względu na fakt, że nie wnoszą
żadnej informacji o zmiennej Y
INFORMACJE potrzebne do selekcji: współczynniki r x i x j ,
Macierz współczynników korelacji
Y
Y
X1
X2
X3

0,52
0,64
- 0,21

X1
0,52
0,82
- 0,18

X2
0,64
0,82
0,08

X3
- 0,21
- 0,18
0,08

r yx

i

Przykład 32. Macierz powiązania
zmiennych ze sobą przedstawia
się następująco (n=20). Jak ją
można zinterpretować? Które
zmienne są powiązane ze sobą w
sposób istotny?

Matematyczne techniki zarządzania - 124
Testowanie istotności współczynnika korelacji
H0:  = 0

Można je przeprowadzić trzema testami: testem Studenta

H1:   0

(t), Fishera (F) i Wallace’a-Snedecora (R)

Fragment tablicy rozkładu Wallece’a-Snedecora (SKRYPT, tab. VII, s.161)
S to pn ie
sw ob od y

2
0,05
0,632
0,444
0,361

8
18
28

,

0,01
0,765
0,561
0,463

L iczb a zm ien n ych
3
0,05
0,01
0,726
0,827
0,532
0,633
0,439
0,530

4
0,05
0,777
0,587
0,490

0,01
0,860
0,678
0,573

Reguła decyzyjna: — jeżeli |Robl|>Rtabl, odrzucamy H0 (korelacja istotna)
— jeżeli |Robl|
W przykładzie 32, jeżeli przyjmiemy  = 0,05, to Rtabl = 0,444.
Y
Y
X1
X2
X3

0,52
0,64
- 0,21

X1
0,52
0,82
- 0,18

X2
0,64
0,82
0,08

X3
- 0,21
- 0,18
0,08

Pozostaną zatem tylko trzy
istotne powiązania:
y-x1, y-x2, x1-x2
BRAK ISTOTNEGO POWIĄZANIA Z Y NIE
OZNACZA, ŻE ZMIENNA NIE WNOSI
ŻADNEJ INFORMACJI O ZJAWISKU Y

Matematyczne techniki zarządzania - 125



Metody selekcji zmiennych objaśniających:
• grafowa
• Hellwiga (pojemności informacji)
• taksonomiczne (clustering)
Metoda grafowa
• obliczenie macierzy współczynników:

rx

i

xj

• wyłowienie z macierzy powiązań istotnych

, r yx

BUDOWA GRAFU
i

• graf spójny

• budowa grafu z powiązań istotnych
• wybranie zmiennych na podstawie grafu

x6

• graf zerowy
x1
x4

x9

DO MODELU WYBIERA SIĘ ZMIENNE:
• każdy graf zerowy (jeśli |ryx|>0,1)

istotne powiązanie

• po jednej reprezentantce grafu spójnego;

reprezentantką grafu jest zmienna, która ma najwięcej powiązań z
innymi kandydatkami
jeżeli kilka zmiennych ma tę samą maksymalną liczbę powiązań, wybiera
się z nich tę, która jest najsilniej powiązana za zmienną Y (max ryx)
jeżeli graf jest rozległy, może mieć dwie reprezentantki, ale muszą one
leżeć na przeciwległych stronach grafu

Matematyczne techniki zarządzania - 126
Przykład 32 cd. Wybierzemy
zmienną x2 (reprezentantka grafu
spójnego) i zmienną x3 (graf
zerowy)
Metoda Hellwiga

Y
Y
X1
X2
X3

0,52
0,64
- 0,21

• wypisujemy wszystkie możliwe kombinacje
kandydatek; jest ich K = 2m—1
• obliczamy pojemność informacji dla każdej
zmiennej w każdej kombinacji

h kl  f ( r yx , r x
i

ixj

)

• obliczamy pojemność całkowitą dla każdej
kombinacji
H l   h kl
k

• wybieramy kombinację o największej
pojemności Hl = max

X1
0,52
0,82
- 0,18

X2
0,64
0,82

X3
- 0,21
- 0,18
0,08

0,08

W przykładzie 32 mamy 7
możliwych kombinacji kandydatek:
1. x1
2. x2

3. x3

maximum:

H6 = 0,42

4. x1,x2
5. x1,x3

Hmax = R2

6. x2,x3
7. x1,x2,x3

Metody taksonomiczne
Taksonomia wrocławska (cluster analysis) to metoda grupowania obiektów (zmiennych) w grupy jednorodne pod względem n cech (wymiarów)
łącznie. Podstawą grupowania jest odległość euklidesowa, która w przypadku zmiennych d ij  f ( r x x )
WSZYSTKIE METODY TO SELEKCJA WSTĘPNA
i

j

Matematyczne techniki zarządzania - 127
ETAP 4. ESTYMACJA PARAMETRÓW MODELU
Cel etapu: wyznaczenie parametrów strukturalnych i stochastycznych
Estymacja: szacowanie parametrów populacji na podstawie próbki
Metody estymacji: analiza regresji i korelacji (KMNK i inne)

Założenia dla KMNK
1. Zmienne losowe są prawdziwymi zmiennymi, nie powiązanymi ze sobą
2. Składnik losowy  ma stałą wariancję, niezależną od zmiennej x lub t
3. Wartości reszt ui są niezależne od siebie

4. Składnik losowy  nie jest powiązany ze zmienną objaśniającą
Skutki niedotrzymania założeń i środki zaradcze
1. Model bez sensu, nieprzydatny; niekiedy absurdalny (źle uwarunkowane
dane)
Stosuje się: dużą próbkę (n>100), regresję grzbietową (ridge regression)
2.

Y

reszta ui

Lewa część zbioru ma dużą wariancję, a
prawa — wariancję małą
Stosuje się specjalny wariant MNK z
korektą na różne wariancje
X

Matematyczne techniki zarządzania - 128
3. Jeśli reszty ui są ze sobą powiązane (skorelowane), mówimy, że
występuje autokorelacja składnika losowego (zjawisko występuje przy
szeregach czasowych — sztywny porządek obserwacji)
Oznacza to, że istnieje istotna zależność u t  f ( u t  k )
Przyczyny autokorelacji: zakłócenia
(dodatnie lub ujemne) w jednym okresie
wpływają na poziom zjawiska w następnych
okresach (rolnictwo, produkcja, rynek)

t  1 , 2 ,...

u t  y t  yˆ t

u t 1

u1
u2
u3
u4
u5

Występowanie autokorelacji powoduje
nieprzydatność modelu


u1
u2
u3
u4

Istnienie autokorelacji sprawdza się testem
Durbina-Watsona d
Stosuje się metodę różniczki zupełnej

y  f (x )

yt  yt  ytk

4. Składnik losowy jest skorelowany ze zmienną objaśniającą, wtedy
gdy została pominięta jakaś ważna zmienna-przyczyna

Model taki nie ma żadnej wartości; trzeba dbać o jak najwyższy współczynnik determinacji (R2>0,9)
• zbiór danych rzeczywistych nigdy
nie spełnia tych wymagań

ESTYMACJĘ MODELU POWTARZA SIĘ WIELOKROTNIE
ponieważ dopiero weryfikacja zapewnia ostateczną selekcję
kandydatek na zmienne objaśniające

• ekonometria to analiza danych nie
spełniających tych założeń
• nie stosować statystyki bezmyślnie (na ślepo)

Matematyczne techniki zarządzania - 129
ETAP 5. WERYFIKACJA MODELU
Cele:

1. opis rzeczywistości (populacji generalnej)



2. dokładna (ostateczna) selekcja zmiennych objaśniających
3. poznanie składnika losowego (spełnienie założeń KMNK)
Narzędzia: hipotezy i testy statystyczne

Metodyka: każde równanie oddzielnie; weryfikacja obejmuje 9 etapów (od
najmniej do najbardziej pracochłonnego)
WYKAZ ETAPÓW WERYFIKACJI MODELU
I.
II.

Badanie istotności korelacji
Badanie wyrazistości modelu

III.

Badanie istotności parametrów

IV.

Badanie symetrii skł. losowego

V.
VI.
VII.
VIII.
IX.

Badanie losowości skł. losowego
Badanie stacjonarności skł. los.
Badanie wartości oczekiwanej skł. los.
Badanie autokorelacji skł. losowego
Badanie normalności skł. losowego

Opis każdego etapu weryfikacji
obejmuje:
• cel etapu
• sposób weryfikacji: wzory,
hipotezy, testy
• podanie których modeli dotyczy (przyczynowo-skutkowych
czy tendencji rozwojowej)
• podanie której postaci modeli
nieliniowych dotyczy (pierwotnej czy transformaty)

Matematyczne techniki zarządzania - 130
Etap I. Badanie istotności korelacji
7
2

8

9

11

12

17

19

23

21

5
2 etapu
9
16
7
9
15
14
Celem
jest
sprawdzenie,
czy
istnieje w populacji generalnej powiązanie pomiędzy zmienną Y i wszystkimi zmiennymi objaśniającymi

25

Przedział ufności dla
nieznanego współczynnika korelacji  dla populacji buduje się przy
użyciu błędu

populacja

zmienna Y

20
15
10

próbka

5
0
8
5

0 9

1011

2

9

20
12

30
17
16
7
zmienna X

25

1940
9

23 50
15

populacja

20

zmienna Y

7
2

15
10

próbka

5
0
0

10

20

30

zmienna X

40

50

21
14

sR 

1 R

0

Robl

2

nk

Istotność korelacji weryfikuje się przez postawienie
następujących hipotez dla
współczynnika korelacji dla
populacji generalnej:

1
R,|r|

H0 :   0

Brak korelacji, nie ma powiązania...

H1 :   0

Korelacja istotna, jest powiązanie...

,

Matematyczne techniki zarządzania - 131
Hipotezy te można weryfikować trzema równoważnymi testami:
• testem t Studenta (tylko dla regresji dwu zmiennych)
• testem F Fishera-Snedecora
• testem R Wallace’a-Snedecora

,

W każdym przypadku obliczamy wartość
statystyki dla próbki (tobl, Fobl, Robl) i porównujemy z wartością krytyczną odczytaną z tablicy odpowiedniego rozkładu w
funkcji poziomu istotności i liczby stopni
swobody (ttabl, Ftabl, Rtabl)

Reguła decyzyjna:
• jeżeli |tobl|< ttabl, nie ma podstaw do odrzucenia H0 (brak korelacji)
• jeżeli |tobl|> ttabl, odrzucamy H0 na korzyść H1 (korelacja istnieje)

TAK SAMO DLA
FiR

W przypadku regresji wielorakiej, gdy liczba zmiennych objaśniajacych
jest duża w porównaniu do liczby obserwacji, współczynnik determinacji
R2 może dawać zawyżoną ocenę stopnia wyjaśnienia zmienności zmiennej
objaśnianej; dlatego wprowadzono skorygowany współczynnik determinacji (i korelacji):
 ( yˆ i  y )

R

2

2

k
n

k

1


2
nk 1
(
y

y
)

i
n1

• adjusted coefficient of multiple
determination (wydruki komputerowe)

• jeśli k jest małe, nie ma większej różnicy
pomiędzy normalnym a skorygowanym R2

Matematyczne techniki zarządzania - 132
Skąd wziąć wartość odpowiedniej statystyki dla próbki i jak odczytywać jej wartości z tablic?
n2
r
t

r

t tabl  t  / 2 { n  2 }
TEST STUDENTA
obl
2
sr
1 r

F obl 

TEST FISHERA

Ź ró d ło z m ien n o śc i

MSTR
MSE



R

nk

2

1 R

2

L ic zb a sto p n i
sw o b o d y

Suma
k w a d ra tó w

Ś re d n i
k w a d ra t

M o d el (c z yn n ik i)
B łą d (re sz ta )

k1
nk

SSTR
SSE

MSTR
MSE

R azem

n1

SSTO

TEST WALLACE’A

R obl 

R

2

k 1

F tabl  F { k  1 , n  k }

S ta ty sty k a
F
F obl 

MSTR
MSE

NIE MYLIĆ
STOPNI SWOBODY LICZNIKA I MIANOWNIKA

R tabl  R { k , n  k }

Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

Matematyczne techniki zarządzania - 133
Odczyt Rtabl z tablicy testu R (SKRYPT s.161-162)

, k,  = n-k

S to pn ie
sw ob od y
8
18
28

2
0,05
0,632
0,444
0,361

0,01
0,765
0,561
0,463

L iczb a zm ien n ych
3
0,05
0,01
0,726
0,827
0,532
0,633
0,439
0,530

4
0,05
0,777
0,587
0,490

0,01
0,860
0,678
0,573

Wnioski dotyczące rozkładu R Wallace’a-Snedecora:
• tablica zawiera maksymalne wartości współczynnika korelacji w danej
sytuacji, jakich można oczekiwać, gdy nie ma korelacji w populacji
• im wyższy poziom istotności, tym niższe Rtabl

• im większa liczba zmiennych w modelu, tym wyższe Rtabl
• im wyższa liczba stopni swobody (większa próbka), tym niższe Rtabl
• tablica R powstała z przeliczenia tablic t oraz F (odwrócenie wzorów)
• tablica testu R jest najszybszym i nawygodniejszym narzędziem do
weryfikacji istotności korelacji

Werdykt z etapu I:

Matematyczne techniki zarządzania - 134

• jeżeli Robl>Rtabl, model jest poprawny, można przejść do etapu II
• jeżeli Roblzmiennych objaśniających albo jego postać matematyczną
ETAP I OBOWIĄZUJE DLA WSZYSTKICH MODELI
ETAP I PRZEPROWADZA SIĘ DLA TRANSFORMATY (dla postaci pierwotnej
można uzyskać R>1)
Rola współczynnika determinacji R2
• korelacja może być istotna przy małym R i bardzo małym R2 (r=0,4,
R2=0,16, co oznacza, że tylko 16% zmienności zmiennej Y jest
wyjaśnione przez zmienną objaśniającą)
• małe R2 oznacza niski stopień wyjaśnienia rzeczywistości i stanowi
zagrożenie dla modelu
• należy dążyć (poprzez odpowiedni dobór zmiennych-przyczyn i postaci
matematycznej modelu) do jak największego R2 (dla postaci pierwotnej)
• wysoka wartość R2 świadczy o dobrym poznaniu badanego zjawiska
• wysoka wartość R2 bardzo często wynika jednak ze złego dobrania
zmiennych objaśniających (silnie powiązane ze sobą — „masło maślane”)
KORELACJA POZORNA — jest zależność, ale jej nie ma? Przyczyny...
Trzeba unikać wartości bezwzględnych (ludność, liczba sklepów, wielkość produkcji)

6

9

12

8

11

12

11

15

9

18

9

11

11

18

15

Matematyczne techniki zarządzania - 135
Etap II. Badanie wyrazistości modelu
Y

Wyrazistość modelu dana jest wzorem

s( y )

ui

y

W obl 

s( y )

100 %

y

Celem etapu
jest kontrola
rozrzutu danych

Współczynnik Wobl<30%, w przeciwnym
przypadku rozrzut danych jest zbyt duży

y

Kłopoty: gdyy jest bliskie 0

x

X

Werdykt: model poprawny lub niepoprawny

ETAP II OBOWIĄZUJE DLA WSZYSTKICH MODELI (ale nie ma on charakteru
statystycznego)

ETAP II PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ (sprawdzamy, czy
nie występuje silny efekt „krzywego lustra”)
Etap III. Badanie istotności parametrów (współczynników) modelu
Celem etapu jest sprawdzenie:
• czy poszczególne zmienne objaśniające mają istotny wpływ na zmienną
objaśnianą?
• czy zmienne objaśniające są wybrane prawidłowo?

• czy wyraz wolny różni się istotnie od zera?

Matematyczne techniki zarządzania - 136
Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

Problem istotności parametrów ai można rozpatrywać (tak jak problem
średniej dla populacji) z dwu punktów widzenia:
• przedziału ufności dla nieznanej wartości i

• hipotez — zerowej H0: i=0 i alternatywnej H1: i 0

1
0

ai

1

i

ISTOTNY (W PRZEDZIALE NIE MA ZERA)

0

ai

i

NIEISTOTNY (W PRZEDZIALE JEST ZERO)

P ( a i  t / 2 { n  k } s ( a i )   i  a i  t / 2 { n  k } s ( a i )  1  

Z tablicy rozkładu Studenta, a nie z wydruku komputerowego!

Matematyczne techniki zarządzania - 137
Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

W praktyce posługujemy się raczej hipotezami:
Badanie istotności przeprowadza
się dla każdego i oddzielnie:

t obl ( a i ) 

ai  0
s(a i )

t tabl  t  / 2 { n  k }

• jeżeli |tobl(ai)|>ttabl(ai), odrzucamy hipotezę zerową; parametr jest istotny z błędem równym co najwyżej 
• jeżeli |tobl(ai)|parametr nie jest istotny
Praktycznie jest to bardzo łatwe:
• sprawdzamy, czy |t(ai)| jest większe czy mniejsze od około 2, a najlepiej
• porównujemy rzeczywisty poziom istotności P(ai) z przyjętym 
ODRZUCAMY H0, JEŻELI P(ai) JEST MNIEJSZE OD 

WTEDY ZMIENNA
Xi MA WPŁYW NA
ZMIENNĄ Y

Matematyczne techniki zarządzania - 138
W etapie III następuje ostateczna selekcja zmiennych objaśniających:
• jeżeli wszystkie ai okażą się istotne, model jest poprawny:
— model przyczynowo-skutkowy: do interpretacji
— model tendencji rozwojowej: do etapu IV
• jeżeli choć jedno ai okaże się nieistotne, model jest niepoprawny i wymaga poprawy przez usunięcie nieistotnych zmiennych:
— zmienne należy usuwać po jednej (ze względu na efekt katalityczny)
— usuwa się zawsze zmienną o najniższej wartości |t(ai)| [czyli o
najwyższej wartości P(ai)]
— usunięcie ostatniej zmiennej nieistotnej kończy proces selekcji
kandydatek na zmienne,

— selekcja nie jest ostateczna, gdyż zawsze istnieje możliwość zamiany zmiennych, które są powiązane ze sobą
Praktyczne znaczenie istotności wyrazu wolnego a0
To są jedne z możliwości dla populacji (p. plansza 106)

Y

W przypadku funkcji K=f(P) wyraz wolny wyznacza poziom kosztów stałych (rachunkowość zarządcza)
W przypadku zależności technicznej Q=f(h) wyraz
wolny oznacza, że przy miąższości pokładu h=0 wydajność produkcji Q też jest równa 0

0
X

Matematyczne techniki zarządzania - 139
Praktyczne znaczenie istotności współczynnika regresji ai



KRZYWE NEYMANA — PLANSZE 106-107
WSPÓŁCZ. ISTOTNY
WSPÓŁ. NIEISTOTNY

ETAP III OBOWIĄZUJE DLA WSZYSTKICH MODELI
ETAP III PRZEPROWADZA SIĘ DLA TRANSFORMATY
Etap IV. Badanie symetrii składnika losowego

Y

CZĘSTOŚĆ RESZT DODATNICH I UJEMNYCH MA BYĆ
ZBLIŻONA

Y

ASYMETRYCZNY
SYMETRYCZNY

t
t
Badanie symetrii przeprowadza się testem Studenta (St. Bartosiewicz
Ekonometria)
Brak symetrii wymaga zmiany matematycznej postaci modelu
ETAP IV OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ

ETAP IV PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ

Matematyczne techniki zarządzania - 140
Etap V. Badanie losowości składnika losowego

Y

Y
NIELOSOWY

LOSOWY

t
t
Badanie losowości przeprowadza się testem Studenta lub testem serii
(Ekonometria, praca zb. pod red. M. Krzysztofiaka)
Brak losowości wymaga zmiany matematycznej postaci modelu
ETAP V OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP V PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ
Etap VI. Badanie stacjonarności składnika losowego
W etapie tym chodzi o niezależność wariancji składnika losowego od
zmiennej objaśniającej t (plansza 127)

Bada się istotność współczynnika korelacji ru t , t
ETAP VI OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VI PRZEPROWADZA SIĘ DLA TRANSFORMATY

Matematyczne techniki zarządzania - 141
Etap VII. Badanie wartości oczekiwanej składnika losowego
Normalnie, gdy przeprowadzamy estymację postaci liniowej, parametry
składnika losowego E ( )  0
{ ui  0}
V ( )  const
Po retransformacji do postaci pierwotnej mamy nowe reszty u’, dla
których
'
'
ui  0
 ui  0
Celem etapu jest sprawdzenie, czy odchyłka od O nie jest zbyt duża
(służy do tego test Studenta)
ETAP VII OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VII PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ
Etap VIII. Badanie autokorelacji składnika losowego
Pojęcie autokorelacji opisano na planszy 128; chodzi o istotność korelacji ru , u
t

tk

Badanie autokorelacji można przeprowadzić:

• testem R istotności korelacji ru

t

,ut  k

d obl

• testem Durbina-Watsona
NIE MA AUTOK.

d1

?

d2 JEST AUTOKORELACJA

ETAP VIII OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VIII PRZEPROWADZA SIĘ DLA TRANSFORMATY

Matematyczne techniki zarządzania - 142
Etap IX. Badanie normalności składnika losowego
Celem etapu jest stwierdzenie, czy reszty mają rozkład normalny
Analiza reszt — oddzielny dział analizy regresji i korelacji
Jeżeli reszty mają rozkład normalny, statystyk otrzymuje „ulgi”
ETAP 6. PRAKTYCZNA INTERPRETACJA MODELU



Celem etapu jest wydobycie z modelu całej nowej wiedzy, której nie widać
„gołym okiem”
INTERPRETUJĄC MODEL (RÓWNANIE REGRESJI) NALEŻY UŻYWAĆ WYŁĄCZNIE
PROSTEJ TERMINOLOGII EKONOMICZNEJ ZROZUMIAŁEJ DLA KLIENTA
NIE NALEŻY UŻYWAĆ TERMINOLOGII MATEMATYCZNEJ ZROZUMIAŁEJ TYLKO DLA
TWÓRCÓW MODELU
INTERPRETOWAĆ WOLNO TYLKO MODEL ZWERYFIKOWANY
CAŁY TRUD MODELOWANIA NIE MOŻE BYĆ „SZTUKĄ DLA SZTUKI”, LECZ MA
SŁUŻYĆ UZYSKANIU KONKRETNYCH WNIOSKÓW PRAKTYCZNYCH

Interpretacja modelu przyczynowo-skutkowego

Polega ona na określeniu wpływu poszczególnych czynników na badane
zjawisko:
• podział wszystkich czynników na trzy grupy

Matematyczne techniki zarządzania - 143
A — czynniki nie mające wpływu na Y
B — czynniki mające wpływ na Y i wprowadzone do modelu
C — czynniki mające wpływ na Y, ale nie występujące w modelu
• ocena jakościowa wpływu czynników B i C
• ocena ilościowa wpływu czynników B i C
Ocena jakościowa



Na podstawie znaków stojących przy współczynnikach r oraz ai możemy
stwierdzić, że wpływ jest:

• dodatni (im lepsze zaliczenie, tym lepszy wynik egzaminu; im więcej
wydatków na reklamę, tym większy zysk; itd.)
• ujemny (im więcej zatrudnionych, tym gorszy wynik finansowy; im
mniej braków, tym wyższy zysk; im mniejsza absencja, tym wyższe
wynagrodzenie; itd.)

Ocena ilościowa
• model liniowy
Przykład 33. Zinterpretuj zweryfikowany model zależności miesięcznych
kosztów działalności przedsiębiorstwa (tys. zł) od wielkości produkcji
(sztuk) i liczby reklamacji:
y i  50 , 8  14 , 5 x 1  3 , 9 x 2  

Matematyczne techniki zarządzania - 144
a0 = 50,8

poziom kosztów stałych; jeśli firma nie będzie prowadzić
żadnej działalności, poniesie koszty w wysokości 50,8 tys. zł

a1 = 14,5

każda sztuka produktu firmy kosztuje ją przeciętnie 14,5
tys. zł; jeżeli firma zwiększy produkcję o 2 sztuki, koszty
wzrosną o 29,0 tys. zł

a2 = 3,9każda wniesiona reklamacja powiększa koszty przeciętnie o
3,9 tys. zł
• model potęgowy
Przykłąd 34. Zinterpretuj zweryfikowaną funkcję produkcji Cobba-Douglasa
0 , 65

Pi  45 , 2 M i

0 , 73

Zi

e

0 , 04



Funkcja produkcji to specjalny model, określający zależność pomiędzy
produkcją (P) a czynnikami produkcji: majątkiem trwałym (M) i nakładami
robocizny (Z).



Funkcje produkcji to modele umożliwiające „prześwietlenie”
przedsiębiorstwa (szereg czasowy) lub branży (dane przekrojowe) i określenie poziomu gospodarowania oraz postępu
technicznego i organizacyjnego.
Elastyczność  to współczynnik określający reakcję zmiany
jednej zmiennej na inną zmienną — na przykład elastyczność
cenowa popytu (jak popyt zmienia się wraz z ceną towaru).

EKSPERCI
ZACHODNI

Matematyczne techniki zarządzania - 145

 

y
y

:

x

FUNKCJA POTĘGOWA JEST JEDYNĄ FUNKCJĄ O STAŁEJ ELASTYCZNOŚCI

x

Izolinie funkcji produkcji

T1
M

Produkcję P można osiągnąć różnymi
kombinacjami majątku i robocizny:

T2

• T1— technika kapitałochłonna, np.
pełna automatyzacja
• T2 — pośredni poziom techniki

T3
P  const

• T3 — niski poziom techniki, produkcja
pracochłonna
P. LOWE

Z
Efekt poprawy zarządzania bez
zmiany techniki (lepsze wykorzystanie ludzi i sprzętu):

P2
M

ZARZĄDZANIE
TECHNOLOGIĄ

P1

T

• zmniejszenie kapitałochłonności

• zmniejszenie pracochłonności
• zwiększenie produkcji (przejście z
funkcji P1 na P2)

Można też rozpatrzyć łączne efekty
zmiany techniki i zarządzania

Z

Matematyczne techniki zarządzania - 146
Wszystkie informacje tego typu można odczytać w trakcie interpretacji
0 , 65
0 , 73 0 , 04
funkcji produkcji:
Pi  45 , 2 M i
Zi
e

• wartości 45,2 nie interpretuje się
• wartość 0,65 to współczynnik elastyczności majątkowej (kapitałowej)
produkcji: zmiana majątku o 10% daje średnio zmianę produkcji o 6,5%
• wartość 0,73 to współczynnik elastyczności zatrudnieniowej produkcji:
zmiana zatrudnienia o 10% daje zmianę produkcji średnio o 7,3%
• suma obu współczynników k=0,65+0,73=1,38 to współczynnik skali
produkcji:

— jeżeli k<1, to firma rozwija się ekstensywnie
— jeżeli k>1, to firma rozwija się intensywnie
• wartość  = 0,04 to współczynnik postępu organizacyjnego:
— jeżeli  >O, to miał miejsce postęp organizacyjny

— jeżeli  <0, to miał miejsce regres organizacyjny
Interpretacja modelu tendencji rozwojowej

DODAMY
TROCHĘ
TEORII

Przypomnienie: t — zmienna objaśniająca (stałe przyrosty)
y — zmienna objaśniana; rozdzielana w ogólności na trzy
części: trend, wahania okresowe, wahania losowe ()

Matematyczne techniki zarządzania - 147
Wykres z planszy 117 (zużycie energii elektrycznej przez WZ AGH)
WAHANIA OKRESOWE OKREŚLA SIĘ WZGLĘDEM TRENDU A
NIE WZGLĘDEM OSI CZASU

y

trend

t
1995

1996

1997

1998

1999

Te trzy części trzeba zidentyfikować, a potem złożyć razem w model:

• addytywny (jeśli amplituda wahań jest stała)
• multiplikatywny (jeśli amplituda wahań rośnie lub maleje regularnie)
Wyznaczanie trendu
Metody mechaniczne:

• wskaźniki bezwzględne (stały przyrost =
postęp arytmetyczny = funkcja liniowa)
• wskaźniki względne (przyrost o stały procent =
postęp geometryczny = funkcja potęgowa)
• średnia ruchoma (wygładzanie danych linią łamaną)

JAK OBLICZYĆ O
ILE PROCENT ROCZNIE SPADAŁA
ŚREDNIO LICZBA
WIDZÓW W
KINACH:
1982 - 193,7 MLN
1989 - 141,3 MLN

Matematyczne techniki zarządzania - 148
Średnia ruchoma: mając szereg czasowy y1, y2,....., yn, przyjmujemy
długość kroku k = 3, lub 5, lub 7 itd. i liczymy
y  ...  y k
y  ...  y k  1
y k / 2 0 ,5  1
a następnie y k / 2  1 , 5  2
itd.
k
k
y  y2  y3
y  y3  y4
dla k=3:
y2  1
y3  2
itd.
3
3
Przykład 35. Wyznacz trend metodą średniej ruchomej dla następujących
danych:
okres
t
wartość yt

1
5

2
4

3
7

4
6

5
8

12

y2 
10

y3 

y

8

y4 

6
4

y5 

2

y6 

0
0

1

2

3

4

5

czas, t

6

7

8

9

y7 

547

6
10

 5 , 67

CECHY
ŚREDNIEJ
RUCHOMEJ:

 7 , 00

• TRACI SIĘ
k-1 DANYCH

3
768

8
8

 5 , 33

3
476

7
9

3
6  8  10

 8 , 00

3
8  10  9

 9 , 00

3
10  9  8

 9 , 00

• IM
WIĘKSZE k,
TYM
BARDZIEJ
SZTYWNY
TREND

3

Metody statystyczne: analiza regresji i korelacji, różne funkcje oparte na
modelach ekonomii

Matematyczne techniki zarządzania - 149
Wyznaczanie wahań okresowych: dobowych, tygodniowych, miesięcznych,
kwartalnych, rocznych, wieloletnich
Trzy metody:

— metoda wskaźników sezonowości
— metoda zmiennych zero-jedynkowych (0-1)

— metoda harmoniczna
Wszystkie metody mają jeden cel:
uzyskanie przeciętnego obrazu jednego cyklu

+

Ws
[t ]
[%]
trend

I

II



III

IV

WADY:
• KONIECZNOŚĆ
KOREKTY
• BRAK
WERYFIKACJI
STATYSTYCZNEJ

Metoda wskaźników sezonowości

• obliczenie surowych wskaźników sezonowości (wyeliminowanie trendu):
y

S s  yt  yt
S s  t
yt
addytywny multiplikatywny
wynik: n wartości odchyleń od trendu

• obliczenie oczyszczonych wskaźników
sezonowości (wyeliminowanie wahań
losowych):
 Ss
So 
k-liczba okresów
k
jednoimiennych
m-długość cyklu wynik: m wartości śr. odchyleń od trendu

Matematyczne techniki zarządzania - 150
Metoda zmiennych zero-jedynkowych (0-1)
m

y t  a 0  a1 t   bi Q i  
i 1

bi — przeciętne odchylenie od trendu dla
okresu i-tego
Qi — zmienna 0-1

wahania losowe
trend

wahania okresowe

t
1
2
3
4
5
6
7
8
9

yt
y1
y2
y3
y4
y5
y6
y7
y8
y9

Q1
1
0
0
0
1
0
0
0
1

Q2
0
1
0
0
0
1
0
0
0

Q3
0
0
1
0
0
0
1
0
0

Q4
0
0
0
1
0
0
0
1
0

Metoda harmoniczna (szeregi Fouriera)
Wahania okresowe przedstawia się jako sumę określonej liczby drgań harmonicznych (sinusoid i cosinusoid) przesuniętych w fazie, lecz o jednakowym okresie
m /2
2 i m / 2
2 i
y t  a 0  a 1 t   b1 i sin
  b 2 i cos

m
m
i 1
i 1
Obie metody dają taki sam wynik, istnieje możliwość weryfikacji
statystycznej
W metodzie 0-1 dostajemy bi = Ws, natomiast w metodzie harmonicznej Ws
jest sumą wartości poszczególnych sinusoid dla danego momentu czasu


Slide 19

Matematyczne techniki zarządzania - 121
ETAP 2. GROMADZENIE DANYCH STATYSTYCZNYCH

!

ZA JAKOŚĆ DANYCH ODPOWIADA MODELUJĄCY
• rodzaje danych: dane przekrojowe i szeregi czasowe
• źródła danych: roczniki statystyczne, różne działy
przedsiębiorstwa, badania marketingowe, wywiady itd.
• wiarygodność danych: do jakiego celu zostały one
przygotowane?

MUSISZ
SPRAWDZAĆ
KAŻDE DANE

• porównywalność danych: inflacja (ceny bieżące a ceny
stałe), zmiany procesów technicznych
Wielkość
produkcji

• zmienność zjawisk: trzeba sprawdzić, czy
wybrana w etapie 1a zmienna jest rzeczywiście zmienną losową

Wx 

s( x )

nowy zakład

100 %

x

stary zakład

Wx musi wynosić co najmniej 30-40%
Wiek studenta może być dobrą zmiennąprzyczyną, ale nie w przypadku studiów
dziennych!

Zatrudnienie

Matematyczne techniki zarządzania - 122
ETAP 3. SELEKCJA ZMIENNYCH OBJAŚNIAJĄCYCH
KAŻDĄ ZMIENNĄ X WYTYPOWANĄ W ETAPIE 1a TRAKTUJEMY JAKO
KANDYDATKĘ NA ZMIENNĄ OBJAŚNIAJĄCĄ
Może być kilka przyczyn powodujących, że taka kandydatka nie może znaleźć się w modelu ekonometrycznym (w równaniu regresji):
• w modelu nie może być zbyt wielu zmiennych (nieczytelny)
• kandydatka może nie mieć wpływu na zmienną Y



• kandydatka może wnosić prawie tę samą informację o Y co inna
kandydatka

• dwie bardzo podobne kandydatki mogą sobie nawzajem przeszkadzać
(efekt katalityczny)
Kryteria, jakie musi spełniać kandydatka Xi, aby nadawała się do modelu:
• musi być silnie powiązana ze zmienną Y

• nie może być powiązana z inną kandydatką Xj
SSTO
x1
x4

x2
x3

reszta

R2=0,79

R2=0,66

x2
x1
x4

R2=0,48

x3
reszta

reszta

SSTO

SSTO

Matematyczne techniki zarządzania - 123
Efekt katalityczny
DWIE ZMIENNE DAJĄ
RAZEM MNIEJ INFORMACJI NIŻ KAŻDA Z
NICH Z OSOBNA

x1

x2

R2=0,25

x2

x1

R2=0,52

R2=0,66

Selekcja kandydatek ma na celu podzielenie ich na trzy grupy:
• zmienne wprowadzone do modelu
• zmienne nie wprowadzone do modelu, ale reprezentowane w nim przez
inne zmienne (możliwość wymiany)
• zmienne nie wprowadzone do modelu ze względu na fakt, że nie wnoszą
żadnej informacji o zmiennej Y
INFORMACJE potrzebne do selekcji: współczynniki r x i x j ,
Macierz współczynników korelacji
Y
Y
X1
X2
X3

0,52
0,64
- 0,21

X1
0,52
0,82
- 0,18

X2
0,64
0,82
0,08

X3
- 0,21
- 0,18
0,08

r yx

i

Przykład 32. Macierz powiązania
zmiennych ze sobą przedstawia
się następująco (n=20). Jak ją
można zinterpretować? Które
zmienne są powiązane ze sobą w
sposób istotny?

Matematyczne techniki zarządzania - 124
Testowanie istotności współczynnika korelacji
H0:  = 0

Można je przeprowadzić trzema testami: testem Studenta

H1:   0

(t), Fishera (F) i Wallace’a-Snedecora (R)

Fragment tablicy rozkładu Wallece’a-Snedecora (SKRYPT, tab. VII, s.161)
S to pn ie
sw ob od y

2
0,05
0,632
0,444
0,361

8
18
28

,

0,01
0,765
0,561
0,463

L iczb a zm ien n ych
3
0,05
0,01
0,726
0,827
0,532
0,633
0,439
0,530

4
0,05
0,777
0,587
0,490

0,01
0,860
0,678
0,573

Reguła decyzyjna: — jeżeli |Robl|>Rtabl, odrzucamy H0 (korelacja istotna)
— jeżeli |Robl|
W przykładzie 32, jeżeli przyjmiemy  = 0,05, to Rtabl = 0,444.
Y
Y
X1
X2
X3

0,52
0,64
- 0,21

X1
0,52
0,82
- 0,18

X2
0,64
0,82
0,08

X3
- 0,21
- 0,18
0,08

Pozostaną zatem tylko trzy
istotne powiązania:
y-x1, y-x2, x1-x2
BRAK ISTOTNEGO POWIĄZANIA Z Y NIE
OZNACZA, ŻE ZMIENNA NIE WNOSI
ŻADNEJ INFORMACJI O ZJAWISKU Y

Matematyczne techniki zarządzania - 125



Metody selekcji zmiennych objaśniających:
• grafowa
• Hellwiga (pojemności informacji)
• taksonomiczne (clustering)
Metoda grafowa
• obliczenie macierzy współczynników:

rx

i

xj

• wyłowienie z macierzy powiązań istotnych

, r yx

BUDOWA GRAFU
i

• graf spójny

• budowa grafu z powiązań istotnych
• wybranie zmiennych na podstawie grafu

x6

• graf zerowy
x1
x4

x9

DO MODELU WYBIERA SIĘ ZMIENNE:
• każdy graf zerowy (jeśli |ryx|>0,1)

istotne powiązanie

• po jednej reprezentantce grafu spójnego;

reprezentantką grafu jest zmienna, która ma najwięcej powiązań z
innymi kandydatkami
jeżeli kilka zmiennych ma tę samą maksymalną liczbę powiązań, wybiera
się z nich tę, która jest najsilniej powiązana za zmienną Y (max ryx)
jeżeli graf jest rozległy, może mieć dwie reprezentantki, ale muszą one
leżeć na przeciwległych stronach grafu

Matematyczne techniki zarządzania - 126
Przykład 32 cd. Wybierzemy
zmienną x2 (reprezentantka grafu
spójnego) i zmienną x3 (graf
zerowy)
Metoda Hellwiga

Y
Y
X1
X2
X3

0,52
0,64
- 0,21

• wypisujemy wszystkie możliwe kombinacje
kandydatek; jest ich K = 2m—1
• obliczamy pojemność informacji dla każdej
zmiennej w każdej kombinacji

h kl  f ( r yx , r x
i

ixj

)

• obliczamy pojemność całkowitą dla każdej
kombinacji
H l   h kl
k

• wybieramy kombinację o największej
pojemności Hl = max

X1
0,52
0,82
- 0,18

X2
0,64
0,82

X3
- 0,21
- 0,18
0,08

0,08

W przykładzie 32 mamy 7
możliwych kombinacji kandydatek:
1. x1
2. x2

3. x3

maximum:

H6 = 0,42

4. x1,x2
5. x1,x3

Hmax = R2

6. x2,x3
7. x1,x2,x3

Metody taksonomiczne
Taksonomia wrocławska (cluster analysis) to metoda grupowania obiektów (zmiennych) w grupy jednorodne pod względem n cech (wymiarów)
łącznie. Podstawą grupowania jest odległość euklidesowa, która w przypadku zmiennych d ij  f ( r x x )
WSZYSTKIE METODY TO SELEKCJA WSTĘPNA
i

j

Matematyczne techniki zarządzania - 127
ETAP 4. ESTYMACJA PARAMETRÓW MODELU
Cel etapu: wyznaczenie parametrów strukturalnych i stochastycznych
Estymacja: szacowanie parametrów populacji na podstawie próbki
Metody estymacji: analiza regresji i korelacji (KMNK i inne)

Założenia dla KMNK
1. Zmienne losowe są prawdziwymi zmiennymi, nie powiązanymi ze sobą
2. Składnik losowy  ma stałą wariancję, niezależną od zmiennej x lub t
3. Wartości reszt ui są niezależne od siebie

4. Składnik losowy  nie jest powiązany ze zmienną objaśniającą
Skutki niedotrzymania założeń i środki zaradcze
1. Model bez sensu, nieprzydatny; niekiedy absurdalny (źle uwarunkowane
dane)
Stosuje się: dużą próbkę (n>100), regresję grzbietową (ridge regression)
2.

Y

reszta ui

Lewa część zbioru ma dużą wariancję, a
prawa — wariancję małą
Stosuje się specjalny wariant MNK z
korektą na różne wariancje
X

Matematyczne techniki zarządzania - 128
3. Jeśli reszty ui są ze sobą powiązane (skorelowane), mówimy, że
występuje autokorelacja składnika losowego (zjawisko występuje przy
szeregach czasowych — sztywny porządek obserwacji)
Oznacza to, że istnieje istotna zależność u t  f ( u t  k )
Przyczyny autokorelacji: zakłócenia
(dodatnie lub ujemne) w jednym okresie
wpływają na poziom zjawiska w następnych
okresach (rolnictwo, produkcja, rynek)

t  1 , 2 ,...

u t  y t  yˆ t

u t 1

u1
u2
u3
u4
u5

Występowanie autokorelacji powoduje
nieprzydatność modelu


u1
u2
u3
u4

Istnienie autokorelacji sprawdza się testem
Durbina-Watsona d
Stosuje się metodę różniczki zupełnej

y  f (x )

yt  yt  ytk

4. Składnik losowy jest skorelowany ze zmienną objaśniającą, wtedy
gdy została pominięta jakaś ważna zmienna-przyczyna

Model taki nie ma żadnej wartości; trzeba dbać o jak najwyższy współczynnik determinacji (R2>0,9)
• zbiór danych rzeczywistych nigdy
nie spełnia tych wymagań

ESTYMACJĘ MODELU POWTARZA SIĘ WIELOKROTNIE
ponieważ dopiero weryfikacja zapewnia ostateczną selekcję
kandydatek na zmienne objaśniające

• ekonometria to analiza danych nie
spełniających tych założeń
• nie stosować statystyki bezmyślnie (na ślepo)

Matematyczne techniki zarządzania - 129
ETAP 5. WERYFIKACJA MODELU
Cele:

1. opis rzeczywistości (populacji generalnej)



2. dokładna (ostateczna) selekcja zmiennych objaśniających
3. poznanie składnika losowego (spełnienie założeń KMNK)
Narzędzia: hipotezy i testy statystyczne

Metodyka: każde równanie oddzielnie; weryfikacja obejmuje 9 etapów (od
najmniej do najbardziej pracochłonnego)
WYKAZ ETAPÓW WERYFIKACJI MODELU
I.
II.

Badanie istotności korelacji
Badanie wyrazistości modelu

III.

Badanie istotności parametrów

IV.

Badanie symetrii skł. losowego

V.
VI.
VII.
VIII.
IX.

Badanie losowości skł. losowego
Badanie stacjonarności skł. los.
Badanie wartości oczekiwanej skł. los.
Badanie autokorelacji skł. losowego
Badanie normalności skł. losowego

Opis każdego etapu weryfikacji
obejmuje:
• cel etapu
• sposób weryfikacji: wzory,
hipotezy, testy
• podanie których modeli dotyczy (przyczynowo-skutkowych
czy tendencji rozwojowej)
• podanie której postaci modeli
nieliniowych dotyczy (pierwotnej czy transformaty)

Matematyczne techniki zarządzania - 130
Etap I. Badanie istotności korelacji
7
2

8

9

11

12

17

19

23

21

5
2 etapu
9
16
7
9
15
14
Celem
jest
sprawdzenie,
czy
istnieje w populacji generalnej powiązanie pomiędzy zmienną Y i wszystkimi zmiennymi objaśniającymi

25

Przedział ufności dla
nieznanego współczynnika korelacji  dla populacji buduje się przy
użyciu błędu

populacja

zmienna Y

20
15
10

próbka

5
0
8
5

0 9

1011

2

9

20
12

30
17
16
7
zmienna X

25

1940
9

23 50
15

populacja

20

zmienna Y

7
2

15
10

próbka

5
0
0

10

20

30

zmienna X

40

50

21
14

sR 

1 R

0

Robl

2

nk

Istotność korelacji weryfikuje się przez postawienie
następujących hipotez dla
współczynnika korelacji dla
populacji generalnej:

1
R,|r|

H0 :   0

Brak korelacji, nie ma powiązania...

H1 :   0

Korelacja istotna, jest powiązanie...

,

Matematyczne techniki zarządzania - 131
Hipotezy te można weryfikować trzema równoważnymi testami:
• testem t Studenta (tylko dla regresji dwu zmiennych)
• testem F Fishera-Snedecora
• testem R Wallace’a-Snedecora

,

W każdym przypadku obliczamy wartość
statystyki dla próbki (tobl, Fobl, Robl) i porównujemy z wartością krytyczną odczytaną z tablicy odpowiedniego rozkładu w
funkcji poziomu istotności i liczby stopni
swobody (ttabl, Ftabl, Rtabl)

Reguła decyzyjna:
• jeżeli |tobl|< ttabl, nie ma podstaw do odrzucenia H0 (brak korelacji)
• jeżeli |tobl|> ttabl, odrzucamy H0 na korzyść H1 (korelacja istnieje)

TAK SAMO DLA
FiR

W przypadku regresji wielorakiej, gdy liczba zmiennych objaśniajacych
jest duża w porównaniu do liczby obserwacji, współczynnik determinacji
R2 może dawać zawyżoną ocenę stopnia wyjaśnienia zmienności zmiennej
objaśnianej; dlatego wprowadzono skorygowany współczynnik determinacji (i korelacji):
 ( yˆ i  y )

R

2

2

k
n

k

1


2
nk 1
(
y

y
)

i
n1

• adjusted coefficient of multiple
determination (wydruki komputerowe)

• jeśli k jest małe, nie ma większej różnicy
pomiędzy normalnym a skorygowanym R2

Matematyczne techniki zarządzania - 132
Skąd wziąć wartość odpowiedniej statystyki dla próbki i jak odczytywać jej wartości z tablic?
n2
r
t

r

t tabl  t  / 2 { n  2 }
TEST STUDENTA
obl
2
sr
1 r

F obl 

TEST FISHERA

Ź ró d ło z m ien n o śc i

MSTR
MSE



R

nk

2

1 R

2

L ic zb a sto p n i
sw o b o d y

Suma
k w a d ra tó w

Ś re d n i
k w a d ra t

M o d el (c z yn n ik i)
B łą d (re sz ta )

k1
nk

SSTR
SSE

MSTR
MSE

R azem

n1

SSTO

TEST WALLACE’A

R obl 

R

2

k 1

F tabl  F { k  1 , n  k }

S ta ty sty k a
F
F obl 

MSTR
MSE

NIE MYLIĆ
STOPNI SWOBODY LICZNIKA I MIANOWNIKA

R tabl  R { k , n  k }

Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

Matematyczne techniki zarządzania - 133
Odczyt Rtabl z tablicy testu R (SKRYPT s.161-162)

, k,  = n-k

S to pn ie
sw ob od y
8
18
28

2
0,05
0,632
0,444
0,361

0,01
0,765
0,561
0,463

L iczb a zm ien n ych
3
0,05
0,01
0,726
0,827
0,532
0,633
0,439
0,530

4
0,05
0,777
0,587
0,490

0,01
0,860
0,678
0,573

Wnioski dotyczące rozkładu R Wallace’a-Snedecora:
• tablica zawiera maksymalne wartości współczynnika korelacji w danej
sytuacji, jakich można oczekiwać, gdy nie ma korelacji w populacji
• im wyższy poziom istotności, tym niższe Rtabl

• im większa liczba zmiennych w modelu, tym wyższe Rtabl
• im wyższa liczba stopni swobody (większa próbka), tym niższe Rtabl
• tablica R powstała z przeliczenia tablic t oraz F (odwrócenie wzorów)
• tablica testu R jest najszybszym i nawygodniejszym narzędziem do
weryfikacji istotności korelacji

Werdykt z etapu I:

Matematyczne techniki zarządzania - 134

• jeżeli Robl>Rtabl, model jest poprawny, można przejść do etapu II
• jeżeli Roblzmiennych objaśniających albo jego postać matematyczną
ETAP I OBOWIĄZUJE DLA WSZYSTKICH MODELI
ETAP I PRZEPROWADZA SIĘ DLA TRANSFORMATY (dla postaci pierwotnej
można uzyskać R>1)
Rola współczynnika determinacji R2
• korelacja może być istotna przy małym R i bardzo małym R2 (r=0,4,
R2=0,16, co oznacza, że tylko 16% zmienności zmiennej Y jest
wyjaśnione przez zmienną objaśniającą)
• małe R2 oznacza niski stopień wyjaśnienia rzeczywistości i stanowi
zagrożenie dla modelu
• należy dążyć (poprzez odpowiedni dobór zmiennych-przyczyn i postaci
matematycznej modelu) do jak największego R2 (dla postaci pierwotnej)
• wysoka wartość R2 świadczy o dobrym poznaniu badanego zjawiska
• wysoka wartość R2 bardzo często wynika jednak ze złego dobrania
zmiennych objaśniających (silnie powiązane ze sobą — „masło maślane”)
KORELACJA POZORNA — jest zależność, ale jej nie ma? Przyczyny...
Trzeba unikać wartości bezwzględnych (ludność, liczba sklepów, wielkość produkcji)

6

9

12

8

11

12

11

15

9

18

9

11

11

18

15

Matematyczne techniki zarządzania - 135
Etap II. Badanie wyrazistości modelu
Y

Wyrazistość modelu dana jest wzorem

s( y )

ui

y

W obl 

s( y )

100 %

y

Celem etapu
jest kontrola
rozrzutu danych

Współczynnik Wobl<30%, w przeciwnym
przypadku rozrzut danych jest zbyt duży

y

Kłopoty: gdyy jest bliskie 0

x

X

Werdykt: model poprawny lub niepoprawny

ETAP II OBOWIĄZUJE DLA WSZYSTKICH MODELI (ale nie ma on charakteru
statystycznego)

ETAP II PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ (sprawdzamy, czy
nie występuje silny efekt „krzywego lustra”)
Etap III. Badanie istotności parametrów (współczynników) modelu
Celem etapu jest sprawdzenie:
• czy poszczególne zmienne objaśniające mają istotny wpływ na zmienną
objaśnianą?
• czy zmienne objaśniające są wybrane prawidłowo?

• czy wyraz wolny różni się istotnie od zera?

Matematyczne techniki zarządzania - 136
Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

Problem istotności parametrów ai można rozpatrywać (tak jak problem
średniej dla populacji) z dwu punktów widzenia:
• przedziału ufności dla nieznanej wartości i

• hipotez — zerowej H0: i=0 i alternatywnej H1: i 0

1
0

ai

1

i

ISTOTNY (W PRZEDZIALE NIE MA ZERA)

0

ai

i

NIEISTOTNY (W PRZEDZIALE JEST ZERO)

P ( a i  t / 2 { n  k } s ( a i )   i  a i  t / 2 { n  k } s ( a i )  1  

Z tablicy rozkładu Studenta, a nie z wydruku komputerowego!

Matematyczne techniki zarządzania - 137
Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

W praktyce posługujemy się raczej hipotezami:
Badanie istotności przeprowadza
się dla każdego i oddzielnie:

t obl ( a i ) 

ai  0
s(a i )

t tabl  t  / 2 { n  k }

• jeżeli |tobl(ai)|>ttabl(ai), odrzucamy hipotezę zerową; parametr jest istotny z błędem równym co najwyżej 
• jeżeli |tobl(ai)|parametr nie jest istotny
Praktycznie jest to bardzo łatwe:
• sprawdzamy, czy |t(ai)| jest większe czy mniejsze od około 2, a najlepiej
• porównujemy rzeczywisty poziom istotności P(ai) z przyjętym 
ODRZUCAMY H0, JEŻELI P(ai) JEST MNIEJSZE OD 

WTEDY ZMIENNA
Xi MA WPŁYW NA
ZMIENNĄ Y

Matematyczne techniki zarządzania - 138
W etapie III następuje ostateczna selekcja zmiennych objaśniających:
• jeżeli wszystkie ai okażą się istotne, model jest poprawny:
— model przyczynowo-skutkowy: do interpretacji
— model tendencji rozwojowej: do etapu IV
• jeżeli choć jedno ai okaże się nieistotne, model jest niepoprawny i wymaga poprawy przez usunięcie nieistotnych zmiennych:
— zmienne należy usuwać po jednej (ze względu na efekt katalityczny)
— usuwa się zawsze zmienną o najniższej wartości |t(ai)| [czyli o
najwyższej wartości P(ai)]
— usunięcie ostatniej zmiennej nieistotnej kończy proces selekcji
kandydatek na zmienne,

— selekcja nie jest ostateczna, gdyż zawsze istnieje możliwość zamiany zmiennych, które są powiązane ze sobą
Praktyczne znaczenie istotności wyrazu wolnego a0
To są jedne z możliwości dla populacji (p. plansza 106)

Y

W przypadku funkcji K=f(P) wyraz wolny wyznacza poziom kosztów stałych (rachunkowość zarządcza)
W przypadku zależności technicznej Q=f(h) wyraz
wolny oznacza, że przy miąższości pokładu h=0 wydajność produkcji Q też jest równa 0

0
X

Matematyczne techniki zarządzania - 139
Praktyczne znaczenie istotności współczynnika regresji ai



KRZYWE NEYMANA — PLANSZE 106-107
WSPÓŁCZ. ISTOTNY
WSPÓŁ. NIEISTOTNY

ETAP III OBOWIĄZUJE DLA WSZYSTKICH MODELI
ETAP III PRZEPROWADZA SIĘ DLA TRANSFORMATY
Etap IV. Badanie symetrii składnika losowego

Y

CZĘSTOŚĆ RESZT DODATNICH I UJEMNYCH MA BYĆ
ZBLIŻONA

Y

ASYMETRYCZNY
SYMETRYCZNY

t
t
Badanie symetrii przeprowadza się testem Studenta (St. Bartosiewicz
Ekonometria)
Brak symetrii wymaga zmiany matematycznej postaci modelu
ETAP IV OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ

ETAP IV PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ

Matematyczne techniki zarządzania - 140
Etap V. Badanie losowości składnika losowego

Y

Y
NIELOSOWY

LOSOWY

t
t
Badanie losowości przeprowadza się testem Studenta lub testem serii
(Ekonometria, praca zb. pod red. M. Krzysztofiaka)
Brak losowości wymaga zmiany matematycznej postaci modelu
ETAP V OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP V PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ
Etap VI. Badanie stacjonarności składnika losowego
W etapie tym chodzi o niezależność wariancji składnika losowego od
zmiennej objaśniającej t (plansza 127)

Bada się istotność współczynnika korelacji ru t , t
ETAP VI OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VI PRZEPROWADZA SIĘ DLA TRANSFORMATY

Matematyczne techniki zarządzania - 141
Etap VII. Badanie wartości oczekiwanej składnika losowego
Normalnie, gdy przeprowadzamy estymację postaci liniowej, parametry
składnika losowego E ( )  0
{ ui  0}
V ( )  const
Po retransformacji do postaci pierwotnej mamy nowe reszty u’, dla
których
'
'
ui  0
 ui  0
Celem etapu jest sprawdzenie, czy odchyłka od O nie jest zbyt duża
(służy do tego test Studenta)
ETAP VII OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VII PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ
Etap VIII. Badanie autokorelacji składnika losowego
Pojęcie autokorelacji opisano na planszy 128; chodzi o istotność korelacji ru , u
t

tk

Badanie autokorelacji można przeprowadzić:

• testem R istotności korelacji ru

t

,ut  k

d obl

• testem Durbina-Watsona
NIE MA AUTOK.

d1

?

d2 JEST AUTOKORELACJA

ETAP VIII OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VIII PRZEPROWADZA SIĘ DLA TRANSFORMATY

Matematyczne techniki zarządzania - 142
Etap IX. Badanie normalności składnika losowego
Celem etapu jest stwierdzenie, czy reszty mają rozkład normalny
Analiza reszt — oddzielny dział analizy regresji i korelacji
Jeżeli reszty mają rozkład normalny, statystyk otrzymuje „ulgi”
ETAP 6. PRAKTYCZNA INTERPRETACJA MODELU



Celem etapu jest wydobycie z modelu całej nowej wiedzy, której nie widać
„gołym okiem”
INTERPRETUJĄC MODEL (RÓWNANIE REGRESJI) NALEŻY UŻYWAĆ WYŁĄCZNIE
PROSTEJ TERMINOLOGII EKONOMICZNEJ ZROZUMIAŁEJ DLA KLIENTA
NIE NALEŻY UŻYWAĆ TERMINOLOGII MATEMATYCZNEJ ZROZUMIAŁEJ TYLKO DLA
TWÓRCÓW MODELU
INTERPRETOWAĆ WOLNO TYLKO MODEL ZWERYFIKOWANY
CAŁY TRUD MODELOWANIA NIE MOŻE BYĆ „SZTUKĄ DLA SZTUKI”, LECZ MA
SŁUŻYĆ UZYSKANIU KONKRETNYCH WNIOSKÓW PRAKTYCZNYCH

Interpretacja modelu przyczynowo-skutkowego

Polega ona na określeniu wpływu poszczególnych czynników na badane
zjawisko:
• podział wszystkich czynników na trzy grupy

Matematyczne techniki zarządzania - 143
A — czynniki nie mające wpływu na Y
B — czynniki mające wpływ na Y i wprowadzone do modelu
C — czynniki mające wpływ na Y, ale nie występujące w modelu
• ocena jakościowa wpływu czynników B i C
• ocena ilościowa wpływu czynników B i C
Ocena jakościowa



Na podstawie znaków stojących przy współczynnikach r oraz ai możemy
stwierdzić, że wpływ jest:

• dodatni (im lepsze zaliczenie, tym lepszy wynik egzaminu; im więcej
wydatków na reklamę, tym większy zysk; itd.)
• ujemny (im więcej zatrudnionych, tym gorszy wynik finansowy; im
mniej braków, tym wyższy zysk; im mniejsza absencja, tym wyższe
wynagrodzenie; itd.)

Ocena ilościowa
• model liniowy
Przykład 33. Zinterpretuj zweryfikowany model zależności miesięcznych
kosztów działalności przedsiębiorstwa (tys. zł) od wielkości produkcji
(sztuk) i liczby reklamacji:
y i  50 , 8  14 , 5 x 1  3 , 9 x 2  

Matematyczne techniki zarządzania - 144
a0 = 50,8

poziom kosztów stałych; jeśli firma nie będzie prowadzić
żadnej działalności, poniesie koszty w wysokości 50,8 tys. zł

a1 = 14,5

każda sztuka produktu firmy kosztuje ją przeciętnie 14,5
tys. zł; jeżeli firma zwiększy produkcję o 2 sztuki, koszty
wzrosną o 29,0 tys. zł

a2 = 3,9każda wniesiona reklamacja powiększa koszty przeciętnie o
3,9 tys. zł
• model potęgowy
Przykłąd 34. Zinterpretuj zweryfikowaną funkcję produkcji Cobba-Douglasa
0 , 65

Pi  45 , 2 M i

0 , 73

Zi

e

0 , 04



Funkcja produkcji to specjalny model, określający zależność pomiędzy
produkcją (P) a czynnikami produkcji: majątkiem trwałym (M) i nakładami
robocizny (Z).



Funkcje produkcji to modele umożliwiające „prześwietlenie”
przedsiębiorstwa (szereg czasowy) lub branży (dane przekrojowe) i określenie poziomu gospodarowania oraz postępu
technicznego i organizacyjnego.
Elastyczność  to współczynnik określający reakcję zmiany
jednej zmiennej na inną zmienną — na przykład elastyczność
cenowa popytu (jak popyt zmienia się wraz z ceną towaru).

EKSPERCI
ZACHODNI

Matematyczne techniki zarządzania - 145

 

y
y

:

x

FUNKCJA POTĘGOWA JEST JEDYNĄ FUNKCJĄ O STAŁEJ ELASTYCZNOŚCI

x

Izolinie funkcji produkcji

T1
M

Produkcję P można osiągnąć różnymi
kombinacjami majątku i robocizny:

T2

• T1— technika kapitałochłonna, np.
pełna automatyzacja
• T2 — pośredni poziom techniki

T3
P  const

• T3 — niski poziom techniki, produkcja
pracochłonna
P. LOWE

Z
Efekt poprawy zarządzania bez
zmiany techniki (lepsze wykorzystanie ludzi i sprzętu):

P2
M

ZARZĄDZANIE
TECHNOLOGIĄ

P1

T

• zmniejszenie kapitałochłonności

• zmniejszenie pracochłonności
• zwiększenie produkcji (przejście z
funkcji P1 na P2)

Można też rozpatrzyć łączne efekty
zmiany techniki i zarządzania

Z

Matematyczne techniki zarządzania - 146
Wszystkie informacje tego typu można odczytać w trakcie interpretacji
0 , 65
0 , 73 0 , 04
funkcji produkcji:
Pi  45 , 2 M i
Zi
e

• wartości 45,2 nie interpretuje się
• wartość 0,65 to współczynnik elastyczności majątkowej (kapitałowej)
produkcji: zmiana majątku o 10% daje średnio zmianę produkcji o 6,5%
• wartość 0,73 to współczynnik elastyczności zatrudnieniowej produkcji:
zmiana zatrudnienia o 10% daje zmianę produkcji średnio o 7,3%
• suma obu współczynników k=0,65+0,73=1,38 to współczynnik skali
produkcji:

— jeżeli k<1, to firma rozwija się ekstensywnie
— jeżeli k>1, to firma rozwija się intensywnie
• wartość  = 0,04 to współczynnik postępu organizacyjnego:
— jeżeli  >O, to miał miejsce postęp organizacyjny

— jeżeli  <0, to miał miejsce regres organizacyjny
Interpretacja modelu tendencji rozwojowej

DODAMY
TROCHĘ
TEORII

Przypomnienie: t — zmienna objaśniająca (stałe przyrosty)
y — zmienna objaśniana; rozdzielana w ogólności na trzy
części: trend, wahania okresowe, wahania losowe ()

Matematyczne techniki zarządzania - 147
Wykres z planszy 117 (zużycie energii elektrycznej przez WZ AGH)
WAHANIA OKRESOWE OKREŚLA SIĘ WZGLĘDEM TRENDU A
NIE WZGLĘDEM OSI CZASU

y

trend

t
1995

1996

1997

1998

1999

Te trzy części trzeba zidentyfikować, a potem złożyć razem w model:

• addytywny (jeśli amplituda wahań jest stała)
• multiplikatywny (jeśli amplituda wahań rośnie lub maleje regularnie)
Wyznaczanie trendu
Metody mechaniczne:

• wskaźniki bezwzględne (stały przyrost =
postęp arytmetyczny = funkcja liniowa)
• wskaźniki względne (przyrost o stały procent =
postęp geometryczny = funkcja potęgowa)
• średnia ruchoma (wygładzanie danych linią łamaną)

JAK OBLICZYĆ O
ILE PROCENT ROCZNIE SPADAŁA
ŚREDNIO LICZBA
WIDZÓW W
KINACH:
1982 - 193,7 MLN
1989 - 141,3 MLN

Matematyczne techniki zarządzania - 148
Średnia ruchoma: mając szereg czasowy y1, y2,....., yn, przyjmujemy
długość kroku k = 3, lub 5, lub 7 itd. i liczymy
y  ...  y k
y  ...  y k  1
y k / 2 0 ,5  1
a następnie y k / 2  1 , 5  2
itd.
k
k
y  y2  y3
y  y3  y4
dla k=3:
y2  1
y3  2
itd.
3
3
Przykład 35. Wyznacz trend metodą średniej ruchomej dla następujących
danych:
okres
t
wartość yt

1
5

2
4

3
7

4
6

5
8

12

y2 
10

y3 

y

8

y4 

6
4

y5 

2

y6 

0
0

1

2

3

4

5

czas, t

6

7

8

9

y7 

547

6
10

 5 , 67

CECHY
ŚREDNIEJ
RUCHOMEJ:

 7 , 00

• TRACI SIĘ
k-1 DANYCH

3
768

8
8

 5 , 33

3
476

7
9

3
6  8  10

 8 , 00

3
8  10  9

 9 , 00

3
10  9  8

 9 , 00

• IM
WIĘKSZE k,
TYM
BARDZIEJ
SZTYWNY
TREND

3

Metody statystyczne: analiza regresji i korelacji, różne funkcje oparte na
modelach ekonomii

Matematyczne techniki zarządzania - 149
Wyznaczanie wahań okresowych: dobowych, tygodniowych, miesięcznych,
kwartalnych, rocznych, wieloletnich
Trzy metody:

— metoda wskaźników sezonowości
— metoda zmiennych zero-jedynkowych (0-1)

— metoda harmoniczna
Wszystkie metody mają jeden cel:
uzyskanie przeciętnego obrazu jednego cyklu

+

Ws
[t ]
[%]
trend

I

II



III

IV

WADY:
• KONIECZNOŚĆ
KOREKTY
• BRAK
WERYFIKACJI
STATYSTYCZNEJ

Metoda wskaźników sezonowości

• obliczenie surowych wskaźników sezonowości (wyeliminowanie trendu):
y

S s  yt  yt
S s  t
yt
addytywny multiplikatywny
wynik: n wartości odchyleń od trendu

• obliczenie oczyszczonych wskaźników
sezonowości (wyeliminowanie wahań
losowych):
 Ss
So 
k-liczba okresów
k
jednoimiennych
m-długość cyklu wynik: m wartości śr. odchyleń od trendu

Matematyczne techniki zarządzania - 150
Metoda zmiennych zero-jedynkowych (0-1)
m

y t  a 0  a1 t   bi Q i  
i 1

bi — przeciętne odchylenie od trendu dla
okresu i-tego
Qi — zmienna 0-1

wahania losowe
trend

wahania okresowe

t
1
2
3
4
5
6
7
8
9

yt
y1
y2
y3
y4
y5
y6
y7
y8
y9

Q1
1
0
0
0
1
0
0
0
1

Q2
0
1
0
0
0
1
0
0
0

Q3
0
0
1
0
0
0
1
0
0

Q4
0
0
0
1
0
0
0
1
0

Metoda harmoniczna (szeregi Fouriera)
Wahania okresowe przedstawia się jako sumę określonej liczby drgań harmonicznych (sinusoid i cosinusoid) przesuniętych w fazie, lecz o jednakowym okresie
m /2
2 i m / 2
2 i
y t  a 0  a 1 t   b1 i sin
  b 2 i cos

m
m
i 1
i 1
Obie metody dają taki sam wynik, istnieje możliwość weryfikacji
statystycznej
W metodzie 0-1 dostajemy bi = Ws, natomiast w metodzie harmonicznej Ws
jest sumą wartości poszczególnych sinusoid dla danego momentu czasu


Slide 20

Matematyczne techniki zarządzania - 121
ETAP 2. GROMADZENIE DANYCH STATYSTYCZNYCH

!

ZA JAKOŚĆ DANYCH ODPOWIADA MODELUJĄCY
• rodzaje danych: dane przekrojowe i szeregi czasowe
• źródła danych: roczniki statystyczne, różne działy
przedsiębiorstwa, badania marketingowe, wywiady itd.
• wiarygodność danych: do jakiego celu zostały one
przygotowane?

MUSISZ
SPRAWDZAĆ
KAŻDE DANE

• porównywalność danych: inflacja (ceny bieżące a ceny
stałe), zmiany procesów technicznych
Wielkość
produkcji

• zmienność zjawisk: trzeba sprawdzić, czy
wybrana w etapie 1a zmienna jest rzeczywiście zmienną losową

Wx 

s( x )

nowy zakład

100 %

x

stary zakład

Wx musi wynosić co najmniej 30-40%
Wiek studenta może być dobrą zmiennąprzyczyną, ale nie w przypadku studiów
dziennych!

Zatrudnienie

Matematyczne techniki zarządzania - 122
ETAP 3. SELEKCJA ZMIENNYCH OBJAŚNIAJĄCYCH
KAŻDĄ ZMIENNĄ X WYTYPOWANĄ W ETAPIE 1a TRAKTUJEMY JAKO
KANDYDATKĘ NA ZMIENNĄ OBJAŚNIAJĄCĄ
Może być kilka przyczyn powodujących, że taka kandydatka nie może znaleźć się w modelu ekonometrycznym (w równaniu regresji):
• w modelu nie może być zbyt wielu zmiennych (nieczytelny)
• kandydatka może nie mieć wpływu na zmienną Y



• kandydatka może wnosić prawie tę samą informację o Y co inna
kandydatka

• dwie bardzo podobne kandydatki mogą sobie nawzajem przeszkadzać
(efekt katalityczny)
Kryteria, jakie musi spełniać kandydatka Xi, aby nadawała się do modelu:
• musi być silnie powiązana ze zmienną Y

• nie może być powiązana z inną kandydatką Xj
SSTO
x1
x4

x2
x3

reszta

R2=0,79

R2=0,66

x2
x1
x4

R2=0,48

x3
reszta

reszta

SSTO

SSTO

Matematyczne techniki zarządzania - 123
Efekt katalityczny
DWIE ZMIENNE DAJĄ
RAZEM MNIEJ INFORMACJI NIŻ KAŻDA Z
NICH Z OSOBNA

x1

x2

R2=0,25

x2

x1

R2=0,52

R2=0,66

Selekcja kandydatek ma na celu podzielenie ich na trzy grupy:
• zmienne wprowadzone do modelu
• zmienne nie wprowadzone do modelu, ale reprezentowane w nim przez
inne zmienne (możliwość wymiany)
• zmienne nie wprowadzone do modelu ze względu na fakt, że nie wnoszą
żadnej informacji o zmiennej Y
INFORMACJE potrzebne do selekcji: współczynniki r x i x j ,
Macierz współczynników korelacji
Y
Y
X1
X2
X3

0,52
0,64
- 0,21

X1
0,52
0,82
- 0,18

X2
0,64
0,82
0,08

X3
- 0,21
- 0,18
0,08

r yx

i

Przykład 32. Macierz powiązania
zmiennych ze sobą przedstawia
się następująco (n=20). Jak ją
można zinterpretować? Które
zmienne są powiązane ze sobą w
sposób istotny?

Matematyczne techniki zarządzania - 124
Testowanie istotności współczynnika korelacji
H0:  = 0

Można je przeprowadzić trzema testami: testem Studenta

H1:   0

(t), Fishera (F) i Wallace’a-Snedecora (R)

Fragment tablicy rozkładu Wallece’a-Snedecora (SKRYPT, tab. VII, s.161)
S to pn ie
sw ob od y

2
0,05
0,632
0,444
0,361

8
18
28

,

0,01
0,765
0,561
0,463

L iczb a zm ien n ych
3
0,05
0,01
0,726
0,827
0,532
0,633
0,439
0,530

4
0,05
0,777
0,587
0,490

0,01
0,860
0,678
0,573

Reguła decyzyjna: — jeżeli |Robl|>Rtabl, odrzucamy H0 (korelacja istotna)
— jeżeli |Robl|
W przykładzie 32, jeżeli przyjmiemy  = 0,05, to Rtabl = 0,444.
Y
Y
X1
X2
X3

0,52
0,64
- 0,21

X1
0,52
0,82
- 0,18

X2
0,64
0,82
0,08

X3
- 0,21
- 0,18
0,08

Pozostaną zatem tylko trzy
istotne powiązania:
y-x1, y-x2, x1-x2
BRAK ISTOTNEGO POWIĄZANIA Z Y NIE
OZNACZA, ŻE ZMIENNA NIE WNOSI
ŻADNEJ INFORMACJI O ZJAWISKU Y

Matematyczne techniki zarządzania - 125



Metody selekcji zmiennych objaśniających:
• grafowa
• Hellwiga (pojemności informacji)
• taksonomiczne (clustering)
Metoda grafowa
• obliczenie macierzy współczynników:

rx

i

xj

• wyłowienie z macierzy powiązań istotnych

, r yx

BUDOWA GRAFU
i

• graf spójny

• budowa grafu z powiązań istotnych
• wybranie zmiennych na podstawie grafu

x6

• graf zerowy
x1
x4

x9

DO MODELU WYBIERA SIĘ ZMIENNE:
• każdy graf zerowy (jeśli |ryx|>0,1)

istotne powiązanie

• po jednej reprezentantce grafu spójnego;

reprezentantką grafu jest zmienna, która ma najwięcej powiązań z
innymi kandydatkami
jeżeli kilka zmiennych ma tę samą maksymalną liczbę powiązań, wybiera
się z nich tę, która jest najsilniej powiązana za zmienną Y (max ryx)
jeżeli graf jest rozległy, może mieć dwie reprezentantki, ale muszą one
leżeć na przeciwległych stronach grafu

Matematyczne techniki zarządzania - 126
Przykład 32 cd. Wybierzemy
zmienną x2 (reprezentantka grafu
spójnego) i zmienną x3 (graf
zerowy)
Metoda Hellwiga

Y
Y
X1
X2
X3

0,52
0,64
- 0,21

• wypisujemy wszystkie możliwe kombinacje
kandydatek; jest ich K = 2m—1
• obliczamy pojemność informacji dla każdej
zmiennej w każdej kombinacji

h kl  f ( r yx , r x
i

ixj

)

• obliczamy pojemność całkowitą dla każdej
kombinacji
H l   h kl
k

• wybieramy kombinację o największej
pojemności Hl = max

X1
0,52
0,82
- 0,18

X2
0,64
0,82

X3
- 0,21
- 0,18
0,08

0,08

W przykładzie 32 mamy 7
możliwych kombinacji kandydatek:
1. x1
2. x2

3. x3

maximum:

H6 = 0,42

4. x1,x2
5. x1,x3

Hmax = R2

6. x2,x3
7. x1,x2,x3

Metody taksonomiczne
Taksonomia wrocławska (cluster analysis) to metoda grupowania obiektów (zmiennych) w grupy jednorodne pod względem n cech (wymiarów)
łącznie. Podstawą grupowania jest odległość euklidesowa, która w przypadku zmiennych d ij  f ( r x x )
WSZYSTKIE METODY TO SELEKCJA WSTĘPNA
i

j

Matematyczne techniki zarządzania - 127
ETAP 4. ESTYMACJA PARAMETRÓW MODELU
Cel etapu: wyznaczenie parametrów strukturalnych i stochastycznych
Estymacja: szacowanie parametrów populacji na podstawie próbki
Metody estymacji: analiza regresji i korelacji (KMNK i inne)

Założenia dla KMNK
1. Zmienne losowe są prawdziwymi zmiennymi, nie powiązanymi ze sobą
2. Składnik losowy  ma stałą wariancję, niezależną od zmiennej x lub t
3. Wartości reszt ui są niezależne od siebie

4. Składnik losowy  nie jest powiązany ze zmienną objaśniającą
Skutki niedotrzymania założeń i środki zaradcze
1. Model bez sensu, nieprzydatny; niekiedy absurdalny (źle uwarunkowane
dane)
Stosuje się: dużą próbkę (n>100), regresję grzbietową (ridge regression)
2.

Y

reszta ui

Lewa część zbioru ma dużą wariancję, a
prawa — wariancję małą
Stosuje się specjalny wariant MNK z
korektą na różne wariancje
X

Matematyczne techniki zarządzania - 128
3. Jeśli reszty ui są ze sobą powiązane (skorelowane), mówimy, że
występuje autokorelacja składnika losowego (zjawisko występuje przy
szeregach czasowych — sztywny porządek obserwacji)
Oznacza to, że istnieje istotna zależność u t  f ( u t  k )
Przyczyny autokorelacji: zakłócenia
(dodatnie lub ujemne) w jednym okresie
wpływają na poziom zjawiska w następnych
okresach (rolnictwo, produkcja, rynek)

t  1 , 2 ,...

u t  y t  yˆ t

u t 1

u1
u2
u3
u4
u5

Występowanie autokorelacji powoduje
nieprzydatność modelu


u1
u2
u3
u4

Istnienie autokorelacji sprawdza się testem
Durbina-Watsona d
Stosuje się metodę różniczki zupełnej

y  f (x )

yt  yt  ytk

4. Składnik losowy jest skorelowany ze zmienną objaśniającą, wtedy
gdy została pominięta jakaś ważna zmienna-przyczyna

Model taki nie ma żadnej wartości; trzeba dbać o jak najwyższy współczynnik determinacji (R2>0,9)
• zbiór danych rzeczywistych nigdy
nie spełnia tych wymagań

ESTYMACJĘ MODELU POWTARZA SIĘ WIELOKROTNIE
ponieważ dopiero weryfikacja zapewnia ostateczną selekcję
kandydatek na zmienne objaśniające

• ekonometria to analiza danych nie
spełniających tych założeń
• nie stosować statystyki bezmyślnie (na ślepo)

Matematyczne techniki zarządzania - 129
ETAP 5. WERYFIKACJA MODELU
Cele:

1. opis rzeczywistości (populacji generalnej)



2. dokładna (ostateczna) selekcja zmiennych objaśniających
3. poznanie składnika losowego (spełnienie założeń KMNK)
Narzędzia: hipotezy i testy statystyczne

Metodyka: każde równanie oddzielnie; weryfikacja obejmuje 9 etapów (od
najmniej do najbardziej pracochłonnego)
WYKAZ ETAPÓW WERYFIKACJI MODELU
I.
II.

Badanie istotności korelacji
Badanie wyrazistości modelu

III.

Badanie istotności parametrów

IV.

Badanie symetrii skł. losowego

V.
VI.
VII.
VIII.
IX.

Badanie losowości skł. losowego
Badanie stacjonarności skł. los.
Badanie wartości oczekiwanej skł. los.
Badanie autokorelacji skł. losowego
Badanie normalności skł. losowego

Opis każdego etapu weryfikacji
obejmuje:
• cel etapu
• sposób weryfikacji: wzory,
hipotezy, testy
• podanie których modeli dotyczy (przyczynowo-skutkowych
czy tendencji rozwojowej)
• podanie której postaci modeli
nieliniowych dotyczy (pierwotnej czy transformaty)

Matematyczne techniki zarządzania - 130
Etap I. Badanie istotności korelacji
7
2

8

9

11

12

17

19

23

21

5
2 etapu
9
16
7
9
15
14
Celem
jest
sprawdzenie,
czy
istnieje w populacji generalnej powiązanie pomiędzy zmienną Y i wszystkimi zmiennymi objaśniającymi

25

Przedział ufności dla
nieznanego współczynnika korelacji  dla populacji buduje się przy
użyciu błędu

populacja

zmienna Y

20
15
10

próbka

5
0
8
5

0 9

1011

2

9

20
12

30
17
16
7
zmienna X

25

1940
9

23 50
15

populacja

20

zmienna Y

7
2

15
10

próbka

5
0
0

10

20

30

zmienna X

40

50

21
14

sR 

1 R

0

Robl

2

nk

Istotność korelacji weryfikuje się przez postawienie
następujących hipotez dla
współczynnika korelacji dla
populacji generalnej:

1
R,|r|

H0 :   0

Brak korelacji, nie ma powiązania...

H1 :   0

Korelacja istotna, jest powiązanie...

,

Matematyczne techniki zarządzania - 131
Hipotezy te można weryfikować trzema równoważnymi testami:
• testem t Studenta (tylko dla regresji dwu zmiennych)
• testem F Fishera-Snedecora
• testem R Wallace’a-Snedecora

,

W każdym przypadku obliczamy wartość
statystyki dla próbki (tobl, Fobl, Robl) i porównujemy z wartością krytyczną odczytaną z tablicy odpowiedniego rozkładu w
funkcji poziomu istotności i liczby stopni
swobody (ttabl, Ftabl, Rtabl)

Reguła decyzyjna:
• jeżeli |tobl|< ttabl, nie ma podstaw do odrzucenia H0 (brak korelacji)
• jeżeli |tobl|> ttabl, odrzucamy H0 na korzyść H1 (korelacja istnieje)

TAK SAMO DLA
FiR

W przypadku regresji wielorakiej, gdy liczba zmiennych objaśniajacych
jest duża w porównaniu do liczby obserwacji, współczynnik determinacji
R2 może dawać zawyżoną ocenę stopnia wyjaśnienia zmienności zmiennej
objaśnianej; dlatego wprowadzono skorygowany współczynnik determinacji (i korelacji):
 ( yˆ i  y )

R

2

2

k
n

k

1


2
nk 1
(
y

y
)

i
n1

• adjusted coefficient of multiple
determination (wydruki komputerowe)

• jeśli k jest małe, nie ma większej różnicy
pomiędzy normalnym a skorygowanym R2

Matematyczne techniki zarządzania - 132
Skąd wziąć wartość odpowiedniej statystyki dla próbki i jak odczytywać jej wartości z tablic?
n2
r
t

r

t tabl  t  / 2 { n  2 }
TEST STUDENTA
obl
2
sr
1 r

F obl 

TEST FISHERA

Ź ró d ło z m ien n o śc i

MSTR
MSE



R

nk

2

1 R

2

L ic zb a sto p n i
sw o b o d y

Suma
k w a d ra tó w

Ś re d n i
k w a d ra t

M o d el (c z yn n ik i)
B łą d (re sz ta )

k1
nk

SSTR
SSE

MSTR
MSE

R azem

n1

SSTO

TEST WALLACE’A

R obl 

R

2

k 1

F tabl  F { k  1 , n  k }

S ta ty sty k a
F
F obl 

MSTR
MSE

NIE MYLIĆ
STOPNI SWOBODY LICZNIKA I MIANOWNIKA

R tabl  R { k , n  k }

Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

Matematyczne techniki zarządzania - 133
Odczyt Rtabl z tablicy testu R (SKRYPT s.161-162)

, k,  = n-k

S to pn ie
sw ob od y
8
18
28

2
0,05
0,632
0,444
0,361

0,01
0,765
0,561
0,463

L iczb a zm ien n ych
3
0,05
0,01
0,726
0,827
0,532
0,633
0,439
0,530

4
0,05
0,777
0,587
0,490

0,01
0,860
0,678
0,573

Wnioski dotyczące rozkładu R Wallace’a-Snedecora:
• tablica zawiera maksymalne wartości współczynnika korelacji w danej
sytuacji, jakich można oczekiwać, gdy nie ma korelacji w populacji
• im wyższy poziom istotności, tym niższe Rtabl

• im większa liczba zmiennych w modelu, tym wyższe Rtabl
• im wyższa liczba stopni swobody (większa próbka), tym niższe Rtabl
• tablica R powstała z przeliczenia tablic t oraz F (odwrócenie wzorów)
• tablica testu R jest najszybszym i nawygodniejszym narzędziem do
weryfikacji istotności korelacji

Werdykt z etapu I:

Matematyczne techniki zarządzania - 134

• jeżeli Robl>Rtabl, model jest poprawny, można przejść do etapu II
• jeżeli Roblzmiennych objaśniających albo jego postać matematyczną
ETAP I OBOWIĄZUJE DLA WSZYSTKICH MODELI
ETAP I PRZEPROWADZA SIĘ DLA TRANSFORMATY (dla postaci pierwotnej
można uzyskać R>1)
Rola współczynnika determinacji R2
• korelacja może być istotna przy małym R i bardzo małym R2 (r=0,4,
R2=0,16, co oznacza, że tylko 16% zmienności zmiennej Y jest
wyjaśnione przez zmienną objaśniającą)
• małe R2 oznacza niski stopień wyjaśnienia rzeczywistości i stanowi
zagrożenie dla modelu
• należy dążyć (poprzez odpowiedni dobór zmiennych-przyczyn i postaci
matematycznej modelu) do jak największego R2 (dla postaci pierwotnej)
• wysoka wartość R2 świadczy o dobrym poznaniu badanego zjawiska
• wysoka wartość R2 bardzo często wynika jednak ze złego dobrania
zmiennych objaśniających (silnie powiązane ze sobą — „masło maślane”)
KORELACJA POZORNA — jest zależność, ale jej nie ma? Przyczyny...
Trzeba unikać wartości bezwzględnych (ludność, liczba sklepów, wielkość produkcji)

6

9

12

8

11

12

11

15

9

18

9

11

11

18

15

Matematyczne techniki zarządzania - 135
Etap II. Badanie wyrazistości modelu
Y

Wyrazistość modelu dana jest wzorem

s( y )

ui

y

W obl 

s( y )

100 %

y

Celem etapu
jest kontrola
rozrzutu danych

Współczynnik Wobl<30%, w przeciwnym
przypadku rozrzut danych jest zbyt duży

y

Kłopoty: gdyy jest bliskie 0

x

X

Werdykt: model poprawny lub niepoprawny

ETAP II OBOWIĄZUJE DLA WSZYSTKICH MODELI (ale nie ma on charakteru
statystycznego)

ETAP II PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ (sprawdzamy, czy
nie występuje silny efekt „krzywego lustra”)
Etap III. Badanie istotności parametrów (współczynników) modelu
Celem etapu jest sprawdzenie:
• czy poszczególne zmienne objaśniające mają istotny wpływ na zmienną
objaśnianą?
• czy zmienne objaśniające są wybrane prawidłowo?

• czy wyraz wolny różni się istotnie od zera?

Matematyczne techniki zarządzania - 136
Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

Problem istotności parametrów ai można rozpatrywać (tak jak problem
średniej dla populacji) z dwu punktów widzenia:
• przedziału ufności dla nieznanej wartości i

• hipotez — zerowej H0: i=0 i alternatywnej H1: i 0

1
0

ai

1

i

ISTOTNY (W PRZEDZIALE NIE MA ZERA)

0

ai

i

NIEISTOTNY (W PRZEDZIALE JEST ZERO)

P ( a i  t / 2 { n  k } s ( a i )   i  a i  t / 2 { n  k } s ( a i )  1  

Z tablicy rozkładu Studenta, a nie z wydruku komputerowego!

Matematyczne techniki zarządzania - 137
Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

W praktyce posługujemy się raczej hipotezami:
Badanie istotności przeprowadza
się dla każdego i oddzielnie:

t obl ( a i ) 

ai  0
s(a i )

t tabl  t  / 2 { n  k }

• jeżeli |tobl(ai)|>ttabl(ai), odrzucamy hipotezę zerową; parametr jest istotny z błędem równym co najwyżej 
• jeżeli |tobl(ai)|parametr nie jest istotny
Praktycznie jest to bardzo łatwe:
• sprawdzamy, czy |t(ai)| jest większe czy mniejsze od około 2, a najlepiej
• porównujemy rzeczywisty poziom istotności P(ai) z przyjętym 
ODRZUCAMY H0, JEŻELI P(ai) JEST MNIEJSZE OD 

WTEDY ZMIENNA
Xi MA WPŁYW NA
ZMIENNĄ Y

Matematyczne techniki zarządzania - 138
W etapie III następuje ostateczna selekcja zmiennych objaśniających:
• jeżeli wszystkie ai okażą się istotne, model jest poprawny:
— model przyczynowo-skutkowy: do interpretacji
— model tendencji rozwojowej: do etapu IV
• jeżeli choć jedno ai okaże się nieistotne, model jest niepoprawny i wymaga poprawy przez usunięcie nieistotnych zmiennych:
— zmienne należy usuwać po jednej (ze względu na efekt katalityczny)
— usuwa się zawsze zmienną o najniższej wartości |t(ai)| [czyli o
najwyższej wartości P(ai)]
— usunięcie ostatniej zmiennej nieistotnej kończy proces selekcji
kandydatek na zmienne,

— selekcja nie jest ostateczna, gdyż zawsze istnieje możliwość zamiany zmiennych, które są powiązane ze sobą
Praktyczne znaczenie istotności wyrazu wolnego a0
To są jedne z możliwości dla populacji (p. plansza 106)

Y

W przypadku funkcji K=f(P) wyraz wolny wyznacza poziom kosztów stałych (rachunkowość zarządcza)
W przypadku zależności technicznej Q=f(h) wyraz
wolny oznacza, że przy miąższości pokładu h=0 wydajność produkcji Q też jest równa 0

0
X

Matematyczne techniki zarządzania - 139
Praktyczne znaczenie istotności współczynnika regresji ai



KRZYWE NEYMANA — PLANSZE 106-107
WSPÓŁCZ. ISTOTNY
WSPÓŁ. NIEISTOTNY

ETAP III OBOWIĄZUJE DLA WSZYSTKICH MODELI
ETAP III PRZEPROWADZA SIĘ DLA TRANSFORMATY
Etap IV. Badanie symetrii składnika losowego

Y

CZĘSTOŚĆ RESZT DODATNICH I UJEMNYCH MA BYĆ
ZBLIŻONA

Y

ASYMETRYCZNY
SYMETRYCZNY

t
t
Badanie symetrii przeprowadza się testem Studenta (St. Bartosiewicz
Ekonometria)
Brak symetrii wymaga zmiany matematycznej postaci modelu
ETAP IV OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ

ETAP IV PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ

Matematyczne techniki zarządzania - 140
Etap V. Badanie losowości składnika losowego

Y

Y
NIELOSOWY

LOSOWY

t
t
Badanie losowości przeprowadza się testem Studenta lub testem serii
(Ekonometria, praca zb. pod red. M. Krzysztofiaka)
Brak losowości wymaga zmiany matematycznej postaci modelu
ETAP V OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP V PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ
Etap VI. Badanie stacjonarności składnika losowego
W etapie tym chodzi o niezależność wariancji składnika losowego od
zmiennej objaśniającej t (plansza 127)

Bada się istotność współczynnika korelacji ru t , t
ETAP VI OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VI PRZEPROWADZA SIĘ DLA TRANSFORMATY

Matematyczne techniki zarządzania - 141
Etap VII. Badanie wartości oczekiwanej składnika losowego
Normalnie, gdy przeprowadzamy estymację postaci liniowej, parametry
składnika losowego E ( )  0
{ ui  0}
V ( )  const
Po retransformacji do postaci pierwotnej mamy nowe reszty u’, dla
których
'
'
ui  0
 ui  0
Celem etapu jest sprawdzenie, czy odchyłka od O nie jest zbyt duża
(służy do tego test Studenta)
ETAP VII OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VII PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ
Etap VIII. Badanie autokorelacji składnika losowego
Pojęcie autokorelacji opisano na planszy 128; chodzi o istotność korelacji ru , u
t

tk

Badanie autokorelacji można przeprowadzić:

• testem R istotności korelacji ru

t

,ut  k

d obl

• testem Durbina-Watsona
NIE MA AUTOK.

d1

?

d2 JEST AUTOKORELACJA

ETAP VIII OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VIII PRZEPROWADZA SIĘ DLA TRANSFORMATY

Matematyczne techniki zarządzania - 142
Etap IX. Badanie normalności składnika losowego
Celem etapu jest stwierdzenie, czy reszty mają rozkład normalny
Analiza reszt — oddzielny dział analizy regresji i korelacji
Jeżeli reszty mają rozkład normalny, statystyk otrzymuje „ulgi”
ETAP 6. PRAKTYCZNA INTERPRETACJA MODELU



Celem etapu jest wydobycie z modelu całej nowej wiedzy, której nie widać
„gołym okiem”
INTERPRETUJĄC MODEL (RÓWNANIE REGRESJI) NALEŻY UŻYWAĆ WYŁĄCZNIE
PROSTEJ TERMINOLOGII EKONOMICZNEJ ZROZUMIAŁEJ DLA KLIENTA
NIE NALEŻY UŻYWAĆ TERMINOLOGII MATEMATYCZNEJ ZROZUMIAŁEJ TYLKO DLA
TWÓRCÓW MODELU
INTERPRETOWAĆ WOLNO TYLKO MODEL ZWERYFIKOWANY
CAŁY TRUD MODELOWANIA NIE MOŻE BYĆ „SZTUKĄ DLA SZTUKI”, LECZ MA
SŁUŻYĆ UZYSKANIU KONKRETNYCH WNIOSKÓW PRAKTYCZNYCH

Interpretacja modelu przyczynowo-skutkowego

Polega ona na określeniu wpływu poszczególnych czynników na badane
zjawisko:
• podział wszystkich czynników na trzy grupy

Matematyczne techniki zarządzania - 143
A — czynniki nie mające wpływu na Y
B — czynniki mające wpływ na Y i wprowadzone do modelu
C — czynniki mające wpływ na Y, ale nie występujące w modelu
• ocena jakościowa wpływu czynników B i C
• ocena ilościowa wpływu czynników B i C
Ocena jakościowa



Na podstawie znaków stojących przy współczynnikach r oraz ai możemy
stwierdzić, że wpływ jest:

• dodatni (im lepsze zaliczenie, tym lepszy wynik egzaminu; im więcej
wydatków na reklamę, tym większy zysk; itd.)
• ujemny (im więcej zatrudnionych, tym gorszy wynik finansowy; im
mniej braków, tym wyższy zysk; im mniejsza absencja, tym wyższe
wynagrodzenie; itd.)

Ocena ilościowa
• model liniowy
Przykład 33. Zinterpretuj zweryfikowany model zależności miesięcznych
kosztów działalności przedsiębiorstwa (tys. zł) od wielkości produkcji
(sztuk) i liczby reklamacji:
y i  50 , 8  14 , 5 x 1  3 , 9 x 2  

Matematyczne techniki zarządzania - 144
a0 = 50,8

poziom kosztów stałych; jeśli firma nie będzie prowadzić
żadnej działalności, poniesie koszty w wysokości 50,8 tys. zł

a1 = 14,5

każda sztuka produktu firmy kosztuje ją przeciętnie 14,5
tys. zł; jeżeli firma zwiększy produkcję o 2 sztuki, koszty
wzrosną o 29,0 tys. zł

a2 = 3,9każda wniesiona reklamacja powiększa koszty przeciętnie o
3,9 tys. zł
• model potęgowy
Przykłąd 34. Zinterpretuj zweryfikowaną funkcję produkcji Cobba-Douglasa
0 , 65

Pi  45 , 2 M i

0 , 73

Zi

e

0 , 04



Funkcja produkcji to specjalny model, określający zależność pomiędzy
produkcją (P) a czynnikami produkcji: majątkiem trwałym (M) i nakładami
robocizny (Z).



Funkcje produkcji to modele umożliwiające „prześwietlenie”
przedsiębiorstwa (szereg czasowy) lub branży (dane przekrojowe) i określenie poziomu gospodarowania oraz postępu
technicznego i organizacyjnego.
Elastyczność  to współczynnik określający reakcję zmiany
jednej zmiennej na inną zmienną — na przykład elastyczność
cenowa popytu (jak popyt zmienia się wraz z ceną towaru).

EKSPERCI
ZACHODNI

Matematyczne techniki zarządzania - 145

 

y
y

:

x

FUNKCJA POTĘGOWA JEST JEDYNĄ FUNKCJĄ O STAŁEJ ELASTYCZNOŚCI

x

Izolinie funkcji produkcji

T1
M

Produkcję P można osiągnąć różnymi
kombinacjami majątku i robocizny:

T2

• T1— technika kapitałochłonna, np.
pełna automatyzacja
• T2 — pośredni poziom techniki

T3
P  const

• T3 — niski poziom techniki, produkcja
pracochłonna
P. LOWE

Z
Efekt poprawy zarządzania bez
zmiany techniki (lepsze wykorzystanie ludzi i sprzętu):

P2
M

ZARZĄDZANIE
TECHNOLOGIĄ

P1

T

• zmniejszenie kapitałochłonności

• zmniejszenie pracochłonności
• zwiększenie produkcji (przejście z
funkcji P1 na P2)

Można też rozpatrzyć łączne efekty
zmiany techniki i zarządzania

Z

Matematyczne techniki zarządzania - 146
Wszystkie informacje tego typu można odczytać w trakcie interpretacji
0 , 65
0 , 73 0 , 04
funkcji produkcji:
Pi  45 , 2 M i
Zi
e

• wartości 45,2 nie interpretuje się
• wartość 0,65 to współczynnik elastyczności majątkowej (kapitałowej)
produkcji: zmiana majątku o 10% daje średnio zmianę produkcji o 6,5%
• wartość 0,73 to współczynnik elastyczności zatrudnieniowej produkcji:
zmiana zatrudnienia o 10% daje zmianę produkcji średnio o 7,3%
• suma obu współczynników k=0,65+0,73=1,38 to współczynnik skali
produkcji:

— jeżeli k<1, to firma rozwija się ekstensywnie
— jeżeli k>1, to firma rozwija się intensywnie
• wartość  = 0,04 to współczynnik postępu organizacyjnego:
— jeżeli  >O, to miał miejsce postęp organizacyjny

— jeżeli  <0, to miał miejsce regres organizacyjny
Interpretacja modelu tendencji rozwojowej

DODAMY
TROCHĘ
TEORII

Przypomnienie: t — zmienna objaśniająca (stałe przyrosty)
y — zmienna objaśniana; rozdzielana w ogólności na trzy
części: trend, wahania okresowe, wahania losowe ()

Matematyczne techniki zarządzania - 147
Wykres z planszy 117 (zużycie energii elektrycznej przez WZ AGH)
WAHANIA OKRESOWE OKREŚLA SIĘ WZGLĘDEM TRENDU A
NIE WZGLĘDEM OSI CZASU

y

trend

t
1995

1996

1997

1998

1999

Te trzy części trzeba zidentyfikować, a potem złożyć razem w model:

• addytywny (jeśli amplituda wahań jest stała)
• multiplikatywny (jeśli amplituda wahań rośnie lub maleje regularnie)
Wyznaczanie trendu
Metody mechaniczne:

• wskaźniki bezwzględne (stały przyrost =
postęp arytmetyczny = funkcja liniowa)
• wskaźniki względne (przyrost o stały procent =
postęp geometryczny = funkcja potęgowa)
• średnia ruchoma (wygładzanie danych linią łamaną)

JAK OBLICZYĆ O
ILE PROCENT ROCZNIE SPADAŁA
ŚREDNIO LICZBA
WIDZÓW W
KINACH:
1982 - 193,7 MLN
1989 - 141,3 MLN

Matematyczne techniki zarządzania - 148
Średnia ruchoma: mając szereg czasowy y1, y2,....., yn, przyjmujemy
długość kroku k = 3, lub 5, lub 7 itd. i liczymy
y  ...  y k
y  ...  y k  1
y k / 2 0 ,5  1
a następnie y k / 2  1 , 5  2
itd.
k
k
y  y2  y3
y  y3  y4
dla k=3:
y2  1
y3  2
itd.
3
3
Przykład 35. Wyznacz trend metodą średniej ruchomej dla następujących
danych:
okres
t
wartość yt

1
5

2
4

3
7

4
6

5
8

12

y2 
10

y3 

y

8

y4 

6
4

y5 

2

y6 

0
0

1

2

3

4

5

czas, t

6

7

8

9

y7 

547

6
10

 5 , 67

CECHY
ŚREDNIEJ
RUCHOMEJ:

 7 , 00

• TRACI SIĘ
k-1 DANYCH

3
768

8
8

 5 , 33

3
476

7
9

3
6  8  10

 8 , 00

3
8  10  9

 9 , 00

3
10  9  8

 9 , 00

• IM
WIĘKSZE k,
TYM
BARDZIEJ
SZTYWNY
TREND

3

Metody statystyczne: analiza regresji i korelacji, różne funkcje oparte na
modelach ekonomii

Matematyczne techniki zarządzania - 149
Wyznaczanie wahań okresowych: dobowych, tygodniowych, miesięcznych,
kwartalnych, rocznych, wieloletnich
Trzy metody:

— metoda wskaźników sezonowości
— metoda zmiennych zero-jedynkowych (0-1)

— metoda harmoniczna
Wszystkie metody mają jeden cel:
uzyskanie przeciętnego obrazu jednego cyklu

+

Ws
[t ]
[%]
trend

I

II



III

IV

WADY:
• KONIECZNOŚĆ
KOREKTY
• BRAK
WERYFIKACJI
STATYSTYCZNEJ

Metoda wskaźników sezonowości

• obliczenie surowych wskaźników sezonowości (wyeliminowanie trendu):
y

S s  yt  yt
S s  t
yt
addytywny multiplikatywny
wynik: n wartości odchyleń od trendu

• obliczenie oczyszczonych wskaźników
sezonowości (wyeliminowanie wahań
losowych):
 Ss
So 
k-liczba okresów
k
jednoimiennych
m-długość cyklu wynik: m wartości śr. odchyleń od trendu

Matematyczne techniki zarządzania - 150
Metoda zmiennych zero-jedynkowych (0-1)
m

y t  a 0  a1 t   bi Q i  
i 1

bi — przeciętne odchylenie od trendu dla
okresu i-tego
Qi — zmienna 0-1

wahania losowe
trend

wahania okresowe

t
1
2
3
4
5
6
7
8
9

yt
y1
y2
y3
y4
y5
y6
y7
y8
y9

Q1
1
0
0
0
1
0
0
0
1

Q2
0
1
0
0
0
1
0
0
0

Q3
0
0
1
0
0
0
1
0
0

Q4
0
0
0
1
0
0
0
1
0

Metoda harmoniczna (szeregi Fouriera)
Wahania okresowe przedstawia się jako sumę określonej liczby drgań harmonicznych (sinusoid i cosinusoid) przesuniętych w fazie, lecz o jednakowym okresie
m /2
2 i m / 2
2 i
y t  a 0  a 1 t   b1 i sin
  b 2 i cos

m
m
i 1
i 1
Obie metody dają taki sam wynik, istnieje możliwość weryfikacji
statystycznej
W metodzie 0-1 dostajemy bi = Ws, natomiast w metodzie harmonicznej Ws
jest sumą wartości poszczególnych sinusoid dla danego momentu czasu


Slide 21

Matematyczne techniki zarządzania - 121
ETAP 2. GROMADZENIE DANYCH STATYSTYCZNYCH

!

ZA JAKOŚĆ DANYCH ODPOWIADA MODELUJĄCY
• rodzaje danych: dane przekrojowe i szeregi czasowe
• źródła danych: roczniki statystyczne, różne działy
przedsiębiorstwa, badania marketingowe, wywiady itd.
• wiarygodność danych: do jakiego celu zostały one
przygotowane?

MUSISZ
SPRAWDZAĆ
KAŻDE DANE

• porównywalność danych: inflacja (ceny bieżące a ceny
stałe), zmiany procesów technicznych
Wielkość
produkcji

• zmienność zjawisk: trzeba sprawdzić, czy
wybrana w etapie 1a zmienna jest rzeczywiście zmienną losową

Wx 

s( x )

nowy zakład

100 %

x

stary zakład

Wx musi wynosić co najmniej 30-40%
Wiek studenta może być dobrą zmiennąprzyczyną, ale nie w przypadku studiów
dziennych!

Zatrudnienie

Matematyczne techniki zarządzania - 122
ETAP 3. SELEKCJA ZMIENNYCH OBJAŚNIAJĄCYCH
KAŻDĄ ZMIENNĄ X WYTYPOWANĄ W ETAPIE 1a TRAKTUJEMY JAKO
KANDYDATKĘ NA ZMIENNĄ OBJAŚNIAJĄCĄ
Może być kilka przyczyn powodujących, że taka kandydatka nie może znaleźć się w modelu ekonometrycznym (w równaniu regresji):
• w modelu nie może być zbyt wielu zmiennych (nieczytelny)
• kandydatka może nie mieć wpływu na zmienną Y



• kandydatka może wnosić prawie tę samą informację o Y co inna
kandydatka

• dwie bardzo podobne kandydatki mogą sobie nawzajem przeszkadzać
(efekt katalityczny)
Kryteria, jakie musi spełniać kandydatka Xi, aby nadawała się do modelu:
• musi być silnie powiązana ze zmienną Y

• nie może być powiązana z inną kandydatką Xj
SSTO
x1
x4

x2
x3

reszta

R2=0,79

R2=0,66

x2
x1
x4

R2=0,48

x3
reszta

reszta

SSTO

SSTO

Matematyczne techniki zarządzania - 123
Efekt katalityczny
DWIE ZMIENNE DAJĄ
RAZEM MNIEJ INFORMACJI NIŻ KAŻDA Z
NICH Z OSOBNA

x1

x2

R2=0,25

x2

x1

R2=0,52

R2=0,66

Selekcja kandydatek ma na celu podzielenie ich na trzy grupy:
• zmienne wprowadzone do modelu
• zmienne nie wprowadzone do modelu, ale reprezentowane w nim przez
inne zmienne (możliwość wymiany)
• zmienne nie wprowadzone do modelu ze względu na fakt, że nie wnoszą
żadnej informacji o zmiennej Y
INFORMACJE potrzebne do selekcji: współczynniki r x i x j ,
Macierz współczynników korelacji
Y
Y
X1
X2
X3

0,52
0,64
- 0,21

X1
0,52
0,82
- 0,18

X2
0,64
0,82
0,08

X3
- 0,21
- 0,18
0,08

r yx

i

Przykład 32. Macierz powiązania
zmiennych ze sobą przedstawia
się następująco (n=20). Jak ją
można zinterpretować? Które
zmienne są powiązane ze sobą w
sposób istotny?

Matematyczne techniki zarządzania - 124
Testowanie istotności współczynnika korelacji
H0:  = 0

Można je przeprowadzić trzema testami: testem Studenta

H1:   0

(t), Fishera (F) i Wallace’a-Snedecora (R)

Fragment tablicy rozkładu Wallece’a-Snedecora (SKRYPT, tab. VII, s.161)
S to pn ie
sw ob od y

2
0,05
0,632
0,444
0,361

8
18
28

,

0,01
0,765
0,561
0,463

L iczb a zm ien n ych
3
0,05
0,01
0,726
0,827
0,532
0,633
0,439
0,530

4
0,05
0,777
0,587
0,490

0,01
0,860
0,678
0,573

Reguła decyzyjna: — jeżeli |Robl|>Rtabl, odrzucamy H0 (korelacja istotna)
— jeżeli |Robl|
W przykładzie 32, jeżeli przyjmiemy  = 0,05, to Rtabl = 0,444.
Y
Y
X1
X2
X3

0,52
0,64
- 0,21

X1
0,52
0,82
- 0,18

X2
0,64
0,82
0,08

X3
- 0,21
- 0,18
0,08

Pozostaną zatem tylko trzy
istotne powiązania:
y-x1, y-x2, x1-x2
BRAK ISTOTNEGO POWIĄZANIA Z Y NIE
OZNACZA, ŻE ZMIENNA NIE WNOSI
ŻADNEJ INFORMACJI O ZJAWISKU Y

Matematyczne techniki zarządzania - 125



Metody selekcji zmiennych objaśniających:
• grafowa
• Hellwiga (pojemności informacji)
• taksonomiczne (clustering)
Metoda grafowa
• obliczenie macierzy współczynników:

rx

i

xj

• wyłowienie z macierzy powiązań istotnych

, r yx

BUDOWA GRAFU
i

• graf spójny

• budowa grafu z powiązań istotnych
• wybranie zmiennych na podstawie grafu

x6

• graf zerowy
x1
x4

x9

DO MODELU WYBIERA SIĘ ZMIENNE:
• każdy graf zerowy (jeśli |ryx|>0,1)

istotne powiązanie

• po jednej reprezentantce grafu spójnego;

reprezentantką grafu jest zmienna, która ma najwięcej powiązań z
innymi kandydatkami
jeżeli kilka zmiennych ma tę samą maksymalną liczbę powiązań, wybiera
się z nich tę, która jest najsilniej powiązana za zmienną Y (max ryx)
jeżeli graf jest rozległy, może mieć dwie reprezentantki, ale muszą one
leżeć na przeciwległych stronach grafu

Matematyczne techniki zarządzania - 126
Przykład 32 cd. Wybierzemy
zmienną x2 (reprezentantka grafu
spójnego) i zmienną x3 (graf
zerowy)
Metoda Hellwiga

Y
Y
X1
X2
X3

0,52
0,64
- 0,21

• wypisujemy wszystkie możliwe kombinacje
kandydatek; jest ich K = 2m—1
• obliczamy pojemność informacji dla każdej
zmiennej w każdej kombinacji

h kl  f ( r yx , r x
i

ixj

)

• obliczamy pojemność całkowitą dla każdej
kombinacji
H l   h kl
k

• wybieramy kombinację o największej
pojemności Hl = max

X1
0,52
0,82
- 0,18

X2
0,64
0,82

X3
- 0,21
- 0,18
0,08

0,08

W przykładzie 32 mamy 7
możliwych kombinacji kandydatek:
1. x1
2. x2

3. x3

maximum:

H6 = 0,42

4. x1,x2
5. x1,x3

Hmax = R2

6. x2,x3
7. x1,x2,x3

Metody taksonomiczne
Taksonomia wrocławska (cluster analysis) to metoda grupowania obiektów (zmiennych) w grupy jednorodne pod względem n cech (wymiarów)
łącznie. Podstawą grupowania jest odległość euklidesowa, która w przypadku zmiennych d ij  f ( r x x )
WSZYSTKIE METODY TO SELEKCJA WSTĘPNA
i

j

Matematyczne techniki zarządzania - 127
ETAP 4. ESTYMACJA PARAMETRÓW MODELU
Cel etapu: wyznaczenie parametrów strukturalnych i stochastycznych
Estymacja: szacowanie parametrów populacji na podstawie próbki
Metody estymacji: analiza regresji i korelacji (KMNK i inne)

Założenia dla KMNK
1. Zmienne losowe są prawdziwymi zmiennymi, nie powiązanymi ze sobą
2. Składnik losowy  ma stałą wariancję, niezależną od zmiennej x lub t
3. Wartości reszt ui są niezależne od siebie

4. Składnik losowy  nie jest powiązany ze zmienną objaśniającą
Skutki niedotrzymania założeń i środki zaradcze
1. Model bez sensu, nieprzydatny; niekiedy absurdalny (źle uwarunkowane
dane)
Stosuje się: dużą próbkę (n>100), regresję grzbietową (ridge regression)
2.

Y

reszta ui

Lewa część zbioru ma dużą wariancję, a
prawa — wariancję małą
Stosuje się specjalny wariant MNK z
korektą na różne wariancje
X

Matematyczne techniki zarządzania - 128
3. Jeśli reszty ui są ze sobą powiązane (skorelowane), mówimy, że
występuje autokorelacja składnika losowego (zjawisko występuje przy
szeregach czasowych — sztywny porządek obserwacji)
Oznacza to, że istnieje istotna zależność u t  f ( u t  k )
Przyczyny autokorelacji: zakłócenia
(dodatnie lub ujemne) w jednym okresie
wpływają na poziom zjawiska w następnych
okresach (rolnictwo, produkcja, rynek)

t  1 , 2 ,...

u t  y t  yˆ t

u t 1

u1
u2
u3
u4
u5

Występowanie autokorelacji powoduje
nieprzydatność modelu


u1
u2
u3
u4

Istnienie autokorelacji sprawdza się testem
Durbina-Watsona d
Stosuje się metodę różniczki zupełnej

y  f (x )

yt  yt  ytk

4. Składnik losowy jest skorelowany ze zmienną objaśniającą, wtedy
gdy została pominięta jakaś ważna zmienna-przyczyna

Model taki nie ma żadnej wartości; trzeba dbać o jak najwyższy współczynnik determinacji (R2>0,9)
• zbiór danych rzeczywistych nigdy
nie spełnia tych wymagań

ESTYMACJĘ MODELU POWTARZA SIĘ WIELOKROTNIE
ponieważ dopiero weryfikacja zapewnia ostateczną selekcję
kandydatek na zmienne objaśniające

• ekonometria to analiza danych nie
spełniających tych założeń
• nie stosować statystyki bezmyślnie (na ślepo)

Matematyczne techniki zarządzania - 129
ETAP 5. WERYFIKACJA MODELU
Cele:

1. opis rzeczywistości (populacji generalnej)



2. dokładna (ostateczna) selekcja zmiennych objaśniających
3. poznanie składnika losowego (spełnienie założeń KMNK)
Narzędzia: hipotezy i testy statystyczne

Metodyka: każde równanie oddzielnie; weryfikacja obejmuje 9 etapów (od
najmniej do najbardziej pracochłonnego)
WYKAZ ETAPÓW WERYFIKACJI MODELU
I.
II.

Badanie istotności korelacji
Badanie wyrazistości modelu

III.

Badanie istotności parametrów

IV.

Badanie symetrii skł. losowego

V.
VI.
VII.
VIII.
IX.

Badanie losowości skł. losowego
Badanie stacjonarności skł. los.
Badanie wartości oczekiwanej skł. los.
Badanie autokorelacji skł. losowego
Badanie normalności skł. losowego

Opis każdego etapu weryfikacji
obejmuje:
• cel etapu
• sposób weryfikacji: wzory,
hipotezy, testy
• podanie których modeli dotyczy (przyczynowo-skutkowych
czy tendencji rozwojowej)
• podanie której postaci modeli
nieliniowych dotyczy (pierwotnej czy transformaty)

Matematyczne techniki zarządzania - 130
Etap I. Badanie istotności korelacji
7
2

8

9

11

12

17

19

23

21

5
2 etapu
9
16
7
9
15
14
Celem
jest
sprawdzenie,
czy
istnieje w populacji generalnej powiązanie pomiędzy zmienną Y i wszystkimi zmiennymi objaśniającymi

25

Przedział ufności dla
nieznanego współczynnika korelacji  dla populacji buduje się przy
użyciu błędu

populacja

zmienna Y

20
15
10

próbka

5
0
8
5

0 9

1011

2

9

20
12

30
17
16
7
zmienna X

25

1940
9

23 50
15

populacja

20

zmienna Y

7
2

15
10

próbka

5
0
0

10

20

30

zmienna X

40

50

21
14

sR 

1 R

0

Robl

2

nk

Istotność korelacji weryfikuje się przez postawienie
następujących hipotez dla
współczynnika korelacji dla
populacji generalnej:

1
R,|r|

H0 :   0

Brak korelacji, nie ma powiązania...

H1 :   0

Korelacja istotna, jest powiązanie...

,

Matematyczne techniki zarządzania - 131
Hipotezy te można weryfikować trzema równoważnymi testami:
• testem t Studenta (tylko dla regresji dwu zmiennych)
• testem F Fishera-Snedecora
• testem R Wallace’a-Snedecora

,

W każdym przypadku obliczamy wartość
statystyki dla próbki (tobl, Fobl, Robl) i porównujemy z wartością krytyczną odczytaną z tablicy odpowiedniego rozkładu w
funkcji poziomu istotności i liczby stopni
swobody (ttabl, Ftabl, Rtabl)

Reguła decyzyjna:
• jeżeli |tobl|< ttabl, nie ma podstaw do odrzucenia H0 (brak korelacji)
• jeżeli |tobl|> ttabl, odrzucamy H0 na korzyść H1 (korelacja istnieje)

TAK SAMO DLA
FiR

W przypadku regresji wielorakiej, gdy liczba zmiennych objaśniajacych
jest duża w porównaniu do liczby obserwacji, współczynnik determinacji
R2 może dawać zawyżoną ocenę stopnia wyjaśnienia zmienności zmiennej
objaśnianej; dlatego wprowadzono skorygowany współczynnik determinacji (i korelacji):
 ( yˆ i  y )

R

2

2

k
n

k

1


2
nk 1
(
y

y
)

i
n1

• adjusted coefficient of multiple
determination (wydruki komputerowe)

• jeśli k jest małe, nie ma większej różnicy
pomiędzy normalnym a skorygowanym R2

Matematyczne techniki zarządzania - 132
Skąd wziąć wartość odpowiedniej statystyki dla próbki i jak odczytywać jej wartości z tablic?
n2
r
t

r

t tabl  t  / 2 { n  2 }
TEST STUDENTA
obl
2
sr
1 r

F obl 

TEST FISHERA

Ź ró d ło z m ien n o śc i

MSTR
MSE



R

nk

2

1 R

2

L ic zb a sto p n i
sw o b o d y

Suma
k w a d ra tó w

Ś re d n i
k w a d ra t

M o d el (c z yn n ik i)
B łą d (re sz ta )

k1
nk

SSTR
SSE

MSTR
MSE

R azem

n1

SSTO

TEST WALLACE’A

R obl 

R

2

k 1

F tabl  F { k  1 , n  k }

S ta ty sty k a
F
F obl 

MSTR
MSE

NIE MYLIĆ
STOPNI SWOBODY LICZNIKA I MIANOWNIKA

R tabl  R { k , n  k }

Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

Matematyczne techniki zarządzania - 133
Odczyt Rtabl z tablicy testu R (SKRYPT s.161-162)

, k,  = n-k

S to pn ie
sw ob od y
8
18
28

2
0,05
0,632
0,444
0,361

0,01
0,765
0,561
0,463

L iczb a zm ien n ych
3
0,05
0,01
0,726
0,827
0,532
0,633
0,439
0,530

4
0,05
0,777
0,587
0,490

0,01
0,860
0,678
0,573

Wnioski dotyczące rozkładu R Wallace’a-Snedecora:
• tablica zawiera maksymalne wartości współczynnika korelacji w danej
sytuacji, jakich można oczekiwać, gdy nie ma korelacji w populacji
• im wyższy poziom istotności, tym niższe Rtabl

• im większa liczba zmiennych w modelu, tym wyższe Rtabl
• im wyższa liczba stopni swobody (większa próbka), tym niższe Rtabl
• tablica R powstała z przeliczenia tablic t oraz F (odwrócenie wzorów)
• tablica testu R jest najszybszym i nawygodniejszym narzędziem do
weryfikacji istotności korelacji

Werdykt z etapu I:

Matematyczne techniki zarządzania - 134

• jeżeli Robl>Rtabl, model jest poprawny, można przejść do etapu II
• jeżeli Roblzmiennych objaśniających albo jego postać matematyczną
ETAP I OBOWIĄZUJE DLA WSZYSTKICH MODELI
ETAP I PRZEPROWADZA SIĘ DLA TRANSFORMATY (dla postaci pierwotnej
można uzyskać R>1)
Rola współczynnika determinacji R2
• korelacja może być istotna przy małym R i bardzo małym R2 (r=0,4,
R2=0,16, co oznacza, że tylko 16% zmienności zmiennej Y jest
wyjaśnione przez zmienną objaśniającą)
• małe R2 oznacza niski stopień wyjaśnienia rzeczywistości i stanowi
zagrożenie dla modelu
• należy dążyć (poprzez odpowiedni dobór zmiennych-przyczyn i postaci
matematycznej modelu) do jak największego R2 (dla postaci pierwotnej)
• wysoka wartość R2 świadczy o dobrym poznaniu badanego zjawiska
• wysoka wartość R2 bardzo często wynika jednak ze złego dobrania
zmiennych objaśniających (silnie powiązane ze sobą — „masło maślane”)
KORELACJA POZORNA — jest zależność, ale jej nie ma? Przyczyny...
Trzeba unikać wartości bezwzględnych (ludność, liczba sklepów, wielkość produkcji)

6

9

12

8

11

12

11

15

9

18

9

11

11

18

15

Matematyczne techniki zarządzania - 135
Etap II. Badanie wyrazistości modelu
Y

Wyrazistość modelu dana jest wzorem

s( y )

ui

y

W obl 

s( y )

100 %

y

Celem etapu
jest kontrola
rozrzutu danych

Współczynnik Wobl<30%, w przeciwnym
przypadku rozrzut danych jest zbyt duży

y

Kłopoty: gdyy jest bliskie 0

x

X

Werdykt: model poprawny lub niepoprawny

ETAP II OBOWIĄZUJE DLA WSZYSTKICH MODELI (ale nie ma on charakteru
statystycznego)

ETAP II PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ (sprawdzamy, czy
nie występuje silny efekt „krzywego lustra”)
Etap III. Badanie istotności parametrów (współczynników) modelu
Celem etapu jest sprawdzenie:
• czy poszczególne zmienne objaśniające mają istotny wpływ na zmienną
objaśnianą?
• czy zmienne objaśniające są wybrane prawidłowo?

• czy wyraz wolny różni się istotnie od zera?

Matematyczne techniki zarządzania - 136
Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

Problem istotności parametrów ai można rozpatrywać (tak jak problem
średniej dla populacji) z dwu punktów widzenia:
• przedziału ufności dla nieznanej wartości i

• hipotez — zerowej H0: i=0 i alternatywnej H1: i 0

1
0

ai

1

i

ISTOTNY (W PRZEDZIALE NIE MA ZERA)

0

ai

i

NIEISTOTNY (W PRZEDZIALE JEST ZERO)

P ( a i  t / 2 { n  k } s ( a i )   i  a i  t / 2 { n  k } s ( a i )  1  

Z tablicy rozkładu Studenta, a nie z wydruku komputerowego!

Matematyczne techniki zarządzania - 137
Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

W praktyce posługujemy się raczej hipotezami:
Badanie istotności przeprowadza
się dla każdego i oddzielnie:

t obl ( a i ) 

ai  0
s(a i )

t tabl  t  / 2 { n  k }

• jeżeli |tobl(ai)|>ttabl(ai), odrzucamy hipotezę zerową; parametr jest istotny z błędem równym co najwyżej 
• jeżeli |tobl(ai)|parametr nie jest istotny
Praktycznie jest to bardzo łatwe:
• sprawdzamy, czy |t(ai)| jest większe czy mniejsze od około 2, a najlepiej
• porównujemy rzeczywisty poziom istotności P(ai) z przyjętym 
ODRZUCAMY H0, JEŻELI P(ai) JEST MNIEJSZE OD 

WTEDY ZMIENNA
Xi MA WPŁYW NA
ZMIENNĄ Y

Matematyczne techniki zarządzania - 138
W etapie III następuje ostateczna selekcja zmiennych objaśniających:
• jeżeli wszystkie ai okażą się istotne, model jest poprawny:
— model przyczynowo-skutkowy: do interpretacji
— model tendencji rozwojowej: do etapu IV
• jeżeli choć jedno ai okaże się nieistotne, model jest niepoprawny i wymaga poprawy przez usunięcie nieistotnych zmiennych:
— zmienne należy usuwać po jednej (ze względu na efekt katalityczny)
— usuwa się zawsze zmienną o najniższej wartości |t(ai)| [czyli o
najwyższej wartości P(ai)]
— usunięcie ostatniej zmiennej nieistotnej kończy proces selekcji
kandydatek na zmienne,

— selekcja nie jest ostateczna, gdyż zawsze istnieje możliwość zamiany zmiennych, które są powiązane ze sobą
Praktyczne znaczenie istotności wyrazu wolnego a0
To są jedne z możliwości dla populacji (p. plansza 106)

Y

W przypadku funkcji K=f(P) wyraz wolny wyznacza poziom kosztów stałych (rachunkowość zarządcza)
W przypadku zależności technicznej Q=f(h) wyraz
wolny oznacza, że przy miąższości pokładu h=0 wydajność produkcji Q też jest równa 0

0
X

Matematyczne techniki zarządzania - 139
Praktyczne znaczenie istotności współczynnika regresji ai



KRZYWE NEYMANA — PLANSZE 106-107
WSPÓŁCZ. ISTOTNY
WSPÓŁ. NIEISTOTNY

ETAP III OBOWIĄZUJE DLA WSZYSTKICH MODELI
ETAP III PRZEPROWADZA SIĘ DLA TRANSFORMATY
Etap IV. Badanie symetrii składnika losowego

Y

CZĘSTOŚĆ RESZT DODATNICH I UJEMNYCH MA BYĆ
ZBLIŻONA

Y

ASYMETRYCZNY
SYMETRYCZNY

t
t
Badanie symetrii przeprowadza się testem Studenta (St. Bartosiewicz
Ekonometria)
Brak symetrii wymaga zmiany matematycznej postaci modelu
ETAP IV OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ

ETAP IV PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ

Matematyczne techniki zarządzania - 140
Etap V. Badanie losowości składnika losowego

Y

Y
NIELOSOWY

LOSOWY

t
t
Badanie losowości przeprowadza się testem Studenta lub testem serii
(Ekonometria, praca zb. pod red. M. Krzysztofiaka)
Brak losowości wymaga zmiany matematycznej postaci modelu
ETAP V OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP V PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ
Etap VI. Badanie stacjonarności składnika losowego
W etapie tym chodzi o niezależność wariancji składnika losowego od
zmiennej objaśniającej t (plansza 127)

Bada się istotność współczynnika korelacji ru t , t
ETAP VI OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VI PRZEPROWADZA SIĘ DLA TRANSFORMATY

Matematyczne techniki zarządzania - 141
Etap VII. Badanie wartości oczekiwanej składnika losowego
Normalnie, gdy przeprowadzamy estymację postaci liniowej, parametry
składnika losowego E ( )  0
{ ui  0}
V ( )  const
Po retransformacji do postaci pierwotnej mamy nowe reszty u’, dla
których
'
'
ui  0
 ui  0
Celem etapu jest sprawdzenie, czy odchyłka od O nie jest zbyt duża
(służy do tego test Studenta)
ETAP VII OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VII PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ
Etap VIII. Badanie autokorelacji składnika losowego
Pojęcie autokorelacji opisano na planszy 128; chodzi o istotność korelacji ru , u
t

tk

Badanie autokorelacji można przeprowadzić:

• testem R istotności korelacji ru

t

,ut  k

d obl

• testem Durbina-Watsona
NIE MA AUTOK.

d1

?

d2 JEST AUTOKORELACJA

ETAP VIII OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VIII PRZEPROWADZA SIĘ DLA TRANSFORMATY

Matematyczne techniki zarządzania - 142
Etap IX. Badanie normalności składnika losowego
Celem etapu jest stwierdzenie, czy reszty mają rozkład normalny
Analiza reszt — oddzielny dział analizy regresji i korelacji
Jeżeli reszty mają rozkład normalny, statystyk otrzymuje „ulgi”
ETAP 6. PRAKTYCZNA INTERPRETACJA MODELU



Celem etapu jest wydobycie z modelu całej nowej wiedzy, której nie widać
„gołym okiem”
INTERPRETUJĄC MODEL (RÓWNANIE REGRESJI) NALEŻY UŻYWAĆ WYŁĄCZNIE
PROSTEJ TERMINOLOGII EKONOMICZNEJ ZROZUMIAŁEJ DLA KLIENTA
NIE NALEŻY UŻYWAĆ TERMINOLOGII MATEMATYCZNEJ ZROZUMIAŁEJ TYLKO DLA
TWÓRCÓW MODELU
INTERPRETOWAĆ WOLNO TYLKO MODEL ZWERYFIKOWANY
CAŁY TRUD MODELOWANIA NIE MOŻE BYĆ „SZTUKĄ DLA SZTUKI”, LECZ MA
SŁUŻYĆ UZYSKANIU KONKRETNYCH WNIOSKÓW PRAKTYCZNYCH

Interpretacja modelu przyczynowo-skutkowego

Polega ona na określeniu wpływu poszczególnych czynników na badane
zjawisko:
• podział wszystkich czynników na trzy grupy

Matematyczne techniki zarządzania - 143
A — czynniki nie mające wpływu na Y
B — czynniki mające wpływ na Y i wprowadzone do modelu
C — czynniki mające wpływ na Y, ale nie występujące w modelu
• ocena jakościowa wpływu czynników B i C
• ocena ilościowa wpływu czynników B i C
Ocena jakościowa



Na podstawie znaków stojących przy współczynnikach r oraz ai możemy
stwierdzić, że wpływ jest:

• dodatni (im lepsze zaliczenie, tym lepszy wynik egzaminu; im więcej
wydatków na reklamę, tym większy zysk; itd.)
• ujemny (im więcej zatrudnionych, tym gorszy wynik finansowy; im
mniej braków, tym wyższy zysk; im mniejsza absencja, tym wyższe
wynagrodzenie; itd.)

Ocena ilościowa
• model liniowy
Przykład 33. Zinterpretuj zweryfikowany model zależności miesięcznych
kosztów działalności przedsiębiorstwa (tys. zł) od wielkości produkcji
(sztuk) i liczby reklamacji:
y i  50 , 8  14 , 5 x 1  3 , 9 x 2  

Matematyczne techniki zarządzania - 144
a0 = 50,8

poziom kosztów stałych; jeśli firma nie będzie prowadzić
żadnej działalności, poniesie koszty w wysokości 50,8 tys. zł

a1 = 14,5

każda sztuka produktu firmy kosztuje ją przeciętnie 14,5
tys. zł; jeżeli firma zwiększy produkcję o 2 sztuki, koszty
wzrosną o 29,0 tys. zł

a2 = 3,9każda wniesiona reklamacja powiększa koszty przeciętnie o
3,9 tys. zł
• model potęgowy
Przykłąd 34. Zinterpretuj zweryfikowaną funkcję produkcji Cobba-Douglasa
0 , 65

Pi  45 , 2 M i

0 , 73

Zi

e

0 , 04



Funkcja produkcji to specjalny model, określający zależność pomiędzy
produkcją (P) a czynnikami produkcji: majątkiem trwałym (M) i nakładami
robocizny (Z).



Funkcje produkcji to modele umożliwiające „prześwietlenie”
przedsiębiorstwa (szereg czasowy) lub branży (dane przekrojowe) i określenie poziomu gospodarowania oraz postępu
technicznego i organizacyjnego.
Elastyczność  to współczynnik określający reakcję zmiany
jednej zmiennej na inną zmienną — na przykład elastyczność
cenowa popytu (jak popyt zmienia się wraz z ceną towaru).

EKSPERCI
ZACHODNI

Matematyczne techniki zarządzania - 145

 

y
y

:

x

FUNKCJA POTĘGOWA JEST JEDYNĄ FUNKCJĄ O STAŁEJ ELASTYCZNOŚCI

x

Izolinie funkcji produkcji

T1
M

Produkcję P można osiągnąć różnymi
kombinacjami majątku i robocizny:

T2

• T1— technika kapitałochłonna, np.
pełna automatyzacja
• T2 — pośredni poziom techniki

T3
P  const

• T3 — niski poziom techniki, produkcja
pracochłonna
P. LOWE

Z
Efekt poprawy zarządzania bez
zmiany techniki (lepsze wykorzystanie ludzi i sprzętu):

P2
M

ZARZĄDZANIE
TECHNOLOGIĄ

P1

T

• zmniejszenie kapitałochłonności

• zmniejszenie pracochłonności
• zwiększenie produkcji (przejście z
funkcji P1 na P2)

Można też rozpatrzyć łączne efekty
zmiany techniki i zarządzania

Z

Matematyczne techniki zarządzania - 146
Wszystkie informacje tego typu można odczytać w trakcie interpretacji
0 , 65
0 , 73 0 , 04
funkcji produkcji:
Pi  45 , 2 M i
Zi
e

• wartości 45,2 nie interpretuje się
• wartość 0,65 to współczynnik elastyczności majątkowej (kapitałowej)
produkcji: zmiana majątku o 10% daje średnio zmianę produkcji o 6,5%
• wartość 0,73 to współczynnik elastyczności zatrudnieniowej produkcji:
zmiana zatrudnienia o 10% daje zmianę produkcji średnio o 7,3%
• suma obu współczynników k=0,65+0,73=1,38 to współczynnik skali
produkcji:

— jeżeli k<1, to firma rozwija się ekstensywnie
— jeżeli k>1, to firma rozwija się intensywnie
• wartość  = 0,04 to współczynnik postępu organizacyjnego:
— jeżeli  >O, to miał miejsce postęp organizacyjny

— jeżeli  <0, to miał miejsce regres organizacyjny
Interpretacja modelu tendencji rozwojowej

DODAMY
TROCHĘ
TEORII

Przypomnienie: t — zmienna objaśniająca (stałe przyrosty)
y — zmienna objaśniana; rozdzielana w ogólności na trzy
części: trend, wahania okresowe, wahania losowe ()

Matematyczne techniki zarządzania - 147
Wykres z planszy 117 (zużycie energii elektrycznej przez WZ AGH)
WAHANIA OKRESOWE OKREŚLA SIĘ WZGLĘDEM TRENDU A
NIE WZGLĘDEM OSI CZASU

y

trend

t
1995

1996

1997

1998

1999

Te trzy części trzeba zidentyfikować, a potem złożyć razem w model:

• addytywny (jeśli amplituda wahań jest stała)
• multiplikatywny (jeśli amplituda wahań rośnie lub maleje regularnie)
Wyznaczanie trendu
Metody mechaniczne:

• wskaźniki bezwzględne (stały przyrost =
postęp arytmetyczny = funkcja liniowa)
• wskaźniki względne (przyrost o stały procent =
postęp geometryczny = funkcja potęgowa)
• średnia ruchoma (wygładzanie danych linią łamaną)

JAK OBLICZYĆ O
ILE PROCENT ROCZNIE SPADAŁA
ŚREDNIO LICZBA
WIDZÓW W
KINACH:
1982 - 193,7 MLN
1989 - 141,3 MLN

Matematyczne techniki zarządzania - 148
Średnia ruchoma: mając szereg czasowy y1, y2,....., yn, przyjmujemy
długość kroku k = 3, lub 5, lub 7 itd. i liczymy
y  ...  y k
y  ...  y k  1
y k / 2 0 ,5  1
a następnie y k / 2  1 , 5  2
itd.
k
k
y  y2  y3
y  y3  y4
dla k=3:
y2  1
y3  2
itd.
3
3
Przykład 35. Wyznacz trend metodą średniej ruchomej dla następujących
danych:
okres
t
wartość yt

1
5

2
4

3
7

4
6

5
8

12

y2 
10

y3 

y

8

y4 

6
4

y5 

2

y6 

0
0

1

2

3

4

5

czas, t

6

7

8

9

y7 

547

6
10

 5 , 67

CECHY
ŚREDNIEJ
RUCHOMEJ:

 7 , 00

• TRACI SIĘ
k-1 DANYCH

3
768

8
8

 5 , 33

3
476

7
9

3
6  8  10

 8 , 00

3
8  10  9

 9 , 00

3
10  9  8

 9 , 00

• IM
WIĘKSZE k,
TYM
BARDZIEJ
SZTYWNY
TREND

3

Metody statystyczne: analiza regresji i korelacji, różne funkcje oparte na
modelach ekonomii

Matematyczne techniki zarządzania - 149
Wyznaczanie wahań okresowych: dobowych, tygodniowych, miesięcznych,
kwartalnych, rocznych, wieloletnich
Trzy metody:

— metoda wskaźników sezonowości
— metoda zmiennych zero-jedynkowych (0-1)

— metoda harmoniczna
Wszystkie metody mają jeden cel:
uzyskanie przeciętnego obrazu jednego cyklu

+

Ws
[t ]
[%]
trend

I

II



III

IV

WADY:
• KONIECZNOŚĆ
KOREKTY
• BRAK
WERYFIKACJI
STATYSTYCZNEJ

Metoda wskaźników sezonowości

• obliczenie surowych wskaźników sezonowości (wyeliminowanie trendu):
y

S s  yt  yt
S s  t
yt
addytywny multiplikatywny
wynik: n wartości odchyleń od trendu

• obliczenie oczyszczonych wskaźników
sezonowości (wyeliminowanie wahań
losowych):
 Ss
So 
k-liczba okresów
k
jednoimiennych
m-długość cyklu wynik: m wartości śr. odchyleń od trendu

Matematyczne techniki zarządzania - 150
Metoda zmiennych zero-jedynkowych (0-1)
m

y t  a 0  a1 t   bi Q i  
i 1

bi — przeciętne odchylenie od trendu dla
okresu i-tego
Qi — zmienna 0-1

wahania losowe
trend

wahania okresowe

t
1
2
3
4
5
6
7
8
9

yt
y1
y2
y3
y4
y5
y6
y7
y8
y9

Q1
1
0
0
0
1
0
0
0
1

Q2
0
1
0
0
0
1
0
0
0

Q3
0
0
1
0
0
0
1
0
0

Q4
0
0
0
1
0
0
0
1
0

Metoda harmoniczna (szeregi Fouriera)
Wahania okresowe przedstawia się jako sumę określonej liczby drgań harmonicznych (sinusoid i cosinusoid) przesuniętych w fazie, lecz o jednakowym okresie
m /2
2 i m / 2
2 i
y t  a 0  a 1 t   b1 i sin
  b 2 i cos

m
m
i 1
i 1
Obie metody dają taki sam wynik, istnieje możliwość weryfikacji
statystycznej
W metodzie 0-1 dostajemy bi = Ws, natomiast w metodzie harmonicznej Ws
jest sumą wartości poszczególnych sinusoid dla danego momentu czasu


Slide 22

Matematyczne techniki zarządzania - 121
ETAP 2. GROMADZENIE DANYCH STATYSTYCZNYCH

!

ZA JAKOŚĆ DANYCH ODPOWIADA MODELUJĄCY
• rodzaje danych: dane przekrojowe i szeregi czasowe
• źródła danych: roczniki statystyczne, różne działy
przedsiębiorstwa, badania marketingowe, wywiady itd.
• wiarygodność danych: do jakiego celu zostały one
przygotowane?

MUSISZ
SPRAWDZAĆ
KAŻDE DANE

• porównywalność danych: inflacja (ceny bieżące a ceny
stałe), zmiany procesów technicznych
Wielkość
produkcji

• zmienność zjawisk: trzeba sprawdzić, czy
wybrana w etapie 1a zmienna jest rzeczywiście zmienną losową

Wx 

s( x )

nowy zakład

100 %

x

stary zakład

Wx musi wynosić co najmniej 30-40%
Wiek studenta może być dobrą zmiennąprzyczyną, ale nie w przypadku studiów
dziennych!

Zatrudnienie

Matematyczne techniki zarządzania - 122
ETAP 3. SELEKCJA ZMIENNYCH OBJAŚNIAJĄCYCH
KAŻDĄ ZMIENNĄ X WYTYPOWANĄ W ETAPIE 1a TRAKTUJEMY JAKO
KANDYDATKĘ NA ZMIENNĄ OBJAŚNIAJĄCĄ
Może być kilka przyczyn powodujących, że taka kandydatka nie może znaleźć się w modelu ekonometrycznym (w równaniu regresji):
• w modelu nie może być zbyt wielu zmiennych (nieczytelny)
• kandydatka może nie mieć wpływu na zmienną Y



• kandydatka może wnosić prawie tę samą informację o Y co inna
kandydatka

• dwie bardzo podobne kandydatki mogą sobie nawzajem przeszkadzać
(efekt katalityczny)
Kryteria, jakie musi spełniać kandydatka Xi, aby nadawała się do modelu:
• musi być silnie powiązana ze zmienną Y

• nie może być powiązana z inną kandydatką Xj
SSTO
x1
x4

x2
x3

reszta

R2=0,79

R2=0,66

x2
x1
x4

R2=0,48

x3
reszta

reszta

SSTO

SSTO

Matematyczne techniki zarządzania - 123
Efekt katalityczny
DWIE ZMIENNE DAJĄ
RAZEM MNIEJ INFORMACJI NIŻ KAŻDA Z
NICH Z OSOBNA

x1

x2

R2=0,25

x2

x1

R2=0,52

R2=0,66

Selekcja kandydatek ma na celu podzielenie ich na trzy grupy:
• zmienne wprowadzone do modelu
• zmienne nie wprowadzone do modelu, ale reprezentowane w nim przez
inne zmienne (możliwość wymiany)
• zmienne nie wprowadzone do modelu ze względu na fakt, że nie wnoszą
żadnej informacji o zmiennej Y
INFORMACJE potrzebne do selekcji: współczynniki r x i x j ,
Macierz współczynników korelacji
Y
Y
X1
X2
X3

0,52
0,64
- 0,21

X1
0,52
0,82
- 0,18

X2
0,64
0,82
0,08

X3
- 0,21
- 0,18
0,08

r yx

i

Przykład 32. Macierz powiązania
zmiennych ze sobą przedstawia
się następująco (n=20). Jak ją
można zinterpretować? Które
zmienne są powiązane ze sobą w
sposób istotny?

Matematyczne techniki zarządzania - 124
Testowanie istotności współczynnika korelacji
H0:  = 0

Można je przeprowadzić trzema testami: testem Studenta

H1:   0

(t), Fishera (F) i Wallace’a-Snedecora (R)

Fragment tablicy rozkładu Wallece’a-Snedecora (SKRYPT, tab. VII, s.161)
S to pn ie
sw ob od y

2
0,05
0,632
0,444
0,361

8
18
28

,

0,01
0,765
0,561
0,463

L iczb a zm ien n ych
3
0,05
0,01
0,726
0,827
0,532
0,633
0,439
0,530

4
0,05
0,777
0,587
0,490

0,01
0,860
0,678
0,573

Reguła decyzyjna: — jeżeli |Robl|>Rtabl, odrzucamy H0 (korelacja istotna)
— jeżeli |Robl|
W przykładzie 32, jeżeli przyjmiemy  = 0,05, to Rtabl = 0,444.
Y
Y
X1
X2
X3

0,52
0,64
- 0,21

X1
0,52
0,82
- 0,18

X2
0,64
0,82
0,08

X3
- 0,21
- 0,18
0,08

Pozostaną zatem tylko trzy
istotne powiązania:
y-x1, y-x2, x1-x2
BRAK ISTOTNEGO POWIĄZANIA Z Y NIE
OZNACZA, ŻE ZMIENNA NIE WNOSI
ŻADNEJ INFORMACJI O ZJAWISKU Y

Matematyczne techniki zarządzania - 125



Metody selekcji zmiennych objaśniających:
• grafowa
• Hellwiga (pojemności informacji)
• taksonomiczne (clustering)
Metoda grafowa
• obliczenie macierzy współczynników:

rx

i

xj

• wyłowienie z macierzy powiązań istotnych

, r yx

BUDOWA GRAFU
i

• graf spójny

• budowa grafu z powiązań istotnych
• wybranie zmiennych na podstawie grafu

x6

• graf zerowy
x1
x4

x9

DO MODELU WYBIERA SIĘ ZMIENNE:
• każdy graf zerowy (jeśli |ryx|>0,1)

istotne powiązanie

• po jednej reprezentantce grafu spójnego;

reprezentantką grafu jest zmienna, która ma najwięcej powiązań z
innymi kandydatkami
jeżeli kilka zmiennych ma tę samą maksymalną liczbę powiązań, wybiera
się z nich tę, która jest najsilniej powiązana za zmienną Y (max ryx)
jeżeli graf jest rozległy, może mieć dwie reprezentantki, ale muszą one
leżeć na przeciwległych stronach grafu

Matematyczne techniki zarządzania - 126
Przykład 32 cd. Wybierzemy
zmienną x2 (reprezentantka grafu
spójnego) i zmienną x3 (graf
zerowy)
Metoda Hellwiga

Y
Y
X1
X2
X3

0,52
0,64
- 0,21

• wypisujemy wszystkie możliwe kombinacje
kandydatek; jest ich K = 2m—1
• obliczamy pojemność informacji dla każdej
zmiennej w każdej kombinacji

h kl  f ( r yx , r x
i

ixj

)

• obliczamy pojemność całkowitą dla każdej
kombinacji
H l   h kl
k

• wybieramy kombinację o największej
pojemności Hl = max

X1
0,52
0,82
- 0,18

X2
0,64
0,82

X3
- 0,21
- 0,18
0,08

0,08

W przykładzie 32 mamy 7
możliwych kombinacji kandydatek:
1. x1
2. x2

3. x3

maximum:

H6 = 0,42

4. x1,x2
5. x1,x3

Hmax = R2

6. x2,x3
7. x1,x2,x3

Metody taksonomiczne
Taksonomia wrocławska (cluster analysis) to metoda grupowania obiektów (zmiennych) w grupy jednorodne pod względem n cech (wymiarów)
łącznie. Podstawą grupowania jest odległość euklidesowa, która w przypadku zmiennych d ij  f ( r x x )
WSZYSTKIE METODY TO SELEKCJA WSTĘPNA
i

j

Matematyczne techniki zarządzania - 127
ETAP 4. ESTYMACJA PARAMETRÓW MODELU
Cel etapu: wyznaczenie parametrów strukturalnych i stochastycznych
Estymacja: szacowanie parametrów populacji na podstawie próbki
Metody estymacji: analiza regresji i korelacji (KMNK i inne)

Założenia dla KMNK
1. Zmienne losowe są prawdziwymi zmiennymi, nie powiązanymi ze sobą
2. Składnik losowy  ma stałą wariancję, niezależną od zmiennej x lub t
3. Wartości reszt ui są niezależne od siebie

4. Składnik losowy  nie jest powiązany ze zmienną objaśniającą
Skutki niedotrzymania założeń i środki zaradcze
1. Model bez sensu, nieprzydatny; niekiedy absurdalny (źle uwarunkowane
dane)
Stosuje się: dużą próbkę (n>100), regresję grzbietową (ridge regression)
2.

Y

reszta ui

Lewa część zbioru ma dużą wariancję, a
prawa — wariancję małą
Stosuje się specjalny wariant MNK z
korektą na różne wariancje
X

Matematyczne techniki zarządzania - 128
3. Jeśli reszty ui są ze sobą powiązane (skorelowane), mówimy, że
występuje autokorelacja składnika losowego (zjawisko występuje przy
szeregach czasowych — sztywny porządek obserwacji)
Oznacza to, że istnieje istotna zależność u t  f ( u t  k )
Przyczyny autokorelacji: zakłócenia
(dodatnie lub ujemne) w jednym okresie
wpływają na poziom zjawiska w następnych
okresach (rolnictwo, produkcja, rynek)

t  1 , 2 ,...

u t  y t  yˆ t

u t 1

u1
u2
u3
u4
u5

Występowanie autokorelacji powoduje
nieprzydatność modelu


u1
u2
u3
u4

Istnienie autokorelacji sprawdza się testem
Durbina-Watsona d
Stosuje się metodę różniczki zupełnej

y  f (x )

yt  yt  ytk

4. Składnik losowy jest skorelowany ze zmienną objaśniającą, wtedy
gdy została pominięta jakaś ważna zmienna-przyczyna

Model taki nie ma żadnej wartości; trzeba dbać o jak najwyższy współczynnik determinacji (R2>0,9)
• zbiór danych rzeczywistych nigdy
nie spełnia tych wymagań

ESTYMACJĘ MODELU POWTARZA SIĘ WIELOKROTNIE
ponieważ dopiero weryfikacja zapewnia ostateczną selekcję
kandydatek na zmienne objaśniające

• ekonometria to analiza danych nie
spełniających tych założeń
• nie stosować statystyki bezmyślnie (na ślepo)

Matematyczne techniki zarządzania - 129
ETAP 5. WERYFIKACJA MODELU
Cele:

1. opis rzeczywistości (populacji generalnej)



2. dokładna (ostateczna) selekcja zmiennych objaśniających
3. poznanie składnika losowego (spełnienie założeń KMNK)
Narzędzia: hipotezy i testy statystyczne

Metodyka: każde równanie oddzielnie; weryfikacja obejmuje 9 etapów (od
najmniej do najbardziej pracochłonnego)
WYKAZ ETAPÓW WERYFIKACJI MODELU
I.
II.

Badanie istotności korelacji
Badanie wyrazistości modelu

III.

Badanie istotności parametrów

IV.

Badanie symetrii skł. losowego

V.
VI.
VII.
VIII.
IX.

Badanie losowości skł. losowego
Badanie stacjonarności skł. los.
Badanie wartości oczekiwanej skł. los.
Badanie autokorelacji skł. losowego
Badanie normalności skł. losowego

Opis każdego etapu weryfikacji
obejmuje:
• cel etapu
• sposób weryfikacji: wzory,
hipotezy, testy
• podanie których modeli dotyczy (przyczynowo-skutkowych
czy tendencji rozwojowej)
• podanie której postaci modeli
nieliniowych dotyczy (pierwotnej czy transformaty)

Matematyczne techniki zarządzania - 130
Etap I. Badanie istotności korelacji
7
2

8

9

11

12

17

19

23

21

5
2 etapu
9
16
7
9
15
14
Celem
jest
sprawdzenie,
czy
istnieje w populacji generalnej powiązanie pomiędzy zmienną Y i wszystkimi zmiennymi objaśniającymi

25

Przedział ufności dla
nieznanego współczynnika korelacji  dla populacji buduje się przy
użyciu błędu

populacja

zmienna Y

20
15
10

próbka

5
0
8
5

0 9

1011

2

9

20
12

30
17
16
7
zmienna X

25

1940
9

23 50
15

populacja

20

zmienna Y

7
2

15
10

próbka

5
0
0

10

20

30

zmienna X

40

50

21
14

sR 

1 R

0

Robl

2

nk

Istotność korelacji weryfikuje się przez postawienie
następujących hipotez dla
współczynnika korelacji dla
populacji generalnej:

1
R,|r|

H0 :   0

Brak korelacji, nie ma powiązania...

H1 :   0

Korelacja istotna, jest powiązanie...

,

Matematyczne techniki zarządzania - 131
Hipotezy te można weryfikować trzema równoważnymi testami:
• testem t Studenta (tylko dla regresji dwu zmiennych)
• testem F Fishera-Snedecora
• testem R Wallace’a-Snedecora

,

W każdym przypadku obliczamy wartość
statystyki dla próbki (tobl, Fobl, Robl) i porównujemy z wartością krytyczną odczytaną z tablicy odpowiedniego rozkładu w
funkcji poziomu istotności i liczby stopni
swobody (ttabl, Ftabl, Rtabl)

Reguła decyzyjna:
• jeżeli |tobl|< ttabl, nie ma podstaw do odrzucenia H0 (brak korelacji)
• jeżeli |tobl|> ttabl, odrzucamy H0 na korzyść H1 (korelacja istnieje)

TAK SAMO DLA
FiR

W przypadku regresji wielorakiej, gdy liczba zmiennych objaśniajacych
jest duża w porównaniu do liczby obserwacji, współczynnik determinacji
R2 może dawać zawyżoną ocenę stopnia wyjaśnienia zmienności zmiennej
objaśnianej; dlatego wprowadzono skorygowany współczynnik determinacji (i korelacji):
 ( yˆ i  y )

R

2

2

k
n

k

1


2
nk 1
(
y

y
)

i
n1

• adjusted coefficient of multiple
determination (wydruki komputerowe)

• jeśli k jest małe, nie ma większej różnicy
pomiędzy normalnym a skorygowanym R2

Matematyczne techniki zarządzania - 132
Skąd wziąć wartość odpowiedniej statystyki dla próbki i jak odczytywać jej wartości z tablic?
n2
r
t

r

t tabl  t  / 2 { n  2 }
TEST STUDENTA
obl
2
sr
1 r

F obl 

TEST FISHERA

Ź ró d ło z m ien n o śc i

MSTR
MSE



R

nk

2

1 R

2

L ic zb a sto p n i
sw o b o d y

Suma
k w a d ra tó w

Ś re d n i
k w a d ra t

M o d el (c z yn n ik i)
B łą d (re sz ta )

k1
nk

SSTR
SSE

MSTR
MSE

R azem

n1

SSTO

TEST WALLACE’A

R obl 

R

2

k 1

F tabl  F { k  1 , n  k }

S ta ty sty k a
F
F obl 

MSTR
MSE

NIE MYLIĆ
STOPNI SWOBODY LICZNIKA I MIANOWNIKA

R tabl  R { k , n  k }

Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

Matematyczne techniki zarządzania - 133
Odczyt Rtabl z tablicy testu R (SKRYPT s.161-162)

, k,  = n-k

S to pn ie
sw ob od y
8
18
28

2
0,05
0,632
0,444
0,361

0,01
0,765
0,561
0,463

L iczb a zm ien n ych
3
0,05
0,01
0,726
0,827
0,532
0,633
0,439
0,530

4
0,05
0,777
0,587
0,490

0,01
0,860
0,678
0,573

Wnioski dotyczące rozkładu R Wallace’a-Snedecora:
• tablica zawiera maksymalne wartości współczynnika korelacji w danej
sytuacji, jakich można oczekiwać, gdy nie ma korelacji w populacji
• im wyższy poziom istotności, tym niższe Rtabl

• im większa liczba zmiennych w modelu, tym wyższe Rtabl
• im wyższa liczba stopni swobody (większa próbka), tym niższe Rtabl
• tablica R powstała z przeliczenia tablic t oraz F (odwrócenie wzorów)
• tablica testu R jest najszybszym i nawygodniejszym narzędziem do
weryfikacji istotności korelacji

Werdykt z etapu I:

Matematyczne techniki zarządzania - 134

• jeżeli Robl>Rtabl, model jest poprawny, można przejść do etapu II
• jeżeli Roblzmiennych objaśniających albo jego postać matematyczną
ETAP I OBOWIĄZUJE DLA WSZYSTKICH MODELI
ETAP I PRZEPROWADZA SIĘ DLA TRANSFORMATY (dla postaci pierwotnej
można uzyskać R>1)
Rola współczynnika determinacji R2
• korelacja może być istotna przy małym R i bardzo małym R2 (r=0,4,
R2=0,16, co oznacza, że tylko 16% zmienności zmiennej Y jest
wyjaśnione przez zmienną objaśniającą)
• małe R2 oznacza niski stopień wyjaśnienia rzeczywistości i stanowi
zagrożenie dla modelu
• należy dążyć (poprzez odpowiedni dobór zmiennych-przyczyn i postaci
matematycznej modelu) do jak największego R2 (dla postaci pierwotnej)
• wysoka wartość R2 świadczy o dobrym poznaniu badanego zjawiska
• wysoka wartość R2 bardzo często wynika jednak ze złego dobrania
zmiennych objaśniających (silnie powiązane ze sobą — „masło maślane”)
KORELACJA POZORNA — jest zależność, ale jej nie ma? Przyczyny...
Trzeba unikać wartości bezwzględnych (ludność, liczba sklepów, wielkość produkcji)

6

9

12

8

11

12

11

15

9

18

9

11

11

18

15

Matematyczne techniki zarządzania - 135
Etap II. Badanie wyrazistości modelu
Y

Wyrazistość modelu dana jest wzorem

s( y )

ui

y

W obl 

s( y )

100 %

y

Celem etapu
jest kontrola
rozrzutu danych

Współczynnik Wobl<30%, w przeciwnym
przypadku rozrzut danych jest zbyt duży

y

Kłopoty: gdyy jest bliskie 0

x

X

Werdykt: model poprawny lub niepoprawny

ETAP II OBOWIĄZUJE DLA WSZYSTKICH MODELI (ale nie ma on charakteru
statystycznego)

ETAP II PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ (sprawdzamy, czy
nie występuje silny efekt „krzywego lustra”)
Etap III. Badanie istotności parametrów (współczynników) modelu
Celem etapu jest sprawdzenie:
• czy poszczególne zmienne objaśniające mają istotny wpływ na zmienną
objaśnianą?
• czy zmienne objaśniające są wybrane prawidłowo?

• czy wyraz wolny różni się istotnie od zera?

Matematyczne techniki zarządzania - 136
Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

Problem istotności parametrów ai można rozpatrywać (tak jak problem
średniej dla populacji) z dwu punktów widzenia:
• przedziału ufności dla nieznanej wartości i

• hipotez — zerowej H0: i=0 i alternatywnej H1: i 0

1
0

ai

1

i

ISTOTNY (W PRZEDZIALE NIE MA ZERA)

0

ai

i

NIEISTOTNY (W PRZEDZIALE JEST ZERO)

P ( a i  t / 2 { n  k } s ( a i )   i  a i  t / 2 { n  k } s ( a i )  1  

Z tablicy rozkładu Studenta, a nie z wydruku komputerowego!

Matematyczne techniki zarządzania - 137
Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

W praktyce posługujemy się raczej hipotezami:
Badanie istotności przeprowadza
się dla każdego i oddzielnie:

t obl ( a i ) 

ai  0
s(a i )

t tabl  t  / 2 { n  k }

• jeżeli |tobl(ai)|>ttabl(ai), odrzucamy hipotezę zerową; parametr jest istotny z błędem równym co najwyżej 
• jeżeli |tobl(ai)|parametr nie jest istotny
Praktycznie jest to bardzo łatwe:
• sprawdzamy, czy |t(ai)| jest większe czy mniejsze od około 2, a najlepiej
• porównujemy rzeczywisty poziom istotności P(ai) z przyjętym 
ODRZUCAMY H0, JEŻELI P(ai) JEST MNIEJSZE OD 

WTEDY ZMIENNA
Xi MA WPŁYW NA
ZMIENNĄ Y

Matematyczne techniki zarządzania - 138
W etapie III następuje ostateczna selekcja zmiennych objaśniających:
• jeżeli wszystkie ai okażą się istotne, model jest poprawny:
— model przyczynowo-skutkowy: do interpretacji
— model tendencji rozwojowej: do etapu IV
• jeżeli choć jedno ai okaże się nieistotne, model jest niepoprawny i wymaga poprawy przez usunięcie nieistotnych zmiennych:
— zmienne należy usuwać po jednej (ze względu na efekt katalityczny)
— usuwa się zawsze zmienną o najniższej wartości |t(ai)| [czyli o
najwyższej wartości P(ai)]
— usunięcie ostatniej zmiennej nieistotnej kończy proces selekcji
kandydatek na zmienne,

— selekcja nie jest ostateczna, gdyż zawsze istnieje możliwość zamiany zmiennych, które są powiązane ze sobą
Praktyczne znaczenie istotności wyrazu wolnego a0
To są jedne z możliwości dla populacji (p. plansza 106)

Y

W przypadku funkcji K=f(P) wyraz wolny wyznacza poziom kosztów stałych (rachunkowość zarządcza)
W przypadku zależności technicznej Q=f(h) wyraz
wolny oznacza, że przy miąższości pokładu h=0 wydajność produkcji Q też jest równa 0

0
X

Matematyczne techniki zarządzania - 139
Praktyczne znaczenie istotności współczynnika regresji ai



KRZYWE NEYMANA — PLANSZE 106-107
WSPÓŁCZ. ISTOTNY
WSPÓŁ. NIEISTOTNY

ETAP III OBOWIĄZUJE DLA WSZYSTKICH MODELI
ETAP III PRZEPROWADZA SIĘ DLA TRANSFORMATY
Etap IV. Badanie symetrii składnika losowego

Y

CZĘSTOŚĆ RESZT DODATNICH I UJEMNYCH MA BYĆ
ZBLIŻONA

Y

ASYMETRYCZNY
SYMETRYCZNY

t
t
Badanie symetrii przeprowadza się testem Studenta (St. Bartosiewicz
Ekonometria)
Brak symetrii wymaga zmiany matematycznej postaci modelu
ETAP IV OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ

ETAP IV PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ

Matematyczne techniki zarządzania - 140
Etap V. Badanie losowości składnika losowego

Y

Y
NIELOSOWY

LOSOWY

t
t
Badanie losowości przeprowadza się testem Studenta lub testem serii
(Ekonometria, praca zb. pod red. M. Krzysztofiaka)
Brak losowości wymaga zmiany matematycznej postaci modelu
ETAP V OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP V PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ
Etap VI. Badanie stacjonarności składnika losowego
W etapie tym chodzi o niezależność wariancji składnika losowego od
zmiennej objaśniającej t (plansza 127)

Bada się istotność współczynnika korelacji ru t , t
ETAP VI OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VI PRZEPROWADZA SIĘ DLA TRANSFORMATY

Matematyczne techniki zarządzania - 141
Etap VII. Badanie wartości oczekiwanej składnika losowego
Normalnie, gdy przeprowadzamy estymację postaci liniowej, parametry
składnika losowego E ( )  0
{ ui  0}
V ( )  const
Po retransformacji do postaci pierwotnej mamy nowe reszty u’, dla
których
'
'
ui  0
 ui  0
Celem etapu jest sprawdzenie, czy odchyłka od O nie jest zbyt duża
(służy do tego test Studenta)
ETAP VII OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VII PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ
Etap VIII. Badanie autokorelacji składnika losowego
Pojęcie autokorelacji opisano na planszy 128; chodzi o istotność korelacji ru , u
t

tk

Badanie autokorelacji można przeprowadzić:

• testem R istotności korelacji ru

t

,ut  k

d obl

• testem Durbina-Watsona
NIE MA AUTOK.

d1

?

d2 JEST AUTOKORELACJA

ETAP VIII OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VIII PRZEPROWADZA SIĘ DLA TRANSFORMATY

Matematyczne techniki zarządzania - 142
Etap IX. Badanie normalności składnika losowego
Celem etapu jest stwierdzenie, czy reszty mają rozkład normalny
Analiza reszt — oddzielny dział analizy regresji i korelacji
Jeżeli reszty mają rozkład normalny, statystyk otrzymuje „ulgi”
ETAP 6. PRAKTYCZNA INTERPRETACJA MODELU



Celem etapu jest wydobycie z modelu całej nowej wiedzy, której nie widać
„gołym okiem”
INTERPRETUJĄC MODEL (RÓWNANIE REGRESJI) NALEŻY UŻYWAĆ WYŁĄCZNIE
PROSTEJ TERMINOLOGII EKONOMICZNEJ ZROZUMIAŁEJ DLA KLIENTA
NIE NALEŻY UŻYWAĆ TERMINOLOGII MATEMATYCZNEJ ZROZUMIAŁEJ TYLKO DLA
TWÓRCÓW MODELU
INTERPRETOWAĆ WOLNO TYLKO MODEL ZWERYFIKOWANY
CAŁY TRUD MODELOWANIA NIE MOŻE BYĆ „SZTUKĄ DLA SZTUKI”, LECZ MA
SŁUŻYĆ UZYSKANIU KONKRETNYCH WNIOSKÓW PRAKTYCZNYCH

Interpretacja modelu przyczynowo-skutkowego

Polega ona na określeniu wpływu poszczególnych czynników na badane
zjawisko:
• podział wszystkich czynników na trzy grupy

Matematyczne techniki zarządzania - 143
A — czynniki nie mające wpływu na Y
B — czynniki mające wpływ na Y i wprowadzone do modelu
C — czynniki mające wpływ na Y, ale nie występujące w modelu
• ocena jakościowa wpływu czynników B i C
• ocena ilościowa wpływu czynników B i C
Ocena jakościowa



Na podstawie znaków stojących przy współczynnikach r oraz ai możemy
stwierdzić, że wpływ jest:

• dodatni (im lepsze zaliczenie, tym lepszy wynik egzaminu; im więcej
wydatków na reklamę, tym większy zysk; itd.)
• ujemny (im więcej zatrudnionych, tym gorszy wynik finansowy; im
mniej braków, tym wyższy zysk; im mniejsza absencja, tym wyższe
wynagrodzenie; itd.)

Ocena ilościowa
• model liniowy
Przykład 33. Zinterpretuj zweryfikowany model zależności miesięcznych
kosztów działalności przedsiębiorstwa (tys. zł) od wielkości produkcji
(sztuk) i liczby reklamacji:
y i  50 , 8  14 , 5 x 1  3 , 9 x 2  

Matematyczne techniki zarządzania - 144
a0 = 50,8

poziom kosztów stałych; jeśli firma nie będzie prowadzić
żadnej działalności, poniesie koszty w wysokości 50,8 tys. zł

a1 = 14,5

każda sztuka produktu firmy kosztuje ją przeciętnie 14,5
tys. zł; jeżeli firma zwiększy produkcję o 2 sztuki, koszty
wzrosną o 29,0 tys. zł

a2 = 3,9każda wniesiona reklamacja powiększa koszty przeciętnie o
3,9 tys. zł
• model potęgowy
Przykłąd 34. Zinterpretuj zweryfikowaną funkcję produkcji Cobba-Douglasa
0 , 65

Pi  45 , 2 M i

0 , 73

Zi

e

0 , 04



Funkcja produkcji to specjalny model, określający zależność pomiędzy
produkcją (P) a czynnikami produkcji: majątkiem trwałym (M) i nakładami
robocizny (Z).



Funkcje produkcji to modele umożliwiające „prześwietlenie”
przedsiębiorstwa (szereg czasowy) lub branży (dane przekrojowe) i określenie poziomu gospodarowania oraz postępu
technicznego i organizacyjnego.
Elastyczność  to współczynnik określający reakcję zmiany
jednej zmiennej na inną zmienną — na przykład elastyczność
cenowa popytu (jak popyt zmienia się wraz z ceną towaru).

EKSPERCI
ZACHODNI

Matematyczne techniki zarządzania - 145

 

y
y

:

x

FUNKCJA POTĘGOWA JEST JEDYNĄ FUNKCJĄ O STAŁEJ ELASTYCZNOŚCI

x

Izolinie funkcji produkcji

T1
M

Produkcję P można osiągnąć różnymi
kombinacjami majątku i robocizny:

T2

• T1— technika kapitałochłonna, np.
pełna automatyzacja
• T2 — pośredni poziom techniki

T3
P  const

• T3 — niski poziom techniki, produkcja
pracochłonna
P. LOWE

Z
Efekt poprawy zarządzania bez
zmiany techniki (lepsze wykorzystanie ludzi i sprzętu):

P2
M

ZARZĄDZANIE
TECHNOLOGIĄ

P1

T

• zmniejszenie kapitałochłonności

• zmniejszenie pracochłonności
• zwiększenie produkcji (przejście z
funkcji P1 na P2)

Można też rozpatrzyć łączne efekty
zmiany techniki i zarządzania

Z

Matematyczne techniki zarządzania - 146
Wszystkie informacje tego typu można odczytać w trakcie interpretacji
0 , 65
0 , 73 0 , 04
funkcji produkcji:
Pi  45 , 2 M i
Zi
e

• wartości 45,2 nie interpretuje się
• wartość 0,65 to współczynnik elastyczności majątkowej (kapitałowej)
produkcji: zmiana majątku o 10% daje średnio zmianę produkcji o 6,5%
• wartość 0,73 to współczynnik elastyczności zatrudnieniowej produkcji:
zmiana zatrudnienia o 10% daje zmianę produkcji średnio o 7,3%
• suma obu współczynników k=0,65+0,73=1,38 to współczynnik skali
produkcji:

— jeżeli k<1, to firma rozwija się ekstensywnie
— jeżeli k>1, to firma rozwija się intensywnie
• wartość  = 0,04 to współczynnik postępu organizacyjnego:
— jeżeli  >O, to miał miejsce postęp organizacyjny

— jeżeli  <0, to miał miejsce regres organizacyjny
Interpretacja modelu tendencji rozwojowej

DODAMY
TROCHĘ
TEORII

Przypomnienie: t — zmienna objaśniająca (stałe przyrosty)
y — zmienna objaśniana; rozdzielana w ogólności na trzy
części: trend, wahania okresowe, wahania losowe ()

Matematyczne techniki zarządzania - 147
Wykres z planszy 117 (zużycie energii elektrycznej przez WZ AGH)
WAHANIA OKRESOWE OKREŚLA SIĘ WZGLĘDEM TRENDU A
NIE WZGLĘDEM OSI CZASU

y

trend

t
1995

1996

1997

1998

1999

Te trzy części trzeba zidentyfikować, a potem złożyć razem w model:

• addytywny (jeśli amplituda wahań jest stała)
• multiplikatywny (jeśli amplituda wahań rośnie lub maleje regularnie)
Wyznaczanie trendu
Metody mechaniczne:

• wskaźniki bezwzględne (stały przyrost =
postęp arytmetyczny = funkcja liniowa)
• wskaźniki względne (przyrost o stały procent =
postęp geometryczny = funkcja potęgowa)
• średnia ruchoma (wygładzanie danych linią łamaną)

JAK OBLICZYĆ O
ILE PROCENT ROCZNIE SPADAŁA
ŚREDNIO LICZBA
WIDZÓW W
KINACH:
1982 - 193,7 MLN
1989 - 141,3 MLN

Matematyczne techniki zarządzania - 148
Średnia ruchoma: mając szereg czasowy y1, y2,....., yn, przyjmujemy
długość kroku k = 3, lub 5, lub 7 itd. i liczymy
y  ...  y k
y  ...  y k  1
y k / 2 0 ,5  1
a następnie y k / 2  1 , 5  2
itd.
k
k
y  y2  y3
y  y3  y4
dla k=3:
y2  1
y3  2
itd.
3
3
Przykład 35. Wyznacz trend metodą średniej ruchomej dla następujących
danych:
okres
t
wartość yt

1
5

2
4

3
7

4
6

5
8

12

y2 
10

y3 

y

8

y4 

6
4

y5 

2

y6 

0
0

1

2

3

4

5

czas, t

6

7

8

9

y7 

547

6
10

 5 , 67

CECHY
ŚREDNIEJ
RUCHOMEJ:

 7 , 00

• TRACI SIĘ
k-1 DANYCH

3
768

8
8

 5 , 33

3
476

7
9

3
6  8  10

 8 , 00

3
8  10  9

 9 , 00

3
10  9  8

 9 , 00

• IM
WIĘKSZE k,
TYM
BARDZIEJ
SZTYWNY
TREND

3

Metody statystyczne: analiza regresji i korelacji, różne funkcje oparte na
modelach ekonomii

Matematyczne techniki zarządzania - 149
Wyznaczanie wahań okresowych: dobowych, tygodniowych, miesięcznych,
kwartalnych, rocznych, wieloletnich
Trzy metody:

— metoda wskaźników sezonowości
— metoda zmiennych zero-jedynkowych (0-1)

— metoda harmoniczna
Wszystkie metody mają jeden cel:
uzyskanie przeciętnego obrazu jednego cyklu

+

Ws
[t ]
[%]
trend

I

II



III

IV

WADY:
• KONIECZNOŚĆ
KOREKTY
• BRAK
WERYFIKACJI
STATYSTYCZNEJ

Metoda wskaźników sezonowości

• obliczenie surowych wskaźników sezonowości (wyeliminowanie trendu):
y

S s  yt  yt
S s  t
yt
addytywny multiplikatywny
wynik: n wartości odchyleń od trendu

• obliczenie oczyszczonych wskaźników
sezonowości (wyeliminowanie wahań
losowych):
 Ss
So 
k-liczba okresów
k
jednoimiennych
m-długość cyklu wynik: m wartości śr. odchyleń od trendu

Matematyczne techniki zarządzania - 150
Metoda zmiennych zero-jedynkowych (0-1)
m

y t  a 0  a1 t   bi Q i  
i 1

bi — przeciętne odchylenie od trendu dla
okresu i-tego
Qi — zmienna 0-1

wahania losowe
trend

wahania okresowe

t
1
2
3
4
5
6
7
8
9

yt
y1
y2
y3
y4
y5
y6
y7
y8
y9

Q1
1
0
0
0
1
0
0
0
1

Q2
0
1
0
0
0
1
0
0
0

Q3
0
0
1
0
0
0
1
0
0

Q4
0
0
0
1
0
0
0
1
0

Metoda harmoniczna (szeregi Fouriera)
Wahania okresowe przedstawia się jako sumę określonej liczby drgań harmonicznych (sinusoid i cosinusoid) przesuniętych w fazie, lecz o jednakowym okresie
m /2
2 i m / 2
2 i
y t  a 0  a 1 t   b1 i sin
  b 2 i cos

m
m
i 1
i 1
Obie metody dają taki sam wynik, istnieje możliwość weryfikacji
statystycznej
W metodzie 0-1 dostajemy bi = Ws, natomiast w metodzie harmonicznej Ws
jest sumą wartości poszczególnych sinusoid dla danego momentu czasu


Slide 23

Matematyczne techniki zarządzania - 121
ETAP 2. GROMADZENIE DANYCH STATYSTYCZNYCH

!

ZA JAKOŚĆ DANYCH ODPOWIADA MODELUJĄCY
• rodzaje danych: dane przekrojowe i szeregi czasowe
• źródła danych: roczniki statystyczne, różne działy
przedsiębiorstwa, badania marketingowe, wywiady itd.
• wiarygodność danych: do jakiego celu zostały one
przygotowane?

MUSISZ
SPRAWDZAĆ
KAŻDE DANE

• porównywalność danych: inflacja (ceny bieżące a ceny
stałe), zmiany procesów technicznych
Wielkość
produkcji

• zmienność zjawisk: trzeba sprawdzić, czy
wybrana w etapie 1a zmienna jest rzeczywiście zmienną losową

Wx 

s( x )

nowy zakład

100 %

x

stary zakład

Wx musi wynosić co najmniej 30-40%
Wiek studenta może być dobrą zmiennąprzyczyną, ale nie w przypadku studiów
dziennych!

Zatrudnienie

Matematyczne techniki zarządzania - 122
ETAP 3. SELEKCJA ZMIENNYCH OBJAŚNIAJĄCYCH
KAŻDĄ ZMIENNĄ X WYTYPOWANĄ W ETAPIE 1a TRAKTUJEMY JAKO
KANDYDATKĘ NA ZMIENNĄ OBJAŚNIAJĄCĄ
Może być kilka przyczyn powodujących, że taka kandydatka nie może znaleźć się w modelu ekonometrycznym (w równaniu regresji):
• w modelu nie może być zbyt wielu zmiennych (nieczytelny)
• kandydatka może nie mieć wpływu na zmienną Y



• kandydatka może wnosić prawie tę samą informację o Y co inna
kandydatka

• dwie bardzo podobne kandydatki mogą sobie nawzajem przeszkadzać
(efekt katalityczny)
Kryteria, jakie musi spełniać kandydatka Xi, aby nadawała się do modelu:
• musi być silnie powiązana ze zmienną Y

• nie może być powiązana z inną kandydatką Xj
SSTO
x1
x4

x2
x3

reszta

R2=0,79

R2=0,66

x2
x1
x4

R2=0,48

x3
reszta

reszta

SSTO

SSTO

Matematyczne techniki zarządzania - 123
Efekt katalityczny
DWIE ZMIENNE DAJĄ
RAZEM MNIEJ INFORMACJI NIŻ KAŻDA Z
NICH Z OSOBNA

x1

x2

R2=0,25

x2

x1

R2=0,52

R2=0,66

Selekcja kandydatek ma na celu podzielenie ich na trzy grupy:
• zmienne wprowadzone do modelu
• zmienne nie wprowadzone do modelu, ale reprezentowane w nim przez
inne zmienne (możliwość wymiany)
• zmienne nie wprowadzone do modelu ze względu na fakt, że nie wnoszą
żadnej informacji o zmiennej Y
INFORMACJE potrzebne do selekcji: współczynniki r x i x j ,
Macierz współczynników korelacji
Y
Y
X1
X2
X3

0,52
0,64
- 0,21

X1
0,52
0,82
- 0,18

X2
0,64
0,82
0,08

X3
- 0,21
- 0,18
0,08

r yx

i

Przykład 32. Macierz powiązania
zmiennych ze sobą przedstawia
się następująco (n=20). Jak ją
można zinterpretować? Które
zmienne są powiązane ze sobą w
sposób istotny?

Matematyczne techniki zarządzania - 124
Testowanie istotności współczynnika korelacji
H0:  = 0

Można je przeprowadzić trzema testami: testem Studenta

H1:   0

(t), Fishera (F) i Wallace’a-Snedecora (R)

Fragment tablicy rozkładu Wallece’a-Snedecora (SKRYPT, tab. VII, s.161)
S to pn ie
sw ob od y

2
0,05
0,632
0,444
0,361

8
18
28

,

0,01
0,765
0,561
0,463

L iczb a zm ien n ych
3
0,05
0,01
0,726
0,827
0,532
0,633
0,439
0,530

4
0,05
0,777
0,587
0,490

0,01
0,860
0,678
0,573

Reguła decyzyjna: — jeżeli |Robl|>Rtabl, odrzucamy H0 (korelacja istotna)
— jeżeli |Robl|
W przykładzie 32, jeżeli przyjmiemy  = 0,05, to Rtabl = 0,444.
Y
Y
X1
X2
X3

0,52
0,64
- 0,21

X1
0,52
0,82
- 0,18

X2
0,64
0,82
0,08

X3
- 0,21
- 0,18
0,08

Pozostaną zatem tylko trzy
istotne powiązania:
y-x1, y-x2, x1-x2
BRAK ISTOTNEGO POWIĄZANIA Z Y NIE
OZNACZA, ŻE ZMIENNA NIE WNOSI
ŻADNEJ INFORMACJI O ZJAWISKU Y

Matematyczne techniki zarządzania - 125



Metody selekcji zmiennych objaśniających:
• grafowa
• Hellwiga (pojemności informacji)
• taksonomiczne (clustering)
Metoda grafowa
• obliczenie macierzy współczynników:

rx

i

xj

• wyłowienie z macierzy powiązań istotnych

, r yx

BUDOWA GRAFU
i

• graf spójny

• budowa grafu z powiązań istotnych
• wybranie zmiennych na podstawie grafu

x6

• graf zerowy
x1
x4

x9

DO MODELU WYBIERA SIĘ ZMIENNE:
• każdy graf zerowy (jeśli |ryx|>0,1)

istotne powiązanie

• po jednej reprezentantce grafu spójnego;

reprezentantką grafu jest zmienna, która ma najwięcej powiązań z
innymi kandydatkami
jeżeli kilka zmiennych ma tę samą maksymalną liczbę powiązań, wybiera
się z nich tę, która jest najsilniej powiązana za zmienną Y (max ryx)
jeżeli graf jest rozległy, może mieć dwie reprezentantki, ale muszą one
leżeć na przeciwległych stronach grafu

Matematyczne techniki zarządzania - 126
Przykład 32 cd. Wybierzemy
zmienną x2 (reprezentantka grafu
spójnego) i zmienną x3 (graf
zerowy)
Metoda Hellwiga

Y
Y
X1
X2
X3

0,52
0,64
- 0,21

• wypisujemy wszystkie możliwe kombinacje
kandydatek; jest ich K = 2m—1
• obliczamy pojemność informacji dla każdej
zmiennej w każdej kombinacji

h kl  f ( r yx , r x
i

ixj

)

• obliczamy pojemność całkowitą dla każdej
kombinacji
H l   h kl
k

• wybieramy kombinację o największej
pojemności Hl = max

X1
0,52
0,82
- 0,18

X2
0,64
0,82

X3
- 0,21
- 0,18
0,08

0,08

W przykładzie 32 mamy 7
możliwych kombinacji kandydatek:
1. x1
2. x2

3. x3

maximum:

H6 = 0,42

4. x1,x2
5. x1,x3

Hmax = R2

6. x2,x3
7. x1,x2,x3

Metody taksonomiczne
Taksonomia wrocławska (cluster analysis) to metoda grupowania obiektów (zmiennych) w grupy jednorodne pod względem n cech (wymiarów)
łącznie. Podstawą grupowania jest odległość euklidesowa, która w przypadku zmiennych d ij  f ( r x x )
WSZYSTKIE METODY TO SELEKCJA WSTĘPNA
i

j

Matematyczne techniki zarządzania - 127
ETAP 4. ESTYMACJA PARAMETRÓW MODELU
Cel etapu: wyznaczenie parametrów strukturalnych i stochastycznych
Estymacja: szacowanie parametrów populacji na podstawie próbki
Metody estymacji: analiza regresji i korelacji (KMNK i inne)

Założenia dla KMNK
1. Zmienne losowe są prawdziwymi zmiennymi, nie powiązanymi ze sobą
2. Składnik losowy  ma stałą wariancję, niezależną od zmiennej x lub t
3. Wartości reszt ui są niezależne od siebie

4. Składnik losowy  nie jest powiązany ze zmienną objaśniającą
Skutki niedotrzymania założeń i środki zaradcze
1. Model bez sensu, nieprzydatny; niekiedy absurdalny (źle uwarunkowane
dane)
Stosuje się: dużą próbkę (n>100), regresję grzbietową (ridge regression)
2.

Y

reszta ui

Lewa część zbioru ma dużą wariancję, a
prawa — wariancję małą
Stosuje się specjalny wariant MNK z
korektą na różne wariancje
X

Matematyczne techniki zarządzania - 128
3. Jeśli reszty ui są ze sobą powiązane (skorelowane), mówimy, że
występuje autokorelacja składnika losowego (zjawisko występuje przy
szeregach czasowych — sztywny porządek obserwacji)
Oznacza to, że istnieje istotna zależność u t  f ( u t  k )
Przyczyny autokorelacji: zakłócenia
(dodatnie lub ujemne) w jednym okresie
wpływają na poziom zjawiska w następnych
okresach (rolnictwo, produkcja, rynek)

t  1 , 2 ,...

u t  y t  yˆ t

u t 1

u1
u2
u3
u4
u5

Występowanie autokorelacji powoduje
nieprzydatność modelu


u1
u2
u3
u4

Istnienie autokorelacji sprawdza się testem
Durbina-Watsona d
Stosuje się metodę różniczki zupełnej

y  f (x )

yt  yt  ytk

4. Składnik losowy jest skorelowany ze zmienną objaśniającą, wtedy
gdy została pominięta jakaś ważna zmienna-przyczyna

Model taki nie ma żadnej wartości; trzeba dbać o jak najwyższy współczynnik determinacji (R2>0,9)
• zbiór danych rzeczywistych nigdy
nie spełnia tych wymagań

ESTYMACJĘ MODELU POWTARZA SIĘ WIELOKROTNIE
ponieważ dopiero weryfikacja zapewnia ostateczną selekcję
kandydatek na zmienne objaśniające

• ekonometria to analiza danych nie
spełniających tych założeń
• nie stosować statystyki bezmyślnie (na ślepo)

Matematyczne techniki zarządzania - 129
ETAP 5. WERYFIKACJA MODELU
Cele:

1. opis rzeczywistości (populacji generalnej)



2. dokładna (ostateczna) selekcja zmiennych objaśniających
3. poznanie składnika losowego (spełnienie założeń KMNK)
Narzędzia: hipotezy i testy statystyczne

Metodyka: każde równanie oddzielnie; weryfikacja obejmuje 9 etapów (od
najmniej do najbardziej pracochłonnego)
WYKAZ ETAPÓW WERYFIKACJI MODELU
I.
II.

Badanie istotności korelacji
Badanie wyrazistości modelu

III.

Badanie istotności parametrów

IV.

Badanie symetrii skł. losowego

V.
VI.
VII.
VIII.
IX.

Badanie losowości skł. losowego
Badanie stacjonarności skł. los.
Badanie wartości oczekiwanej skł. los.
Badanie autokorelacji skł. losowego
Badanie normalności skł. losowego

Opis każdego etapu weryfikacji
obejmuje:
• cel etapu
• sposób weryfikacji: wzory,
hipotezy, testy
• podanie których modeli dotyczy (przyczynowo-skutkowych
czy tendencji rozwojowej)
• podanie której postaci modeli
nieliniowych dotyczy (pierwotnej czy transformaty)

Matematyczne techniki zarządzania - 130
Etap I. Badanie istotności korelacji
7
2

8

9

11

12

17

19

23

21

5
2 etapu
9
16
7
9
15
14
Celem
jest
sprawdzenie,
czy
istnieje w populacji generalnej powiązanie pomiędzy zmienną Y i wszystkimi zmiennymi objaśniającymi

25

Przedział ufności dla
nieznanego współczynnika korelacji  dla populacji buduje się przy
użyciu błędu

populacja

zmienna Y

20
15
10

próbka

5
0
8
5

0 9

1011

2

9

20
12

30
17
16
7
zmienna X

25

1940
9

23 50
15

populacja

20

zmienna Y

7
2

15
10

próbka

5
0
0

10

20

30

zmienna X

40

50

21
14

sR 

1 R

0

Robl

2

nk

Istotność korelacji weryfikuje się przez postawienie
następujących hipotez dla
współczynnika korelacji dla
populacji generalnej:

1
R,|r|

H0 :   0

Brak korelacji, nie ma powiązania...

H1 :   0

Korelacja istotna, jest powiązanie...

,

Matematyczne techniki zarządzania - 131
Hipotezy te można weryfikować trzema równoważnymi testami:
• testem t Studenta (tylko dla regresji dwu zmiennych)
• testem F Fishera-Snedecora
• testem R Wallace’a-Snedecora

,

W każdym przypadku obliczamy wartość
statystyki dla próbki (tobl, Fobl, Robl) i porównujemy z wartością krytyczną odczytaną z tablicy odpowiedniego rozkładu w
funkcji poziomu istotności i liczby stopni
swobody (ttabl, Ftabl, Rtabl)

Reguła decyzyjna:
• jeżeli |tobl|< ttabl, nie ma podstaw do odrzucenia H0 (brak korelacji)
• jeżeli |tobl|> ttabl, odrzucamy H0 na korzyść H1 (korelacja istnieje)

TAK SAMO DLA
FiR

W przypadku regresji wielorakiej, gdy liczba zmiennych objaśniajacych
jest duża w porównaniu do liczby obserwacji, współczynnik determinacji
R2 może dawać zawyżoną ocenę stopnia wyjaśnienia zmienności zmiennej
objaśnianej; dlatego wprowadzono skorygowany współczynnik determinacji (i korelacji):
 ( yˆ i  y )

R

2

2

k
n

k

1


2
nk 1
(
y

y
)

i
n1

• adjusted coefficient of multiple
determination (wydruki komputerowe)

• jeśli k jest małe, nie ma większej różnicy
pomiędzy normalnym a skorygowanym R2

Matematyczne techniki zarządzania - 132
Skąd wziąć wartość odpowiedniej statystyki dla próbki i jak odczytywać jej wartości z tablic?
n2
r
t

r

t tabl  t  / 2 { n  2 }
TEST STUDENTA
obl
2
sr
1 r

F obl 

TEST FISHERA

Ź ró d ło z m ien n o śc i

MSTR
MSE



R

nk

2

1 R

2

L ic zb a sto p n i
sw o b o d y

Suma
k w a d ra tó w

Ś re d n i
k w a d ra t

M o d el (c z yn n ik i)
B łą d (re sz ta )

k1
nk

SSTR
SSE

MSTR
MSE

R azem

n1

SSTO

TEST WALLACE’A

R obl 

R

2

k 1

F tabl  F { k  1 , n  k }

S ta ty sty k a
F
F obl 

MSTR
MSE

NIE MYLIĆ
STOPNI SWOBODY LICZNIKA I MIANOWNIKA

R tabl  R { k , n  k }

Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

Matematyczne techniki zarządzania - 133
Odczyt Rtabl z tablicy testu R (SKRYPT s.161-162)

, k,  = n-k

S to pn ie
sw ob od y
8
18
28

2
0,05
0,632
0,444
0,361

0,01
0,765
0,561
0,463

L iczb a zm ien n ych
3
0,05
0,01
0,726
0,827
0,532
0,633
0,439
0,530

4
0,05
0,777
0,587
0,490

0,01
0,860
0,678
0,573

Wnioski dotyczące rozkładu R Wallace’a-Snedecora:
• tablica zawiera maksymalne wartości współczynnika korelacji w danej
sytuacji, jakich można oczekiwać, gdy nie ma korelacji w populacji
• im wyższy poziom istotności, tym niższe Rtabl

• im większa liczba zmiennych w modelu, tym wyższe Rtabl
• im wyższa liczba stopni swobody (większa próbka), tym niższe Rtabl
• tablica R powstała z przeliczenia tablic t oraz F (odwrócenie wzorów)
• tablica testu R jest najszybszym i nawygodniejszym narzędziem do
weryfikacji istotności korelacji

Werdykt z etapu I:

Matematyczne techniki zarządzania - 134

• jeżeli Robl>Rtabl, model jest poprawny, można przejść do etapu II
• jeżeli Roblzmiennych objaśniających albo jego postać matematyczną
ETAP I OBOWIĄZUJE DLA WSZYSTKICH MODELI
ETAP I PRZEPROWADZA SIĘ DLA TRANSFORMATY (dla postaci pierwotnej
można uzyskać R>1)
Rola współczynnika determinacji R2
• korelacja może być istotna przy małym R i bardzo małym R2 (r=0,4,
R2=0,16, co oznacza, że tylko 16% zmienności zmiennej Y jest
wyjaśnione przez zmienną objaśniającą)
• małe R2 oznacza niski stopień wyjaśnienia rzeczywistości i stanowi
zagrożenie dla modelu
• należy dążyć (poprzez odpowiedni dobór zmiennych-przyczyn i postaci
matematycznej modelu) do jak największego R2 (dla postaci pierwotnej)
• wysoka wartość R2 świadczy o dobrym poznaniu badanego zjawiska
• wysoka wartość R2 bardzo często wynika jednak ze złego dobrania
zmiennych objaśniających (silnie powiązane ze sobą — „masło maślane”)
KORELACJA POZORNA — jest zależność, ale jej nie ma? Przyczyny...
Trzeba unikać wartości bezwzględnych (ludność, liczba sklepów, wielkość produkcji)

6

9

12

8

11

12

11

15

9

18

9

11

11

18

15

Matematyczne techniki zarządzania - 135
Etap II. Badanie wyrazistości modelu
Y

Wyrazistość modelu dana jest wzorem

s( y )

ui

y

W obl 

s( y )

100 %

y

Celem etapu
jest kontrola
rozrzutu danych

Współczynnik Wobl<30%, w przeciwnym
przypadku rozrzut danych jest zbyt duży

y

Kłopoty: gdyy jest bliskie 0

x

X

Werdykt: model poprawny lub niepoprawny

ETAP II OBOWIĄZUJE DLA WSZYSTKICH MODELI (ale nie ma on charakteru
statystycznego)

ETAP II PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ (sprawdzamy, czy
nie występuje silny efekt „krzywego lustra”)
Etap III. Badanie istotności parametrów (współczynników) modelu
Celem etapu jest sprawdzenie:
• czy poszczególne zmienne objaśniające mają istotny wpływ na zmienną
objaśnianą?
• czy zmienne objaśniające są wybrane prawidłowo?

• czy wyraz wolny różni się istotnie od zera?

Matematyczne techniki zarządzania - 136
Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

Problem istotności parametrów ai można rozpatrywać (tak jak problem
średniej dla populacji) z dwu punktów widzenia:
• przedziału ufności dla nieznanej wartości i

• hipotez — zerowej H0: i=0 i alternatywnej H1: i 0

1
0

ai

1

i

ISTOTNY (W PRZEDZIALE NIE MA ZERA)

0

ai

i

NIEISTOTNY (W PRZEDZIALE JEST ZERO)

P ( a i  t / 2 { n  k } s ( a i )   i  a i  t / 2 { n  k } s ( a i )  1  

Z tablicy rozkładu Studenta, a nie z wydruku komputerowego!

Matematyczne techniki zarządzania - 137
Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

W praktyce posługujemy się raczej hipotezami:
Badanie istotności przeprowadza
się dla każdego i oddzielnie:

t obl ( a i ) 

ai  0
s(a i )

t tabl  t  / 2 { n  k }

• jeżeli |tobl(ai)|>ttabl(ai), odrzucamy hipotezę zerową; parametr jest istotny z błędem równym co najwyżej 
• jeżeli |tobl(ai)|parametr nie jest istotny
Praktycznie jest to bardzo łatwe:
• sprawdzamy, czy |t(ai)| jest większe czy mniejsze od około 2, a najlepiej
• porównujemy rzeczywisty poziom istotności P(ai) z przyjętym 
ODRZUCAMY H0, JEŻELI P(ai) JEST MNIEJSZE OD 

WTEDY ZMIENNA
Xi MA WPŁYW NA
ZMIENNĄ Y

Matematyczne techniki zarządzania - 138
W etapie III następuje ostateczna selekcja zmiennych objaśniających:
• jeżeli wszystkie ai okażą się istotne, model jest poprawny:
— model przyczynowo-skutkowy: do interpretacji
— model tendencji rozwojowej: do etapu IV
• jeżeli choć jedno ai okaże się nieistotne, model jest niepoprawny i wymaga poprawy przez usunięcie nieistotnych zmiennych:
— zmienne należy usuwać po jednej (ze względu na efekt katalityczny)
— usuwa się zawsze zmienną o najniższej wartości |t(ai)| [czyli o
najwyższej wartości P(ai)]
— usunięcie ostatniej zmiennej nieistotnej kończy proces selekcji
kandydatek na zmienne,

— selekcja nie jest ostateczna, gdyż zawsze istnieje możliwość zamiany zmiennych, które są powiązane ze sobą
Praktyczne znaczenie istotności wyrazu wolnego a0
To są jedne z możliwości dla populacji (p. plansza 106)

Y

W przypadku funkcji K=f(P) wyraz wolny wyznacza poziom kosztów stałych (rachunkowość zarządcza)
W przypadku zależności technicznej Q=f(h) wyraz
wolny oznacza, że przy miąższości pokładu h=0 wydajność produkcji Q też jest równa 0

0
X

Matematyczne techniki zarządzania - 139
Praktyczne znaczenie istotności współczynnika regresji ai



KRZYWE NEYMANA — PLANSZE 106-107
WSPÓŁCZ. ISTOTNY
WSPÓŁ. NIEISTOTNY

ETAP III OBOWIĄZUJE DLA WSZYSTKICH MODELI
ETAP III PRZEPROWADZA SIĘ DLA TRANSFORMATY
Etap IV. Badanie symetrii składnika losowego

Y

CZĘSTOŚĆ RESZT DODATNICH I UJEMNYCH MA BYĆ
ZBLIŻONA

Y

ASYMETRYCZNY
SYMETRYCZNY

t
t
Badanie symetrii przeprowadza się testem Studenta (St. Bartosiewicz
Ekonometria)
Brak symetrii wymaga zmiany matematycznej postaci modelu
ETAP IV OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ

ETAP IV PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ

Matematyczne techniki zarządzania - 140
Etap V. Badanie losowości składnika losowego

Y

Y
NIELOSOWY

LOSOWY

t
t
Badanie losowości przeprowadza się testem Studenta lub testem serii
(Ekonometria, praca zb. pod red. M. Krzysztofiaka)
Brak losowości wymaga zmiany matematycznej postaci modelu
ETAP V OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP V PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ
Etap VI. Badanie stacjonarności składnika losowego
W etapie tym chodzi o niezależność wariancji składnika losowego od
zmiennej objaśniającej t (plansza 127)

Bada się istotność współczynnika korelacji ru t , t
ETAP VI OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VI PRZEPROWADZA SIĘ DLA TRANSFORMATY

Matematyczne techniki zarządzania - 141
Etap VII. Badanie wartości oczekiwanej składnika losowego
Normalnie, gdy przeprowadzamy estymację postaci liniowej, parametry
składnika losowego E ( )  0
{ ui  0}
V ( )  const
Po retransformacji do postaci pierwotnej mamy nowe reszty u’, dla
których
'
'
ui  0
 ui  0
Celem etapu jest sprawdzenie, czy odchyłka od O nie jest zbyt duża
(służy do tego test Studenta)
ETAP VII OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VII PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ
Etap VIII. Badanie autokorelacji składnika losowego
Pojęcie autokorelacji opisano na planszy 128; chodzi o istotność korelacji ru , u
t

tk

Badanie autokorelacji można przeprowadzić:

• testem R istotności korelacji ru

t

,ut  k

d obl

• testem Durbina-Watsona
NIE MA AUTOK.

d1

?

d2 JEST AUTOKORELACJA

ETAP VIII OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VIII PRZEPROWADZA SIĘ DLA TRANSFORMATY

Matematyczne techniki zarządzania - 142
Etap IX. Badanie normalności składnika losowego
Celem etapu jest stwierdzenie, czy reszty mają rozkład normalny
Analiza reszt — oddzielny dział analizy regresji i korelacji
Jeżeli reszty mają rozkład normalny, statystyk otrzymuje „ulgi”
ETAP 6. PRAKTYCZNA INTERPRETACJA MODELU



Celem etapu jest wydobycie z modelu całej nowej wiedzy, której nie widać
„gołym okiem”
INTERPRETUJĄC MODEL (RÓWNANIE REGRESJI) NALEŻY UŻYWAĆ WYŁĄCZNIE
PROSTEJ TERMINOLOGII EKONOMICZNEJ ZROZUMIAŁEJ DLA KLIENTA
NIE NALEŻY UŻYWAĆ TERMINOLOGII MATEMATYCZNEJ ZROZUMIAŁEJ TYLKO DLA
TWÓRCÓW MODELU
INTERPRETOWAĆ WOLNO TYLKO MODEL ZWERYFIKOWANY
CAŁY TRUD MODELOWANIA NIE MOŻE BYĆ „SZTUKĄ DLA SZTUKI”, LECZ MA
SŁUŻYĆ UZYSKANIU KONKRETNYCH WNIOSKÓW PRAKTYCZNYCH

Interpretacja modelu przyczynowo-skutkowego

Polega ona na określeniu wpływu poszczególnych czynników na badane
zjawisko:
• podział wszystkich czynników na trzy grupy

Matematyczne techniki zarządzania - 143
A — czynniki nie mające wpływu na Y
B — czynniki mające wpływ na Y i wprowadzone do modelu
C — czynniki mające wpływ na Y, ale nie występujące w modelu
• ocena jakościowa wpływu czynników B i C
• ocena ilościowa wpływu czynników B i C
Ocena jakościowa



Na podstawie znaków stojących przy współczynnikach r oraz ai możemy
stwierdzić, że wpływ jest:

• dodatni (im lepsze zaliczenie, tym lepszy wynik egzaminu; im więcej
wydatków na reklamę, tym większy zysk; itd.)
• ujemny (im więcej zatrudnionych, tym gorszy wynik finansowy; im
mniej braków, tym wyższy zysk; im mniejsza absencja, tym wyższe
wynagrodzenie; itd.)

Ocena ilościowa
• model liniowy
Przykład 33. Zinterpretuj zweryfikowany model zależności miesięcznych
kosztów działalności przedsiębiorstwa (tys. zł) od wielkości produkcji
(sztuk) i liczby reklamacji:
y i  50 , 8  14 , 5 x 1  3 , 9 x 2  

Matematyczne techniki zarządzania - 144
a0 = 50,8

poziom kosztów stałych; jeśli firma nie będzie prowadzić
żadnej działalności, poniesie koszty w wysokości 50,8 tys. zł

a1 = 14,5

każda sztuka produktu firmy kosztuje ją przeciętnie 14,5
tys. zł; jeżeli firma zwiększy produkcję o 2 sztuki, koszty
wzrosną o 29,0 tys. zł

a2 = 3,9każda wniesiona reklamacja powiększa koszty przeciętnie o
3,9 tys. zł
• model potęgowy
Przykłąd 34. Zinterpretuj zweryfikowaną funkcję produkcji Cobba-Douglasa
0 , 65

Pi  45 , 2 M i

0 , 73

Zi

e

0 , 04



Funkcja produkcji to specjalny model, określający zależność pomiędzy
produkcją (P) a czynnikami produkcji: majątkiem trwałym (M) i nakładami
robocizny (Z).



Funkcje produkcji to modele umożliwiające „prześwietlenie”
przedsiębiorstwa (szereg czasowy) lub branży (dane przekrojowe) i określenie poziomu gospodarowania oraz postępu
technicznego i organizacyjnego.
Elastyczność  to współczynnik określający reakcję zmiany
jednej zmiennej na inną zmienną — na przykład elastyczność
cenowa popytu (jak popyt zmienia się wraz z ceną towaru).

EKSPERCI
ZACHODNI

Matematyczne techniki zarządzania - 145

 

y
y

:

x

FUNKCJA POTĘGOWA JEST JEDYNĄ FUNKCJĄ O STAŁEJ ELASTYCZNOŚCI

x

Izolinie funkcji produkcji

T1
M

Produkcję P można osiągnąć różnymi
kombinacjami majątku i robocizny:

T2

• T1— technika kapitałochłonna, np.
pełna automatyzacja
• T2 — pośredni poziom techniki

T3
P  const

• T3 — niski poziom techniki, produkcja
pracochłonna
P. LOWE

Z
Efekt poprawy zarządzania bez
zmiany techniki (lepsze wykorzystanie ludzi i sprzętu):

P2
M

ZARZĄDZANIE
TECHNOLOGIĄ

P1

T

• zmniejszenie kapitałochłonności

• zmniejszenie pracochłonności
• zwiększenie produkcji (przejście z
funkcji P1 na P2)

Można też rozpatrzyć łączne efekty
zmiany techniki i zarządzania

Z

Matematyczne techniki zarządzania - 146
Wszystkie informacje tego typu można odczytać w trakcie interpretacji
0 , 65
0 , 73 0 , 04
funkcji produkcji:
Pi  45 , 2 M i
Zi
e

• wartości 45,2 nie interpretuje się
• wartość 0,65 to współczynnik elastyczności majątkowej (kapitałowej)
produkcji: zmiana majątku o 10% daje średnio zmianę produkcji o 6,5%
• wartość 0,73 to współczynnik elastyczności zatrudnieniowej produkcji:
zmiana zatrudnienia o 10% daje zmianę produkcji średnio o 7,3%
• suma obu współczynników k=0,65+0,73=1,38 to współczynnik skali
produkcji:

— jeżeli k<1, to firma rozwija się ekstensywnie
— jeżeli k>1, to firma rozwija się intensywnie
• wartość  = 0,04 to współczynnik postępu organizacyjnego:
— jeżeli  >O, to miał miejsce postęp organizacyjny

— jeżeli  <0, to miał miejsce regres organizacyjny
Interpretacja modelu tendencji rozwojowej

DODAMY
TROCHĘ
TEORII

Przypomnienie: t — zmienna objaśniająca (stałe przyrosty)
y — zmienna objaśniana; rozdzielana w ogólności na trzy
części: trend, wahania okresowe, wahania losowe ()

Matematyczne techniki zarządzania - 147
Wykres z planszy 117 (zużycie energii elektrycznej przez WZ AGH)
WAHANIA OKRESOWE OKREŚLA SIĘ WZGLĘDEM TRENDU A
NIE WZGLĘDEM OSI CZASU

y

trend

t
1995

1996

1997

1998

1999

Te trzy części trzeba zidentyfikować, a potem złożyć razem w model:

• addytywny (jeśli amplituda wahań jest stała)
• multiplikatywny (jeśli amplituda wahań rośnie lub maleje regularnie)
Wyznaczanie trendu
Metody mechaniczne:

• wskaźniki bezwzględne (stały przyrost =
postęp arytmetyczny = funkcja liniowa)
• wskaźniki względne (przyrost o stały procent =
postęp geometryczny = funkcja potęgowa)
• średnia ruchoma (wygładzanie danych linią łamaną)

JAK OBLICZYĆ O
ILE PROCENT ROCZNIE SPADAŁA
ŚREDNIO LICZBA
WIDZÓW W
KINACH:
1982 - 193,7 MLN
1989 - 141,3 MLN

Matematyczne techniki zarządzania - 148
Średnia ruchoma: mając szereg czasowy y1, y2,....., yn, przyjmujemy
długość kroku k = 3, lub 5, lub 7 itd. i liczymy
y  ...  y k
y  ...  y k  1
y k / 2 0 ,5  1
a następnie y k / 2  1 , 5  2
itd.
k
k
y  y2  y3
y  y3  y4
dla k=3:
y2  1
y3  2
itd.
3
3
Przykład 35. Wyznacz trend metodą średniej ruchomej dla następujących
danych:
okres
t
wartość yt

1
5

2
4

3
7

4
6

5
8

12

y2 
10

y3 

y

8

y4 

6
4

y5 

2

y6 

0
0

1

2

3

4

5

czas, t

6

7

8

9

y7 

547

6
10

 5 , 67

CECHY
ŚREDNIEJ
RUCHOMEJ:

 7 , 00

• TRACI SIĘ
k-1 DANYCH

3
768

8
8

 5 , 33

3
476

7
9

3
6  8  10

 8 , 00

3
8  10  9

 9 , 00

3
10  9  8

 9 , 00

• IM
WIĘKSZE k,
TYM
BARDZIEJ
SZTYWNY
TREND

3

Metody statystyczne: analiza regresji i korelacji, różne funkcje oparte na
modelach ekonomii

Matematyczne techniki zarządzania - 149
Wyznaczanie wahań okresowych: dobowych, tygodniowych, miesięcznych,
kwartalnych, rocznych, wieloletnich
Trzy metody:

— metoda wskaźników sezonowości
— metoda zmiennych zero-jedynkowych (0-1)

— metoda harmoniczna
Wszystkie metody mają jeden cel:
uzyskanie przeciętnego obrazu jednego cyklu

+

Ws
[t ]
[%]
trend

I

II



III

IV

WADY:
• KONIECZNOŚĆ
KOREKTY
• BRAK
WERYFIKACJI
STATYSTYCZNEJ

Metoda wskaźników sezonowości

• obliczenie surowych wskaźników sezonowości (wyeliminowanie trendu):
y

S s  yt  yt
S s  t
yt
addytywny multiplikatywny
wynik: n wartości odchyleń od trendu

• obliczenie oczyszczonych wskaźników
sezonowości (wyeliminowanie wahań
losowych):
 Ss
So 
k-liczba okresów
k
jednoimiennych
m-długość cyklu wynik: m wartości śr. odchyleń od trendu

Matematyczne techniki zarządzania - 150
Metoda zmiennych zero-jedynkowych (0-1)
m

y t  a 0  a1 t   bi Q i  
i 1

bi — przeciętne odchylenie od trendu dla
okresu i-tego
Qi — zmienna 0-1

wahania losowe
trend

wahania okresowe

t
1
2
3
4
5
6
7
8
9

yt
y1
y2
y3
y4
y5
y6
y7
y8
y9

Q1
1
0
0
0
1
0
0
0
1

Q2
0
1
0
0
0
1
0
0
0

Q3
0
0
1
0
0
0
1
0
0

Q4
0
0
0
1
0
0
0
1
0

Metoda harmoniczna (szeregi Fouriera)
Wahania okresowe przedstawia się jako sumę określonej liczby drgań harmonicznych (sinusoid i cosinusoid) przesuniętych w fazie, lecz o jednakowym okresie
m /2
2 i m / 2
2 i
y t  a 0  a 1 t   b1 i sin
  b 2 i cos

m
m
i 1
i 1
Obie metody dają taki sam wynik, istnieje możliwość weryfikacji
statystycznej
W metodzie 0-1 dostajemy bi = Ws, natomiast w metodzie harmonicznej Ws
jest sumą wartości poszczególnych sinusoid dla danego momentu czasu


Slide 24

Matematyczne techniki zarządzania - 121
ETAP 2. GROMADZENIE DANYCH STATYSTYCZNYCH

!

ZA JAKOŚĆ DANYCH ODPOWIADA MODELUJĄCY
• rodzaje danych: dane przekrojowe i szeregi czasowe
• źródła danych: roczniki statystyczne, różne działy
przedsiębiorstwa, badania marketingowe, wywiady itd.
• wiarygodność danych: do jakiego celu zostały one
przygotowane?

MUSISZ
SPRAWDZAĆ
KAŻDE DANE

• porównywalność danych: inflacja (ceny bieżące a ceny
stałe), zmiany procesów technicznych
Wielkość
produkcji

• zmienność zjawisk: trzeba sprawdzić, czy
wybrana w etapie 1a zmienna jest rzeczywiście zmienną losową

Wx 

s( x )

nowy zakład

100 %

x

stary zakład

Wx musi wynosić co najmniej 30-40%
Wiek studenta może być dobrą zmiennąprzyczyną, ale nie w przypadku studiów
dziennych!

Zatrudnienie

Matematyczne techniki zarządzania - 122
ETAP 3. SELEKCJA ZMIENNYCH OBJAŚNIAJĄCYCH
KAŻDĄ ZMIENNĄ X WYTYPOWANĄ W ETAPIE 1a TRAKTUJEMY JAKO
KANDYDATKĘ NA ZMIENNĄ OBJAŚNIAJĄCĄ
Może być kilka przyczyn powodujących, że taka kandydatka nie może znaleźć się w modelu ekonometrycznym (w równaniu regresji):
• w modelu nie może być zbyt wielu zmiennych (nieczytelny)
• kandydatka może nie mieć wpływu na zmienną Y



• kandydatka może wnosić prawie tę samą informację o Y co inna
kandydatka

• dwie bardzo podobne kandydatki mogą sobie nawzajem przeszkadzać
(efekt katalityczny)
Kryteria, jakie musi spełniać kandydatka Xi, aby nadawała się do modelu:
• musi być silnie powiązana ze zmienną Y

• nie może być powiązana z inną kandydatką Xj
SSTO
x1
x4

x2
x3

reszta

R2=0,79

R2=0,66

x2
x1
x4

R2=0,48

x3
reszta

reszta

SSTO

SSTO

Matematyczne techniki zarządzania - 123
Efekt katalityczny
DWIE ZMIENNE DAJĄ
RAZEM MNIEJ INFORMACJI NIŻ KAŻDA Z
NICH Z OSOBNA

x1

x2

R2=0,25

x2

x1

R2=0,52

R2=0,66

Selekcja kandydatek ma na celu podzielenie ich na trzy grupy:
• zmienne wprowadzone do modelu
• zmienne nie wprowadzone do modelu, ale reprezentowane w nim przez
inne zmienne (możliwość wymiany)
• zmienne nie wprowadzone do modelu ze względu na fakt, że nie wnoszą
żadnej informacji o zmiennej Y
INFORMACJE potrzebne do selekcji: współczynniki r x i x j ,
Macierz współczynników korelacji
Y
Y
X1
X2
X3

0,52
0,64
- 0,21

X1
0,52
0,82
- 0,18

X2
0,64
0,82
0,08

X3
- 0,21
- 0,18
0,08

r yx

i

Przykład 32. Macierz powiązania
zmiennych ze sobą przedstawia
się następująco (n=20). Jak ją
można zinterpretować? Które
zmienne są powiązane ze sobą w
sposób istotny?

Matematyczne techniki zarządzania - 124
Testowanie istotności współczynnika korelacji
H0:  = 0

Można je przeprowadzić trzema testami: testem Studenta

H1:   0

(t), Fishera (F) i Wallace’a-Snedecora (R)

Fragment tablicy rozkładu Wallece’a-Snedecora (SKRYPT, tab. VII, s.161)
S to pn ie
sw ob od y

2
0,05
0,632
0,444
0,361

8
18
28

,

0,01
0,765
0,561
0,463

L iczb a zm ien n ych
3
0,05
0,01
0,726
0,827
0,532
0,633
0,439
0,530

4
0,05
0,777
0,587
0,490

0,01
0,860
0,678
0,573

Reguła decyzyjna: — jeżeli |Robl|>Rtabl, odrzucamy H0 (korelacja istotna)
— jeżeli |Robl|
W przykładzie 32, jeżeli przyjmiemy  = 0,05, to Rtabl = 0,444.
Y
Y
X1
X2
X3

0,52
0,64
- 0,21

X1
0,52
0,82
- 0,18

X2
0,64
0,82
0,08

X3
- 0,21
- 0,18
0,08

Pozostaną zatem tylko trzy
istotne powiązania:
y-x1, y-x2, x1-x2
BRAK ISTOTNEGO POWIĄZANIA Z Y NIE
OZNACZA, ŻE ZMIENNA NIE WNOSI
ŻADNEJ INFORMACJI O ZJAWISKU Y

Matematyczne techniki zarządzania - 125



Metody selekcji zmiennych objaśniających:
• grafowa
• Hellwiga (pojemności informacji)
• taksonomiczne (clustering)
Metoda grafowa
• obliczenie macierzy współczynników:

rx

i

xj

• wyłowienie z macierzy powiązań istotnych

, r yx

BUDOWA GRAFU
i

• graf spójny

• budowa grafu z powiązań istotnych
• wybranie zmiennych na podstawie grafu

x6

• graf zerowy
x1
x4

x9

DO MODELU WYBIERA SIĘ ZMIENNE:
• każdy graf zerowy (jeśli |ryx|>0,1)

istotne powiązanie

• po jednej reprezentantce grafu spójnego;

reprezentantką grafu jest zmienna, która ma najwięcej powiązań z
innymi kandydatkami
jeżeli kilka zmiennych ma tę samą maksymalną liczbę powiązań, wybiera
się z nich tę, która jest najsilniej powiązana za zmienną Y (max ryx)
jeżeli graf jest rozległy, może mieć dwie reprezentantki, ale muszą one
leżeć na przeciwległych stronach grafu

Matematyczne techniki zarządzania - 126
Przykład 32 cd. Wybierzemy
zmienną x2 (reprezentantka grafu
spójnego) i zmienną x3 (graf
zerowy)
Metoda Hellwiga

Y
Y
X1
X2
X3

0,52
0,64
- 0,21

• wypisujemy wszystkie możliwe kombinacje
kandydatek; jest ich K = 2m—1
• obliczamy pojemność informacji dla każdej
zmiennej w każdej kombinacji

h kl  f ( r yx , r x
i

ixj

)

• obliczamy pojemność całkowitą dla każdej
kombinacji
H l   h kl
k

• wybieramy kombinację o największej
pojemności Hl = max

X1
0,52
0,82
- 0,18

X2
0,64
0,82

X3
- 0,21
- 0,18
0,08

0,08

W przykładzie 32 mamy 7
możliwych kombinacji kandydatek:
1. x1
2. x2

3. x3

maximum:

H6 = 0,42

4. x1,x2
5. x1,x3

Hmax = R2

6. x2,x3
7. x1,x2,x3

Metody taksonomiczne
Taksonomia wrocławska (cluster analysis) to metoda grupowania obiektów (zmiennych) w grupy jednorodne pod względem n cech (wymiarów)
łącznie. Podstawą grupowania jest odległość euklidesowa, która w przypadku zmiennych d ij  f ( r x x )
WSZYSTKIE METODY TO SELEKCJA WSTĘPNA
i

j

Matematyczne techniki zarządzania - 127
ETAP 4. ESTYMACJA PARAMETRÓW MODELU
Cel etapu: wyznaczenie parametrów strukturalnych i stochastycznych
Estymacja: szacowanie parametrów populacji na podstawie próbki
Metody estymacji: analiza regresji i korelacji (KMNK i inne)

Założenia dla KMNK
1. Zmienne losowe są prawdziwymi zmiennymi, nie powiązanymi ze sobą
2. Składnik losowy  ma stałą wariancję, niezależną od zmiennej x lub t
3. Wartości reszt ui są niezależne od siebie

4. Składnik losowy  nie jest powiązany ze zmienną objaśniającą
Skutki niedotrzymania założeń i środki zaradcze
1. Model bez sensu, nieprzydatny; niekiedy absurdalny (źle uwarunkowane
dane)
Stosuje się: dużą próbkę (n>100), regresję grzbietową (ridge regression)
2.

Y

reszta ui

Lewa część zbioru ma dużą wariancję, a
prawa — wariancję małą
Stosuje się specjalny wariant MNK z
korektą na różne wariancje
X

Matematyczne techniki zarządzania - 128
3. Jeśli reszty ui są ze sobą powiązane (skorelowane), mówimy, że
występuje autokorelacja składnika losowego (zjawisko występuje przy
szeregach czasowych — sztywny porządek obserwacji)
Oznacza to, że istnieje istotna zależność u t  f ( u t  k )
Przyczyny autokorelacji: zakłócenia
(dodatnie lub ujemne) w jednym okresie
wpływają na poziom zjawiska w następnych
okresach (rolnictwo, produkcja, rynek)

t  1 , 2 ,...

u t  y t  yˆ t

u t 1

u1
u2
u3
u4
u5

Występowanie autokorelacji powoduje
nieprzydatność modelu


u1
u2
u3
u4

Istnienie autokorelacji sprawdza się testem
Durbina-Watsona d
Stosuje się metodę różniczki zupełnej

y  f (x )

yt  yt  ytk

4. Składnik losowy jest skorelowany ze zmienną objaśniającą, wtedy
gdy została pominięta jakaś ważna zmienna-przyczyna

Model taki nie ma żadnej wartości; trzeba dbać o jak najwyższy współczynnik determinacji (R2>0,9)
• zbiór danych rzeczywistych nigdy
nie spełnia tych wymagań

ESTYMACJĘ MODELU POWTARZA SIĘ WIELOKROTNIE
ponieważ dopiero weryfikacja zapewnia ostateczną selekcję
kandydatek na zmienne objaśniające

• ekonometria to analiza danych nie
spełniających tych założeń
• nie stosować statystyki bezmyślnie (na ślepo)

Matematyczne techniki zarządzania - 129
ETAP 5. WERYFIKACJA MODELU
Cele:

1. opis rzeczywistości (populacji generalnej)



2. dokładna (ostateczna) selekcja zmiennych objaśniających
3. poznanie składnika losowego (spełnienie założeń KMNK)
Narzędzia: hipotezy i testy statystyczne

Metodyka: każde równanie oddzielnie; weryfikacja obejmuje 9 etapów (od
najmniej do najbardziej pracochłonnego)
WYKAZ ETAPÓW WERYFIKACJI MODELU
I.
II.

Badanie istotności korelacji
Badanie wyrazistości modelu

III.

Badanie istotności parametrów

IV.

Badanie symetrii skł. losowego

V.
VI.
VII.
VIII.
IX.

Badanie losowości skł. losowego
Badanie stacjonarności skł. los.
Badanie wartości oczekiwanej skł. los.
Badanie autokorelacji skł. losowego
Badanie normalności skł. losowego

Opis każdego etapu weryfikacji
obejmuje:
• cel etapu
• sposób weryfikacji: wzory,
hipotezy, testy
• podanie których modeli dotyczy (przyczynowo-skutkowych
czy tendencji rozwojowej)
• podanie której postaci modeli
nieliniowych dotyczy (pierwotnej czy transformaty)

Matematyczne techniki zarządzania - 130
Etap I. Badanie istotności korelacji
7
2

8

9

11

12

17

19

23

21

5
2 etapu
9
16
7
9
15
14
Celem
jest
sprawdzenie,
czy
istnieje w populacji generalnej powiązanie pomiędzy zmienną Y i wszystkimi zmiennymi objaśniającymi

25

Przedział ufności dla
nieznanego współczynnika korelacji  dla populacji buduje się przy
użyciu błędu

populacja

zmienna Y

20
15
10

próbka

5
0
8
5

0 9

1011

2

9

20
12

30
17
16
7
zmienna X

25

1940
9

23 50
15

populacja

20

zmienna Y

7
2

15
10

próbka

5
0
0

10

20

30

zmienna X

40

50

21
14

sR 

1 R

0

Robl

2

nk

Istotność korelacji weryfikuje się przez postawienie
następujących hipotez dla
współczynnika korelacji dla
populacji generalnej:

1
R,|r|

H0 :   0

Brak korelacji, nie ma powiązania...

H1 :   0

Korelacja istotna, jest powiązanie...

,

Matematyczne techniki zarządzania - 131
Hipotezy te można weryfikować trzema równoważnymi testami:
• testem t Studenta (tylko dla regresji dwu zmiennych)
• testem F Fishera-Snedecora
• testem R Wallace’a-Snedecora

,

W każdym przypadku obliczamy wartość
statystyki dla próbki (tobl, Fobl, Robl) i porównujemy z wartością krytyczną odczytaną z tablicy odpowiedniego rozkładu w
funkcji poziomu istotności i liczby stopni
swobody (ttabl, Ftabl, Rtabl)

Reguła decyzyjna:
• jeżeli |tobl|< ttabl, nie ma podstaw do odrzucenia H0 (brak korelacji)
• jeżeli |tobl|> ttabl, odrzucamy H0 na korzyść H1 (korelacja istnieje)

TAK SAMO DLA
FiR

W przypadku regresji wielorakiej, gdy liczba zmiennych objaśniajacych
jest duża w porównaniu do liczby obserwacji, współczynnik determinacji
R2 może dawać zawyżoną ocenę stopnia wyjaśnienia zmienności zmiennej
objaśnianej; dlatego wprowadzono skorygowany współczynnik determinacji (i korelacji):
 ( yˆ i  y )

R

2

2

k
n

k

1


2
nk 1
(
y

y
)

i
n1

• adjusted coefficient of multiple
determination (wydruki komputerowe)

• jeśli k jest małe, nie ma większej różnicy
pomiędzy normalnym a skorygowanym R2

Matematyczne techniki zarządzania - 132
Skąd wziąć wartość odpowiedniej statystyki dla próbki i jak odczytywać jej wartości z tablic?
n2
r
t

r

t tabl  t  / 2 { n  2 }
TEST STUDENTA
obl
2
sr
1 r

F obl 

TEST FISHERA

Ź ró d ło z m ien n o śc i

MSTR
MSE



R

nk

2

1 R

2

L ic zb a sto p n i
sw o b o d y

Suma
k w a d ra tó w

Ś re d n i
k w a d ra t

M o d el (c z yn n ik i)
B łą d (re sz ta )

k1
nk

SSTR
SSE

MSTR
MSE

R azem

n1

SSTO

TEST WALLACE’A

R obl 

R

2

k 1

F tabl  F { k  1 , n  k }

S ta ty sty k a
F
F obl 

MSTR
MSE

NIE MYLIĆ
STOPNI SWOBODY LICZNIKA I MIANOWNIKA

R tabl  R { k , n  k }

Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

Matematyczne techniki zarządzania - 133
Odczyt Rtabl z tablicy testu R (SKRYPT s.161-162)

, k,  = n-k

S to pn ie
sw ob od y
8
18
28

2
0,05
0,632
0,444
0,361

0,01
0,765
0,561
0,463

L iczb a zm ien n ych
3
0,05
0,01
0,726
0,827
0,532
0,633
0,439
0,530

4
0,05
0,777
0,587
0,490

0,01
0,860
0,678
0,573

Wnioski dotyczące rozkładu R Wallace’a-Snedecora:
• tablica zawiera maksymalne wartości współczynnika korelacji w danej
sytuacji, jakich można oczekiwać, gdy nie ma korelacji w populacji
• im wyższy poziom istotności, tym niższe Rtabl

• im większa liczba zmiennych w modelu, tym wyższe Rtabl
• im wyższa liczba stopni swobody (większa próbka), tym niższe Rtabl
• tablica R powstała z przeliczenia tablic t oraz F (odwrócenie wzorów)
• tablica testu R jest najszybszym i nawygodniejszym narzędziem do
weryfikacji istotności korelacji

Werdykt z etapu I:

Matematyczne techniki zarządzania - 134

• jeżeli Robl>Rtabl, model jest poprawny, można przejść do etapu II
• jeżeli Roblzmiennych objaśniających albo jego postać matematyczną
ETAP I OBOWIĄZUJE DLA WSZYSTKICH MODELI
ETAP I PRZEPROWADZA SIĘ DLA TRANSFORMATY (dla postaci pierwotnej
można uzyskać R>1)
Rola współczynnika determinacji R2
• korelacja może być istotna przy małym R i bardzo małym R2 (r=0,4,
R2=0,16, co oznacza, że tylko 16% zmienności zmiennej Y jest
wyjaśnione przez zmienną objaśniającą)
• małe R2 oznacza niski stopień wyjaśnienia rzeczywistości i stanowi
zagrożenie dla modelu
• należy dążyć (poprzez odpowiedni dobór zmiennych-przyczyn i postaci
matematycznej modelu) do jak największego R2 (dla postaci pierwotnej)
• wysoka wartość R2 świadczy o dobrym poznaniu badanego zjawiska
• wysoka wartość R2 bardzo często wynika jednak ze złego dobrania
zmiennych objaśniających (silnie powiązane ze sobą — „masło maślane”)
KORELACJA POZORNA — jest zależność, ale jej nie ma? Przyczyny...
Trzeba unikać wartości bezwzględnych (ludność, liczba sklepów, wielkość produkcji)

6

9

12

8

11

12

11

15

9

18

9

11

11

18

15

Matematyczne techniki zarządzania - 135
Etap II. Badanie wyrazistości modelu
Y

Wyrazistość modelu dana jest wzorem

s( y )

ui

y

W obl 

s( y )

100 %

y

Celem etapu
jest kontrola
rozrzutu danych

Współczynnik Wobl<30%, w przeciwnym
przypadku rozrzut danych jest zbyt duży

y

Kłopoty: gdyy jest bliskie 0

x

X

Werdykt: model poprawny lub niepoprawny

ETAP II OBOWIĄZUJE DLA WSZYSTKICH MODELI (ale nie ma on charakteru
statystycznego)

ETAP II PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ (sprawdzamy, czy
nie występuje silny efekt „krzywego lustra”)
Etap III. Badanie istotności parametrów (współczynników) modelu
Celem etapu jest sprawdzenie:
• czy poszczególne zmienne objaśniające mają istotny wpływ na zmienną
objaśnianą?
• czy zmienne objaśniające są wybrane prawidłowo?

• czy wyraz wolny różni się istotnie od zera?

Matematyczne techniki zarządzania - 136
Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

Problem istotności parametrów ai można rozpatrywać (tak jak problem
średniej dla populacji) z dwu punktów widzenia:
• przedziału ufności dla nieznanej wartości i

• hipotez — zerowej H0: i=0 i alternatywnej H1: i 0

1
0

ai

1

i

ISTOTNY (W PRZEDZIALE NIE MA ZERA)

0

ai

i

NIEISTOTNY (W PRZEDZIALE JEST ZERO)

P ( a i  t / 2 { n  k } s ( a i )   i  a i  t / 2 { n  k } s ( a i )  1  

Z tablicy rozkładu Studenta, a nie z wydruku komputerowego!

Matematyczne techniki zarządzania - 137
Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

W praktyce posługujemy się raczej hipotezami:
Badanie istotności przeprowadza
się dla każdego i oddzielnie:

t obl ( a i ) 

ai  0
s(a i )

t tabl  t  / 2 { n  k }

• jeżeli |tobl(ai)|>ttabl(ai), odrzucamy hipotezę zerową; parametr jest istotny z błędem równym co najwyżej 
• jeżeli |tobl(ai)|parametr nie jest istotny
Praktycznie jest to bardzo łatwe:
• sprawdzamy, czy |t(ai)| jest większe czy mniejsze od około 2, a najlepiej
• porównujemy rzeczywisty poziom istotności P(ai) z przyjętym 
ODRZUCAMY H0, JEŻELI P(ai) JEST MNIEJSZE OD 

WTEDY ZMIENNA
Xi MA WPŁYW NA
ZMIENNĄ Y

Matematyczne techniki zarządzania - 138
W etapie III następuje ostateczna selekcja zmiennych objaśniających:
• jeżeli wszystkie ai okażą się istotne, model jest poprawny:
— model przyczynowo-skutkowy: do interpretacji
— model tendencji rozwojowej: do etapu IV
• jeżeli choć jedno ai okaże się nieistotne, model jest niepoprawny i wymaga poprawy przez usunięcie nieistotnych zmiennych:
— zmienne należy usuwać po jednej (ze względu na efekt katalityczny)
— usuwa się zawsze zmienną o najniższej wartości |t(ai)| [czyli o
najwyższej wartości P(ai)]
— usunięcie ostatniej zmiennej nieistotnej kończy proces selekcji
kandydatek na zmienne,

— selekcja nie jest ostateczna, gdyż zawsze istnieje możliwość zamiany zmiennych, które są powiązane ze sobą
Praktyczne znaczenie istotności wyrazu wolnego a0
To są jedne z możliwości dla populacji (p. plansza 106)

Y

W przypadku funkcji K=f(P) wyraz wolny wyznacza poziom kosztów stałych (rachunkowość zarządcza)
W przypadku zależności technicznej Q=f(h) wyraz
wolny oznacza, że przy miąższości pokładu h=0 wydajność produkcji Q też jest równa 0

0
X

Matematyczne techniki zarządzania - 139
Praktyczne znaczenie istotności współczynnika regresji ai



KRZYWE NEYMANA — PLANSZE 106-107
WSPÓŁCZ. ISTOTNY
WSPÓŁ. NIEISTOTNY

ETAP III OBOWIĄZUJE DLA WSZYSTKICH MODELI
ETAP III PRZEPROWADZA SIĘ DLA TRANSFORMATY
Etap IV. Badanie symetrii składnika losowego

Y

CZĘSTOŚĆ RESZT DODATNICH I UJEMNYCH MA BYĆ
ZBLIŻONA

Y

ASYMETRYCZNY
SYMETRYCZNY

t
t
Badanie symetrii przeprowadza się testem Studenta (St. Bartosiewicz
Ekonometria)
Brak symetrii wymaga zmiany matematycznej postaci modelu
ETAP IV OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ

ETAP IV PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ

Matematyczne techniki zarządzania - 140
Etap V. Badanie losowości składnika losowego

Y

Y
NIELOSOWY

LOSOWY

t
t
Badanie losowości przeprowadza się testem Studenta lub testem serii
(Ekonometria, praca zb. pod red. M. Krzysztofiaka)
Brak losowości wymaga zmiany matematycznej postaci modelu
ETAP V OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP V PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ
Etap VI. Badanie stacjonarności składnika losowego
W etapie tym chodzi o niezależność wariancji składnika losowego od
zmiennej objaśniającej t (plansza 127)

Bada się istotność współczynnika korelacji ru t , t
ETAP VI OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VI PRZEPROWADZA SIĘ DLA TRANSFORMATY

Matematyczne techniki zarządzania - 141
Etap VII. Badanie wartości oczekiwanej składnika losowego
Normalnie, gdy przeprowadzamy estymację postaci liniowej, parametry
składnika losowego E ( )  0
{ ui  0}
V ( )  const
Po retransformacji do postaci pierwotnej mamy nowe reszty u’, dla
których
'
'
ui  0
 ui  0
Celem etapu jest sprawdzenie, czy odchyłka od O nie jest zbyt duża
(służy do tego test Studenta)
ETAP VII OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VII PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ
Etap VIII. Badanie autokorelacji składnika losowego
Pojęcie autokorelacji opisano na planszy 128; chodzi o istotność korelacji ru , u
t

tk

Badanie autokorelacji można przeprowadzić:

• testem R istotności korelacji ru

t

,ut  k

d obl

• testem Durbina-Watsona
NIE MA AUTOK.

d1

?

d2 JEST AUTOKORELACJA

ETAP VIII OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VIII PRZEPROWADZA SIĘ DLA TRANSFORMATY

Matematyczne techniki zarządzania - 142
Etap IX. Badanie normalności składnika losowego
Celem etapu jest stwierdzenie, czy reszty mają rozkład normalny
Analiza reszt — oddzielny dział analizy regresji i korelacji
Jeżeli reszty mają rozkład normalny, statystyk otrzymuje „ulgi”
ETAP 6. PRAKTYCZNA INTERPRETACJA MODELU



Celem etapu jest wydobycie z modelu całej nowej wiedzy, której nie widać
„gołym okiem”
INTERPRETUJĄC MODEL (RÓWNANIE REGRESJI) NALEŻY UŻYWAĆ WYŁĄCZNIE
PROSTEJ TERMINOLOGII EKONOMICZNEJ ZROZUMIAŁEJ DLA KLIENTA
NIE NALEŻY UŻYWAĆ TERMINOLOGII MATEMATYCZNEJ ZROZUMIAŁEJ TYLKO DLA
TWÓRCÓW MODELU
INTERPRETOWAĆ WOLNO TYLKO MODEL ZWERYFIKOWANY
CAŁY TRUD MODELOWANIA NIE MOŻE BYĆ „SZTUKĄ DLA SZTUKI”, LECZ MA
SŁUŻYĆ UZYSKANIU KONKRETNYCH WNIOSKÓW PRAKTYCZNYCH

Interpretacja modelu przyczynowo-skutkowego

Polega ona na określeniu wpływu poszczególnych czynników na badane
zjawisko:
• podział wszystkich czynników na trzy grupy

Matematyczne techniki zarządzania - 143
A — czynniki nie mające wpływu na Y
B — czynniki mające wpływ na Y i wprowadzone do modelu
C — czynniki mające wpływ na Y, ale nie występujące w modelu
• ocena jakościowa wpływu czynników B i C
• ocena ilościowa wpływu czynników B i C
Ocena jakościowa



Na podstawie znaków stojących przy współczynnikach r oraz ai możemy
stwierdzić, że wpływ jest:

• dodatni (im lepsze zaliczenie, tym lepszy wynik egzaminu; im więcej
wydatków na reklamę, tym większy zysk; itd.)
• ujemny (im więcej zatrudnionych, tym gorszy wynik finansowy; im
mniej braków, tym wyższy zysk; im mniejsza absencja, tym wyższe
wynagrodzenie; itd.)

Ocena ilościowa
• model liniowy
Przykład 33. Zinterpretuj zweryfikowany model zależności miesięcznych
kosztów działalności przedsiębiorstwa (tys. zł) od wielkości produkcji
(sztuk) i liczby reklamacji:
y i  50 , 8  14 , 5 x 1  3 , 9 x 2  

Matematyczne techniki zarządzania - 144
a0 = 50,8

poziom kosztów stałych; jeśli firma nie będzie prowadzić
żadnej działalności, poniesie koszty w wysokości 50,8 tys. zł

a1 = 14,5

każda sztuka produktu firmy kosztuje ją przeciętnie 14,5
tys. zł; jeżeli firma zwiększy produkcję o 2 sztuki, koszty
wzrosną o 29,0 tys. zł

a2 = 3,9każda wniesiona reklamacja powiększa koszty przeciętnie o
3,9 tys. zł
• model potęgowy
Przykłąd 34. Zinterpretuj zweryfikowaną funkcję produkcji Cobba-Douglasa
0 , 65

Pi  45 , 2 M i

0 , 73

Zi

e

0 , 04



Funkcja produkcji to specjalny model, określający zależność pomiędzy
produkcją (P) a czynnikami produkcji: majątkiem trwałym (M) i nakładami
robocizny (Z).



Funkcje produkcji to modele umożliwiające „prześwietlenie”
przedsiębiorstwa (szereg czasowy) lub branży (dane przekrojowe) i określenie poziomu gospodarowania oraz postępu
technicznego i organizacyjnego.
Elastyczność  to współczynnik określający reakcję zmiany
jednej zmiennej na inną zmienną — na przykład elastyczność
cenowa popytu (jak popyt zmienia się wraz z ceną towaru).

EKSPERCI
ZACHODNI

Matematyczne techniki zarządzania - 145

 

y
y

:

x

FUNKCJA POTĘGOWA JEST JEDYNĄ FUNKCJĄ O STAŁEJ ELASTYCZNOŚCI

x

Izolinie funkcji produkcji

T1
M

Produkcję P można osiągnąć różnymi
kombinacjami majątku i robocizny:

T2

• T1— technika kapitałochłonna, np.
pełna automatyzacja
• T2 — pośredni poziom techniki

T3
P  const

• T3 — niski poziom techniki, produkcja
pracochłonna
P. LOWE

Z
Efekt poprawy zarządzania bez
zmiany techniki (lepsze wykorzystanie ludzi i sprzętu):

P2
M

ZARZĄDZANIE
TECHNOLOGIĄ

P1

T

• zmniejszenie kapitałochłonności

• zmniejszenie pracochłonności
• zwiększenie produkcji (przejście z
funkcji P1 na P2)

Można też rozpatrzyć łączne efekty
zmiany techniki i zarządzania

Z

Matematyczne techniki zarządzania - 146
Wszystkie informacje tego typu można odczytać w trakcie interpretacji
0 , 65
0 , 73 0 , 04
funkcji produkcji:
Pi  45 , 2 M i
Zi
e

• wartości 45,2 nie interpretuje się
• wartość 0,65 to współczynnik elastyczności majątkowej (kapitałowej)
produkcji: zmiana majątku o 10% daje średnio zmianę produkcji o 6,5%
• wartość 0,73 to współczynnik elastyczności zatrudnieniowej produkcji:
zmiana zatrudnienia o 10% daje zmianę produkcji średnio o 7,3%
• suma obu współczynników k=0,65+0,73=1,38 to współczynnik skali
produkcji:

— jeżeli k<1, to firma rozwija się ekstensywnie
— jeżeli k>1, to firma rozwija się intensywnie
• wartość  = 0,04 to współczynnik postępu organizacyjnego:
— jeżeli  >O, to miał miejsce postęp organizacyjny

— jeżeli  <0, to miał miejsce regres organizacyjny
Interpretacja modelu tendencji rozwojowej

DODAMY
TROCHĘ
TEORII

Przypomnienie: t — zmienna objaśniająca (stałe przyrosty)
y — zmienna objaśniana; rozdzielana w ogólności na trzy
części: trend, wahania okresowe, wahania losowe ()

Matematyczne techniki zarządzania - 147
Wykres z planszy 117 (zużycie energii elektrycznej przez WZ AGH)
WAHANIA OKRESOWE OKREŚLA SIĘ WZGLĘDEM TRENDU A
NIE WZGLĘDEM OSI CZASU

y

trend

t
1995

1996

1997

1998

1999

Te trzy części trzeba zidentyfikować, a potem złożyć razem w model:

• addytywny (jeśli amplituda wahań jest stała)
• multiplikatywny (jeśli amplituda wahań rośnie lub maleje regularnie)
Wyznaczanie trendu
Metody mechaniczne:

• wskaźniki bezwzględne (stały przyrost =
postęp arytmetyczny = funkcja liniowa)
• wskaźniki względne (przyrost o stały procent =
postęp geometryczny = funkcja potęgowa)
• średnia ruchoma (wygładzanie danych linią łamaną)

JAK OBLICZYĆ O
ILE PROCENT ROCZNIE SPADAŁA
ŚREDNIO LICZBA
WIDZÓW W
KINACH:
1982 - 193,7 MLN
1989 - 141,3 MLN

Matematyczne techniki zarządzania - 148
Średnia ruchoma: mając szereg czasowy y1, y2,....., yn, przyjmujemy
długość kroku k = 3, lub 5, lub 7 itd. i liczymy
y  ...  y k
y  ...  y k  1
y k / 2 0 ,5  1
a następnie y k / 2  1 , 5  2
itd.
k
k
y  y2  y3
y  y3  y4
dla k=3:
y2  1
y3  2
itd.
3
3
Przykład 35. Wyznacz trend metodą średniej ruchomej dla następujących
danych:
okres
t
wartość yt

1
5

2
4

3
7

4
6

5
8

12

y2 
10

y3 

y

8

y4 

6
4

y5 

2

y6 

0
0

1

2

3

4

5

czas, t

6

7

8

9

y7 

547

6
10

 5 , 67

CECHY
ŚREDNIEJ
RUCHOMEJ:

 7 , 00

• TRACI SIĘ
k-1 DANYCH

3
768

8
8

 5 , 33

3
476

7
9

3
6  8  10

 8 , 00

3
8  10  9

 9 , 00

3
10  9  8

 9 , 00

• IM
WIĘKSZE k,
TYM
BARDZIEJ
SZTYWNY
TREND

3

Metody statystyczne: analiza regresji i korelacji, różne funkcje oparte na
modelach ekonomii

Matematyczne techniki zarządzania - 149
Wyznaczanie wahań okresowych: dobowych, tygodniowych, miesięcznych,
kwartalnych, rocznych, wieloletnich
Trzy metody:

— metoda wskaźników sezonowości
— metoda zmiennych zero-jedynkowych (0-1)

— metoda harmoniczna
Wszystkie metody mają jeden cel:
uzyskanie przeciętnego obrazu jednego cyklu

+

Ws
[t ]
[%]
trend

I

II



III

IV

WADY:
• KONIECZNOŚĆ
KOREKTY
• BRAK
WERYFIKACJI
STATYSTYCZNEJ

Metoda wskaźników sezonowości

• obliczenie surowych wskaźników sezonowości (wyeliminowanie trendu):
y

S s  yt  yt
S s  t
yt
addytywny multiplikatywny
wynik: n wartości odchyleń od trendu

• obliczenie oczyszczonych wskaźników
sezonowości (wyeliminowanie wahań
losowych):
 Ss
So 
k-liczba okresów
k
jednoimiennych
m-długość cyklu wynik: m wartości śr. odchyleń od trendu

Matematyczne techniki zarządzania - 150
Metoda zmiennych zero-jedynkowych (0-1)
m

y t  a 0  a1 t   bi Q i  
i 1

bi — przeciętne odchylenie od trendu dla
okresu i-tego
Qi — zmienna 0-1

wahania losowe
trend

wahania okresowe

t
1
2
3
4
5
6
7
8
9

yt
y1
y2
y3
y4
y5
y6
y7
y8
y9

Q1
1
0
0
0
1
0
0
0
1

Q2
0
1
0
0
0
1
0
0
0

Q3
0
0
1
0
0
0
1
0
0

Q4
0
0
0
1
0
0
0
1
0

Metoda harmoniczna (szeregi Fouriera)
Wahania okresowe przedstawia się jako sumę określonej liczby drgań harmonicznych (sinusoid i cosinusoid) przesuniętych w fazie, lecz o jednakowym okresie
m /2
2 i m / 2
2 i
y t  a 0  a 1 t   b1 i sin
  b 2 i cos

m
m
i 1
i 1
Obie metody dają taki sam wynik, istnieje możliwość weryfikacji
statystycznej
W metodzie 0-1 dostajemy bi = Ws, natomiast w metodzie harmonicznej Ws
jest sumą wartości poszczególnych sinusoid dla danego momentu czasu


Slide 25

Matematyczne techniki zarządzania - 121
ETAP 2. GROMADZENIE DANYCH STATYSTYCZNYCH

!

ZA JAKOŚĆ DANYCH ODPOWIADA MODELUJĄCY
• rodzaje danych: dane przekrojowe i szeregi czasowe
• źródła danych: roczniki statystyczne, różne działy
przedsiębiorstwa, badania marketingowe, wywiady itd.
• wiarygodność danych: do jakiego celu zostały one
przygotowane?

MUSISZ
SPRAWDZAĆ
KAŻDE DANE

• porównywalność danych: inflacja (ceny bieżące a ceny
stałe), zmiany procesów technicznych
Wielkość
produkcji

• zmienność zjawisk: trzeba sprawdzić, czy
wybrana w etapie 1a zmienna jest rzeczywiście zmienną losową

Wx 

s( x )

nowy zakład

100 %

x

stary zakład

Wx musi wynosić co najmniej 30-40%
Wiek studenta może być dobrą zmiennąprzyczyną, ale nie w przypadku studiów
dziennych!

Zatrudnienie

Matematyczne techniki zarządzania - 122
ETAP 3. SELEKCJA ZMIENNYCH OBJAŚNIAJĄCYCH
KAŻDĄ ZMIENNĄ X WYTYPOWANĄ W ETAPIE 1a TRAKTUJEMY JAKO
KANDYDATKĘ NA ZMIENNĄ OBJAŚNIAJĄCĄ
Może być kilka przyczyn powodujących, że taka kandydatka nie może znaleźć się w modelu ekonometrycznym (w równaniu regresji):
• w modelu nie może być zbyt wielu zmiennych (nieczytelny)
• kandydatka może nie mieć wpływu na zmienną Y



• kandydatka może wnosić prawie tę samą informację o Y co inna
kandydatka

• dwie bardzo podobne kandydatki mogą sobie nawzajem przeszkadzać
(efekt katalityczny)
Kryteria, jakie musi spełniać kandydatka Xi, aby nadawała się do modelu:
• musi być silnie powiązana ze zmienną Y

• nie może być powiązana z inną kandydatką Xj
SSTO
x1
x4

x2
x3

reszta

R2=0,79

R2=0,66

x2
x1
x4

R2=0,48

x3
reszta

reszta

SSTO

SSTO

Matematyczne techniki zarządzania - 123
Efekt katalityczny
DWIE ZMIENNE DAJĄ
RAZEM MNIEJ INFORMACJI NIŻ KAŻDA Z
NICH Z OSOBNA

x1

x2

R2=0,25

x2

x1

R2=0,52

R2=0,66

Selekcja kandydatek ma na celu podzielenie ich na trzy grupy:
• zmienne wprowadzone do modelu
• zmienne nie wprowadzone do modelu, ale reprezentowane w nim przez
inne zmienne (możliwość wymiany)
• zmienne nie wprowadzone do modelu ze względu na fakt, że nie wnoszą
żadnej informacji o zmiennej Y
INFORMACJE potrzebne do selekcji: współczynniki r x i x j ,
Macierz współczynników korelacji
Y
Y
X1
X2
X3

0,52
0,64
- 0,21

X1
0,52
0,82
- 0,18

X2
0,64
0,82
0,08

X3
- 0,21
- 0,18
0,08

r yx

i

Przykład 32. Macierz powiązania
zmiennych ze sobą przedstawia
się następująco (n=20). Jak ją
można zinterpretować? Które
zmienne są powiązane ze sobą w
sposób istotny?

Matematyczne techniki zarządzania - 124
Testowanie istotności współczynnika korelacji
H0:  = 0

Można je przeprowadzić trzema testami: testem Studenta

H1:   0

(t), Fishera (F) i Wallace’a-Snedecora (R)

Fragment tablicy rozkładu Wallece’a-Snedecora (SKRYPT, tab. VII, s.161)
S to pn ie
sw ob od y

2
0,05
0,632
0,444
0,361

8
18
28

,

0,01
0,765
0,561
0,463

L iczb a zm ien n ych
3
0,05
0,01
0,726
0,827
0,532
0,633
0,439
0,530

4
0,05
0,777
0,587
0,490

0,01
0,860
0,678
0,573

Reguła decyzyjna: — jeżeli |Robl|>Rtabl, odrzucamy H0 (korelacja istotna)
— jeżeli |Robl|
W przykładzie 32, jeżeli przyjmiemy  = 0,05, to Rtabl = 0,444.
Y
Y
X1
X2
X3

0,52
0,64
- 0,21

X1
0,52
0,82
- 0,18

X2
0,64
0,82
0,08

X3
- 0,21
- 0,18
0,08

Pozostaną zatem tylko trzy
istotne powiązania:
y-x1, y-x2, x1-x2
BRAK ISTOTNEGO POWIĄZANIA Z Y NIE
OZNACZA, ŻE ZMIENNA NIE WNOSI
ŻADNEJ INFORMACJI O ZJAWISKU Y

Matematyczne techniki zarządzania - 125



Metody selekcji zmiennych objaśniających:
• grafowa
• Hellwiga (pojemności informacji)
• taksonomiczne (clustering)
Metoda grafowa
• obliczenie macierzy współczynników:

rx

i

xj

• wyłowienie z macierzy powiązań istotnych

, r yx

BUDOWA GRAFU
i

• graf spójny

• budowa grafu z powiązań istotnych
• wybranie zmiennych na podstawie grafu

x6

• graf zerowy
x1
x4

x9

DO MODELU WYBIERA SIĘ ZMIENNE:
• każdy graf zerowy (jeśli |ryx|>0,1)

istotne powiązanie

• po jednej reprezentantce grafu spójnego;

reprezentantką grafu jest zmienna, która ma najwięcej powiązań z
innymi kandydatkami
jeżeli kilka zmiennych ma tę samą maksymalną liczbę powiązań, wybiera
się z nich tę, która jest najsilniej powiązana za zmienną Y (max ryx)
jeżeli graf jest rozległy, może mieć dwie reprezentantki, ale muszą one
leżeć na przeciwległych stronach grafu

Matematyczne techniki zarządzania - 126
Przykład 32 cd. Wybierzemy
zmienną x2 (reprezentantka grafu
spójnego) i zmienną x3 (graf
zerowy)
Metoda Hellwiga

Y
Y
X1
X2
X3

0,52
0,64
- 0,21

• wypisujemy wszystkie możliwe kombinacje
kandydatek; jest ich K = 2m—1
• obliczamy pojemność informacji dla każdej
zmiennej w każdej kombinacji

h kl  f ( r yx , r x
i

ixj

)

• obliczamy pojemność całkowitą dla każdej
kombinacji
H l   h kl
k

• wybieramy kombinację o największej
pojemności Hl = max

X1
0,52
0,82
- 0,18

X2
0,64
0,82

X3
- 0,21
- 0,18
0,08

0,08

W przykładzie 32 mamy 7
możliwych kombinacji kandydatek:
1. x1
2. x2

3. x3

maximum:

H6 = 0,42

4. x1,x2
5. x1,x3

Hmax = R2

6. x2,x3
7. x1,x2,x3

Metody taksonomiczne
Taksonomia wrocławska (cluster analysis) to metoda grupowania obiektów (zmiennych) w grupy jednorodne pod względem n cech (wymiarów)
łącznie. Podstawą grupowania jest odległość euklidesowa, która w przypadku zmiennych d ij  f ( r x x )
WSZYSTKIE METODY TO SELEKCJA WSTĘPNA
i

j

Matematyczne techniki zarządzania - 127
ETAP 4. ESTYMACJA PARAMETRÓW MODELU
Cel etapu: wyznaczenie parametrów strukturalnych i stochastycznych
Estymacja: szacowanie parametrów populacji na podstawie próbki
Metody estymacji: analiza regresji i korelacji (KMNK i inne)

Założenia dla KMNK
1. Zmienne losowe są prawdziwymi zmiennymi, nie powiązanymi ze sobą
2. Składnik losowy  ma stałą wariancję, niezależną od zmiennej x lub t
3. Wartości reszt ui są niezależne od siebie

4. Składnik losowy  nie jest powiązany ze zmienną objaśniającą
Skutki niedotrzymania założeń i środki zaradcze
1. Model bez sensu, nieprzydatny; niekiedy absurdalny (źle uwarunkowane
dane)
Stosuje się: dużą próbkę (n>100), regresję grzbietową (ridge regression)
2.

Y

reszta ui

Lewa część zbioru ma dużą wariancję, a
prawa — wariancję małą
Stosuje się specjalny wariant MNK z
korektą na różne wariancje
X

Matematyczne techniki zarządzania - 128
3. Jeśli reszty ui są ze sobą powiązane (skorelowane), mówimy, że
występuje autokorelacja składnika losowego (zjawisko występuje przy
szeregach czasowych — sztywny porządek obserwacji)
Oznacza to, że istnieje istotna zależność u t  f ( u t  k )
Przyczyny autokorelacji: zakłócenia
(dodatnie lub ujemne) w jednym okresie
wpływają na poziom zjawiska w następnych
okresach (rolnictwo, produkcja, rynek)

t  1 , 2 ,...

u t  y t  yˆ t

u t 1

u1
u2
u3
u4
u5

Występowanie autokorelacji powoduje
nieprzydatność modelu


u1
u2
u3
u4

Istnienie autokorelacji sprawdza się testem
Durbina-Watsona d
Stosuje się metodę różniczki zupełnej

y  f (x )

yt  yt  ytk

4. Składnik losowy jest skorelowany ze zmienną objaśniającą, wtedy
gdy została pominięta jakaś ważna zmienna-przyczyna

Model taki nie ma żadnej wartości; trzeba dbać o jak najwyższy współczynnik determinacji (R2>0,9)
• zbiór danych rzeczywistych nigdy
nie spełnia tych wymagań

ESTYMACJĘ MODELU POWTARZA SIĘ WIELOKROTNIE
ponieważ dopiero weryfikacja zapewnia ostateczną selekcję
kandydatek na zmienne objaśniające

• ekonometria to analiza danych nie
spełniających tych założeń
• nie stosować statystyki bezmyślnie (na ślepo)

Matematyczne techniki zarządzania - 129
ETAP 5. WERYFIKACJA MODELU
Cele:

1. opis rzeczywistości (populacji generalnej)



2. dokładna (ostateczna) selekcja zmiennych objaśniających
3. poznanie składnika losowego (spełnienie założeń KMNK)
Narzędzia: hipotezy i testy statystyczne

Metodyka: każde równanie oddzielnie; weryfikacja obejmuje 9 etapów (od
najmniej do najbardziej pracochłonnego)
WYKAZ ETAPÓW WERYFIKACJI MODELU
I.
II.

Badanie istotności korelacji
Badanie wyrazistości modelu

III.

Badanie istotności parametrów

IV.

Badanie symetrii skł. losowego

V.
VI.
VII.
VIII.
IX.

Badanie losowości skł. losowego
Badanie stacjonarności skł. los.
Badanie wartości oczekiwanej skł. los.
Badanie autokorelacji skł. losowego
Badanie normalności skł. losowego

Opis każdego etapu weryfikacji
obejmuje:
• cel etapu
• sposób weryfikacji: wzory,
hipotezy, testy
• podanie których modeli dotyczy (przyczynowo-skutkowych
czy tendencji rozwojowej)
• podanie której postaci modeli
nieliniowych dotyczy (pierwotnej czy transformaty)

Matematyczne techniki zarządzania - 130
Etap I. Badanie istotności korelacji
7
2

8

9

11

12

17

19

23

21

5
2 etapu
9
16
7
9
15
14
Celem
jest
sprawdzenie,
czy
istnieje w populacji generalnej powiązanie pomiędzy zmienną Y i wszystkimi zmiennymi objaśniającymi

25

Przedział ufności dla
nieznanego współczynnika korelacji  dla populacji buduje się przy
użyciu błędu

populacja

zmienna Y

20
15
10

próbka

5
0
8
5

0 9

1011

2

9

20
12

30
17
16
7
zmienna X

25

1940
9

23 50
15

populacja

20

zmienna Y

7
2

15
10

próbka

5
0
0

10

20

30

zmienna X

40

50

21
14

sR 

1 R

0

Robl

2

nk

Istotność korelacji weryfikuje się przez postawienie
następujących hipotez dla
współczynnika korelacji dla
populacji generalnej:

1
R,|r|

H0 :   0

Brak korelacji, nie ma powiązania...

H1 :   0

Korelacja istotna, jest powiązanie...

,

Matematyczne techniki zarządzania - 131
Hipotezy te można weryfikować trzema równoważnymi testami:
• testem t Studenta (tylko dla regresji dwu zmiennych)
• testem F Fishera-Snedecora
• testem R Wallace’a-Snedecora

,

W każdym przypadku obliczamy wartość
statystyki dla próbki (tobl, Fobl, Robl) i porównujemy z wartością krytyczną odczytaną z tablicy odpowiedniego rozkładu w
funkcji poziomu istotności i liczby stopni
swobody (ttabl, Ftabl, Rtabl)

Reguła decyzyjna:
• jeżeli |tobl|< ttabl, nie ma podstaw do odrzucenia H0 (brak korelacji)
• jeżeli |tobl|> ttabl, odrzucamy H0 na korzyść H1 (korelacja istnieje)

TAK SAMO DLA
FiR

W przypadku regresji wielorakiej, gdy liczba zmiennych objaśniajacych
jest duża w porównaniu do liczby obserwacji, współczynnik determinacji
R2 może dawać zawyżoną ocenę stopnia wyjaśnienia zmienności zmiennej
objaśnianej; dlatego wprowadzono skorygowany współczynnik determinacji (i korelacji):
 ( yˆ i  y )

R

2

2

k
n

k

1


2
nk 1
(
y

y
)

i
n1

• adjusted coefficient of multiple
determination (wydruki komputerowe)

• jeśli k jest małe, nie ma większej różnicy
pomiędzy normalnym a skorygowanym R2

Matematyczne techniki zarządzania - 132
Skąd wziąć wartość odpowiedniej statystyki dla próbki i jak odczytywać jej wartości z tablic?
n2
r
t

r

t tabl  t  / 2 { n  2 }
TEST STUDENTA
obl
2
sr
1 r

F obl 

TEST FISHERA

Ź ró d ło z m ien n o śc i

MSTR
MSE



R

nk

2

1 R

2

L ic zb a sto p n i
sw o b o d y

Suma
k w a d ra tó w

Ś re d n i
k w a d ra t

M o d el (c z yn n ik i)
B łą d (re sz ta )

k1
nk

SSTR
SSE

MSTR
MSE

R azem

n1

SSTO

TEST WALLACE’A

R obl 

R

2

k 1

F tabl  F { k  1 , n  k }

S ta ty sty k a
F
F obl 

MSTR
MSE

NIE MYLIĆ
STOPNI SWOBODY LICZNIKA I MIANOWNIKA

R tabl  R { k , n  k }

Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

Matematyczne techniki zarządzania - 133
Odczyt Rtabl z tablicy testu R (SKRYPT s.161-162)

, k,  = n-k

S to pn ie
sw ob od y
8
18
28

2
0,05
0,632
0,444
0,361

0,01
0,765
0,561
0,463

L iczb a zm ien n ych
3
0,05
0,01
0,726
0,827
0,532
0,633
0,439
0,530

4
0,05
0,777
0,587
0,490

0,01
0,860
0,678
0,573

Wnioski dotyczące rozkładu R Wallace’a-Snedecora:
• tablica zawiera maksymalne wartości współczynnika korelacji w danej
sytuacji, jakich można oczekiwać, gdy nie ma korelacji w populacji
• im wyższy poziom istotności, tym niższe Rtabl

• im większa liczba zmiennych w modelu, tym wyższe Rtabl
• im wyższa liczba stopni swobody (większa próbka), tym niższe Rtabl
• tablica R powstała z przeliczenia tablic t oraz F (odwrócenie wzorów)
• tablica testu R jest najszybszym i nawygodniejszym narzędziem do
weryfikacji istotności korelacji

Werdykt z etapu I:

Matematyczne techniki zarządzania - 134

• jeżeli Robl>Rtabl, model jest poprawny, można przejść do etapu II
• jeżeli Roblzmiennych objaśniających albo jego postać matematyczną
ETAP I OBOWIĄZUJE DLA WSZYSTKICH MODELI
ETAP I PRZEPROWADZA SIĘ DLA TRANSFORMATY (dla postaci pierwotnej
można uzyskać R>1)
Rola współczynnika determinacji R2
• korelacja może być istotna przy małym R i bardzo małym R2 (r=0,4,
R2=0,16, co oznacza, że tylko 16% zmienności zmiennej Y jest
wyjaśnione przez zmienną objaśniającą)
• małe R2 oznacza niski stopień wyjaśnienia rzeczywistości i stanowi
zagrożenie dla modelu
• należy dążyć (poprzez odpowiedni dobór zmiennych-przyczyn i postaci
matematycznej modelu) do jak największego R2 (dla postaci pierwotnej)
• wysoka wartość R2 świadczy o dobrym poznaniu badanego zjawiska
• wysoka wartość R2 bardzo często wynika jednak ze złego dobrania
zmiennych objaśniających (silnie powiązane ze sobą — „masło maślane”)
KORELACJA POZORNA — jest zależność, ale jej nie ma? Przyczyny...
Trzeba unikać wartości bezwzględnych (ludność, liczba sklepów, wielkość produkcji)

6

9

12

8

11

12

11

15

9

18

9

11

11

18

15

Matematyczne techniki zarządzania - 135
Etap II. Badanie wyrazistości modelu
Y

Wyrazistość modelu dana jest wzorem

s( y )

ui

y

W obl 

s( y )

100 %

y

Celem etapu
jest kontrola
rozrzutu danych

Współczynnik Wobl<30%, w przeciwnym
przypadku rozrzut danych jest zbyt duży

y

Kłopoty: gdyy jest bliskie 0

x

X

Werdykt: model poprawny lub niepoprawny

ETAP II OBOWIĄZUJE DLA WSZYSTKICH MODELI (ale nie ma on charakteru
statystycznego)

ETAP II PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ (sprawdzamy, czy
nie występuje silny efekt „krzywego lustra”)
Etap III. Badanie istotności parametrów (współczynników) modelu
Celem etapu jest sprawdzenie:
• czy poszczególne zmienne objaśniające mają istotny wpływ na zmienną
objaśnianą?
• czy zmienne objaśniające są wybrane prawidłowo?

• czy wyraz wolny różni się istotnie od zera?

Matematyczne techniki zarządzania - 136
Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

Problem istotności parametrów ai można rozpatrywać (tak jak problem
średniej dla populacji) z dwu punktów widzenia:
• przedziału ufności dla nieznanej wartości i

• hipotez — zerowej H0: i=0 i alternatywnej H1: i 0

1
0

ai

1

i

ISTOTNY (W PRZEDZIALE NIE MA ZERA)

0

ai

i

NIEISTOTNY (W PRZEDZIALE JEST ZERO)

P ( a i  t / 2 { n  k } s ( a i )   i  a i  t / 2 { n  k } s ( a i )  1  

Z tablicy rozkładu Studenta, a nie z wydruku komputerowego!

Matematyczne techniki zarządzania - 137
Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

W praktyce posługujemy się raczej hipotezami:
Badanie istotności przeprowadza
się dla każdego i oddzielnie:

t obl ( a i ) 

ai  0
s(a i )

t tabl  t  / 2 { n  k }

• jeżeli |tobl(ai)|>ttabl(ai), odrzucamy hipotezę zerową; parametr jest istotny z błędem równym co najwyżej 
• jeżeli |tobl(ai)|parametr nie jest istotny
Praktycznie jest to bardzo łatwe:
• sprawdzamy, czy |t(ai)| jest większe czy mniejsze od około 2, a najlepiej
• porównujemy rzeczywisty poziom istotności P(ai) z przyjętym 
ODRZUCAMY H0, JEŻELI P(ai) JEST MNIEJSZE OD 

WTEDY ZMIENNA
Xi MA WPŁYW NA
ZMIENNĄ Y

Matematyczne techniki zarządzania - 138
W etapie III następuje ostateczna selekcja zmiennych objaśniających:
• jeżeli wszystkie ai okażą się istotne, model jest poprawny:
— model przyczynowo-skutkowy: do interpretacji
— model tendencji rozwojowej: do etapu IV
• jeżeli choć jedno ai okaże się nieistotne, model jest niepoprawny i wymaga poprawy przez usunięcie nieistotnych zmiennych:
— zmienne należy usuwać po jednej (ze względu na efekt katalityczny)
— usuwa się zawsze zmienną o najniższej wartości |t(ai)| [czyli o
najwyższej wartości P(ai)]
— usunięcie ostatniej zmiennej nieistotnej kończy proces selekcji
kandydatek na zmienne,

— selekcja nie jest ostateczna, gdyż zawsze istnieje możliwość zamiany zmiennych, które są powiązane ze sobą
Praktyczne znaczenie istotności wyrazu wolnego a0
To są jedne z możliwości dla populacji (p. plansza 106)

Y

W przypadku funkcji K=f(P) wyraz wolny wyznacza poziom kosztów stałych (rachunkowość zarządcza)
W przypadku zależności technicznej Q=f(h) wyraz
wolny oznacza, że przy miąższości pokładu h=0 wydajność produkcji Q też jest równa 0

0
X

Matematyczne techniki zarządzania - 139
Praktyczne znaczenie istotności współczynnika regresji ai



KRZYWE NEYMANA — PLANSZE 106-107
WSPÓŁCZ. ISTOTNY
WSPÓŁ. NIEISTOTNY

ETAP III OBOWIĄZUJE DLA WSZYSTKICH MODELI
ETAP III PRZEPROWADZA SIĘ DLA TRANSFORMATY
Etap IV. Badanie symetrii składnika losowego

Y

CZĘSTOŚĆ RESZT DODATNICH I UJEMNYCH MA BYĆ
ZBLIŻONA

Y

ASYMETRYCZNY
SYMETRYCZNY

t
t
Badanie symetrii przeprowadza się testem Studenta (St. Bartosiewicz
Ekonometria)
Brak symetrii wymaga zmiany matematycznej postaci modelu
ETAP IV OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ

ETAP IV PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ

Matematyczne techniki zarządzania - 140
Etap V. Badanie losowości składnika losowego

Y

Y
NIELOSOWY

LOSOWY

t
t
Badanie losowości przeprowadza się testem Studenta lub testem serii
(Ekonometria, praca zb. pod red. M. Krzysztofiaka)
Brak losowości wymaga zmiany matematycznej postaci modelu
ETAP V OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP V PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ
Etap VI. Badanie stacjonarności składnika losowego
W etapie tym chodzi o niezależność wariancji składnika losowego od
zmiennej objaśniającej t (plansza 127)

Bada się istotność współczynnika korelacji ru t , t
ETAP VI OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VI PRZEPROWADZA SIĘ DLA TRANSFORMATY

Matematyczne techniki zarządzania - 141
Etap VII. Badanie wartości oczekiwanej składnika losowego
Normalnie, gdy przeprowadzamy estymację postaci liniowej, parametry
składnika losowego E ( )  0
{ ui  0}
V ( )  const
Po retransformacji do postaci pierwotnej mamy nowe reszty u’, dla
których
'
'
ui  0
 ui  0
Celem etapu jest sprawdzenie, czy odchyłka od O nie jest zbyt duża
(służy do tego test Studenta)
ETAP VII OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VII PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ
Etap VIII. Badanie autokorelacji składnika losowego
Pojęcie autokorelacji opisano na planszy 128; chodzi o istotność korelacji ru , u
t

tk

Badanie autokorelacji można przeprowadzić:

• testem R istotności korelacji ru

t

,ut  k

d obl

• testem Durbina-Watsona
NIE MA AUTOK.

d1

?

d2 JEST AUTOKORELACJA

ETAP VIII OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VIII PRZEPROWADZA SIĘ DLA TRANSFORMATY

Matematyczne techniki zarządzania - 142
Etap IX. Badanie normalności składnika losowego
Celem etapu jest stwierdzenie, czy reszty mają rozkład normalny
Analiza reszt — oddzielny dział analizy regresji i korelacji
Jeżeli reszty mają rozkład normalny, statystyk otrzymuje „ulgi”
ETAP 6. PRAKTYCZNA INTERPRETACJA MODELU



Celem etapu jest wydobycie z modelu całej nowej wiedzy, której nie widać
„gołym okiem”
INTERPRETUJĄC MODEL (RÓWNANIE REGRESJI) NALEŻY UŻYWAĆ WYŁĄCZNIE
PROSTEJ TERMINOLOGII EKONOMICZNEJ ZROZUMIAŁEJ DLA KLIENTA
NIE NALEŻY UŻYWAĆ TERMINOLOGII MATEMATYCZNEJ ZROZUMIAŁEJ TYLKO DLA
TWÓRCÓW MODELU
INTERPRETOWAĆ WOLNO TYLKO MODEL ZWERYFIKOWANY
CAŁY TRUD MODELOWANIA NIE MOŻE BYĆ „SZTUKĄ DLA SZTUKI”, LECZ MA
SŁUŻYĆ UZYSKANIU KONKRETNYCH WNIOSKÓW PRAKTYCZNYCH

Interpretacja modelu przyczynowo-skutkowego

Polega ona na określeniu wpływu poszczególnych czynników na badane
zjawisko:
• podział wszystkich czynników na trzy grupy

Matematyczne techniki zarządzania - 143
A — czynniki nie mające wpływu na Y
B — czynniki mające wpływ na Y i wprowadzone do modelu
C — czynniki mające wpływ na Y, ale nie występujące w modelu
• ocena jakościowa wpływu czynników B i C
• ocena ilościowa wpływu czynników B i C
Ocena jakościowa



Na podstawie znaków stojących przy współczynnikach r oraz ai możemy
stwierdzić, że wpływ jest:

• dodatni (im lepsze zaliczenie, tym lepszy wynik egzaminu; im więcej
wydatków na reklamę, tym większy zysk; itd.)
• ujemny (im więcej zatrudnionych, tym gorszy wynik finansowy; im
mniej braków, tym wyższy zysk; im mniejsza absencja, tym wyższe
wynagrodzenie; itd.)

Ocena ilościowa
• model liniowy
Przykład 33. Zinterpretuj zweryfikowany model zależności miesięcznych
kosztów działalności przedsiębiorstwa (tys. zł) od wielkości produkcji
(sztuk) i liczby reklamacji:
y i  50 , 8  14 , 5 x 1  3 , 9 x 2  

Matematyczne techniki zarządzania - 144
a0 = 50,8

poziom kosztów stałych; jeśli firma nie będzie prowadzić
żadnej działalności, poniesie koszty w wysokości 50,8 tys. zł

a1 = 14,5

każda sztuka produktu firmy kosztuje ją przeciętnie 14,5
tys. zł; jeżeli firma zwiększy produkcję o 2 sztuki, koszty
wzrosną o 29,0 tys. zł

a2 = 3,9każda wniesiona reklamacja powiększa koszty przeciętnie o
3,9 tys. zł
• model potęgowy
Przykłąd 34. Zinterpretuj zweryfikowaną funkcję produkcji Cobba-Douglasa
0 , 65

Pi  45 , 2 M i

0 , 73

Zi

e

0 , 04



Funkcja produkcji to specjalny model, określający zależność pomiędzy
produkcją (P) a czynnikami produkcji: majątkiem trwałym (M) i nakładami
robocizny (Z).



Funkcje produkcji to modele umożliwiające „prześwietlenie”
przedsiębiorstwa (szereg czasowy) lub branży (dane przekrojowe) i określenie poziomu gospodarowania oraz postępu
technicznego i organizacyjnego.
Elastyczność  to współczynnik określający reakcję zmiany
jednej zmiennej na inną zmienną — na przykład elastyczność
cenowa popytu (jak popyt zmienia się wraz z ceną towaru).

EKSPERCI
ZACHODNI

Matematyczne techniki zarządzania - 145

 

y
y

:

x

FUNKCJA POTĘGOWA JEST JEDYNĄ FUNKCJĄ O STAŁEJ ELASTYCZNOŚCI

x

Izolinie funkcji produkcji

T1
M

Produkcję P można osiągnąć różnymi
kombinacjami majątku i robocizny:

T2

• T1— technika kapitałochłonna, np.
pełna automatyzacja
• T2 — pośredni poziom techniki

T3
P  const

• T3 — niski poziom techniki, produkcja
pracochłonna
P. LOWE

Z
Efekt poprawy zarządzania bez
zmiany techniki (lepsze wykorzystanie ludzi i sprzętu):

P2
M

ZARZĄDZANIE
TECHNOLOGIĄ

P1

T

• zmniejszenie kapitałochłonności

• zmniejszenie pracochłonności
• zwiększenie produkcji (przejście z
funkcji P1 na P2)

Można też rozpatrzyć łączne efekty
zmiany techniki i zarządzania

Z

Matematyczne techniki zarządzania - 146
Wszystkie informacje tego typu można odczytać w trakcie interpretacji
0 , 65
0 , 73 0 , 04
funkcji produkcji:
Pi  45 , 2 M i
Zi
e

• wartości 45,2 nie interpretuje się
• wartość 0,65 to współczynnik elastyczności majątkowej (kapitałowej)
produkcji: zmiana majątku o 10% daje średnio zmianę produkcji o 6,5%
• wartość 0,73 to współczynnik elastyczności zatrudnieniowej produkcji:
zmiana zatrudnienia o 10% daje zmianę produkcji średnio o 7,3%
• suma obu współczynników k=0,65+0,73=1,38 to współczynnik skali
produkcji:

— jeżeli k<1, to firma rozwija się ekstensywnie
— jeżeli k>1, to firma rozwija się intensywnie
• wartość  = 0,04 to współczynnik postępu organizacyjnego:
— jeżeli  >O, to miał miejsce postęp organizacyjny

— jeżeli  <0, to miał miejsce regres organizacyjny
Interpretacja modelu tendencji rozwojowej

DODAMY
TROCHĘ
TEORII

Przypomnienie: t — zmienna objaśniająca (stałe przyrosty)
y — zmienna objaśniana; rozdzielana w ogólności na trzy
części: trend, wahania okresowe, wahania losowe ()

Matematyczne techniki zarządzania - 147
Wykres z planszy 117 (zużycie energii elektrycznej przez WZ AGH)
WAHANIA OKRESOWE OKREŚLA SIĘ WZGLĘDEM TRENDU A
NIE WZGLĘDEM OSI CZASU

y

trend

t
1995

1996

1997

1998

1999

Te trzy części trzeba zidentyfikować, a potem złożyć razem w model:

• addytywny (jeśli amplituda wahań jest stała)
• multiplikatywny (jeśli amplituda wahań rośnie lub maleje regularnie)
Wyznaczanie trendu
Metody mechaniczne:

• wskaźniki bezwzględne (stały przyrost =
postęp arytmetyczny = funkcja liniowa)
• wskaźniki względne (przyrost o stały procent =
postęp geometryczny = funkcja potęgowa)
• średnia ruchoma (wygładzanie danych linią łamaną)

JAK OBLICZYĆ O
ILE PROCENT ROCZNIE SPADAŁA
ŚREDNIO LICZBA
WIDZÓW W
KINACH:
1982 - 193,7 MLN
1989 - 141,3 MLN

Matematyczne techniki zarządzania - 148
Średnia ruchoma: mając szereg czasowy y1, y2,....., yn, przyjmujemy
długość kroku k = 3, lub 5, lub 7 itd. i liczymy
y  ...  y k
y  ...  y k  1
y k / 2 0 ,5  1
a następnie y k / 2  1 , 5  2
itd.
k
k
y  y2  y3
y  y3  y4
dla k=3:
y2  1
y3  2
itd.
3
3
Przykład 35. Wyznacz trend metodą średniej ruchomej dla następujących
danych:
okres
t
wartość yt

1
5

2
4

3
7

4
6

5
8

12

y2 
10

y3 

y

8

y4 

6
4

y5 

2

y6 

0
0

1

2

3

4

5

czas, t

6

7

8

9

y7 

547

6
10

 5 , 67

CECHY
ŚREDNIEJ
RUCHOMEJ:

 7 , 00

• TRACI SIĘ
k-1 DANYCH

3
768

8
8

 5 , 33

3
476

7
9

3
6  8  10

 8 , 00

3
8  10  9

 9 , 00

3
10  9  8

 9 , 00

• IM
WIĘKSZE k,
TYM
BARDZIEJ
SZTYWNY
TREND

3

Metody statystyczne: analiza regresji i korelacji, różne funkcje oparte na
modelach ekonomii

Matematyczne techniki zarządzania - 149
Wyznaczanie wahań okresowych: dobowych, tygodniowych, miesięcznych,
kwartalnych, rocznych, wieloletnich
Trzy metody:

— metoda wskaźników sezonowości
— metoda zmiennych zero-jedynkowych (0-1)

— metoda harmoniczna
Wszystkie metody mają jeden cel:
uzyskanie przeciętnego obrazu jednego cyklu

+

Ws
[t ]
[%]
trend

I

II



III

IV

WADY:
• KONIECZNOŚĆ
KOREKTY
• BRAK
WERYFIKACJI
STATYSTYCZNEJ

Metoda wskaźników sezonowości

• obliczenie surowych wskaźników sezonowości (wyeliminowanie trendu):
y

S s  yt  yt
S s  t
yt
addytywny multiplikatywny
wynik: n wartości odchyleń od trendu

• obliczenie oczyszczonych wskaźników
sezonowości (wyeliminowanie wahań
losowych):
 Ss
So 
k-liczba okresów
k
jednoimiennych
m-długość cyklu wynik: m wartości śr. odchyleń od trendu

Matematyczne techniki zarządzania - 150
Metoda zmiennych zero-jedynkowych (0-1)
m

y t  a 0  a1 t   bi Q i  
i 1

bi — przeciętne odchylenie od trendu dla
okresu i-tego
Qi — zmienna 0-1

wahania losowe
trend

wahania okresowe

t
1
2
3
4
5
6
7
8
9

yt
y1
y2
y3
y4
y5
y6
y7
y8
y9

Q1
1
0
0
0
1
0
0
0
1

Q2
0
1
0
0
0
1
0
0
0

Q3
0
0
1
0
0
0
1
0
0

Q4
0
0
0
1
0
0
0
1
0

Metoda harmoniczna (szeregi Fouriera)
Wahania okresowe przedstawia się jako sumę określonej liczby drgań harmonicznych (sinusoid i cosinusoid) przesuniętych w fazie, lecz o jednakowym okresie
m /2
2 i m / 2
2 i
y t  a 0  a 1 t   b1 i sin
  b 2 i cos

m
m
i 1
i 1
Obie metody dają taki sam wynik, istnieje możliwość weryfikacji
statystycznej
W metodzie 0-1 dostajemy bi = Ws, natomiast w metodzie harmonicznej Ws
jest sumą wartości poszczególnych sinusoid dla danego momentu czasu


Slide 26

Matematyczne techniki zarządzania - 121
ETAP 2. GROMADZENIE DANYCH STATYSTYCZNYCH

!

ZA JAKOŚĆ DANYCH ODPOWIADA MODELUJĄCY
• rodzaje danych: dane przekrojowe i szeregi czasowe
• źródła danych: roczniki statystyczne, różne działy
przedsiębiorstwa, badania marketingowe, wywiady itd.
• wiarygodność danych: do jakiego celu zostały one
przygotowane?

MUSISZ
SPRAWDZAĆ
KAŻDE DANE

• porównywalność danych: inflacja (ceny bieżące a ceny
stałe), zmiany procesów technicznych
Wielkość
produkcji

• zmienność zjawisk: trzeba sprawdzić, czy
wybrana w etapie 1a zmienna jest rzeczywiście zmienną losową

Wx 

s( x )

nowy zakład

100 %

x

stary zakład

Wx musi wynosić co najmniej 30-40%
Wiek studenta może być dobrą zmiennąprzyczyną, ale nie w przypadku studiów
dziennych!

Zatrudnienie

Matematyczne techniki zarządzania - 122
ETAP 3. SELEKCJA ZMIENNYCH OBJAŚNIAJĄCYCH
KAŻDĄ ZMIENNĄ X WYTYPOWANĄ W ETAPIE 1a TRAKTUJEMY JAKO
KANDYDATKĘ NA ZMIENNĄ OBJAŚNIAJĄCĄ
Może być kilka przyczyn powodujących, że taka kandydatka nie może znaleźć się w modelu ekonometrycznym (w równaniu regresji):
• w modelu nie może być zbyt wielu zmiennych (nieczytelny)
• kandydatka może nie mieć wpływu na zmienną Y



• kandydatka może wnosić prawie tę samą informację o Y co inna
kandydatka

• dwie bardzo podobne kandydatki mogą sobie nawzajem przeszkadzać
(efekt katalityczny)
Kryteria, jakie musi spełniać kandydatka Xi, aby nadawała się do modelu:
• musi być silnie powiązana ze zmienną Y

• nie może być powiązana z inną kandydatką Xj
SSTO
x1
x4

x2
x3

reszta

R2=0,79

R2=0,66

x2
x1
x4

R2=0,48

x3
reszta

reszta

SSTO

SSTO

Matematyczne techniki zarządzania - 123
Efekt katalityczny
DWIE ZMIENNE DAJĄ
RAZEM MNIEJ INFORMACJI NIŻ KAŻDA Z
NICH Z OSOBNA

x1

x2

R2=0,25

x2

x1

R2=0,52

R2=0,66

Selekcja kandydatek ma na celu podzielenie ich na trzy grupy:
• zmienne wprowadzone do modelu
• zmienne nie wprowadzone do modelu, ale reprezentowane w nim przez
inne zmienne (możliwość wymiany)
• zmienne nie wprowadzone do modelu ze względu na fakt, że nie wnoszą
żadnej informacji o zmiennej Y
INFORMACJE potrzebne do selekcji: współczynniki r x i x j ,
Macierz współczynników korelacji
Y
Y
X1
X2
X3

0,52
0,64
- 0,21

X1
0,52
0,82
- 0,18

X2
0,64
0,82
0,08

X3
- 0,21
- 0,18
0,08

r yx

i

Przykład 32. Macierz powiązania
zmiennych ze sobą przedstawia
się następująco (n=20). Jak ją
można zinterpretować? Które
zmienne są powiązane ze sobą w
sposób istotny?

Matematyczne techniki zarządzania - 124
Testowanie istotności współczynnika korelacji
H0:  = 0

Można je przeprowadzić trzema testami: testem Studenta

H1:   0

(t), Fishera (F) i Wallace’a-Snedecora (R)

Fragment tablicy rozkładu Wallece’a-Snedecora (SKRYPT, tab. VII, s.161)
S to pn ie
sw ob od y

2
0,05
0,632
0,444
0,361

8
18
28

,

0,01
0,765
0,561
0,463

L iczb a zm ien n ych
3
0,05
0,01
0,726
0,827
0,532
0,633
0,439
0,530

4
0,05
0,777
0,587
0,490

0,01
0,860
0,678
0,573

Reguła decyzyjna: — jeżeli |Robl|>Rtabl, odrzucamy H0 (korelacja istotna)
— jeżeli |Robl|
W przykładzie 32, jeżeli przyjmiemy  = 0,05, to Rtabl = 0,444.
Y
Y
X1
X2
X3

0,52
0,64
- 0,21

X1
0,52
0,82
- 0,18

X2
0,64
0,82
0,08

X3
- 0,21
- 0,18
0,08

Pozostaną zatem tylko trzy
istotne powiązania:
y-x1, y-x2, x1-x2
BRAK ISTOTNEGO POWIĄZANIA Z Y NIE
OZNACZA, ŻE ZMIENNA NIE WNOSI
ŻADNEJ INFORMACJI O ZJAWISKU Y

Matematyczne techniki zarządzania - 125



Metody selekcji zmiennych objaśniających:
• grafowa
• Hellwiga (pojemności informacji)
• taksonomiczne (clustering)
Metoda grafowa
• obliczenie macierzy współczynników:

rx

i

xj

• wyłowienie z macierzy powiązań istotnych

, r yx

BUDOWA GRAFU
i

• graf spójny

• budowa grafu z powiązań istotnych
• wybranie zmiennych na podstawie grafu

x6

• graf zerowy
x1
x4

x9

DO MODELU WYBIERA SIĘ ZMIENNE:
• każdy graf zerowy (jeśli |ryx|>0,1)

istotne powiązanie

• po jednej reprezentantce grafu spójnego;

reprezentantką grafu jest zmienna, która ma najwięcej powiązań z
innymi kandydatkami
jeżeli kilka zmiennych ma tę samą maksymalną liczbę powiązań, wybiera
się z nich tę, która jest najsilniej powiązana za zmienną Y (max ryx)
jeżeli graf jest rozległy, może mieć dwie reprezentantki, ale muszą one
leżeć na przeciwległych stronach grafu

Matematyczne techniki zarządzania - 126
Przykład 32 cd. Wybierzemy
zmienną x2 (reprezentantka grafu
spójnego) i zmienną x3 (graf
zerowy)
Metoda Hellwiga

Y
Y
X1
X2
X3

0,52
0,64
- 0,21

• wypisujemy wszystkie możliwe kombinacje
kandydatek; jest ich K = 2m—1
• obliczamy pojemność informacji dla każdej
zmiennej w każdej kombinacji

h kl  f ( r yx , r x
i

ixj

)

• obliczamy pojemność całkowitą dla każdej
kombinacji
H l   h kl
k

• wybieramy kombinację o największej
pojemności Hl = max

X1
0,52
0,82
- 0,18

X2
0,64
0,82

X3
- 0,21
- 0,18
0,08

0,08

W przykładzie 32 mamy 7
możliwych kombinacji kandydatek:
1. x1
2. x2

3. x3

maximum:

H6 = 0,42

4. x1,x2
5. x1,x3

Hmax = R2

6. x2,x3
7. x1,x2,x3

Metody taksonomiczne
Taksonomia wrocławska (cluster analysis) to metoda grupowania obiektów (zmiennych) w grupy jednorodne pod względem n cech (wymiarów)
łącznie. Podstawą grupowania jest odległość euklidesowa, która w przypadku zmiennych d ij  f ( r x x )
WSZYSTKIE METODY TO SELEKCJA WSTĘPNA
i

j

Matematyczne techniki zarządzania - 127
ETAP 4. ESTYMACJA PARAMETRÓW MODELU
Cel etapu: wyznaczenie parametrów strukturalnych i stochastycznych
Estymacja: szacowanie parametrów populacji na podstawie próbki
Metody estymacji: analiza regresji i korelacji (KMNK i inne)

Założenia dla KMNK
1. Zmienne losowe są prawdziwymi zmiennymi, nie powiązanymi ze sobą
2. Składnik losowy  ma stałą wariancję, niezależną od zmiennej x lub t
3. Wartości reszt ui są niezależne od siebie

4. Składnik losowy  nie jest powiązany ze zmienną objaśniającą
Skutki niedotrzymania założeń i środki zaradcze
1. Model bez sensu, nieprzydatny; niekiedy absurdalny (źle uwarunkowane
dane)
Stosuje się: dużą próbkę (n>100), regresję grzbietową (ridge regression)
2.

Y

reszta ui

Lewa część zbioru ma dużą wariancję, a
prawa — wariancję małą
Stosuje się specjalny wariant MNK z
korektą na różne wariancje
X

Matematyczne techniki zarządzania - 128
3. Jeśli reszty ui są ze sobą powiązane (skorelowane), mówimy, że
występuje autokorelacja składnika losowego (zjawisko występuje przy
szeregach czasowych — sztywny porządek obserwacji)
Oznacza to, że istnieje istotna zależność u t  f ( u t  k )
Przyczyny autokorelacji: zakłócenia
(dodatnie lub ujemne) w jednym okresie
wpływają na poziom zjawiska w następnych
okresach (rolnictwo, produkcja, rynek)

t  1 , 2 ,...

u t  y t  yˆ t

u t 1

u1
u2
u3
u4
u5

Występowanie autokorelacji powoduje
nieprzydatność modelu


u1
u2
u3
u4

Istnienie autokorelacji sprawdza się testem
Durbina-Watsona d
Stosuje się metodę różniczki zupełnej

y  f (x )

yt  yt  ytk

4. Składnik losowy jest skorelowany ze zmienną objaśniającą, wtedy
gdy została pominięta jakaś ważna zmienna-przyczyna

Model taki nie ma żadnej wartości; trzeba dbać o jak najwyższy współczynnik determinacji (R2>0,9)
• zbiór danych rzeczywistych nigdy
nie spełnia tych wymagań

ESTYMACJĘ MODELU POWTARZA SIĘ WIELOKROTNIE
ponieważ dopiero weryfikacja zapewnia ostateczną selekcję
kandydatek na zmienne objaśniające

• ekonometria to analiza danych nie
spełniających tych założeń
• nie stosować statystyki bezmyślnie (na ślepo)

Matematyczne techniki zarządzania - 129
ETAP 5. WERYFIKACJA MODELU
Cele:

1. opis rzeczywistości (populacji generalnej)



2. dokładna (ostateczna) selekcja zmiennych objaśniających
3. poznanie składnika losowego (spełnienie założeń KMNK)
Narzędzia: hipotezy i testy statystyczne

Metodyka: każde równanie oddzielnie; weryfikacja obejmuje 9 etapów (od
najmniej do najbardziej pracochłonnego)
WYKAZ ETAPÓW WERYFIKACJI MODELU
I.
II.

Badanie istotności korelacji
Badanie wyrazistości modelu

III.

Badanie istotności parametrów

IV.

Badanie symetrii skł. losowego

V.
VI.
VII.
VIII.
IX.

Badanie losowości skł. losowego
Badanie stacjonarności skł. los.
Badanie wartości oczekiwanej skł. los.
Badanie autokorelacji skł. losowego
Badanie normalności skł. losowego

Opis każdego etapu weryfikacji
obejmuje:
• cel etapu
• sposób weryfikacji: wzory,
hipotezy, testy
• podanie których modeli dotyczy (przyczynowo-skutkowych
czy tendencji rozwojowej)
• podanie której postaci modeli
nieliniowych dotyczy (pierwotnej czy transformaty)

Matematyczne techniki zarządzania - 130
Etap I. Badanie istotności korelacji
7
2

8

9

11

12

17

19

23

21

5
2 etapu
9
16
7
9
15
14
Celem
jest
sprawdzenie,
czy
istnieje w populacji generalnej powiązanie pomiędzy zmienną Y i wszystkimi zmiennymi objaśniającymi

25

Przedział ufności dla
nieznanego współczynnika korelacji  dla populacji buduje się przy
użyciu błędu

populacja

zmienna Y

20
15
10

próbka

5
0
8
5

0 9

1011

2

9

20
12

30
17
16
7
zmienna X

25

1940
9

23 50
15

populacja

20

zmienna Y

7
2

15
10

próbka

5
0
0

10

20

30

zmienna X

40

50

21
14

sR 

1 R

0

Robl

2

nk

Istotność korelacji weryfikuje się przez postawienie
następujących hipotez dla
współczynnika korelacji dla
populacji generalnej:

1
R,|r|

H0 :   0

Brak korelacji, nie ma powiązania...

H1 :   0

Korelacja istotna, jest powiązanie...

,

Matematyczne techniki zarządzania - 131
Hipotezy te można weryfikować trzema równoważnymi testami:
• testem t Studenta (tylko dla regresji dwu zmiennych)
• testem F Fishera-Snedecora
• testem R Wallace’a-Snedecora

,

W każdym przypadku obliczamy wartość
statystyki dla próbki (tobl, Fobl, Robl) i porównujemy z wartością krytyczną odczytaną z tablicy odpowiedniego rozkładu w
funkcji poziomu istotności i liczby stopni
swobody (ttabl, Ftabl, Rtabl)

Reguła decyzyjna:
• jeżeli |tobl|< ttabl, nie ma podstaw do odrzucenia H0 (brak korelacji)
• jeżeli |tobl|> ttabl, odrzucamy H0 na korzyść H1 (korelacja istnieje)

TAK SAMO DLA
FiR

W przypadku regresji wielorakiej, gdy liczba zmiennych objaśniajacych
jest duża w porównaniu do liczby obserwacji, współczynnik determinacji
R2 może dawać zawyżoną ocenę stopnia wyjaśnienia zmienności zmiennej
objaśnianej; dlatego wprowadzono skorygowany współczynnik determinacji (i korelacji):
 ( yˆ i  y )

R

2

2

k
n

k

1


2
nk 1
(
y

y
)

i
n1

• adjusted coefficient of multiple
determination (wydruki komputerowe)

• jeśli k jest małe, nie ma większej różnicy
pomiędzy normalnym a skorygowanym R2

Matematyczne techniki zarządzania - 132
Skąd wziąć wartość odpowiedniej statystyki dla próbki i jak odczytywać jej wartości z tablic?
n2
r
t

r

t tabl  t  / 2 { n  2 }
TEST STUDENTA
obl
2
sr
1 r

F obl 

TEST FISHERA

Ź ró d ło z m ien n o śc i

MSTR
MSE



R

nk

2

1 R

2

L ic zb a sto p n i
sw o b o d y

Suma
k w a d ra tó w

Ś re d n i
k w a d ra t

M o d el (c z yn n ik i)
B łą d (re sz ta )

k1
nk

SSTR
SSE

MSTR
MSE

R azem

n1

SSTO

TEST WALLACE’A

R obl 

R

2

k 1

F tabl  F { k  1 , n  k }

S ta ty sty k a
F
F obl 

MSTR
MSE

NIE MYLIĆ
STOPNI SWOBODY LICZNIKA I MIANOWNIKA

R tabl  R { k , n  k }

Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

Matematyczne techniki zarządzania - 133
Odczyt Rtabl z tablicy testu R (SKRYPT s.161-162)

, k,  = n-k

S to pn ie
sw ob od y
8
18
28

2
0,05
0,632
0,444
0,361

0,01
0,765
0,561
0,463

L iczb a zm ien n ych
3
0,05
0,01
0,726
0,827
0,532
0,633
0,439
0,530

4
0,05
0,777
0,587
0,490

0,01
0,860
0,678
0,573

Wnioski dotyczące rozkładu R Wallace’a-Snedecora:
• tablica zawiera maksymalne wartości współczynnika korelacji w danej
sytuacji, jakich można oczekiwać, gdy nie ma korelacji w populacji
• im wyższy poziom istotności, tym niższe Rtabl

• im większa liczba zmiennych w modelu, tym wyższe Rtabl
• im wyższa liczba stopni swobody (większa próbka), tym niższe Rtabl
• tablica R powstała z przeliczenia tablic t oraz F (odwrócenie wzorów)
• tablica testu R jest najszybszym i nawygodniejszym narzędziem do
weryfikacji istotności korelacji

Werdykt z etapu I:

Matematyczne techniki zarządzania - 134

• jeżeli Robl>Rtabl, model jest poprawny, można przejść do etapu II
• jeżeli Roblzmiennych objaśniających albo jego postać matematyczną
ETAP I OBOWIĄZUJE DLA WSZYSTKICH MODELI
ETAP I PRZEPROWADZA SIĘ DLA TRANSFORMATY (dla postaci pierwotnej
można uzyskać R>1)
Rola współczynnika determinacji R2
• korelacja może być istotna przy małym R i bardzo małym R2 (r=0,4,
R2=0,16, co oznacza, że tylko 16% zmienności zmiennej Y jest
wyjaśnione przez zmienną objaśniającą)
• małe R2 oznacza niski stopień wyjaśnienia rzeczywistości i stanowi
zagrożenie dla modelu
• należy dążyć (poprzez odpowiedni dobór zmiennych-przyczyn i postaci
matematycznej modelu) do jak największego R2 (dla postaci pierwotnej)
• wysoka wartość R2 świadczy o dobrym poznaniu badanego zjawiska
• wysoka wartość R2 bardzo często wynika jednak ze złego dobrania
zmiennych objaśniających (silnie powiązane ze sobą — „masło maślane”)
KORELACJA POZORNA — jest zależność, ale jej nie ma? Przyczyny...
Trzeba unikać wartości bezwzględnych (ludność, liczba sklepów, wielkość produkcji)

6

9

12

8

11

12

11

15

9

18

9

11

11

18

15

Matematyczne techniki zarządzania - 135
Etap II. Badanie wyrazistości modelu
Y

Wyrazistość modelu dana jest wzorem

s( y )

ui

y

W obl 

s( y )

100 %

y

Celem etapu
jest kontrola
rozrzutu danych

Współczynnik Wobl<30%, w przeciwnym
przypadku rozrzut danych jest zbyt duży

y

Kłopoty: gdyy jest bliskie 0

x

X

Werdykt: model poprawny lub niepoprawny

ETAP II OBOWIĄZUJE DLA WSZYSTKICH MODELI (ale nie ma on charakteru
statystycznego)

ETAP II PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ (sprawdzamy, czy
nie występuje silny efekt „krzywego lustra”)
Etap III. Badanie istotności parametrów (współczynników) modelu
Celem etapu jest sprawdzenie:
• czy poszczególne zmienne objaśniające mają istotny wpływ na zmienną
objaśnianą?
• czy zmienne objaśniające są wybrane prawidłowo?

• czy wyraz wolny różni się istotnie od zera?

Matematyczne techniki zarządzania - 136
Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

Problem istotności parametrów ai można rozpatrywać (tak jak problem
średniej dla populacji) z dwu punktów widzenia:
• przedziału ufności dla nieznanej wartości i

• hipotez — zerowej H0: i=0 i alternatywnej H1: i 0

1
0

ai

1

i

ISTOTNY (W PRZEDZIALE NIE MA ZERA)

0

ai

i

NIEISTOTNY (W PRZEDZIALE JEST ZERO)

P ( a i  t / 2 { n  k } s ( a i )   i  a i  t / 2 { n  k } s ( a i )  1  

Z tablicy rozkładu Studenta, a nie z wydruku komputerowego!

Matematyczne techniki zarządzania - 137
Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

W praktyce posługujemy się raczej hipotezami:
Badanie istotności przeprowadza
się dla każdego i oddzielnie:

t obl ( a i ) 

ai  0
s(a i )

t tabl  t  / 2 { n  k }

• jeżeli |tobl(ai)|>ttabl(ai), odrzucamy hipotezę zerową; parametr jest istotny z błędem równym co najwyżej 
• jeżeli |tobl(ai)|parametr nie jest istotny
Praktycznie jest to bardzo łatwe:
• sprawdzamy, czy |t(ai)| jest większe czy mniejsze od około 2, a najlepiej
• porównujemy rzeczywisty poziom istotności P(ai) z przyjętym 
ODRZUCAMY H0, JEŻELI P(ai) JEST MNIEJSZE OD 

WTEDY ZMIENNA
Xi MA WPŁYW NA
ZMIENNĄ Y

Matematyczne techniki zarządzania - 138
W etapie III następuje ostateczna selekcja zmiennych objaśniających:
• jeżeli wszystkie ai okażą się istotne, model jest poprawny:
— model przyczynowo-skutkowy: do interpretacji
— model tendencji rozwojowej: do etapu IV
• jeżeli choć jedno ai okaże się nieistotne, model jest niepoprawny i wymaga poprawy przez usunięcie nieistotnych zmiennych:
— zmienne należy usuwać po jednej (ze względu na efekt katalityczny)
— usuwa się zawsze zmienną o najniższej wartości |t(ai)| [czyli o
najwyższej wartości P(ai)]
— usunięcie ostatniej zmiennej nieistotnej kończy proces selekcji
kandydatek na zmienne,

— selekcja nie jest ostateczna, gdyż zawsze istnieje możliwość zamiany zmiennych, które są powiązane ze sobą
Praktyczne znaczenie istotności wyrazu wolnego a0
To są jedne z możliwości dla populacji (p. plansza 106)

Y

W przypadku funkcji K=f(P) wyraz wolny wyznacza poziom kosztów stałych (rachunkowość zarządcza)
W przypadku zależności technicznej Q=f(h) wyraz
wolny oznacza, że przy miąższości pokładu h=0 wydajność produkcji Q też jest równa 0

0
X

Matematyczne techniki zarządzania - 139
Praktyczne znaczenie istotności współczynnika regresji ai



KRZYWE NEYMANA — PLANSZE 106-107
WSPÓŁCZ. ISTOTNY
WSPÓŁ. NIEISTOTNY

ETAP III OBOWIĄZUJE DLA WSZYSTKICH MODELI
ETAP III PRZEPROWADZA SIĘ DLA TRANSFORMATY
Etap IV. Badanie symetrii składnika losowego

Y

CZĘSTOŚĆ RESZT DODATNICH I UJEMNYCH MA BYĆ
ZBLIŻONA

Y

ASYMETRYCZNY
SYMETRYCZNY

t
t
Badanie symetrii przeprowadza się testem Studenta (St. Bartosiewicz
Ekonometria)
Brak symetrii wymaga zmiany matematycznej postaci modelu
ETAP IV OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ

ETAP IV PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ

Matematyczne techniki zarządzania - 140
Etap V. Badanie losowości składnika losowego

Y

Y
NIELOSOWY

LOSOWY

t
t
Badanie losowości przeprowadza się testem Studenta lub testem serii
(Ekonometria, praca zb. pod red. M. Krzysztofiaka)
Brak losowości wymaga zmiany matematycznej postaci modelu
ETAP V OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP V PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ
Etap VI. Badanie stacjonarności składnika losowego
W etapie tym chodzi o niezależność wariancji składnika losowego od
zmiennej objaśniającej t (plansza 127)

Bada się istotność współczynnika korelacji ru t , t
ETAP VI OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VI PRZEPROWADZA SIĘ DLA TRANSFORMATY

Matematyczne techniki zarządzania - 141
Etap VII. Badanie wartości oczekiwanej składnika losowego
Normalnie, gdy przeprowadzamy estymację postaci liniowej, parametry
składnika losowego E ( )  0
{ ui  0}
V ( )  const
Po retransformacji do postaci pierwotnej mamy nowe reszty u’, dla
których
'
'
ui  0
 ui  0
Celem etapu jest sprawdzenie, czy odchyłka od O nie jest zbyt duża
(służy do tego test Studenta)
ETAP VII OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VII PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ
Etap VIII. Badanie autokorelacji składnika losowego
Pojęcie autokorelacji opisano na planszy 128; chodzi o istotność korelacji ru , u
t

tk

Badanie autokorelacji można przeprowadzić:

• testem R istotności korelacji ru

t

,ut  k

d obl

• testem Durbina-Watsona
NIE MA AUTOK.

d1

?

d2 JEST AUTOKORELACJA

ETAP VIII OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VIII PRZEPROWADZA SIĘ DLA TRANSFORMATY

Matematyczne techniki zarządzania - 142
Etap IX. Badanie normalności składnika losowego
Celem etapu jest stwierdzenie, czy reszty mają rozkład normalny
Analiza reszt — oddzielny dział analizy regresji i korelacji
Jeżeli reszty mają rozkład normalny, statystyk otrzymuje „ulgi”
ETAP 6. PRAKTYCZNA INTERPRETACJA MODELU



Celem etapu jest wydobycie z modelu całej nowej wiedzy, której nie widać
„gołym okiem”
INTERPRETUJĄC MODEL (RÓWNANIE REGRESJI) NALEŻY UŻYWAĆ WYŁĄCZNIE
PROSTEJ TERMINOLOGII EKONOMICZNEJ ZROZUMIAŁEJ DLA KLIENTA
NIE NALEŻY UŻYWAĆ TERMINOLOGII MATEMATYCZNEJ ZROZUMIAŁEJ TYLKO DLA
TWÓRCÓW MODELU
INTERPRETOWAĆ WOLNO TYLKO MODEL ZWERYFIKOWANY
CAŁY TRUD MODELOWANIA NIE MOŻE BYĆ „SZTUKĄ DLA SZTUKI”, LECZ MA
SŁUŻYĆ UZYSKANIU KONKRETNYCH WNIOSKÓW PRAKTYCZNYCH

Interpretacja modelu przyczynowo-skutkowego

Polega ona na określeniu wpływu poszczególnych czynników na badane
zjawisko:
• podział wszystkich czynników na trzy grupy

Matematyczne techniki zarządzania - 143
A — czynniki nie mające wpływu na Y
B — czynniki mające wpływ na Y i wprowadzone do modelu
C — czynniki mające wpływ na Y, ale nie występujące w modelu
• ocena jakościowa wpływu czynników B i C
• ocena ilościowa wpływu czynników B i C
Ocena jakościowa



Na podstawie znaków stojących przy współczynnikach r oraz ai możemy
stwierdzić, że wpływ jest:

• dodatni (im lepsze zaliczenie, tym lepszy wynik egzaminu; im więcej
wydatków na reklamę, tym większy zysk; itd.)
• ujemny (im więcej zatrudnionych, tym gorszy wynik finansowy; im
mniej braków, tym wyższy zysk; im mniejsza absencja, tym wyższe
wynagrodzenie; itd.)

Ocena ilościowa
• model liniowy
Przykład 33. Zinterpretuj zweryfikowany model zależności miesięcznych
kosztów działalności przedsiębiorstwa (tys. zł) od wielkości produkcji
(sztuk) i liczby reklamacji:
y i  50 , 8  14 , 5 x 1  3 , 9 x 2  

Matematyczne techniki zarządzania - 144
a0 = 50,8

poziom kosztów stałych; jeśli firma nie będzie prowadzić
żadnej działalności, poniesie koszty w wysokości 50,8 tys. zł

a1 = 14,5

każda sztuka produktu firmy kosztuje ją przeciętnie 14,5
tys. zł; jeżeli firma zwiększy produkcję o 2 sztuki, koszty
wzrosną o 29,0 tys. zł

a2 = 3,9każda wniesiona reklamacja powiększa koszty przeciętnie o
3,9 tys. zł
• model potęgowy
Przykłąd 34. Zinterpretuj zweryfikowaną funkcję produkcji Cobba-Douglasa
0 , 65

Pi  45 , 2 M i

0 , 73

Zi

e

0 , 04



Funkcja produkcji to specjalny model, określający zależność pomiędzy
produkcją (P) a czynnikami produkcji: majątkiem trwałym (M) i nakładami
robocizny (Z).



Funkcje produkcji to modele umożliwiające „prześwietlenie”
przedsiębiorstwa (szereg czasowy) lub branży (dane przekrojowe) i określenie poziomu gospodarowania oraz postępu
technicznego i organizacyjnego.
Elastyczność  to współczynnik określający reakcję zmiany
jednej zmiennej na inną zmienną — na przykład elastyczność
cenowa popytu (jak popyt zmienia się wraz z ceną towaru).

EKSPERCI
ZACHODNI

Matematyczne techniki zarządzania - 145

 

y
y

:

x

FUNKCJA POTĘGOWA JEST JEDYNĄ FUNKCJĄ O STAŁEJ ELASTYCZNOŚCI

x

Izolinie funkcji produkcji

T1
M

Produkcję P można osiągnąć różnymi
kombinacjami majątku i robocizny:

T2

• T1— technika kapitałochłonna, np.
pełna automatyzacja
• T2 — pośredni poziom techniki

T3
P  const

• T3 — niski poziom techniki, produkcja
pracochłonna
P. LOWE

Z
Efekt poprawy zarządzania bez
zmiany techniki (lepsze wykorzystanie ludzi i sprzętu):

P2
M

ZARZĄDZANIE
TECHNOLOGIĄ

P1

T

• zmniejszenie kapitałochłonności

• zmniejszenie pracochłonności
• zwiększenie produkcji (przejście z
funkcji P1 na P2)

Można też rozpatrzyć łączne efekty
zmiany techniki i zarządzania

Z

Matematyczne techniki zarządzania - 146
Wszystkie informacje tego typu można odczytać w trakcie interpretacji
0 , 65
0 , 73 0 , 04
funkcji produkcji:
Pi  45 , 2 M i
Zi
e

• wartości 45,2 nie interpretuje się
• wartość 0,65 to współczynnik elastyczności majątkowej (kapitałowej)
produkcji: zmiana majątku o 10% daje średnio zmianę produkcji o 6,5%
• wartość 0,73 to współczynnik elastyczności zatrudnieniowej produkcji:
zmiana zatrudnienia o 10% daje zmianę produkcji średnio o 7,3%
• suma obu współczynników k=0,65+0,73=1,38 to współczynnik skali
produkcji:

— jeżeli k<1, to firma rozwija się ekstensywnie
— jeżeli k>1, to firma rozwija się intensywnie
• wartość  = 0,04 to współczynnik postępu organizacyjnego:
— jeżeli  >O, to miał miejsce postęp organizacyjny

— jeżeli  <0, to miał miejsce regres organizacyjny
Interpretacja modelu tendencji rozwojowej

DODAMY
TROCHĘ
TEORII

Przypomnienie: t — zmienna objaśniająca (stałe przyrosty)
y — zmienna objaśniana; rozdzielana w ogólności na trzy
części: trend, wahania okresowe, wahania losowe ()

Matematyczne techniki zarządzania - 147
Wykres z planszy 117 (zużycie energii elektrycznej przez WZ AGH)
WAHANIA OKRESOWE OKREŚLA SIĘ WZGLĘDEM TRENDU A
NIE WZGLĘDEM OSI CZASU

y

trend

t
1995

1996

1997

1998

1999

Te trzy części trzeba zidentyfikować, a potem złożyć razem w model:

• addytywny (jeśli amplituda wahań jest stała)
• multiplikatywny (jeśli amplituda wahań rośnie lub maleje regularnie)
Wyznaczanie trendu
Metody mechaniczne:

• wskaźniki bezwzględne (stały przyrost =
postęp arytmetyczny = funkcja liniowa)
• wskaźniki względne (przyrost o stały procent =
postęp geometryczny = funkcja potęgowa)
• średnia ruchoma (wygładzanie danych linią łamaną)

JAK OBLICZYĆ O
ILE PROCENT ROCZNIE SPADAŁA
ŚREDNIO LICZBA
WIDZÓW W
KINACH:
1982 - 193,7 MLN
1989 - 141,3 MLN

Matematyczne techniki zarządzania - 148
Średnia ruchoma: mając szereg czasowy y1, y2,....., yn, przyjmujemy
długość kroku k = 3, lub 5, lub 7 itd. i liczymy
y  ...  y k
y  ...  y k  1
y k / 2 0 ,5  1
a następnie y k / 2  1 , 5  2
itd.
k
k
y  y2  y3
y  y3  y4
dla k=3:
y2  1
y3  2
itd.
3
3
Przykład 35. Wyznacz trend metodą średniej ruchomej dla następujących
danych:
okres
t
wartość yt

1
5

2
4

3
7

4
6

5
8

12

y2 
10

y3 

y

8

y4 

6
4

y5 

2

y6 

0
0

1

2

3

4

5

czas, t

6

7

8

9

y7 

547

6
10

 5 , 67

CECHY
ŚREDNIEJ
RUCHOMEJ:

 7 , 00

• TRACI SIĘ
k-1 DANYCH

3
768

8
8

 5 , 33

3
476

7
9

3
6  8  10

 8 , 00

3
8  10  9

 9 , 00

3
10  9  8

 9 , 00

• IM
WIĘKSZE k,
TYM
BARDZIEJ
SZTYWNY
TREND

3

Metody statystyczne: analiza regresji i korelacji, różne funkcje oparte na
modelach ekonomii

Matematyczne techniki zarządzania - 149
Wyznaczanie wahań okresowych: dobowych, tygodniowych, miesięcznych,
kwartalnych, rocznych, wieloletnich
Trzy metody:

— metoda wskaźników sezonowości
— metoda zmiennych zero-jedynkowych (0-1)

— metoda harmoniczna
Wszystkie metody mają jeden cel:
uzyskanie przeciętnego obrazu jednego cyklu

+

Ws
[t ]
[%]
trend

I

II



III

IV

WADY:
• KONIECZNOŚĆ
KOREKTY
• BRAK
WERYFIKACJI
STATYSTYCZNEJ

Metoda wskaźników sezonowości

• obliczenie surowych wskaźników sezonowości (wyeliminowanie trendu):
y

S s  yt  yt
S s  t
yt
addytywny multiplikatywny
wynik: n wartości odchyleń od trendu

• obliczenie oczyszczonych wskaźników
sezonowości (wyeliminowanie wahań
losowych):
 Ss
So 
k-liczba okresów
k
jednoimiennych
m-długość cyklu wynik: m wartości śr. odchyleń od trendu

Matematyczne techniki zarządzania - 150
Metoda zmiennych zero-jedynkowych (0-1)
m

y t  a 0  a1 t   bi Q i  
i 1

bi — przeciętne odchylenie od trendu dla
okresu i-tego
Qi — zmienna 0-1

wahania losowe
trend

wahania okresowe

t
1
2
3
4
5
6
7
8
9

yt
y1
y2
y3
y4
y5
y6
y7
y8
y9

Q1
1
0
0
0
1
0
0
0
1

Q2
0
1
0
0
0
1
0
0
0

Q3
0
0
1
0
0
0
1
0
0

Q4
0
0
0
1
0
0
0
1
0

Metoda harmoniczna (szeregi Fouriera)
Wahania okresowe przedstawia się jako sumę określonej liczby drgań harmonicznych (sinusoid i cosinusoid) przesuniętych w fazie, lecz o jednakowym okresie
m /2
2 i m / 2
2 i
y t  a 0  a 1 t   b1 i sin
  b 2 i cos

m
m
i 1
i 1
Obie metody dają taki sam wynik, istnieje możliwość weryfikacji
statystycznej
W metodzie 0-1 dostajemy bi = Ws, natomiast w metodzie harmonicznej Ws
jest sumą wartości poszczególnych sinusoid dla danego momentu czasu


Slide 27

Matematyczne techniki zarządzania - 121
ETAP 2. GROMADZENIE DANYCH STATYSTYCZNYCH

!

ZA JAKOŚĆ DANYCH ODPOWIADA MODELUJĄCY
• rodzaje danych: dane przekrojowe i szeregi czasowe
• źródła danych: roczniki statystyczne, różne działy
przedsiębiorstwa, badania marketingowe, wywiady itd.
• wiarygodność danych: do jakiego celu zostały one
przygotowane?

MUSISZ
SPRAWDZAĆ
KAŻDE DANE

• porównywalność danych: inflacja (ceny bieżące a ceny
stałe), zmiany procesów technicznych
Wielkość
produkcji

• zmienność zjawisk: trzeba sprawdzić, czy
wybrana w etapie 1a zmienna jest rzeczywiście zmienną losową

Wx 

s( x )

nowy zakład

100 %

x

stary zakład

Wx musi wynosić co najmniej 30-40%
Wiek studenta może być dobrą zmiennąprzyczyną, ale nie w przypadku studiów
dziennych!

Zatrudnienie

Matematyczne techniki zarządzania - 122
ETAP 3. SELEKCJA ZMIENNYCH OBJAŚNIAJĄCYCH
KAŻDĄ ZMIENNĄ X WYTYPOWANĄ W ETAPIE 1a TRAKTUJEMY JAKO
KANDYDATKĘ NA ZMIENNĄ OBJAŚNIAJĄCĄ
Może być kilka przyczyn powodujących, że taka kandydatka nie może znaleźć się w modelu ekonometrycznym (w równaniu regresji):
• w modelu nie może być zbyt wielu zmiennych (nieczytelny)
• kandydatka może nie mieć wpływu na zmienną Y



• kandydatka może wnosić prawie tę samą informację o Y co inna
kandydatka

• dwie bardzo podobne kandydatki mogą sobie nawzajem przeszkadzać
(efekt katalityczny)
Kryteria, jakie musi spełniać kandydatka Xi, aby nadawała się do modelu:
• musi być silnie powiązana ze zmienną Y

• nie może być powiązana z inną kandydatką Xj
SSTO
x1
x4

x2
x3

reszta

R2=0,79

R2=0,66

x2
x1
x4

R2=0,48

x3
reszta

reszta

SSTO

SSTO

Matematyczne techniki zarządzania - 123
Efekt katalityczny
DWIE ZMIENNE DAJĄ
RAZEM MNIEJ INFORMACJI NIŻ KAŻDA Z
NICH Z OSOBNA

x1

x2

R2=0,25

x2

x1

R2=0,52

R2=0,66

Selekcja kandydatek ma na celu podzielenie ich na trzy grupy:
• zmienne wprowadzone do modelu
• zmienne nie wprowadzone do modelu, ale reprezentowane w nim przez
inne zmienne (możliwość wymiany)
• zmienne nie wprowadzone do modelu ze względu na fakt, że nie wnoszą
żadnej informacji o zmiennej Y
INFORMACJE potrzebne do selekcji: współczynniki r x i x j ,
Macierz współczynników korelacji
Y
Y
X1
X2
X3

0,52
0,64
- 0,21

X1
0,52
0,82
- 0,18

X2
0,64
0,82
0,08

X3
- 0,21
- 0,18
0,08

r yx

i

Przykład 32. Macierz powiązania
zmiennych ze sobą przedstawia
się następująco (n=20). Jak ją
można zinterpretować? Które
zmienne są powiązane ze sobą w
sposób istotny?

Matematyczne techniki zarządzania - 124
Testowanie istotności współczynnika korelacji
H0:  = 0

Można je przeprowadzić trzema testami: testem Studenta

H1:   0

(t), Fishera (F) i Wallace’a-Snedecora (R)

Fragment tablicy rozkładu Wallece’a-Snedecora (SKRYPT, tab. VII, s.161)
S to pn ie
sw ob od y

2
0,05
0,632
0,444
0,361

8
18
28

,

0,01
0,765
0,561
0,463

L iczb a zm ien n ych
3
0,05
0,01
0,726
0,827
0,532
0,633
0,439
0,530

4
0,05
0,777
0,587
0,490

0,01
0,860
0,678
0,573

Reguła decyzyjna: — jeżeli |Robl|>Rtabl, odrzucamy H0 (korelacja istotna)
— jeżeli |Robl|
W przykładzie 32, jeżeli przyjmiemy  = 0,05, to Rtabl = 0,444.
Y
Y
X1
X2
X3

0,52
0,64
- 0,21

X1
0,52
0,82
- 0,18

X2
0,64
0,82
0,08

X3
- 0,21
- 0,18
0,08

Pozostaną zatem tylko trzy
istotne powiązania:
y-x1, y-x2, x1-x2
BRAK ISTOTNEGO POWIĄZANIA Z Y NIE
OZNACZA, ŻE ZMIENNA NIE WNOSI
ŻADNEJ INFORMACJI O ZJAWISKU Y

Matematyczne techniki zarządzania - 125



Metody selekcji zmiennych objaśniających:
• grafowa
• Hellwiga (pojemności informacji)
• taksonomiczne (clustering)
Metoda grafowa
• obliczenie macierzy współczynników:

rx

i

xj

• wyłowienie z macierzy powiązań istotnych

, r yx

BUDOWA GRAFU
i

• graf spójny

• budowa grafu z powiązań istotnych
• wybranie zmiennych na podstawie grafu

x6

• graf zerowy
x1
x4

x9

DO MODELU WYBIERA SIĘ ZMIENNE:
• każdy graf zerowy (jeśli |ryx|>0,1)

istotne powiązanie

• po jednej reprezentantce grafu spójnego;

reprezentantką grafu jest zmienna, która ma najwięcej powiązań z
innymi kandydatkami
jeżeli kilka zmiennych ma tę samą maksymalną liczbę powiązań, wybiera
się z nich tę, która jest najsilniej powiązana za zmienną Y (max ryx)
jeżeli graf jest rozległy, może mieć dwie reprezentantki, ale muszą one
leżeć na przeciwległych stronach grafu

Matematyczne techniki zarządzania - 126
Przykład 32 cd. Wybierzemy
zmienną x2 (reprezentantka grafu
spójnego) i zmienną x3 (graf
zerowy)
Metoda Hellwiga

Y
Y
X1
X2
X3

0,52
0,64
- 0,21

• wypisujemy wszystkie możliwe kombinacje
kandydatek; jest ich K = 2m—1
• obliczamy pojemność informacji dla każdej
zmiennej w każdej kombinacji

h kl  f ( r yx , r x
i

ixj

)

• obliczamy pojemność całkowitą dla każdej
kombinacji
H l   h kl
k

• wybieramy kombinację o największej
pojemności Hl = max

X1
0,52
0,82
- 0,18

X2
0,64
0,82

X3
- 0,21
- 0,18
0,08

0,08

W przykładzie 32 mamy 7
możliwych kombinacji kandydatek:
1. x1
2. x2

3. x3

maximum:

H6 = 0,42

4. x1,x2
5. x1,x3

Hmax = R2

6. x2,x3
7. x1,x2,x3

Metody taksonomiczne
Taksonomia wrocławska (cluster analysis) to metoda grupowania obiektów (zmiennych) w grupy jednorodne pod względem n cech (wymiarów)
łącznie. Podstawą grupowania jest odległość euklidesowa, która w przypadku zmiennych d ij  f ( r x x )
WSZYSTKIE METODY TO SELEKCJA WSTĘPNA
i

j

Matematyczne techniki zarządzania - 127
ETAP 4. ESTYMACJA PARAMETRÓW MODELU
Cel etapu: wyznaczenie parametrów strukturalnych i stochastycznych
Estymacja: szacowanie parametrów populacji na podstawie próbki
Metody estymacji: analiza regresji i korelacji (KMNK i inne)

Założenia dla KMNK
1. Zmienne losowe są prawdziwymi zmiennymi, nie powiązanymi ze sobą
2. Składnik losowy  ma stałą wariancję, niezależną od zmiennej x lub t
3. Wartości reszt ui są niezależne od siebie

4. Składnik losowy  nie jest powiązany ze zmienną objaśniającą
Skutki niedotrzymania założeń i środki zaradcze
1. Model bez sensu, nieprzydatny; niekiedy absurdalny (źle uwarunkowane
dane)
Stosuje się: dużą próbkę (n>100), regresję grzbietową (ridge regression)
2.

Y

reszta ui

Lewa część zbioru ma dużą wariancję, a
prawa — wariancję małą
Stosuje się specjalny wariant MNK z
korektą na różne wariancje
X

Matematyczne techniki zarządzania - 128
3. Jeśli reszty ui są ze sobą powiązane (skorelowane), mówimy, że
występuje autokorelacja składnika losowego (zjawisko występuje przy
szeregach czasowych — sztywny porządek obserwacji)
Oznacza to, że istnieje istotna zależność u t  f ( u t  k )
Przyczyny autokorelacji: zakłócenia
(dodatnie lub ujemne) w jednym okresie
wpływają na poziom zjawiska w następnych
okresach (rolnictwo, produkcja, rynek)

t  1 , 2 ,...

u t  y t  yˆ t

u t 1

u1
u2
u3
u4
u5

Występowanie autokorelacji powoduje
nieprzydatność modelu


u1
u2
u3
u4

Istnienie autokorelacji sprawdza się testem
Durbina-Watsona d
Stosuje się metodę różniczki zupełnej

y  f (x )

yt  yt  ytk

4. Składnik losowy jest skorelowany ze zmienną objaśniającą, wtedy
gdy została pominięta jakaś ważna zmienna-przyczyna

Model taki nie ma żadnej wartości; trzeba dbać o jak najwyższy współczynnik determinacji (R2>0,9)
• zbiór danych rzeczywistych nigdy
nie spełnia tych wymagań

ESTYMACJĘ MODELU POWTARZA SIĘ WIELOKROTNIE
ponieważ dopiero weryfikacja zapewnia ostateczną selekcję
kandydatek na zmienne objaśniające

• ekonometria to analiza danych nie
spełniających tych założeń
• nie stosować statystyki bezmyślnie (na ślepo)

Matematyczne techniki zarządzania - 129
ETAP 5. WERYFIKACJA MODELU
Cele:

1. opis rzeczywistości (populacji generalnej)



2. dokładna (ostateczna) selekcja zmiennych objaśniających
3. poznanie składnika losowego (spełnienie założeń KMNK)
Narzędzia: hipotezy i testy statystyczne

Metodyka: każde równanie oddzielnie; weryfikacja obejmuje 9 etapów (od
najmniej do najbardziej pracochłonnego)
WYKAZ ETAPÓW WERYFIKACJI MODELU
I.
II.

Badanie istotności korelacji
Badanie wyrazistości modelu

III.

Badanie istotności parametrów

IV.

Badanie symetrii skł. losowego

V.
VI.
VII.
VIII.
IX.

Badanie losowości skł. losowego
Badanie stacjonarności skł. los.
Badanie wartości oczekiwanej skł. los.
Badanie autokorelacji skł. losowego
Badanie normalności skł. losowego

Opis każdego etapu weryfikacji
obejmuje:
• cel etapu
• sposób weryfikacji: wzory,
hipotezy, testy
• podanie których modeli dotyczy (przyczynowo-skutkowych
czy tendencji rozwojowej)
• podanie której postaci modeli
nieliniowych dotyczy (pierwotnej czy transformaty)

Matematyczne techniki zarządzania - 130
Etap I. Badanie istotności korelacji
7
2

8

9

11

12

17

19

23

21

5
2 etapu
9
16
7
9
15
14
Celem
jest
sprawdzenie,
czy
istnieje w populacji generalnej powiązanie pomiędzy zmienną Y i wszystkimi zmiennymi objaśniającymi

25

Przedział ufności dla
nieznanego współczynnika korelacji  dla populacji buduje się przy
użyciu błędu

populacja

zmienna Y

20
15
10

próbka

5
0
8
5

0 9

1011

2

9

20
12

30
17
16
7
zmienna X

25

1940
9

23 50
15

populacja

20

zmienna Y

7
2

15
10

próbka

5
0
0

10

20

30

zmienna X

40

50

21
14

sR 

1 R

0

Robl

2

nk

Istotność korelacji weryfikuje się przez postawienie
następujących hipotez dla
współczynnika korelacji dla
populacji generalnej:

1
R,|r|

H0 :   0

Brak korelacji, nie ma powiązania...

H1 :   0

Korelacja istotna, jest powiązanie...

,

Matematyczne techniki zarządzania - 131
Hipotezy te można weryfikować trzema równoważnymi testami:
• testem t Studenta (tylko dla regresji dwu zmiennych)
• testem F Fishera-Snedecora
• testem R Wallace’a-Snedecora

,

W każdym przypadku obliczamy wartość
statystyki dla próbki (tobl, Fobl, Robl) i porównujemy z wartością krytyczną odczytaną z tablicy odpowiedniego rozkładu w
funkcji poziomu istotności i liczby stopni
swobody (ttabl, Ftabl, Rtabl)

Reguła decyzyjna:
• jeżeli |tobl|< ttabl, nie ma podstaw do odrzucenia H0 (brak korelacji)
• jeżeli |tobl|> ttabl, odrzucamy H0 na korzyść H1 (korelacja istnieje)

TAK SAMO DLA
FiR

W przypadku regresji wielorakiej, gdy liczba zmiennych objaśniajacych
jest duża w porównaniu do liczby obserwacji, współczynnik determinacji
R2 może dawać zawyżoną ocenę stopnia wyjaśnienia zmienności zmiennej
objaśnianej; dlatego wprowadzono skorygowany współczynnik determinacji (i korelacji):
 ( yˆ i  y )

R

2

2

k
n

k

1


2
nk 1
(
y

y
)

i
n1

• adjusted coefficient of multiple
determination (wydruki komputerowe)

• jeśli k jest małe, nie ma większej różnicy
pomiędzy normalnym a skorygowanym R2

Matematyczne techniki zarządzania - 132
Skąd wziąć wartość odpowiedniej statystyki dla próbki i jak odczytywać jej wartości z tablic?
n2
r
t

r

t tabl  t  / 2 { n  2 }
TEST STUDENTA
obl
2
sr
1 r

F obl 

TEST FISHERA

Ź ró d ło z m ien n o śc i

MSTR
MSE



R

nk

2

1 R

2

L ic zb a sto p n i
sw o b o d y

Suma
k w a d ra tó w

Ś re d n i
k w a d ra t

M o d el (c z yn n ik i)
B łą d (re sz ta )

k1
nk

SSTR
SSE

MSTR
MSE

R azem

n1

SSTO

TEST WALLACE’A

R obl 

R

2

k 1

F tabl  F { k  1 , n  k }

S ta ty sty k a
F
F obl 

MSTR
MSE

NIE MYLIĆ
STOPNI SWOBODY LICZNIKA I MIANOWNIKA

R tabl  R { k , n  k }

Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

Matematyczne techniki zarządzania - 133
Odczyt Rtabl z tablicy testu R (SKRYPT s.161-162)

, k,  = n-k

S to pn ie
sw ob od y
8
18
28

2
0,05
0,632
0,444
0,361

0,01
0,765
0,561
0,463

L iczb a zm ien n ych
3
0,05
0,01
0,726
0,827
0,532
0,633
0,439
0,530

4
0,05
0,777
0,587
0,490

0,01
0,860
0,678
0,573

Wnioski dotyczące rozkładu R Wallace’a-Snedecora:
• tablica zawiera maksymalne wartości współczynnika korelacji w danej
sytuacji, jakich można oczekiwać, gdy nie ma korelacji w populacji
• im wyższy poziom istotności, tym niższe Rtabl

• im większa liczba zmiennych w modelu, tym wyższe Rtabl
• im wyższa liczba stopni swobody (większa próbka), tym niższe Rtabl
• tablica R powstała z przeliczenia tablic t oraz F (odwrócenie wzorów)
• tablica testu R jest najszybszym i nawygodniejszym narzędziem do
weryfikacji istotności korelacji

Werdykt z etapu I:

Matematyczne techniki zarządzania - 134

• jeżeli Robl>Rtabl, model jest poprawny, można przejść do etapu II
• jeżeli Roblzmiennych objaśniających albo jego postać matematyczną
ETAP I OBOWIĄZUJE DLA WSZYSTKICH MODELI
ETAP I PRZEPROWADZA SIĘ DLA TRANSFORMATY (dla postaci pierwotnej
można uzyskać R>1)
Rola współczynnika determinacji R2
• korelacja może być istotna przy małym R i bardzo małym R2 (r=0,4,
R2=0,16, co oznacza, że tylko 16% zmienności zmiennej Y jest
wyjaśnione przez zmienną objaśniającą)
• małe R2 oznacza niski stopień wyjaśnienia rzeczywistości i stanowi
zagrożenie dla modelu
• należy dążyć (poprzez odpowiedni dobór zmiennych-przyczyn i postaci
matematycznej modelu) do jak największego R2 (dla postaci pierwotnej)
• wysoka wartość R2 świadczy o dobrym poznaniu badanego zjawiska
• wysoka wartość R2 bardzo często wynika jednak ze złego dobrania
zmiennych objaśniających (silnie powiązane ze sobą — „masło maślane”)
KORELACJA POZORNA — jest zależność, ale jej nie ma? Przyczyny...
Trzeba unikać wartości bezwzględnych (ludność, liczba sklepów, wielkość produkcji)

6

9

12

8

11

12

11

15

9

18

9

11

11

18

15

Matematyczne techniki zarządzania - 135
Etap II. Badanie wyrazistości modelu
Y

Wyrazistość modelu dana jest wzorem

s( y )

ui

y

W obl 

s( y )

100 %

y

Celem etapu
jest kontrola
rozrzutu danych

Współczynnik Wobl<30%, w przeciwnym
przypadku rozrzut danych jest zbyt duży

y

Kłopoty: gdyy jest bliskie 0

x

X

Werdykt: model poprawny lub niepoprawny

ETAP II OBOWIĄZUJE DLA WSZYSTKICH MODELI (ale nie ma on charakteru
statystycznego)

ETAP II PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ (sprawdzamy, czy
nie występuje silny efekt „krzywego lustra”)
Etap III. Badanie istotności parametrów (współczynników) modelu
Celem etapu jest sprawdzenie:
• czy poszczególne zmienne objaśniające mają istotny wpływ na zmienną
objaśnianą?
• czy zmienne objaśniające są wybrane prawidłowo?

• czy wyraz wolny różni się istotnie od zera?

Matematyczne techniki zarządzania - 136
Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

Problem istotności parametrów ai można rozpatrywać (tak jak problem
średniej dla populacji) z dwu punktów widzenia:
• przedziału ufności dla nieznanej wartości i

• hipotez — zerowej H0: i=0 i alternatywnej H1: i 0

1
0

ai

1

i

ISTOTNY (W PRZEDZIALE NIE MA ZERA)

0

ai

i

NIEISTOTNY (W PRZEDZIALE JEST ZERO)

P ( a i  t / 2 { n  k } s ( a i )   i  a i  t / 2 { n  k } s ( a i )  1  

Z tablicy rozkładu Studenta, a nie z wydruku komputerowego!

Matematyczne techniki zarządzania - 137
Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

W praktyce posługujemy się raczej hipotezami:
Badanie istotności przeprowadza
się dla każdego i oddzielnie:

t obl ( a i ) 

ai  0
s(a i )

t tabl  t  / 2 { n  k }

• jeżeli |tobl(ai)|>ttabl(ai), odrzucamy hipotezę zerową; parametr jest istotny z błędem równym co najwyżej 
• jeżeli |tobl(ai)|parametr nie jest istotny
Praktycznie jest to bardzo łatwe:
• sprawdzamy, czy |t(ai)| jest większe czy mniejsze od około 2, a najlepiej
• porównujemy rzeczywisty poziom istotności P(ai) z przyjętym 
ODRZUCAMY H0, JEŻELI P(ai) JEST MNIEJSZE OD 

WTEDY ZMIENNA
Xi MA WPŁYW NA
ZMIENNĄ Y

Matematyczne techniki zarządzania - 138
W etapie III następuje ostateczna selekcja zmiennych objaśniających:
• jeżeli wszystkie ai okażą się istotne, model jest poprawny:
— model przyczynowo-skutkowy: do interpretacji
— model tendencji rozwojowej: do etapu IV
• jeżeli choć jedno ai okaże się nieistotne, model jest niepoprawny i wymaga poprawy przez usunięcie nieistotnych zmiennych:
— zmienne należy usuwać po jednej (ze względu na efekt katalityczny)
— usuwa się zawsze zmienną o najniższej wartości |t(ai)| [czyli o
najwyższej wartości P(ai)]
— usunięcie ostatniej zmiennej nieistotnej kończy proces selekcji
kandydatek na zmienne,

— selekcja nie jest ostateczna, gdyż zawsze istnieje możliwość zamiany zmiennych, które są powiązane ze sobą
Praktyczne znaczenie istotności wyrazu wolnego a0
To są jedne z możliwości dla populacji (p. plansza 106)

Y

W przypadku funkcji K=f(P) wyraz wolny wyznacza poziom kosztów stałych (rachunkowość zarządcza)
W przypadku zależności technicznej Q=f(h) wyraz
wolny oznacza, że przy miąższości pokładu h=0 wydajność produkcji Q też jest równa 0

0
X

Matematyczne techniki zarządzania - 139
Praktyczne znaczenie istotności współczynnika regresji ai



KRZYWE NEYMANA — PLANSZE 106-107
WSPÓŁCZ. ISTOTNY
WSPÓŁ. NIEISTOTNY

ETAP III OBOWIĄZUJE DLA WSZYSTKICH MODELI
ETAP III PRZEPROWADZA SIĘ DLA TRANSFORMATY
Etap IV. Badanie symetrii składnika losowego

Y

CZĘSTOŚĆ RESZT DODATNICH I UJEMNYCH MA BYĆ
ZBLIŻONA

Y

ASYMETRYCZNY
SYMETRYCZNY

t
t
Badanie symetrii przeprowadza się testem Studenta (St. Bartosiewicz
Ekonometria)
Brak symetrii wymaga zmiany matematycznej postaci modelu
ETAP IV OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ

ETAP IV PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ

Matematyczne techniki zarządzania - 140
Etap V. Badanie losowości składnika losowego

Y

Y
NIELOSOWY

LOSOWY

t
t
Badanie losowości przeprowadza się testem Studenta lub testem serii
(Ekonometria, praca zb. pod red. M. Krzysztofiaka)
Brak losowości wymaga zmiany matematycznej postaci modelu
ETAP V OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP V PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ
Etap VI. Badanie stacjonarności składnika losowego
W etapie tym chodzi o niezależność wariancji składnika losowego od
zmiennej objaśniającej t (plansza 127)

Bada się istotność współczynnika korelacji ru t , t
ETAP VI OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VI PRZEPROWADZA SIĘ DLA TRANSFORMATY

Matematyczne techniki zarządzania - 141
Etap VII. Badanie wartości oczekiwanej składnika losowego
Normalnie, gdy przeprowadzamy estymację postaci liniowej, parametry
składnika losowego E ( )  0
{ ui  0}
V ( )  const
Po retransformacji do postaci pierwotnej mamy nowe reszty u’, dla
których
'
'
ui  0
 ui  0
Celem etapu jest sprawdzenie, czy odchyłka od O nie jest zbyt duża
(służy do tego test Studenta)
ETAP VII OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VII PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ
Etap VIII. Badanie autokorelacji składnika losowego
Pojęcie autokorelacji opisano na planszy 128; chodzi o istotność korelacji ru , u
t

tk

Badanie autokorelacji można przeprowadzić:

• testem R istotności korelacji ru

t

,ut  k

d obl

• testem Durbina-Watsona
NIE MA AUTOK.

d1

?

d2 JEST AUTOKORELACJA

ETAP VIII OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VIII PRZEPROWADZA SIĘ DLA TRANSFORMATY

Matematyczne techniki zarządzania - 142
Etap IX. Badanie normalności składnika losowego
Celem etapu jest stwierdzenie, czy reszty mają rozkład normalny
Analiza reszt — oddzielny dział analizy regresji i korelacji
Jeżeli reszty mają rozkład normalny, statystyk otrzymuje „ulgi”
ETAP 6. PRAKTYCZNA INTERPRETACJA MODELU



Celem etapu jest wydobycie z modelu całej nowej wiedzy, której nie widać
„gołym okiem”
INTERPRETUJĄC MODEL (RÓWNANIE REGRESJI) NALEŻY UŻYWAĆ WYŁĄCZNIE
PROSTEJ TERMINOLOGII EKONOMICZNEJ ZROZUMIAŁEJ DLA KLIENTA
NIE NALEŻY UŻYWAĆ TERMINOLOGII MATEMATYCZNEJ ZROZUMIAŁEJ TYLKO DLA
TWÓRCÓW MODELU
INTERPRETOWAĆ WOLNO TYLKO MODEL ZWERYFIKOWANY
CAŁY TRUD MODELOWANIA NIE MOŻE BYĆ „SZTUKĄ DLA SZTUKI”, LECZ MA
SŁUŻYĆ UZYSKANIU KONKRETNYCH WNIOSKÓW PRAKTYCZNYCH

Interpretacja modelu przyczynowo-skutkowego

Polega ona na określeniu wpływu poszczególnych czynników na badane
zjawisko:
• podział wszystkich czynników na trzy grupy

Matematyczne techniki zarządzania - 143
A — czynniki nie mające wpływu na Y
B — czynniki mające wpływ na Y i wprowadzone do modelu
C — czynniki mające wpływ na Y, ale nie występujące w modelu
• ocena jakościowa wpływu czynników B i C
• ocena ilościowa wpływu czynników B i C
Ocena jakościowa



Na podstawie znaków stojących przy współczynnikach r oraz ai możemy
stwierdzić, że wpływ jest:

• dodatni (im lepsze zaliczenie, tym lepszy wynik egzaminu; im więcej
wydatków na reklamę, tym większy zysk; itd.)
• ujemny (im więcej zatrudnionych, tym gorszy wynik finansowy; im
mniej braków, tym wyższy zysk; im mniejsza absencja, tym wyższe
wynagrodzenie; itd.)

Ocena ilościowa
• model liniowy
Przykład 33. Zinterpretuj zweryfikowany model zależności miesięcznych
kosztów działalności przedsiębiorstwa (tys. zł) od wielkości produkcji
(sztuk) i liczby reklamacji:
y i  50 , 8  14 , 5 x 1  3 , 9 x 2  

Matematyczne techniki zarządzania - 144
a0 = 50,8

poziom kosztów stałych; jeśli firma nie będzie prowadzić
żadnej działalności, poniesie koszty w wysokości 50,8 tys. zł

a1 = 14,5

każda sztuka produktu firmy kosztuje ją przeciętnie 14,5
tys. zł; jeżeli firma zwiększy produkcję o 2 sztuki, koszty
wzrosną o 29,0 tys. zł

a2 = 3,9każda wniesiona reklamacja powiększa koszty przeciętnie o
3,9 tys. zł
• model potęgowy
Przykłąd 34. Zinterpretuj zweryfikowaną funkcję produkcji Cobba-Douglasa
0 , 65

Pi  45 , 2 M i

0 , 73

Zi

e

0 , 04



Funkcja produkcji to specjalny model, określający zależność pomiędzy
produkcją (P) a czynnikami produkcji: majątkiem trwałym (M) i nakładami
robocizny (Z).



Funkcje produkcji to modele umożliwiające „prześwietlenie”
przedsiębiorstwa (szereg czasowy) lub branży (dane przekrojowe) i określenie poziomu gospodarowania oraz postępu
technicznego i organizacyjnego.
Elastyczność  to współczynnik określający reakcję zmiany
jednej zmiennej na inną zmienną — na przykład elastyczność
cenowa popytu (jak popyt zmienia się wraz z ceną towaru).

EKSPERCI
ZACHODNI

Matematyczne techniki zarządzania - 145

 

y
y

:

x

FUNKCJA POTĘGOWA JEST JEDYNĄ FUNKCJĄ O STAŁEJ ELASTYCZNOŚCI

x

Izolinie funkcji produkcji

T1
M

Produkcję P można osiągnąć różnymi
kombinacjami majątku i robocizny:

T2

• T1— technika kapitałochłonna, np.
pełna automatyzacja
• T2 — pośredni poziom techniki

T3
P  const

• T3 — niski poziom techniki, produkcja
pracochłonna
P. LOWE

Z
Efekt poprawy zarządzania bez
zmiany techniki (lepsze wykorzystanie ludzi i sprzętu):

P2
M

ZARZĄDZANIE
TECHNOLOGIĄ

P1

T

• zmniejszenie kapitałochłonności

• zmniejszenie pracochłonności
• zwiększenie produkcji (przejście z
funkcji P1 na P2)

Można też rozpatrzyć łączne efekty
zmiany techniki i zarządzania

Z

Matematyczne techniki zarządzania - 146
Wszystkie informacje tego typu można odczytać w trakcie interpretacji
0 , 65
0 , 73 0 , 04
funkcji produkcji:
Pi  45 , 2 M i
Zi
e

• wartości 45,2 nie interpretuje się
• wartość 0,65 to współczynnik elastyczności majątkowej (kapitałowej)
produkcji: zmiana majątku o 10% daje średnio zmianę produkcji o 6,5%
• wartość 0,73 to współczynnik elastyczności zatrudnieniowej produkcji:
zmiana zatrudnienia o 10% daje zmianę produkcji średnio o 7,3%
• suma obu współczynników k=0,65+0,73=1,38 to współczynnik skali
produkcji:

— jeżeli k<1, to firma rozwija się ekstensywnie
— jeżeli k>1, to firma rozwija się intensywnie
• wartość  = 0,04 to współczynnik postępu organizacyjnego:
— jeżeli  >O, to miał miejsce postęp organizacyjny

— jeżeli  <0, to miał miejsce regres organizacyjny
Interpretacja modelu tendencji rozwojowej

DODAMY
TROCHĘ
TEORII

Przypomnienie: t — zmienna objaśniająca (stałe przyrosty)
y — zmienna objaśniana; rozdzielana w ogólności na trzy
części: trend, wahania okresowe, wahania losowe ()

Matematyczne techniki zarządzania - 147
Wykres z planszy 117 (zużycie energii elektrycznej przez WZ AGH)
WAHANIA OKRESOWE OKREŚLA SIĘ WZGLĘDEM TRENDU A
NIE WZGLĘDEM OSI CZASU

y

trend

t
1995

1996

1997

1998

1999

Te trzy części trzeba zidentyfikować, a potem złożyć razem w model:

• addytywny (jeśli amplituda wahań jest stała)
• multiplikatywny (jeśli amplituda wahań rośnie lub maleje regularnie)
Wyznaczanie trendu
Metody mechaniczne:

• wskaźniki bezwzględne (stały przyrost =
postęp arytmetyczny = funkcja liniowa)
• wskaźniki względne (przyrost o stały procent =
postęp geometryczny = funkcja potęgowa)
• średnia ruchoma (wygładzanie danych linią łamaną)

JAK OBLICZYĆ O
ILE PROCENT ROCZNIE SPADAŁA
ŚREDNIO LICZBA
WIDZÓW W
KINACH:
1982 - 193,7 MLN
1989 - 141,3 MLN

Matematyczne techniki zarządzania - 148
Średnia ruchoma: mając szereg czasowy y1, y2,....., yn, przyjmujemy
długość kroku k = 3, lub 5, lub 7 itd. i liczymy
y  ...  y k
y  ...  y k  1
y k / 2 0 ,5  1
a następnie y k / 2  1 , 5  2
itd.
k
k
y  y2  y3
y  y3  y4
dla k=3:
y2  1
y3  2
itd.
3
3
Przykład 35. Wyznacz trend metodą średniej ruchomej dla następujących
danych:
okres
t
wartość yt

1
5

2
4

3
7

4
6

5
8

12

y2 
10

y3 

y

8

y4 

6
4

y5 

2

y6 

0
0

1

2

3

4

5

czas, t

6

7

8

9

y7 

547

6
10

 5 , 67

CECHY
ŚREDNIEJ
RUCHOMEJ:

 7 , 00

• TRACI SIĘ
k-1 DANYCH

3
768

8
8

 5 , 33

3
476

7
9

3
6  8  10

 8 , 00

3
8  10  9

 9 , 00

3
10  9  8

 9 , 00

• IM
WIĘKSZE k,
TYM
BARDZIEJ
SZTYWNY
TREND

3

Metody statystyczne: analiza regresji i korelacji, różne funkcje oparte na
modelach ekonomii

Matematyczne techniki zarządzania - 149
Wyznaczanie wahań okresowych: dobowych, tygodniowych, miesięcznych,
kwartalnych, rocznych, wieloletnich
Trzy metody:

— metoda wskaźników sezonowości
— metoda zmiennych zero-jedynkowych (0-1)

— metoda harmoniczna
Wszystkie metody mają jeden cel:
uzyskanie przeciętnego obrazu jednego cyklu

+

Ws
[t ]
[%]
trend

I

II



III

IV

WADY:
• KONIECZNOŚĆ
KOREKTY
• BRAK
WERYFIKACJI
STATYSTYCZNEJ

Metoda wskaźników sezonowości

• obliczenie surowych wskaźników sezonowości (wyeliminowanie trendu):
y

S s  yt  yt
S s  t
yt
addytywny multiplikatywny
wynik: n wartości odchyleń od trendu

• obliczenie oczyszczonych wskaźników
sezonowości (wyeliminowanie wahań
losowych):
 Ss
So 
k-liczba okresów
k
jednoimiennych
m-długość cyklu wynik: m wartości śr. odchyleń od trendu

Matematyczne techniki zarządzania - 150
Metoda zmiennych zero-jedynkowych (0-1)
m

y t  a 0  a1 t   bi Q i  
i 1

bi — przeciętne odchylenie od trendu dla
okresu i-tego
Qi — zmienna 0-1

wahania losowe
trend

wahania okresowe

t
1
2
3
4
5
6
7
8
9

yt
y1
y2
y3
y4
y5
y6
y7
y8
y9

Q1
1
0
0
0
1
0
0
0
1

Q2
0
1
0
0
0
1
0
0
0

Q3
0
0
1
0
0
0
1
0
0

Q4
0
0
0
1
0
0
0
1
0

Metoda harmoniczna (szeregi Fouriera)
Wahania okresowe przedstawia się jako sumę określonej liczby drgań harmonicznych (sinusoid i cosinusoid) przesuniętych w fazie, lecz o jednakowym okresie
m /2
2 i m / 2
2 i
y t  a 0  a 1 t   b1 i sin
  b 2 i cos

m
m
i 1
i 1
Obie metody dają taki sam wynik, istnieje możliwość weryfikacji
statystycznej
W metodzie 0-1 dostajemy bi = Ws, natomiast w metodzie harmonicznej Ws
jest sumą wartości poszczególnych sinusoid dla danego momentu czasu


Slide 28

Matematyczne techniki zarządzania - 121
ETAP 2. GROMADZENIE DANYCH STATYSTYCZNYCH

!

ZA JAKOŚĆ DANYCH ODPOWIADA MODELUJĄCY
• rodzaje danych: dane przekrojowe i szeregi czasowe
• źródła danych: roczniki statystyczne, różne działy
przedsiębiorstwa, badania marketingowe, wywiady itd.
• wiarygodność danych: do jakiego celu zostały one
przygotowane?

MUSISZ
SPRAWDZAĆ
KAŻDE DANE

• porównywalność danych: inflacja (ceny bieżące a ceny
stałe), zmiany procesów technicznych
Wielkość
produkcji

• zmienność zjawisk: trzeba sprawdzić, czy
wybrana w etapie 1a zmienna jest rzeczywiście zmienną losową

Wx 

s( x )

nowy zakład

100 %

x

stary zakład

Wx musi wynosić co najmniej 30-40%
Wiek studenta może być dobrą zmiennąprzyczyną, ale nie w przypadku studiów
dziennych!

Zatrudnienie

Matematyczne techniki zarządzania - 122
ETAP 3. SELEKCJA ZMIENNYCH OBJAŚNIAJĄCYCH
KAŻDĄ ZMIENNĄ X WYTYPOWANĄ W ETAPIE 1a TRAKTUJEMY JAKO
KANDYDATKĘ NA ZMIENNĄ OBJAŚNIAJĄCĄ
Może być kilka przyczyn powodujących, że taka kandydatka nie może znaleźć się w modelu ekonometrycznym (w równaniu regresji):
• w modelu nie może być zbyt wielu zmiennych (nieczytelny)
• kandydatka może nie mieć wpływu na zmienną Y



• kandydatka może wnosić prawie tę samą informację o Y co inna
kandydatka

• dwie bardzo podobne kandydatki mogą sobie nawzajem przeszkadzać
(efekt katalityczny)
Kryteria, jakie musi spełniać kandydatka Xi, aby nadawała się do modelu:
• musi być silnie powiązana ze zmienną Y

• nie może być powiązana z inną kandydatką Xj
SSTO
x1
x4

x2
x3

reszta

R2=0,79

R2=0,66

x2
x1
x4

R2=0,48

x3
reszta

reszta

SSTO

SSTO

Matematyczne techniki zarządzania - 123
Efekt katalityczny
DWIE ZMIENNE DAJĄ
RAZEM MNIEJ INFORMACJI NIŻ KAŻDA Z
NICH Z OSOBNA

x1

x2

R2=0,25

x2

x1

R2=0,52

R2=0,66

Selekcja kandydatek ma na celu podzielenie ich na trzy grupy:
• zmienne wprowadzone do modelu
• zmienne nie wprowadzone do modelu, ale reprezentowane w nim przez
inne zmienne (możliwość wymiany)
• zmienne nie wprowadzone do modelu ze względu na fakt, że nie wnoszą
żadnej informacji o zmiennej Y
INFORMACJE potrzebne do selekcji: współczynniki r x i x j ,
Macierz współczynników korelacji
Y
Y
X1
X2
X3

0,52
0,64
- 0,21

X1
0,52
0,82
- 0,18

X2
0,64
0,82
0,08

X3
- 0,21
- 0,18
0,08

r yx

i

Przykład 32. Macierz powiązania
zmiennych ze sobą przedstawia
się następująco (n=20). Jak ją
można zinterpretować? Które
zmienne są powiązane ze sobą w
sposób istotny?

Matematyczne techniki zarządzania - 124
Testowanie istotności współczynnika korelacji
H0:  = 0

Można je przeprowadzić trzema testami: testem Studenta

H1:   0

(t), Fishera (F) i Wallace’a-Snedecora (R)

Fragment tablicy rozkładu Wallece’a-Snedecora (SKRYPT, tab. VII, s.161)
S to pn ie
sw ob od y

2
0,05
0,632
0,444
0,361

8
18
28

,

0,01
0,765
0,561
0,463

L iczb a zm ien n ych
3
0,05
0,01
0,726
0,827
0,532
0,633
0,439
0,530

4
0,05
0,777
0,587
0,490

0,01
0,860
0,678
0,573

Reguła decyzyjna: — jeżeli |Robl|>Rtabl, odrzucamy H0 (korelacja istotna)
— jeżeli |Robl|
W przykładzie 32, jeżeli przyjmiemy  = 0,05, to Rtabl = 0,444.
Y
Y
X1
X2
X3

0,52
0,64
- 0,21

X1
0,52
0,82
- 0,18

X2
0,64
0,82
0,08

X3
- 0,21
- 0,18
0,08

Pozostaną zatem tylko trzy
istotne powiązania:
y-x1, y-x2, x1-x2
BRAK ISTOTNEGO POWIĄZANIA Z Y NIE
OZNACZA, ŻE ZMIENNA NIE WNOSI
ŻADNEJ INFORMACJI O ZJAWISKU Y

Matematyczne techniki zarządzania - 125



Metody selekcji zmiennych objaśniających:
• grafowa
• Hellwiga (pojemności informacji)
• taksonomiczne (clustering)
Metoda grafowa
• obliczenie macierzy współczynników:

rx

i

xj

• wyłowienie z macierzy powiązań istotnych

, r yx

BUDOWA GRAFU
i

• graf spójny

• budowa grafu z powiązań istotnych
• wybranie zmiennych na podstawie grafu

x6

• graf zerowy
x1
x4

x9

DO MODELU WYBIERA SIĘ ZMIENNE:
• każdy graf zerowy (jeśli |ryx|>0,1)

istotne powiązanie

• po jednej reprezentantce grafu spójnego;

reprezentantką grafu jest zmienna, która ma najwięcej powiązań z
innymi kandydatkami
jeżeli kilka zmiennych ma tę samą maksymalną liczbę powiązań, wybiera
się z nich tę, która jest najsilniej powiązana za zmienną Y (max ryx)
jeżeli graf jest rozległy, może mieć dwie reprezentantki, ale muszą one
leżeć na przeciwległych stronach grafu

Matematyczne techniki zarządzania - 126
Przykład 32 cd. Wybierzemy
zmienną x2 (reprezentantka grafu
spójnego) i zmienną x3 (graf
zerowy)
Metoda Hellwiga

Y
Y
X1
X2
X3

0,52
0,64
- 0,21

• wypisujemy wszystkie możliwe kombinacje
kandydatek; jest ich K = 2m—1
• obliczamy pojemność informacji dla każdej
zmiennej w każdej kombinacji

h kl  f ( r yx , r x
i

ixj

)

• obliczamy pojemność całkowitą dla każdej
kombinacji
H l   h kl
k

• wybieramy kombinację o największej
pojemności Hl = max

X1
0,52
0,82
- 0,18

X2
0,64
0,82

X3
- 0,21
- 0,18
0,08

0,08

W przykładzie 32 mamy 7
możliwych kombinacji kandydatek:
1. x1
2. x2

3. x3

maximum:

H6 = 0,42

4. x1,x2
5. x1,x3

Hmax = R2

6. x2,x3
7. x1,x2,x3

Metody taksonomiczne
Taksonomia wrocławska (cluster analysis) to metoda grupowania obiektów (zmiennych) w grupy jednorodne pod względem n cech (wymiarów)
łącznie. Podstawą grupowania jest odległość euklidesowa, która w przypadku zmiennych d ij  f ( r x x )
WSZYSTKIE METODY TO SELEKCJA WSTĘPNA
i

j

Matematyczne techniki zarządzania - 127
ETAP 4. ESTYMACJA PARAMETRÓW MODELU
Cel etapu: wyznaczenie parametrów strukturalnych i stochastycznych
Estymacja: szacowanie parametrów populacji na podstawie próbki
Metody estymacji: analiza regresji i korelacji (KMNK i inne)

Założenia dla KMNK
1. Zmienne losowe są prawdziwymi zmiennymi, nie powiązanymi ze sobą
2. Składnik losowy  ma stałą wariancję, niezależną od zmiennej x lub t
3. Wartości reszt ui są niezależne od siebie

4. Składnik losowy  nie jest powiązany ze zmienną objaśniającą
Skutki niedotrzymania założeń i środki zaradcze
1. Model bez sensu, nieprzydatny; niekiedy absurdalny (źle uwarunkowane
dane)
Stosuje się: dużą próbkę (n>100), regresję grzbietową (ridge regression)
2.

Y

reszta ui

Lewa część zbioru ma dużą wariancję, a
prawa — wariancję małą
Stosuje się specjalny wariant MNK z
korektą na różne wariancje
X

Matematyczne techniki zarządzania - 128
3. Jeśli reszty ui są ze sobą powiązane (skorelowane), mówimy, że
występuje autokorelacja składnika losowego (zjawisko występuje przy
szeregach czasowych — sztywny porządek obserwacji)
Oznacza to, że istnieje istotna zależność u t  f ( u t  k )
Przyczyny autokorelacji: zakłócenia
(dodatnie lub ujemne) w jednym okresie
wpływają na poziom zjawiska w następnych
okresach (rolnictwo, produkcja, rynek)

t  1 , 2 ,...

u t  y t  yˆ t

u t 1

u1
u2
u3
u4
u5

Występowanie autokorelacji powoduje
nieprzydatność modelu


u1
u2
u3
u4

Istnienie autokorelacji sprawdza się testem
Durbina-Watsona d
Stosuje się metodę różniczki zupełnej

y  f (x )

yt  yt  ytk

4. Składnik losowy jest skorelowany ze zmienną objaśniającą, wtedy
gdy została pominięta jakaś ważna zmienna-przyczyna

Model taki nie ma żadnej wartości; trzeba dbać o jak najwyższy współczynnik determinacji (R2>0,9)
• zbiór danych rzeczywistych nigdy
nie spełnia tych wymagań

ESTYMACJĘ MODELU POWTARZA SIĘ WIELOKROTNIE
ponieważ dopiero weryfikacja zapewnia ostateczną selekcję
kandydatek na zmienne objaśniające

• ekonometria to analiza danych nie
spełniających tych założeń
• nie stosować statystyki bezmyślnie (na ślepo)

Matematyczne techniki zarządzania - 129
ETAP 5. WERYFIKACJA MODELU
Cele:

1. opis rzeczywistości (populacji generalnej)



2. dokładna (ostateczna) selekcja zmiennych objaśniających
3. poznanie składnika losowego (spełnienie założeń KMNK)
Narzędzia: hipotezy i testy statystyczne

Metodyka: każde równanie oddzielnie; weryfikacja obejmuje 9 etapów (od
najmniej do najbardziej pracochłonnego)
WYKAZ ETAPÓW WERYFIKACJI MODELU
I.
II.

Badanie istotności korelacji
Badanie wyrazistości modelu

III.

Badanie istotności parametrów

IV.

Badanie symetrii skł. losowego

V.
VI.
VII.
VIII.
IX.

Badanie losowości skł. losowego
Badanie stacjonarności skł. los.
Badanie wartości oczekiwanej skł. los.
Badanie autokorelacji skł. losowego
Badanie normalności skł. losowego

Opis każdego etapu weryfikacji
obejmuje:
• cel etapu
• sposób weryfikacji: wzory,
hipotezy, testy
• podanie których modeli dotyczy (przyczynowo-skutkowych
czy tendencji rozwojowej)
• podanie której postaci modeli
nieliniowych dotyczy (pierwotnej czy transformaty)

Matematyczne techniki zarządzania - 130
Etap I. Badanie istotności korelacji
7
2

8

9

11

12

17

19

23

21

5
2 etapu
9
16
7
9
15
14
Celem
jest
sprawdzenie,
czy
istnieje w populacji generalnej powiązanie pomiędzy zmienną Y i wszystkimi zmiennymi objaśniającymi

25

Przedział ufności dla
nieznanego współczynnika korelacji  dla populacji buduje się przy
użyciu błędu

populacja

zmienna Y

20
15
10

próbka

5
0
8
5

0 9

1011

2

9

20
12

30
17
16
7
zmienna X

25

1940
9

23 50
15

populacja

20

zmienna Y

7
2

15
10

próbka

5
0
0

10

20

30

zmienna X

40

50

21
14

sR 

1 R

0

Robl

2

nk

Istotność korelacji weryfikuje się przez postawienie
następujących hipotez dla
współczynnika korelacji dla
populacji generalnej:

1
R,|r|

H0 :   0

Brak korelacji, nie ma powiązania...

H1 :   0

Korelacja istotna, jest powiązanie...

,

Matematyczne techniki zarządzania - 131
Hipotezy te można weryfikować trzema równoważnymi testami:
• testem t Studenta (tylko dla regresji dwu zmiennych)
• testem F Fishera-Snedecora
• testem R Wallace’a-Snedecora

,

W każdym przypadku obliczamy wartość
statystyki dla próbki (tobl, Fobl, Robl) i porównujemy z wartością krytyczną odczytaną z tablicy odpowiedniego rozkładu w
funkcji poziomu istotności i liczby stopni
swobody (ttabl, Ftabl, Rtabl)

Reguła decyzyjna:
• jeżeli |tobl|< ttabl, nie ma podstaw do odrzucenia H0 (brak korelacji)
• jeżeli |tobl|> ttabl, odrzucamy H0 na korzyść H1 (korelacja istnieje)

TAK SAMO DLA
FiR

W przypadku regresji wielorakiej, gdy liczba zmiennych objaśniajacych
jest duża w porównaniu do liczby obserwacji, współczynnik determinacji
R2 może dawać zawyżoną ocenę stopnia wyjaśnienia zmienności zmiennej
objaśnianej; dlatego wprowadzono skorygowany współczynnik determinacji (i korelacji):
 ( yˆ i  y )

R

2

2

k
n

k

1


2
nk 1
(
y

y
)

i
n1

• adjusted coefficient of multiple
determination (wydruki komputerowe)

• jeśli k jest małe, nie ma większej różnicy
pomiędzy normalnym a skorygowanym R2

Matematyczne techniki zarządzania - 132
Skąd wziąć wartość odpowiedniej statystyki dla próbki i jak odczytywać jej wartości z tablic?
n2
r
t

r

t tabl  t  / 2 { n  2 }
TEST STUDENTA
obl
2
sr
1 r

F obl 

TEST FISHERA

Ź ró d ło z m ien n o śc i

MSTR
MSE



R

nk

2

1 R

2

L ic zb a sto p n i
sw o b o d y

Suma
k w a d ra tó w

Ś re d n i
k w a d ra t

M o d el (c z yn n ik i)
B łą d (re sz ta )

k1
nk

SSTR
SSE

MSTR
MSE

R azem

n1

SSTO

TEST WALLACE’A

R obl 

R

2

k 1

F tabl  F { k  1 , n  k }

S ta ty sty k a
F
F obl 

MSTR
MSE

NIE MYLIĆ
STOPNI SWOBODY LICZNIKA I MIANOWNIKA

R tabl  R { k , n  k }

Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

Matematyczne techniki zarządzania - 133
Odczyt Rtabl z tablicy testu R (SKRYPT s.161-162)

, k,  = n-k

S to pn ie
sw ob od y
8
18
28

2
0,05
0,632
0,444
0,361

0,01
0,765
0,561
0,463

L iczb a zm ien n ych
3
0,05
0,01
0,726
0,827
0,532
0,633
0,439
0,530

4
0,05
0,777
0,587
0,490

0,01
0,860
0,678
0,573

Wnioski dotyczące rozkładu R Wallace’a-Snedecora:
• tablica zawiera maksymalne wartości współczynnika korelacji w danej
sytuacji, jakich można oczekiwać, gdy nie ma korelacji w populacji
• im wyższy poziom istotności, tym niższe Rtabl

• im większa liczba zmiennych w modelu, tym wyższe Rtabl
• im wyższa liczba stopni swobody (większa próbka), tym niższe Rtabl
• tablica R powstała z przeliczenia tablic t oraz F (odwrócenie wzorów)
• tablica testu R jest najszybszym i nawygodniejszym narzędziem do
weryfikacji istotności korelacji

Werdykt z etapu I:

Matematyczne techniki zarządzania - 134

• jeżeli Robl>Rtabl, model jest poprawny, można przejść do etapu II
• jeżeli Roblzmiennych objaśniających albo jego postać matematyczną
ETAP I OBOWIĄZUJE DLA WSZYSTKICH MODELI
ETAP I PRZEPROWADZA SIĘ DLA TRANSFORMATY (dla postaci pierwotnej
można uzyskać R>1)
Rola współczynnika determinacji R2
• korelacja może być istotna przy małym R i bardzo małym R2 (r=0,4,
R2=0,16, co oznacza, że tylko 16% zmienności zmiennej Y jest
wyjaśnione przez zmienną objaśniającą)
• małe R2 oznacza niski stopień wyjaśnienia rzeczywistości i stanowi
zagrożenie dla modelu
• należy dążyć (poprzez odpowiedni dobór zmiennych-przyczyn i postaci
matematycznej modelu) do jak największego R2 (dla postaci pierwotnej)
• wysoka wartość R2 świadczy o dobrym poznaniu badanego zjawiska
• wysoka wartość R2 bardzo często wynika jednak ze złego dobrania
zmiennych objaśniających (silnie powiązane ze sobą — „masło maślane”)
KORELACJA POZORNA — jest zależność, ale jej nie ma? Przyczyny...
Trzeba unikać wartości bezwzględnych (ludność, liczba sklepów, wielkość produkcji)

6

9

12

8

11

12

11

15

9

18

9

11

11

18

15

Matematyczne techniki zarządzania - 135
Etap II. Badanie wyrazistości modelu
Y

Wyrazistość modelu dana jest wzorem

s( y )

ui

y

W obl 

s( y )

100 %

y

Celem etapu
jest kontrola
rozrzutu danych

Współczynnik Wobl<30%, w przeciwnym
przypadku rozrzut danych jest zbyt duży

y

Kłopoty: gdyy jest bliskie 0

x

X

Werdykt: model poprawny lub niepoprawny

ETAP II OBOWIĄZUJE DLA WSZYSTKICH MODELI (ale nie ma on charakteru
statystycznego)

ETAP II PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ (sprawdzamy, czy
nie występuje silny efekt „krzywego lustra”)
Etap III. Badanie istotności parametrów (współczynników) modelu
Celem etapu jest sprawdzenie:
• czy poszczególne zmienne objaśniające mają istotny wpływ na zmienną
objaśnianą?
• czy zmienne objaśniające są wybrane prawidłowo?

• czy wyraz wolny różni się istotnie od zera?

Matematyczne techniki zarządzania - 136
Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

Problem istotności parametrów ai można rozpatrywać (tak jak problem
średniej dla populacji) z dwu punktów widzenia:
• przedziału ufności dla nieznanej wartości i

• hipotez — zerowej H0: i=0 i alternatywnej H1: i 0

1
0

ai

1

i

ISTOTNY (W PRZEDZIALE NIE MA ZERA)

0

ai

i

NIEISTOTNY (W PRZEDZIALE JEST ZERO)

P ( a i  t / 2 { n  k } s ( a i )   i  a i  t / 2 { n  k } s ( a i )  1  

Z tablicy rozkładu Studenta, a nie z wydruku komputerowego!

Matematyczne techniki zarządzania - 137
Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

W praktyce posługujemy się raczej hipotezami:
Badanie istotności przeprowadza
się dla każdego i oddzielnie:

t obl ( a i ) 

ai  0
s(a i )

t tabl  t  / 2 { n  k }

• jeżeli |tobl(ai)|>ttabl(ai), odrzucamy hipotezę zerową; parametr jest istotny z błędem równym co najwyżej 
• jeżeli |tobl(ai)|parametr nie jest istotny
Praktycznie jest to bardzo łatwe:
• sprawdzamy, czy |t(ai)| jest większe czy mniejsze od około 2, a najlepiej
• porównujemy rzeczywisty poziom istotności P(ai) z przyjętym 
ODRZUCAMY H0, JEŻELI P(ai) JEST MNIEJSZE OD 

WTEDY ZMIENNA
Xi MA WPŁYW NA
ZMIENNĄ Y

Matematyczne techniki zarządzania - 138
W etapie III następuje ostateczna selekcja zmiennych objaśniających:
• jeżeli wszystkie ai okażą się istotne, model jest poprawny:
— model przyczynowo-skutkowy: do interpretacji
— model tendencji rozwojowej: do etapu IV
• jeżeli choć jedno ai okaże się nieistotne, model jest niepoprawny i wymaga poprawy przez usunięcie nieistotnych zmiennych:
— zmienne należy usuwać po jednej (ze względu na efekt katalityczny)
— usuwa się zawsze zmienną o najniższej wartości |t(ai)| [czyli o
najwyższej wartości P(ai)]
— usunięcie ostatniej zmiennej nieistotnej kończy proces selekcji
kandydatek na zmienne,

— selekcja nie jest ostateczna, gdyż zawsze istnieje możliwość zamiany zmiennych, które są powiązane ze sobą
Praktyczne znaczenie istotności wyrazu wolnego a0
To są jedne z możliwości dla populacji (p. plansza 106)

Y

W przypadku funkcji K=f(P) wyraz wolny wyznacza poziom kosztów stałych (rachunkowość zarządcza)
W przypadku zależności technicznej Q=f(h) wyraz
wolny oznacza, że przy miąższości pokładu h=0 wydajność produkcji Q też jest równa 0

0
X

Matematyczne techniki zarządzania - 139
Praktyczne znaczenie istotności współczynnika regresji ai



KRZYWE NEYMANA — PLANSZE 106-107
WSPÓŁCZ. ISTOTNY
WSPÓŁ. NIEISTOTNY

ETAP III OBOWIĄZUJE DLA WSZYSTKICH MODELI
ETAP III PRZEPROWADZA SIĘ DLA TRANSFORMATY
Etap IV. Badanie symetrii składnika losowego

Y

CZĘSTOŚĆ RESZT DODATNICH I UJEMNYCH MA BYĆ
ZBLIŻONA

Y

ASYMETRYCZNY
SYMETRYCZNY

t
t
Badanie symetrii przeprowadza się testem Studenta (St. Bartosiewicz
Ekonometria)
Brak symetrii wymaga zmiany matematycznej postaci modelu
ETAP IV OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ

ETAP IV PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ

Matematyczne techniki zarządzania - 140
Etap V. Badanie losowości składnika losowego

Y

Y
NIELOSOWY

LOSOWY

t
t
Badanie losowości przeprowadza się testem Studenta lub testem serii
(Ekonometria, praca zb. pod red. M. Krzysztofiaka)
Brak losowości wymaga zmiany matematycznej postaci modelu
ETAP V OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP V PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ
Etap VI. Badanie stacjonarności składnika losowego
W etapie tym chodzi o niezależność wariancji składnika losowego od
zmiennej objaśniającej t (plansza 127)

Bada się istotność współczynnika korelacji ru t , t
ETAP VI OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VI PRZEPROWADZA SIĘ DLA TRANSFORMATY

Matematyczne techniki zarządzania - 141
Etap VII. Badanie wartości oczekiwanej składnika losowego
Normalnie, gdy przeprowadzamy estymację postaci liniowej, parametry
składnika losowego E ( )  0
{ ui  0}
V ( )  const
Po retransformacji do postaci pierwotnej mamy nowe reszty u’, dla
których
'
'
ui  0
 ui  0
Celem etapu jest sprawdzenie, czy odchyłka od O nie jest zbyt duża
(służy do tego test Studenta)
ETAP VII OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VII PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ
Etap VIII. Badanie autokorelacji składnika losowego
Pojęcie autokorelacji opisano na planszy 128; chodzi o istotność korelacji ru , u
t

tk

Badanie autokorelacji można przeprowadzić:

• testem R istotności korelacji ru

t

,ut  k

d obl

• testem Durbina-Watsona
NIE MA AUTOK.

d1

?

d2 JEST AUTOKORELACJA

ETAP VIII OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VIII PRZEPROWADZA SIĘ DLA TRANSFORMATY

Matematyczne techniki zarządzania - 142
Etap IX. Badanie normalności składnika losowego
Celem etapu jest stwierdzenie, czy reszty mają rozkład normalny
Analiza reszt — oddzielny dział analizy regresji i korelacji
Jeżeli reszty mają rozkład normalny, statystyk otrzymuje „ulgi”
ETAP 6. PRAKTYCZNA INTERPRETACJA MODELU



Celem etapu jest wydobycie z modelu całej nowej wiedzy, której nie widać
„gołym okiem”
INTERPRETUJĄC MODEL (RÓWNANIE REGRESJI) NALEŻY UŻYWAĆ WYŁĄCZNIE
PROSTEJ TERMINOLOGII EKONOMICZNEJ ZROZUMIAŁEJ DLA KLIENTA
NIE NALEŻY UŻYWAĆ TERMINOLOGII MATEMATYCZNEJ ZROZUMIAŁEJ TYLKO DLA
TWÓRCÓW MODELU
INTERPRETOWAĆ WOLNO TYLKO MODEL ZWERYFIKOWANY
CAŁY TRUD MODELOWANIA NIE MOŻE BYĆ „SZTUKĄ DLA SZTUKI”, LECZ MA
SŁUŻYĆ UZYSKANIU KONKRETNYCH WNIOSKÓW PRAKTYCZNYCH

Interpretacja modelu przyczynowo-skutkowego

Polega ona na określeniu wpływu poszczególnych czynników na badane
zjawisko:
• podział wszystkich czynników na trzy grupy

Matematyczne techniki zarządzania - 143
A — czynniki nie mające wpływu na Y
B — czynniki mające wpływ na Y i wprowadzone do modelu
C — czynniki mające wpływ na Y, ale nie występujące w modelu
• ocena jakościowa wpływu czynników B i C
• ocena ilościowa wpływu czynników B i C
Ocena jakościowa



Na podstawie znaków stojących przy współczynnikach r oraz ai możemy
stwierdzić, że wpływ jest:

• dodatni (im lepsze zaliczenie, tym lepszy wynik egzaminu; im więcej
wydatków na reklamę, tym większy zysk; itd.)
• ujemny (im więcej zatrudnionych, tym gorszy wynik finansowy; im
mniej braków, tym wyższy zysk; im mniejsza absencja, tym wyższe
wynagrodzenie; itd.)

Ocena ilościowa
• model liniowy
Przykład 33. Zinterpretuj zweryfikowany model zależności miesięcznych
kosztów działalności przedsiębiorstwa (tys. zł) od wielkości produkcji
(sztuk) i liczby reklamacji:
y i  50 , 8  14 , 5 x 1  3 , 9 x 2  

Matematyczne techniki zarządzania - 144
a0 = 50,8

poziom kosztów stałych; jeśli firma nie będzie prowadzić
żadnej działalności, poniesie koszty w wysokości 50,8 tys. zł

a1 = 14,5

każda sztuka produktu firmy kosztuje ją przeciętnie 14,5
tys. zł; jeżeli firma zwiększy produkcję o 2 sztuki, koszty
wzrosną o 29,0 tys. zł

a2 = 3,9każda wniesiona reklamacja powiększa koszty przeciętnie o
3,9 tys. zł
• model potęgowy
Przykłąd 34. Zinterpretuj zweryfikowaną funkcję produkcji Cobba-Douglasa
0 , 65

Pi  45 , 2 M i

0 , 73

Zi

e

0 , 04



Funkcja produkcji to specjalny model, określający zależność pomiędzy
produkcją (P) a czynnikami produkcji: majątkiem trwałym (M) i nakładami
robocizny (Z).



Funkcje produkcji to modele umożliwiające „prześwietlenie”
przedsiębiorstwa (szereg czasowy) lub branży (dane przekrojowe) i określenie poziomu gospodarowania oraz postępu
technicznego i organizacyjnego.
Elastyczność  to współczynnik określający reakcję zmiany
jednej zmiennej na inną zmienną — na przykład elastyczność
cenowa popytu (jak popyt zmienia się wraz z ceną towaru).

EKSPERCI
ZACHODNI

Matematyczne techniki zarządzania - 145

 

y
y

:

x

FUNKCJA POTĘGOWA JEST JEDYNĄ FUNKCJĄ O STAŁEJ ELASTYCZNOŚCI

x

Izolinie funkcji produkcji

T1
M

Produkcję P można osiągnąć różnymi
kombinacjami majątku i robocizny:

T2

• T1— technika kapitałochłonna, np.
pełna automatyzacja
• T2 — pośredni poziom techniki

T3
P  const

• T3 — niski poziom techniki, produkcja
pracochłonna
P. LOWE

Z
Efekt poprawy zarządzania bez
zmiany techniki (lepsze wykorzystanie ludzi i sprzętu):

P2
M

ZARZĄDZANIE
TECHNOLOGIĄ

P1

T

• zmniejszenie kapitałochłonności

• zmniejszenie pracochłonności
• zwiększenie produkcji (przejście z
funkcji P1 na P2)

Można też rozpatrzyć łączne efekty
zmiany techniki i zarządzania

Z

Matematyczne techniki zarządzania - 146
Wszystkie informacje tego typu można odczytać w trakcie interpretacji
0 , 65
0 , 73 0 , 04
funkcji produkcji:
Pi  45 , 2 M i
Zi
e

• wartości 45,2 nie interpretuje się
• wartość 0,65 to współczynnik elastyczności majątkowej (kapitałowej)
produkcji: zmiana majątku o 10% daje średnio zmianę produkcji o 6,5%
• wartość 0,73 to współczynnik elastyczności zatrudnieniowej produkcji:
zmiana zatrudnienia o 10% daje zmianę produkcji średnio o 7,3%
• suma obu współczynników k=0,65+0,73=1,38 to współczynnik skali
produkcji:

— jeżeli k<1, to firma rozwija się ekstensywnie
— jeżeli k>1, to firma rozwija się intensywnie
• wartość  = 0,04 to współczynnik postępu organizacyjnego:
— jeżeli  >O, to miał miejsce postęp organizacyjny

— jeżeli  <0, to miał miejsce regres organizacyjny
Interpretacja modelu tendencji rozwojowej

DODAMY
TROCHĘ
TEORII

Przypomnienie: t — zmienna objaśniająca (stałe przyrosty)
y — zmienna objaśniana; rozdzielana w ogólności na trzy
części: trend, wahania okresowe, wahania losowe ()

Matematyczne techniki zarządzania - 147
Wykres z planszy 117 (zużycie energii elektrycznej przez WZ AGH)
WAHANIA OKRESOWE OKREŚLA SIĘ WZGLĘDEM TRENDU A
NIE WZGLĘDEM OSI CZASU

y

trend

t
1995

1996

1997

1998

1999

Te trzy części trzeba zidentyfikować, a potem złożyć razem w model:

• addytywny (jeśli amplituda wahań jest stała)
• multiplikatywny (jeśli amplituda wahań rośnie lub maleje regularnie)
Wyznaczanie trendu
Metody mechaniczne:

• wskaźniki bezwzględne (stały przyrost =
postęp arytmetyczny = funkcja liniowa)
• wskaźniki względne (przyrost o stały procent =
postęp geometryczny = funkcja potęgowa)
• średnia ruchoma (wygładzanie danych linią łamaną)

JAK OBLICZYĆ O
ILE PROCENT ROCZNIE SPADAŁA
ŚREDNIO LICZBA
WIDZÓW W
KINACH:
1982 - 193,7 MLN
1989 - 141,3 MLN

Matematyczne techniki zarządzania - 148
Średnia ruchoma: mając szereg czasowy y1, y2,....., yn, przyjmujemy
długość kroku k = 3, lub 5, lub 7 itd. i liczymy
y  ...  y k
y  ...  y k  1
y k / 2 0 ,5  1
a następnie y k / 2  1 , 5  2
itd.
k
k
y  y2  y3
y  y3  y4
dla k=3:
y2  1
y3  2
itd.
3
3
Przykład 35. Wyznacz trend metodą średniej ruchomej dla następujących
danych:
okres
t
wartość yt

1
5

2
4

3
7

4
6

5
8

12

y2 
10

y3 

y

8

y4 

6
4

y5 

2

y6 

0
0

1

2

3

4

5

czas, t

6

7

8

9

y7 

547

6
10

 5 , 67

CECHY
ŚREDNIEJ
RUCHOMEJ:

 7 , 00

• TRACI SIĘ
k-1 DANYCH

3
768

8
8

 5 , 33

3
476

7
9

3
6  8  10

 8 , 00

3
8  10  9

 9 , 00

3
10  9  8

 9 , 00

• IM
WIĘKSZE k,
TYM
BARDZIEJ
SZTYWNY
TREND

3

Metody statystyczne: analiza regresji i korelacji, różne funkcje oparte na
modelach ekonomii

Matematyczne techniki zarządzania - 149
Wyznaczanie wahań okresowych: dobowych, tygodniowych, miesięcznych,
kwartalnych, rocznych, wieloletnich
Trzy metody:

— metoda wskaźników sezonowości
— metoda zmiennych zero-jedynkowych (0-1)

— metoda harmoniczna
Wszystkie metody mają jeden cel:
uzyskanie przeciętnego obrazu jednego cyklu

+

Ws
[t ]
[%]
trend

I

II



III

IV

WADY:
• KONIECZNOŚĆ
KOREKTY
• BRAK
WERYFIKACJI
STATYSTYCZNEJ

Metoda wskaźników sezonowości

• obliczenie surowych wskaźników sezonowości (wyeliminowanie trendu):
y

S s  yt  yt
S s  t
yt
addytywny multiplikatywny
wynik: n wartości odchyleń od trendu

• obliczenie oczyszczonych wskaźników
sezonowości (wyeliminowanie wahań
losowych):
 Ss
So 
k-liczba okresów
k
jednoimiennych
m-długość cyklu wynik: m wartości śr. odchyleń od trendu

Matematyczne techniki zarządzania - 150
Metoda zmiennych zero-jedynkowych (0-1)
m

y t  a 0  a1 t   bi Q i  
i 1

bi — przeciętne odchylenie od trendu dla
okresu i-tego
Qi — zmienna 0-1

wahania losowe
trend

wahania okresowe

t
1
2
3
4
5
6
7
8
9

yt
y1
y2
y3
y4
y5
y6
y7
y8
y9

Q1
1
0
0
0
1
0
0
0
1

Q2
0
1
0
0
0
1
0
0
0

Q3
0
0
1
0
0
0
1
0
0

Q4
0
0
0
1
0
0
0
1
0

Metoda harmoniczna (szeregi Fouriera)
Wahania okresowe przedstawia się jako sumę określonej liczby drgań harmonicznych (sinusoid i cosinusoid) przesuniętych w fazie, lecz o jednakowym okresie
m /2
2 i m / 2
2 i
y t  a 0  a 1 t   b1 i sin
  b 2 i cos

m
m
i 1
i 1
Obie metody dają taki sam wynik, istnieje możliwość weryfikacji
statystycznej
W metodzie 0-1 dostajemy bi = Ws, natomiast w metodzie harmonicznej Ws
jest sumą wartości poszczególnych sinusoid dla danego momentu czasu


Slide 29

Matematyczne techniki zarządzania - 121
ETAP 2. GROMADZENIE DANYCH STATYSTYCZNYCH

!

ZA JAKOŚĆ DANYCH ODPOWIADA MODELUJĄCY
• rodzaje danych: dane przekrojowe i szeregi czasowe
• źródła danych: roczniki statystyczne, różne działy
przedsiębiorstwa, badania marketingowe, wywiady itd.
• wiarygodność danych: do jakiego celu zostały one
przygotowane?

MUSISZ
SPRAWDZAĆ
KAŻDE DANE

• porównywalność danych: inflacja (ceny bieżące a ceny
stałe), zmiany procesów technicznych
Wielkość
produkcji

• zmienność zjawisk: trzeba sprawdzić, czy
wybrana w etapie 1a zmienna jest rzeczywiście zmienną losową

Wx 

s( x )

nowy zakład

100 %

x

stary zakład

Wx musi wynosić co najmniej 30-40%
Wiek studenta może być dobrą zmiennąprzyczyną, ale nie w przypadku studiów
dziennych!

Zatrudnienie

Matematyczne techniki zarządzania - 122
ETAP 3. SELEKCJA ZMIENNYCH OBJAŚNIAJĄCYCH
KAŻDĄ ZMIENNĄ X WYTYPOWANĄ W ETAPIE 1a TRAKTUJEMY JAKO
KANDYDATKĘ NA ZMIENNĄ OBJAŚNIAJĄCĄ
Może być kilka przyczyn powodujących, że taka kandydatka nie może znaleźć się w modelu ekonometrycznym (w równaniu regresji):
• w modelu nie może być zbyt wielu zmiennych (nieczytelny)
• kandydatka może nie mieć wpływu na zmienną Y



• kandydatka może wnosić prawie tę samą informację o Y co inna
kandydatka

• dwie bardzo podobne kandydatki mogą sobie nawzajem przeszkadzać
(efekt katalityczny)
Kryteria, jakie musi spełniać kandydatka Xi, aby nadawała się do modelu:
• musi być silnie powiązana ze zmienną Y

• nie może być powiązana z inną kandydatką Xj
SSTO
x1
x4

x2
x3

reszta

R2=0,79

R2=0,66

x2
x1
x4

R2=0,48

x3
reszta

reszta

SSTO

SSTO

Matematyczne techniki zarządzania - 123
Efekt katalityczny
DWIE ZMIENNE DAJĄ
RAZEM MNIEJ INFORMACJI NIŻ KAŻDA Z
NICH Z OSOBNA

x1

x2

R2=0,25

x2

x1

R2=0,52

R2=0,66

Selekcja kandydatek ma na celu podzielenie ich na trzy grupy:
• zmienne wprowadzone do modelu
• zmienne nie wprowadzone do modelu, ale reprezentowane w nim przez
inne zmienne (możliwość wymiany)
• zmienne nie wprowadzone do modelu ze względu na fakt, że nie wnoszą
żadnej informacji o zmiennej Y
INFORMACJE potrzebne do selekcji: współczynniki r x i x j ,
Macierz współczynników korelacji
Y
Y
X1
X2
X3

0,52
0,64
- 0,21

X1
0,52
0,82
- 0,18

X2
0,64
0,82
0,08

X3
- 0,21
- 0,18
0,08

r yx

i

Przykład 32. Macierz powiązania
zmiennych ze sobą przedstawia
się następująco (n=20). Jak ją
można zinterpretować? Które
zmienne są powiązane ze sobą w
sposób istotny?

Matematyczne techniki zarządzania - 124
Testowanie istotności współczynnika korelacji
H0:  = 0

Można je przeprowadzić trzema testami: testem Studenta

H1:   0

(t), Fishera (F) i Wallace’a-Snedecora (R)

Fragment tablicy rozkładu Wallece’a-Snedecora (SKRYPT, tab. VII, s.161)
S to pn ie
sw ob od y

2
0,05
0,632
0,444
0,361

8
18
28

,

0,01
0,765
0,561
0,463

L iczb a zm ien n ych
3
0,05
0,01
0,726
0,827
0,532
0,633
0,439
0,530

4
0,05
0,777
0,587
0,490

0,01
0,860
0,678
0,573

Reguła decyzyjna: — jeżeli |Robl|>Rtabl, odrzucamy H0 (korelacja istotna)
— jeżeli |Robl|
W przykładzie 32, jeżeli przyjmiemy  = 0,05, to Rtabl = 0,444.
Y
Y
X1
X2
X3

0,52
0,64
- 0,21

X1
0,52
0,82
- 0,18

X2
0,64
0,82
0,08

X3
- 0,21
- 0,18
0,08

Pozostaną zatem tylko trzy
istotne powiązania:
y-x1, y-x2, x1-x2
BRAK ISTOTNEGO POWIĄZANIA Z Y NIE
OZNACZA, ŻE ZMIENNA NIE WNOSI
ŻADNEJ INFORMACJI O ZJAWISKU Y

Matematyczne techniki zarządzania - 125



Metody selekcji zmiennych objaśniających:
• grafowa
• Hellwiga (pojemności informacji)
• taksonomiczne (clustering)
Metoda grafowa
• obliczenie macierzy współczynników:

rx

i

xj

• wyłowienie z macierzy powiązań istotnych

, r yx

BUDOWA GRAFU
i

• graf spójny

• budowa grafu z powiązań istotnych
• wybranie zmiennych na podstawie grafu

x6

• graf zerowy
x1
x4

x9

DO MODELU WYBIERA SIĘ ZMIENNE:
• każdy graf zerowy (jeśli |ryx|>0,1)

istotne powiązanie

• po jednej reprezentantce grafu spójnego;

reprezentantką grafu jest zmienna, która ma najwięcej powiązań z
innymi kandydatkami
jeżeli kilka zmiennych ma tę samą maksymalną liczbę powiązań, wybiera
się z nich tę, która jest najsilniej powiązana za zmienną Y (max ryx)
jeżeli graf jest rozległy, może mieć dwie reprezentantki, ale muszą one
leżeć na przeciwległych stronach grafu

Matematyczne techniki zarządzania - 126
Przykład 32 cd. Wybierzemy
zmienną x2 (reprezentantka grafu
spójnego) i zmienną x3 (graf
zerowy)
Metoda Hellwiga

Y
Y
X1
X2
X3

0,52
0,64
- 0,21

• wypisujemy wszystkie możliwe kombinacje
kandydatek; jest ich K = 2m—1
• obliczamy pojemność informacji dla każdej
zmiennej w każdej kombinacji

h kl  f ( r yx , r x
i

ixj

)

• obliczamy pojemność całkowitą dla każdej
kombinacji
H l   h kl
k

• wybieramy kombinację o największej
pojemności Hl = max

X1
0,52
0,82
- 0,18

X2
0,64
0,82

X3
- 0,21
- 0,18
0,08

0,08

W przykładzie 32 mamy 7
możliwych kombinacji kandydatek:
1. x1
2. x2

3. x3

maximum:

H6 = 0,42

4. x1,x2
5. x1,x3

Hmax = R2

6. x2,x3
7. x1,x2,x3

Metody taksonomiczne
Taksonomia wrocławska (cluster analysis) to metoda grupowania obiektów (zmiennych) w grupy jednorodne pod względem n cech (wymiarów)
łącznie. Podstawą grupowania jest odległość euklidesowa, która w przypadku zmiennych d ij  f ( r x x )
WSZYSTKIE METODY TO SELEKCJA WSTĘPNA
i

j

Matematyczne techniki zarządzania - 127
ETAP 4. ESTYMACJA PARAMETRÓW MODELU
Cel etapu: wyznaczenie parametrów strukturalnych i stochastycznych
Estymacja: szacowanie parametrów populacji na podstawie próbki
Metody estymacji: analiza regresji i korelacji (KMNK i inne)

Założenia dla KMNK
1. Zmienne losowe są prawdziwymi zmiennymi, nie powiązanymi ze sobą
2. Składnik losowy  ma stałą wariancję, niezależną od zmiennej x lub t
3. Wartości reszt ui są niezależne od siebie

4. Składnik losowy  nie jest powiązany ze zmienną objaśniającą
Skutki niedotrzymania założeń i środki zaradcze
1. Model bez sensu, nieprzydatny; niekiedy absurdalny (źle uwarunkowane
dane)
Stosuje się: dużą próbkę (n>100), regresję grzbietową (ridge regression)
2.

Y

reszta ui

Lewa część zbioru ma dużą wariancję, a
prawa — wariancję małą
Stosuje się specjalny wariant MNK z
korektą na różne wariancje
X

Matematyczne techniki zarządzania - 128
3. Jeśli reszty ui są ze sobą powiązane (skorelowane), mówimy, że
występuje autokorelacja składnika losowego (zjawisko występuje przy
szeregach czasowych — sztywny porządek obserwacji)
Oznacza to, że istnieje istotna zależność u t  f ( u t  k )
Przyczyny autokorelacji: zakłócenia
(dodatnie lub ujemne) w jednym okresie
wpływają na poziom zjawiska w następnych
okresach (rolnictwo, produkcja, rynek)

t  1 , 2 ,...

u t  y t  yˆ t

u t 1

u1
u2
u3
u4
u5

Występowanie autokorelacji powoduje
nieprzydatność modelu


u1
u2
u3
u4

Istnienie autokorelacji sprawdza się testem
Durbina-Watsona d
Stosuje się metodę różniczki zupełnej

y  f (x )

yt  yt  ytk

4. Składnik losowy jest skorelowany ze zmienną objaśniającą, wtedy
gdy została pominięta jakaś ważna zmienna-przyczyna

Model taki nie ma żadnej wartości; trzeba dbać o jak najwyższy współczynnik determinacji (R2>0,9)
• zbiór danych rzeczywistych nigdy
nie spełnia tych wymagań

ESTYMACJĘ MODELU POWTARZA SIĘ WIELOKROTNIE
ponieważ dopiero weryfikacja zapewnia ostateczną selekcję
kandydatek na zmienne objaśniające

• ekonometria to analiza danych nie
spełniających tych założeń
• nie stosować statystyki bezmyślnie (na ślepo)

Matematyczne techniki zarządzania - 129
ETAP 5. WERYFIKACJA MODELU
Cele:

1. opis rzeczywistości (populacji generalnej)



2. dokładna (ostateczna) selekcja zmiennych objaśniających
3. poznanie składnika losowego (spełnienie założeń KMNK)
Narzędzia: hipotezy i testy statystyczne

Metodyka: każde równanie oddzielnie; weryfikacja obejmuje 9 etapów (od
najmniej do najbardziej pracochłonnego)
WYKAZ ETAPÓW WERYFIKACJI MODELU
I.
II.

Badanie istotności korelacji
Badanie wyrazistości modelu

III.

Badanie istotności parametrów

IV.

Badanie symetrii skł. losowego

V.
VI.
VII.
VIII.
IX.

Badanie losowości skł. losowego
Badanie stacjonarności skł. los.
Badanie wartości oczekiwanej skł. los.
Badanie autokorelacji skł. losowego
Badanie normalności skł. losowego

Opis każdego etapu weryfikacji
obejmuje:
• cel etapu
• sposób weryfikacji: wzory,
hipotezy, testy
• podanie których modeli dotyczy (przyczynowo-skutkowych
czy tendencji rozwojowej)
• podanie której postaci modeli
nieliniowych dotyczy (pierwotnej czy transformaty)

Matematyczne techniki zarządzania - 130
Etap I. Badanie istotności korelacji
7
2

8

9

11

12

17

19

23

21

5
2 etapu
9
16
7
9
15
14
Celem
jest
sprawdzenie,
czy
istnieje w populacji generalnej powiązanie pomiędzy zmienną Y i wszystkimi zmiennymi objaśniającymi

25

Przedział ufności dla
nieznanego współczynnika korelacji  dla populacji buduje się przy
użyciu błędu

populacja

zmienna Y

20
15
10

próbka

5
0
8
5

0 9

1011

2

9

20
12

30
17
16
7
zmienna X

25

1940
9

23 50
15

populacja

20

zmienna Y

7
2

15
10

próbka

5
0
0

10

20

30

zmienna X

40

50

21
14

sR 

1 R

0

Robl

2

nk

Istotność korelacji weryfikuje się przez postawienie
następujących hipotez dla
współczynnika korelacji dla
populacji generalnej:

1
R,|r|

H0 :   0

Brak korelacji, nie ma powiązania...

H1 :   0

Korelacja istotna, jest powiązanie...

,

Matematyczne techniki zarządzania - 131
Hipotezy te można weryfikować trzema równoważnymi testami:
• testem t Studenta (tylko dla regresji dwu zmiennych)
• testem F Fishera-Snedecora
• testem R Wallace’a-Snedecora

,

W każdym przypadku obliczamy wartość
statystyki dla próbki (tobl, Fobl, Robl) i porównujemy z wartością krytyczną odczytaną z tablicy odpowiedniego rozkładu w
funkcji poziomu istotności i liczby stopni
swobody (ttabl, Ftabl, Rtabl)

Reguła decyzyjna:
• jeżeli |tobl|< ttabl, nie ma podstaw do odrzucenia H0 (brak korelacji)
• jeżeli |tobl|> ttabl, odrzucamy H0 na korzyść H1 (korelacja istnieje)

TAK SAMO DLA
FiR

W przypadku regresji wielorakiej, gdy liczba zmiennych objaśniajacych
jest duża w porównaniu do liczby obserwacji, współczynnik determinacji
R2 może dawać zawyżoną ocenę stopnia wyjaśnienia zmienności zmiennej
objaśnianej; dlatego wprowadzono skorygowany współczynnik determinacji (i korelacji):
 ( yˆ i  y )

R

2

2

k
n

k

1


2
nk 1
(
y

y
)

i
n1

• adjusted coefficient of multiple
determination (wydruki komputerowe)

• jeśli k jest małe, nie ma większej różnicy
pomiędzy normalnym a skorygowanym R2

Matematyczne techniki zarządzania - 132
Skąd wziąć wartość odpowiedniej statystyki dla próbki i jak odczytywać jej wartości z tablic?
n2
r
t

r

t tabl  t  / 2 { n  2 }
TEST STUDENTA
obl
2
sr
1 r

F obl 

TEST FISHERA

Ź ró d ło z m ien n o śc i

MSTR
MSE



R

nk

2

1 R

2

L ic zb a sto p n i
sw o b o d y

Suma
k w a d ra tó w

Ś re d n i
k w a d ra t

M o d el (c z yn n ik i)
B łą d (re sz ta )

k1
nk

SSTR
SSE

MSTR
MSE

R azem

n1

SSTO

TEST WALLACE’A

R obl 

R

2

k 1

F tabl  F { k  1 , n  k }

S ta ty sty k a
F
F obl 

MSTR
MSE

NIE MYLIĆ
STOPNI SWOBODY LICZNIKA I MIANOWNIKA

R tabl  R { k , n  k }

Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

Matematyczne techniki zarządzania - 133
Odczyt Rtabl z tablicy testu R (SKRYPT s.161-162)

, k,  = n-k

S to pn ie
sw ob od y
8
18
28

2
0,05
0,632
0,444
0,361

0,01
0,765
0,561
0,463

L iczb a zm ien n ych
3
0,05
0,01
0,726
0,827
0,532
0,633
0,439
0,530

4
0,05
0,777
0,587
0,490

0,01
0,860
0,678
0,573

Wnioski dotyczące rozkładu R Wallace’a-Snedecora:
• tablica zawiera maksymalne wartości współczynnika korelacji w danej
sytuacji, jakich można oczekiwać, gdy nie ma korelacji w populacji
• im wyższy poziom istotności, tym niższe Rtabl

• im większa liczba zmiennych w modelu, tym wyższe Rtabl
• im wyższa liczba stopni swobody (większa próbka), tym niższe Rtabl
• tablica R powstała z przeliczenia tablic t oraz F (odwrócenie wzorów)
• tablica testu R jest najszybszym i nawygodniejszym narzędziem do
weryfikacji istotności korelacji

Werdykt z etapu I:

Matematyczne techniki zarządzania - 134

• jeżeli Robl>Rtabl, model jest poprawny, można przejść do etapu II
• jeżeli Roblzmiennych objaśniających albo jego postać matematyczną
ETAP I OBOWIĄZUJE DLA WSZYSTKICH MODELI
ETAP I PRZEPROWADZA SIĘ DLA TRANSFORMATY (dla postaci pierwotnej
można uzyskać R>1)
Rola współczynnika determinacji R2
• korelacja może być istotna przy małym R i bardzo małym R2 (r=0,4,
R2=0,16, co oznacza, że tylko 16% zmienności zmiennej Y jest
wyjaśnione przez zmienną objaśniającą)
• małe R2 oznacza niski stopień wyjaśnienia rzeczywistości i stanowi
zagrożenie dla modelu
• należy dążyć (poprzez odpowiedni dobór zmiennych-przyczyn i postaci
matematycznej modelu) do jak największego R2 (dla postaci pierwotnej)
• wysoka wartość R2 świadczy o dobrym poznaniu badanego zjawiska
• wysoka wartość R2 bardzo często wynika jednak ze złego dobrania
zmiennych objaśniających (silnie powiązane ze sobą — „masło maślane”)
KORELACJA POZORNA — jest zależność, ale jej nie ma? Przyczyny...
Trzeba unikać wartości bezwzględnych (ludność, liczba sklepów, wielkość produkcji)

6

9

12

8

11

12

11

15

9

18

9

11

11

18

15

Matematyczne techniki zarządzania - 135
Etap II. Badanie wyrazistości modelu
Y

Wyrazistość modelu dana jest wzorem

s( y )

ui

y

W obl 

s( y )

100 %

y

Celem etapu
jest kontrola
rozrzutu danych

Współczynnik Wobl<30%, w przeciwnym
przypadku rozrzut danych jest zbyt duży

y

Kłopoty: gdyy jest bliskie 0

x

X

Werdykt: model poprawny lub niepoprawny

ETAP II OBOWIĄZUJE DLA WSZYSTKICH MODELI (ale nie ma on charakteru
statystycznego)

ETAP II PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ (sprawdzamy, czy
nie występuje silny efekt „krzywego lustra”)
Etap III. Badanie istotności parametrów (współczynników) modelu
Celem etapu jest sprawdzenie:
• czy poszczególne zmienne objaśniające mają istotny wpływ na zmienną
objaśnianą?
• czy zmienne objaśniające są wybrane prawidłowo?

• czy wyraz wolny różni się istotnie od zera?

Matematyczne techniki zarządzania - 136
Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

Problem istotności parametrów ai można rozpatrywać (tak jak problem
średniej dla populacji) z dwu punktów widzenia:
• przedziału ufności dla nieznanej wartości i

• hipotez — zerowej H0: i=0 i alternatywnej H1: i 0

1
0

ai

1

i

ISTOTNY (W PRZEDZIALE NIE MA ZERA)

0

ai

i

NIEISTOTNY (W PRZEDZIALE JEST ZERO)

P ( a i  t / 2 { n  k } s ( a i )   i  a i  t / 2 { n  k } s ( a i )  1  

Z tablicy rozkładu Studenta, a nie z wydruku komputerowego!

Matematyczne techniki zarządzania - 137
Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

W praktyce posługujemy się raczej hipotezami:
Badanie istotności przeprowadza
się dla każdego i oddzielnie:

t obl ( a i ) 

ai  0
s(a i )

t tabl  t  / 2 { n  k }

• jeżeli |tobl(ai)|>ttabl(ai), odrzucamy hipotezę zerową; parametr jest istotny z błędem równym co najwyżej 
• jeżeli |tobl(ai)|parametr nie jest istotny
Praktycznie jest to bardzo łatwe:
• sprawdzamy, czy |t(ai)| jest większe czy mniejsze od około 2, a najlepiej
• porównujemy rzeczywisty poziom istotności P(ai) z przyjętym 
ODRZUCAMY H0, JEŻELI P(ai) JEST MNIEJSZE OD 

WTEDY ZMIENNA
Xi MA WPŁYW NA
ZMIENNĄ Y

Matematyczne techniki zarządzania - 138
W etapie III następuje ostateczna selekcja zmiennych objaśniających:
• jeżeli wszystkie ai okażą się istotne, model jest poprawny:
— model przyczynowo-skutkowy: do interpretacji
— model tendencji rozwojowej: do etapu IV
• jeżeli choć jedno ai okaże się nieistotne, model jest niepoprawny i wymaga poprawy przez usunięcie nieistotnych zmiennych:
— zmienne należy usuwać po jednej (ze względu na efekt katalityczny)
— usuwa się zawsze zmienną o najniższej wartości |t(ai)| [czyli o
najwyższej wartości P(ai)]
— usunięcie ostatniej zmiennej nieistotnej kończy proces selekcji
kandydatek na zmienne,

— selekcja nie jest ostateczna, gdyż zawsze istnieje możliwość zamiany zmiennych, które są powiązane ze sobą
Praktyczne znaczenie istotności wyrazu wolnego a0
To są jedne z możliwości dla populacji (p. plansza 106)

Y

W przypadku funkcji K=f(P) wyraz wolny wyznacza poziom kosztów stałych (rachunkowość zarządcza)
W przypadku zależności technicznej Q=f(h) wyraz
wolny oznacza, że przy miąższości pokładu h=0 wydajność produkcji Q też jest równa 0

0
X

Matematyczne techniki zarządzania - 139
Praktyczne znaczenie istotności współczynnika regresji ai



KRZYWE NEYMANA — PLANSZE 106-107
WSPÓŁCZ. ISTOTNY
WSPÓŁ. NIEISTOTNY

ETAP III OBOWIĄZUJE DLA WSZYSTKICH MODELI
ETAP III PRZEPROWADZA SIĘ DLA TRANSFORMATY
Etap IV. Badanie symetrii składnika losowego

Y

CZĘSTOŚĆ RESZT DODATNICH I UJEMNYCH MA BYĆ
ZBLIŻONA

Y

ASYMETRYCZNY
SYMETRYCZNY

t
t
Badanie symetrii przeprowadza się testem Studenta (St. Bartosiewicz
Ekonometria)
Brak symetrii wymaga zmiany matematycznej postaci modelu
ETAP IV OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ

ETAP IV PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ

Matematyczne techniki zarządzania - 140
Etap V. Badanie losowości składnika losowego

Y

Y
NIELOSOWY

LOSOWY

t
t
Badanie losowości przeprowadza się testem Studenta lub testem serii
(Ekonometria, praca zb. pod red. M. Krzysztofiaka)
Brak losowości wymaga zmiany matematycznej postaci modelu
ETAP V OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP V PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ
Etap VI. Badanie stacjonarności składnika losowego
W etapie tym chodzi o niezależność wariancji składnika losowego od
zmiennej objaśniającej t (plansza 127)

Bada się istotność współczynnika korelacji ru t , t
ETAP VI OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VI PRZEPROWADZA SIĘ DLA TRANSFORMATY

Matematyczne techniki zarządzania - 141
Etap VII. Badanie wartości oczekiwanej składnika losowego
Normalnie, gdy przeprowadzamy estymację postaci liniowej, parametry
składnika losowego E ( )  0
{ ui  0}
V ( )  const
Po retransformacji do postaci pierwotnej mamy nowe reszty u’, dla
których
'
'
ui  0
 ui  0
Celem etapu jest sprawdzenie, czy odchyłka od O nie jest zbyt duża
(służy do tego test Studenta)
ETAP VII OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VII PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ
Etap VIII. Badanie autokorelacji składnika losowego
Pojęcie autokorelacji opisano na planszy 128; chodzi o istotność korelacji ru , u
t

tk

Badanie autokorelacji można przeprowadzić:

• testem R istotności korelacji ru

t

,ut  k

d obl

• testem Durbina-Watsona
NIE MA AUTOK.

d1

?

d2 JEST AUTOKORELACJA

ETAP VIII OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VIII PRZEPROWADZA SIĘ DLA TRANSFORMATY

Matematyczne techniki zarządzania - 142
Etap IX. Badanie normalności składnika losowego
Celem etapu jest stwierdzenie, czy reszty mają rozkład normalny
Analiza reszt — oddzielny dział analizy regresji i korelacji
Jeżeli reszty mają rozkład normalny, statystyk otrzymuje „ulgi”
ETAP 6. PRAKTYCZNA INTERPRETACJA MODELU



Celem etapu jest wydobycie z modelu całej nowej wiedzy, której nie widać
„gołym okiem”
INTERPRETUJĄC MODEL (RÓWNANIE REGRESJI) NALEŻY UŻYWAĆ WYŁĄCZNIE
PROSTEJ TERMINOLOGII EKONOMICZNEJ ZROZUMIAŁEJ DLA KLIENTA
NIE NALEŻY UŻYWAĆ TERMINOLOGII MATEMATYCZNEJ ZROZUMIAŁEJ TYLKO DLA
TWÓRCÓW MODELU
INTERPRETOWAĆ WOLNO TYLKO MODEL ZWERYFIKOWANY
CAŁY TRUD MODELOWANIA NIE MOŻE BYĆ „SZTUKĄ DLA SZTUKI”, LECZ MA
SŁUŻYĆ UZYSKANIU KONKRETNYCH WNIOSKÓW PRAKTYCZNYCH

Interpretacja modelu przyczynowo-skutkowego

Polega ona na określeniu wpływu poszczególnych czynników na badane
zjawisko:
• podział wszystkich czynników na trzy grupy

Matematyczne techniki zarządzania - 143
A — czynniki nie mające wpływu na Y
B — czynniki mające wpływ na Y i wprowadzone do modelu
C — czynniki mające wpływ na Y, ale nie występujące w modelu
• ocena jakościowa wpływu czynników B i C
• ocena ilościowa wpływu czynników B i C
Ocena jakościowa



Na podstawie znaków stojących przy współczynnikach r oraz ai możemy
stwierdzić, że wpływ jest:

• dodatni (im lepsze zaliczenie, tym lepszy wynik egzaminu; im więcej
wydatków na reklamę, tym większy zysk; itd.)
• ujemny (im więcej zatrudnionych, tym gorszy wynik finansowy; im
mniej braków, tym wyższy zysk; im mniejsza absencja, tym wyższe
wynagrodzenie; itd.)

Ocena ilościowa
• model liniowy
Przykład 33. Zinterpretuj zweryfikowany model zależności miesięcznych
kosztów działalności przedsiębiorstwa (tys. zł) od wielkości produkcji
(sztuk) i liczby reklamacji:
y i  50 , 8  14 , 5 x 1  3 , 9 x 2  

Matematyczne techniki zarządzania - 144
a0 = 50,8

poziom kosztów stałych; jeśli firma nie będzie prowadzić
żadnej działalności, poniesie koszty w wysokości 50,8 tys. zł

a1 = 14,5

każda sztuka produktu firmy kosztuje ją przeciętnie 14,5
tys. zł; jeżeli firma zwiększy produkcję o 2 sztuki, koszty
wzrosną o 29,0 tys. zł

a2 = 3,9każda wniesiona reklamacja powiększa koszty przeciętnie o
3,9 tys. zł
• model potęgowy
Przykłąd 34. Zinterpretuj zweryfikowaną funkcję produkcji Cobba-Douglasa
0 , 65

Pi  45 , 2 M i

0 , 73

Zi

e

0 , 04



Funkcja produkcji to specjalny model, określający zależność pomiędzy
produkcją (P) a czynnikami produkcji: majątkiem trwałym (M) i nakładami
robocizny (Z).



Funkcje produkcji to modele umożliwiające „prześwietlenie”
przedsiębiorstwa (szereg czasowy) lub branży (dane przekrojowe) i określenie poziomu gospodarowania oraz postępu
technicznego i organizacyjnego.
Elastyczność  to współczynnik określający reakcję zmiany
jednej zmiennej na inną zmienną — na przykład elastyczność
cenowa popytu (jak popyt zmienia się wraz z ceną towaru).

EKSPERCI
ZACHODNI

Matematyczne techniki zarządzania - 145

 

y
y

:

x

FUNKCJA POTĘGOWA JEST JEDYNĄ FUNKCJĄ O STAŁEJ ELASTYCZNOŚCI

x

Izolinie funkcji produkcji

T1
M

Produkcję P można osiągnąć różnymi
kombinacjami majątku i robocizny:

T2

• T1— technika kapitałochłonna, np.
pełna automatyzacja
• T2 — pośredni poziom techniki

T3
P  const

• T3 — niski poziom techniki, produkcja
pracochłonna
P. LOWE

Z
Efekt poprawy zarządzania bez
zmiany techniki (lepsze wykorzystanie ludzi i sprzętu):

P2
M

ZARZĄDZANIE
TECHNOLOGIĄ

P1

T

• zmniejszenie kapitałochłonności

• zmniejszenie pracochłonności
• zwiększenie produkcji (przejście z
funkcji P1 na P2)

Można też rozpatrzyć łączne efekty
zmiany techniki i zarządzania

Z

Matematyczne techniki zarządzania - 146
Wszystkie informacje tego typu można odczytać w trakcie interpretacji
0 , 65
0 , 73 0 , 04
funkcji produkcji:
Pi  45 , 2 M i
Zi
e

• wartości 45,2 nie interpretuje się
• wartość 0,65 to współczynnik elastyczności majątkowej (kapitałowej)
produkcji: zmiana majątku o 10% daje średnio zmianę produkcji o 6,5%
• wartość 0,73 to współczynnik elastyczności zatrudnieniowej produkcji:
zmiana zatrudnienia o 10% daje zmianę produkcji średnio o 7,3%
• suma obu współczynników k=0,65+0,73=1,38 to współczynnik skali
produkcji:

— jeżeli k<1, to firma rozwija się ekstensywnie
— jeżeli k>1, to firma rozwija się intensywnie
• wartość  = 0,04 to współczynnik postępu organizacyjnego:
— jeżeli  >O, to miał miejsce postęp organizacyjny

— jeżeli  <0, to miał miejsce regres organizacyjny
Interpretacja modelu tendencji rozwojowej

DODAMY
TROCHĘ
TEORII

Przypomnienie: t — zmienna objaśniająca (stałe przyrosty)
y — zmienna objaśniana; rozdzielana w ogólności na trzy
części: trend, wahania okresowe, wahania losowe ()

Matematyczne techniki zarządzania - 147
Wykres z planszy 117 (zużycie energii elektrycznej przez WZ AGH)
WAHANIA OKRESOWE OKREŚLA SIĘ WZGLĘDEM TRENDU A
NIE WZGLĘDEM OSI CZASU

y

trend

t
1995

1996

1997

1998

1999

Te trzy części trzeba zidentyfikować, a potem złożyć razem w model:

• addytywny (jeśli amplituda wahań jest stała)
• multiplikatywny (jeśli amplituda wahań rośnie lub maleje regularnie)
Wyznaczanie trendu
Metody mechaniczne:

• wskaźniki bezwzględne (stały przyrost =
postęp arytmetyczny = funkcja liniowa)
• wskaźniki względne (przyrost o stały procent =
postęp geometryczny = funkcja potęgowa)
• średnia ruchoma (wygładzanie danych linią łamaną)

JAK OBLICZYĆ O
ILE PROCENT ROCZNIE SPADAŁA
ŚREDNIO LICZBA
WIDZÓW W
KINACH:
1982 - 193,7 MLN
1989 - 141,3 MLN

Matematyczne techniki zarządzania - 148
Średnia ruchoma: mając szereg czasowy y1, y2,....., yn, przyjmujemy
długość kroku k = 3, lub 5, lub 7 itd. i liczymy
y  ...  y k
y  ...  y k  1
y k / 2 0 ,5  1
a następnie y k / 2  1 , 5  2
itd.
k
k
y  y2  y3
y  y3  y4
dla k=3:
y2  1
y3  2
itd.
3
3
Przykład 35. Wyznacz trend metodą średniej ruchomej dla następujących
danych:
okres
t
wartość yt

1
5

2
4

3
7

4
6

5
8

12

y2 
10

y3 

y

8

y4 

6
4

y5 

2

y6 

0
0

1

2

3

4

5

czas, t

6

7

8

9

y7 

547

6
10

 5 , 67

CECHY
ŚREDNIEJ
RUCHOMEJ:

 7 , 00

• TRACI SIĘ
k-1 DANYCH

3
768

8
8

 5 , 33

3
476

7
9

3
6  8  10

 8 , 00

3
8  10  9

 9 , 00

3
10  9  8

 9 , 00

• IM
WIĘKSZE k,
TYM
BARDZIEJ
SZTYWNY
TREND

3

Metody statystyczne: analiza regresji i korelacji, różne funkcje oparte na
modelach ekonomii

Matematyczne techniki zarządzania - 149
Wyznaczanie wahań okresowych: dobowych, tygodniowych, miesięcznych,
kwartalnych, rocznych, wieloletnich
Trzy metody:

— metoda wskaźników sezonowości
— metoda zmiennych zero-jedynkowych (0-1)

— metoda harmoniczna
Wszystkie metody mają jeden cel:
uzyskanie przeciętnego obrazu jednego cyklu

+

Ws
[t ]
[%]
trend

I

II



III

IV

WADY:
• KONIECZNOŚĆ
KOREKTY
• BRAK
WERYFIKACJI
STATYSTYCZNEJ

Metoda wskaźników sezonowości

• obliczenie surowych wskaźników sezonowości (wyeliminowanie trendu):
y

S s  yt  yt
S s  t
yt
addytywny multiplikatywny
wynik: n wartości odchyleń od trendu

• obliczenie oczyszczonych wskaźników
sezonowości (wyeliminowanie wahań
losowych):
 Ss
So 
k-liczba okresów
k
jednoimiennych
m-długość cyklu wynik: m wartości śr. odchyleń od trendu

Matematyczne techniki zarządzania - 150
Metoda zmiennych zero-jedynkowych (0-1)
m

y t  a 0  a1 t   bi Q i  
i 1

bi — przeciętne odchylenie od trendu dla
okresu i-tego
Qi — zmienna 0-1

wahania losowe
trend

wahania okresowe

t
1
2
3
4
5
6
7
8
9

yt
y1
y2
y3
y4
y5
y6
y7
y8
y9

Q1
1
0
0
0
1
0
0
0
1

Q2
0
1
0
0
0
1
0
0
0

Q3
0
0
1
0
0
0
1
0
0

Q4
0
0
0
1
0
0
0
1
0

Metoda harmoniczna (szeregi Fouriera)
Wahania okresowe przedstawia się jako sumę określonej liczby drgań harmonicznych (sinusoid i cosinusoid) przesuniętych w fazie, lecz o jednakowym okresie
m /2
2 i m / 2
2 i
y t  a 0  a 1 t   b1 i sin
  b 2 i cos

m
m
i 1
i 1
Obie metody dają taki sam wynik, istnieje możliwość weryfikacji
statystycznej
W metodzie 0-1 dostajemy bi = Ws, natomiast w metodzie harmonicznej Ws
jest sumą wartości poszczególnych sinusoid dla danego momentu czasu


Slide 30

Matematyczne techniki zarządzania - 121
ETAP 2. GROMADZENIE DANYCH STATYSTYCZNYCH

!

ZA JAKOŚĆ DANYCH ODPOWIADA MODELUJĄCY
• rodzaje danych: dane przekrojowe i szeregi czasowe
• źródła danych: roczniki statystyczne, różne działy
przedsiębiorstwa, badania marketingowe, wywiady itd.
• wiarygodność danych: do jakiego celu zostały one
przygotowane?

MUSISZ
SPRAWDZAĆ
KAŻDE DANE

• porównywalność danych: inflacja (ceny bieżące a ceny
stałe), zmiany procesów technicznych
Wielkość
produkcji

• zmienność zjawisk: trzeba sprawdzić, czy
wybrana w etapie 1a zmienna jest rzeczywiście zmienną losową

Wx 

s( x )

nowy zakład

100 %

x

stary zakład

Wx musi wynosić co najmniej 30-40%
Wiek studenta może być dobrą zmiennąprzyczyną, ale nie w przypadku studiów
dziennych!

Zatrudnienie

Matematyczne techniki zarządzania - 122
ETAP 3. SELEKCJA ZMIENNYCH OBJAŚNIAJĄCYCH
KAŻDĄ ZMIENNĄ X WYTYPOWANĄ W ETAPIE 1a TRAKTUJEMY JAKO
KANDYDATKĘ NA ZMIENNĄ OBJAŚNIAJĄCĄ
Może być kilka przyczyn powodujących, że taka kandydatka nie może znaleźć się w modelu ekonometrycznym (w równaniu regresji):
• w modelu nie może być zbyt wielu zmiennych (nieczytelny)
• kandydatka może nie mieć wpływu na zmienną Y



• kandydatka może wnosić prawie tę samą informację o Y co inna
kandydatka

• dwie bardzo podobne kandydatki mogą sobie nawzajem przeszkadzać
(efekt katalityczny)
Kryteria, jakie musi spełniać kandydatka Xi, aby nadawała się do modelu:
• musi być silnie powiązana ze zmienną Y

• nie może być powiązana z inną kandydatką Xj
SSTO
x1
x4

x2
x3

reszta

R2=0,79

R2=0,66

x2
x1
x4

R2=0,48

x3
reszta

reszta

SSTO

SSTO

Matematyczne techniki zarządzania - 123
Efekt katalityczny
DWIE ZMIENNE DAJĄ
RAZEM MNIEJ INFORMACJI NIŻ KAŻDA Z
NICH Z OSOBNA

x1

x2

R2=0,25

x2

x1

R2=0,52

R2=0,66

Selekcja kandydatek ma na celu podzielenie ich na trzy grupy:
• zmienne wprowadzone do modelu
• zmienne nie wprowadzone do modelu, ale reprezentowane w nim przez
inne zmienne (możliwość wymiany)
• zmienne nie wprowadzone do modelu ze względu na fakt, że nie wnoszą
żadnej informacji o zmiennej Y
INFORMACJE potrzebne do selekcji: współczynniki r x i x j ,
Macierz współczynników korelacji
Y
Y
X1
X2
X3

0,52
0,64
- 0,21

X1
0,52
0,82
- 0,18

X2
0,64
0,82
0,08

X3
- 0,21
- 0,18
0,08

r yx

i

Przykład 32. Macierz powiązania
zmiennych ze sobą przedstawia
się następująco (n=20). Jak ją
można zinterpretować? Które
zmienne są powiązane ze sobą w
sposób istotny?

Matematyczne techniki zarządzania - 124
Testowanie istotności współczynnika korelacji
H0:  = 0

Można je przeprowadzić trzema testami: testem Studenta

H1:   0

(t), Fishera (F) i Wallace’a-Snedecora (R)

Fragment tablicy rozkładu Wallece’a-Snedecora (SKRYPT, tab. VII, s.161)
S to pn ie
sw ob od y

2
0,05
0,632
0,444
0,361

8
18
28

,

0,01
0,765
0,561
0,463

L iczb a zm ien n ych
3
0,05
0,01
0,726
0,827
0,532
0,633
0,439
0,530

4
0,05
0,777
0,587
0,490

0,01
0,860
0,678
0,573

Reguła decyzyjna: — jeżeli |Robl|>Rtabl, odrzucamy H0 (korelacja istotna)
— jeżeli |Robl|
W przykładzie 32, jeżeli przyjmiemy  = 0,05, to Rtabl = 0,444.
Y
Y
X1
X2
X3

0,52
0,64
- 0,21

X1
0,52
0,82
- 0,18

X2
0,64
0,82
0,08

X3
- 0,21
- 0,18
0,08

Pozostaną zatem tylko trzy
istotne powiązania:
y-x1, y-x2, x1-x2
BRAK ISTOTNEGO POWIĄZANIA Z Y NIE
OZNACZA, ŻE ZMIENNA NIE WNOSI
ŻADNEJ INFORMACJI O ZJAWISKU Y

Matematyczne techniki zarządzania - 125



Metody selekcji zmiennych objaśniających:
• grafowa
• Hellwiga (pojemności informacji)
• taksonomiczne (clustering)
Metoda grafowa
• obliczenie macierzy współczynników:

rx

i

xj

• wyłowienie z macierzy powiązań istotnych

, r yx

BUDOWA GRAFU
i

• graf spójny

• budowa grafu z powiązań istotnych
• wybranie zmiennych na podstawie grafu

x6

• graf zerowy
x1
x4

x9

DO MODELU WYBIERA SIĘ ZMIENNE:
• każdy graf zerowy (jeśli |ryx|>0,1)

istotne powiązanie

• po jednej reprezentantce grafu spójnego;

reprezentantką grafu jest zmienna, która ma najwięcej powiązań z
innymi kandydatkami
jeżeli kilka zmiennych ma tę samą maksymalną liczbę powiązań, wybiera
się z nich tę, która jest najsilniej powiązana za zmienną Y (max ryx)
jeżeli graf jest rozległy, może mieć dwie reprezentantki, ale muszą one
leżeć na przeciwległych stronach grafu

Matematyczne techniki zarządzania - 126
Przykład 32 cd. Wybierzemy
zmienną x2 (reprezentantka grafu
spójnego) i zmienną x3 (graf
zerowy)
Metoda Hellwiga

Y
Y
X1
X2
X3

0,52
0,64
- 0,21

• wypisujemy wszystkie możliwe kombinacje
kandydatek; jest ich K = 2m—1
• obliczamy pojemność informacji dla każdej
zmiennej w każdej kombinacji

h kl  f ( r yx , r x
i

ixj

)

• obliczamy pojemność całkowitą dla każdej
kombinacji
H l   h kl
k

• wybieramy kombinację o największej
pojemności Hl = max

X1
0,52
0,82
- 0,18

X2
0,64
0,82

X3
- 0,21
- 0,18
0,08

0,08

W przykładzie 32 mamy 7
możliwych kombinacji kandydatek:
1. x1
2. x2

3. x3

maximum:

H6 = 0,42

4. x1,x2
5. x1,x3

Hmax = R2

6. x2,x3
7. x1,x2,x3

Metody taksonomiczne
Taksonomia wrocławska (cluster analysis) to metoda grupowania obiektów (zmiennych) w grupy jednorodne pod względem n cech (wymiarów)
łącznie. Podstawą grupowania jest odległość euklidesowa, która w przypadku zmiennych d ij  f ( r x x )
WSZYSTKIE METODY TO SELEKCJA WSTĘPNA
i

j

Matematyczne techniki zarządzania - 127
ETAP 4. ESTYMACJA PARAMETRÓW MODELU
Cel etapu: wyznaczenie parametrów strukturalnych i stochastycznych
Estymacja: szacowanie parametrów populacji na podstawie próbki
Metody estymacji: analiza regresji i korelacji (KMNK i inne)

Założenia dla KMNK
1. Zmienne losowe są prawdziwymi zmiennymi, nie powiązanymi ze sobą
2. Składnik losowy  ma stałą wariancję, niezależną od zmiennej x lub t
3. Wartości reszt ui są niezależne od siebie

4. Składnik losowy  nie jest powiązany ze zmienną objaśniającą
Skutki niedotrzymania założeń i środki zaradcze
1. Model bez sensu, nieprzydatny; niekiedy absurdalny (źle uwarunkowane
dane)
Stosuje się: dużą próbkę (n>100), regresję grzbietową (ridge regression)
2.

Y

reszta ui

Lewa część zbioru ma dużą wariancję, a
prawa — wariancję małą
Stosuje się specjalny wariant MNK z
korektą na różne wariancje
X

Matematyczne techniki zarządzania - 128
3. Jeśli reszty ui są ze sobą powiązane (skorelowane), mówimy, że
występuje autokorelacja składnika losowego (zjawisko występuje przy
szeregach czasowych — sztywny porządek obserwacji)
Oznacza to, że istnieje istotna zależność u t  f ( u t  k )
Przyczyny autokorelacji: zakłócenia
(dodatnie lub ujemne) w jednym okresie
wpływają na poziom zjawiska w następnych
okresach (rolnictwo, produkcja, rynek)

t  1 , 2 ,...

u t  y t  yˆ t

u t 1

u1
u2
u3
u4
u5

Występowanie autokorelacji powoduje
nieprzydatność modelu


u1
u2
u3
u4

Istnienie autokorelacji sprawdza się testem
Durbina-Watsona d
Stosuje się metodę różniczki zupełnej

y  f (x )

yt  yt  ytk

4. Składnik losowy jest skorelowany ze zmienną objaśniającą, wtedy
gdy została pominięta jakaś ważna zmienna-przyczyna

Model taki nie ma żadnej wartości; trzeba dbać o jak najwyższy współczynnik determinacji (R2>0,9)
• zbiór danych rzeczywistych nigdy
nie spełnia tych wymagań

ESTYMACJĘ MODELU POWTARZA SIĘ WIELOKROTNIE
ponieważ dopiero weryfikacja zapewnia ostateczną selekcję
kandydatek na zmienne objaśniające

• ekonometria to analiza danych nie
spełniających tych założeń
• nie stosować statystyki bezmyślnie (na ślepo)

Matematyczne techniki zarządzania - 129
ETAP 5. WERYFIKACJA MODELU
Cele:

1. opis rzeczywistości (populacji generalnej)



2. dokładna (ostateczna) selekcja zmiennych objaśniających
3. poznanie składnika losowego (spełnienie założeń KMNK)
Narzędzia: hipotezy i testy statystyczne

Metodyka: każde równanie oddzielnie; weryfikacja obejmuje 9 etapów (od
najmniej do najbardziej pracochłonnego)
WYKAZ ETAPÓW WERYFIKACJI MODELU
I.
II.

Badanie istotności korelacji
Badanie wyrazistości modelu

III.

Badanie istotności parametrów

IV.

Badanie symetrii skł. losowego

V.
VI.
VII.
VIII.
IX.

Badanie losowości skł. losowego
Badanie stacjonarności skł. los.
Badanie wartości oczekiwanej skł. los.
Badanie autokorelacji skł. losowego
Badanie normalności skł. losowego

Opis każdego etapu weryfikacji
obejmuje:
• cel etapu
• sposób weryfikacji: wzory,
hipotezy, testy
• podanie których modeli dotyczy (przyczynowo-skutkowych
czy tendencji rozwojowej)
• podanie której postaci modeli
nieliniowych dotyczy (pierwotnej czy transformaty)

Matematyczne techniki zarządzania - 130
Etap I. Badanie istotności korelacji
7
2

8

9

11

12

17

19

23

21

5
2 etapu
9
16
7
9
15
14
Celem
jest
sprawdzenie,
czy
istnieje w populacji generalnej powiązanie pomiędzy zmienną Y i wszystkimi zmiennymi objaśniającymi

25

Przedział ufności dla
nieznanego współczynnika korelacji  dla populacji buduje się przy
użyciu błędu

populacja

zmienna Y

20
15
10

próbka

5
0
8
5

0 9

1011

2

9

20
12

30
17
16
7
zmienna X

25

1940
9

23 50
15

populacja

20

zmienna Y

7
2

15
10

próbka

5
0
0

10

20

30

zmienna X

40

50

21
14

sR 

1 R

0

Robl

2

nk

Istotność korelacji weryfikuje się przez postawienie
następujących hipotez dla
współczynnika korelacji dla
populacji generalnej:

1
R,|r|

H0 :   0

Brak korelacji, nie ma powiązania...

H1 :   0

Korelacja istotna, jest powiązanie...

,

Matematyczne techniki zarządzania - 131
Hipotezy te można weryfikować trzema równoważnymi testami:
• testem t Studenta (tylko dla regresji dwu zmiennych)
• testem F Fishera-Snedecora
• testem R Wallace’a-Snedecora

,

W każdym przypadku obliczamy wartość
statystyki dla próbki (tobl, Fobl, Robl) i porównujemy z wartością krytyczną odczytaną z tablicy odpowiedniego rozkładu w
funkcji poziomu istotności i liczby stopni
swobody (ttabl, Ftabl, Rtabl)

Reguła decyzyjna:
• jeżeli |tobl|< ttabl, nie ma podstaw do odrzucenia H0 (brak korelacji)
• jeżeli |tobl|> ttabl, odrzucamy H0 na korzyść H1 (korelacja istnieje)

TAK SAMO DLA
FiR

W przypadku regresji wielorakiej, gdy liczba zmiennych objaśniajacych
jest duża w porównaniu do liczby obserwacji, współczynnik determinacji
R2 może dawać zawyżoną ocenę stopnia wyjaśnienia zmienności zmiennej
objaśnianej; dlatego wprowadzono skorygowany współczynnik determinacji (i korelacji):
 ( yˆ i  y )

R

2

2

k
n

k

1


2
nk 1
(
y

y
)

i
n1

• adjusted coefficient of multiple
determination (wydruki komputerowe)

• jeśli k jest małe, nie ma większej różnicy
pomiędzy normalnym a skorygowanym R2

Matematyczne techniki zarządzania - 132
Skąd wziąć wartość odpowiedniej statystyki dla próbki i jak odczytywać jej wartości z tablic?
n2
r
t

r

t tabl  t  / 2 { n  2 }
TEST STUDENTA
obl
2
sr
1 r

F obl 

TEST FISHERA

Ź ró d ło z m ien n o śc i

MSTR
MSE



R

nk

2

1 R

2

L ic zb a sto p n i
sw o b o d y

Suma
k w a d ra tó w

Ś re d n i
k w a d ra t

M o d el (c z yn n ik i)
B łą d (re sz ta )

k1
nk

SSTR
SSE

MSTR
MSE

R azem

n1

SSTO

TEST WALLACE’A

R obl 

R

2

k 1

F tabl  F { k  1 , n  k }

S ta ty sty k a
F
F obl 

MSTR
MSE

NIE MYLIĆ
STOPNI SWOBODY LICZNIKA I MIANOWNIKA

R tabl  R { k , n  k }

Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

Matematyczne techniki zarządzania - 133
Odczyt Rtabl z tablicy testu R (SKRYPT s.161-162)

, k,  = n-k

S to pn ie
sw ob od y
8
18
28

2
0,05
0,632
0,444
0,361

0,01
0,765
0,561
0,463

L iczb a zm ien n ych
3
0,05
0,01
0,726
0,827
0,532
0,633
0,439
0,530

4
0,05
0,777
0,587
0,490

0,01
0,860
0,678
0,573

Wnioski dotyczące rozkładu R Wallace’a-Snedecora:
• tablica zawiera maksymalne wartości współczynnika korelacji w danej
sytuacji, jakich można oczekiwać, gdy nie ma korelacji w populacji
• im wyższy poziom istotności, tym niższe Rtabl

• im większa liczba zmiennych w modelu, tym wyższe Rtabl
• im wyższa liczba stopni swobody (większa próbka), tym niższe Rtabl
• tablica R powstała z przeliczenia tablic t oraz F (odwrócenie wzorów)
• tablica testu R jest najszybszym i nawygodniejszym narzędziem do
weryfikacji istotności korelacji

Werdykt z etapu I:

Matematyczne techniki zarządzania - 134

• jeżeli Robl>Rtabl, model jest poprawny, można przejść do etapu II
• jeżeli Roblzmiennych objaśniających albo jego postać matematyczną
ETAP I OBOWIĄZUJE DLA WSZYSTKICH MODELI
ETAP I PRZEPROWADZA SIĘ DLA TRANSFORMATY (dla postaci pierwotnej
można uzyskać R>1)
Rola współczynnika determinacji R2
• korelacja może być istotna przy małym R i bardzo małym R2 (r=0,4,
R2=0,16, co oznacza, że tylko 16% zmienności zmiennej Y jest
wyjaśnione przez zmienną objaśniającą)
• małe R2 oznacza niski stopień wyjaśnienia rzeczywistości i stanowi
zagrożenie dla modelu
• należy dążyć (poprzez odpowiedni dobór zmiennych-przyczyn i postaci
matematycznej modelu) do jak największego R2 (dla postaci pierwotnej)
• wysoka wartość R2 świadczy o dobrym poznaniu badanego zjawiska
• wysoka wartość R2 bardzo często wynika jednak ze złego dobrania
zmiennych objaśniających (silnie powiązane ze sobą — „masło maślane”)
KORELACJA POZORNA — jest zależność, ale jej nie ma? Przyczyny...
Trzeba unikać wartości bezwzględnych (ludność, liczba sklepów, wielkość produkcji)

6

9

12

8

11

12

11

15

9

18

9

11

11

18

15

Matematyczne techniki zarządzania - 135
Etap II. Badanie wyrazistości modelu
Y

Wyrazistość modelu dana jest wzorem

s( y )

ui

y

W obl 

s( y )

100 %

y

Celem etapu
jest kontrola
rozrzutu danych

Współczynnik Wobl<30%, w przeciwnym
przypadku rozrzut danych jest zbyt duży

y

Kłopoty: gdyy jest bliskie 0

x

X

Werdykt: model poprawny lub niepoprawny

ETAP II OBOWIĄZUJE DLA WSZYSTKICH MODELI (ale nie ma on charakteru
statystycznego)

ETAP II PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ (sprawdzamy, czy
nie występuje silny efekt „krzywego lustra”)
Etap III. Badanie istotności parametrów (współczynników) modelu
Celem etapu jest sprawdzenie:
• czy poszczególne zmienne objaśniające mają istotny wpływ na zmienną
objaśnianą?
• czy zmienne objaśniające są wybrane prawidłowo?

• czy wyraz wolny różni się istotnie od zera?

Matematyczne techniki zarządzania - 136
Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

Problem istotności parametrów ai można rozpatrywać (tak jak problem
średniej dla populacji) z dwu punktów widzenia:
• przedziału ufności dla nieznanej wartości i

• hipotez — zerowej H0: i=0 i alternatywnej H1: i 0

1
0

ai

1

i

ISTOTNY (W PRZEDZIALE NIE MA ZERA)

0

ai

i

NIEISTOTNY (W PRZEDZIALE JEST ZERO)

P ( a i  t / 2 { n  k } s ( a i )   i  a i  t / 2 { n  k } s ( a i )  1  

Z tablicy rozkładu Studenta, a nie z wydruku komputerowego!

Matematyczne techniki zarządzania - 137
Z m ie n n a
W a rto ś ć
B łą d
S ta ty s ty k a
R ze c zy w is ty p o (c zy n n ik )
o s za c o w an a
o s za c o w an ia
to bl
zio m is to tn o ś c i P
W y ra z w o ln y
a0
s (a 0 )
t(a 0 )
P (a 0 )
C zy n n ik X 1
a1
s (a 1 )
t(a 1 )
P (a 1 )
C zy n n ik X 2
a2
s (a 2 )
t(a 2 )
P (a 2 )
C zy n n ik X 3
a3
s (a 3 )
t(a 3 )
P (a 3 )
2
2
W s p ó łc zy n n iki: d e te rm in a c ji R , zb ie żn o ś c i  , b łąd re s zto w y s (y ) i in n e

W praktyce posługujemy się raczej hipotezami:
Badanie istotności przeprowadza
się dla każdego i oddzielnie:

t obl ( a i ) 

ai  0
s(a i )

t tabl  t  / 2 { n  k }

• jeżeli |tobl(ai)|>ttabl(ai), odrzucamy hipotezę zerową; parametr jest istotny z błędem równym co najwyżej 
• jeżeli |tobl(ai)|parametr nie jest istotny
Praktycznie jest to bardzo łatwe:
• sprawdzamy, czy |t(ai)| jest większe czy mniejsze od około 2, a najlepiej
• porównujemy rzeczywisty poziom istotności P(ai) z przyjętym 
ODRZUCAMY H0, JEŻELI P(ai) JEST MNIEJSZE OD 

WTEDY ZMIENNA
Xi MA WPŁYW NA
ZMIENNĄ Y

Matematyczne techniki zarządzania - 138
W etapie III następuje ostateczna selekcja zmiennych objaśniających:
• jeżeli wszystkie ai okażą się istotne, model jest poprawny:
— model przyczynowo-skutkowy: do interpretacji
— model tendencji rozwojowej: do etapu IV
• jeżeli choć jedno ai okaże się nieistotne, model jest niepoprawny i wymaga poprawy przez usunięcie nieistotnych zmiennych:
— zmienne należy usuwać po jednej (ze względu na efekt katalityczny)
— usuwa się zawsze zmienną o najniższej wartości |t(ai)| [czyli o
najwyższej wartości P(ai)]
— usunięcie ostatniej zmiennej nieistotnej kończy proces selekcji
kandydatek na zmienne,

— selekcja nie jest ostateczna, gdyż zawsze istnieje możliwość zamiany zmiennych, które są powiązane ze sobą
Praktyczne znaczenie istotności wyrazu wolnego a0
To są jedne z możliwości dla populacji (p. plansza 106)

Y

W przypadku funkcji K=f(P) wyraz wolny wyznacza poziom kosztów stałych (rachunkowość zarządcza)
W przypadku zależności technicznej Q=f(h) wyraz
wolny oznacza, że przy miąższości pokładu h=0 wydajność produkcji Q też jest równa 0

0
X

Matematyczne techniki zarządzania - 139
Praktyczne znaczenie istotności współczynnika regresji ai



KRZYWE NEYMANA — PLANSZE 106-107
WSPÓŁCZ. ISTOTNY
WSPÓŁ. NIEISTOTNY

ETAP III OBOWIĄZUJE DLA WSZYSTKICH MODELI
ETAP III PRZEPROWADZA SIĘ DLA TRANSFORMATY
Etap IV. Badanie symetrii składnika losowego

Y

CZĘSTOŚĆ RESZT DODATNICH I UJEMNYCH MA BYĆ
ZBLIŻONA

Y

ASYMETRYCZNY
SYMETRYCZNY

t
t
Badanie symetrii przeprowadza się testem Studenta (St. Bartosiewicz
Ekonometria)
Brak symetrii wymaga zmiany matematycznej postaci modelu
ETAP IV OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ

ETAP IV PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ

Matematyczne techniki zarządzania - 140
Etap V. Badanie losowości składnika losowego

Y

Y
NIELOSOWY

LOSOWY

t
t
Badanie losowości przeprowadza się testem Studenta lub testem serii
(Ekonometria, praca zb. pod red. M. Krzysztofiaka)
Brak losowości wymaga zmiany matematycznej postaci modelu
ETAP V OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP V PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ
Etap VI. Badanie stacjonarności składnika losowego
W etapie tym chodzi o niezależność wariancji składnika losowego od
zmiennej objaśniającej t (plansza 127)

Bada się istotność współczynnika korelacji ru t , t
ETAP VI OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VI PRZEPROWADZA SIĘ DLA TRANSFORMATY

Matematyczne techniki zarządzania - 141
Etap VII. Badanie wartości oczekiwanej składnika losowego
Normalnie, gdy przeprowadzamy estymację postaci liniowej, parametry
składnika losowego E ( )  0
{ ui  0}
V ( )  const
Po retransformacji do postaci pierwotnej mamy nowe reszty u’, dla
których
'
'
ui  0
 ui  0
Celem etapu jest sprawdzenie, czy odchyłka od O nie jest zbyt duża
(służy do tego test Studenta)
ETAP VII OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VII PRZEPROWADZA SIĘ DLA POSTACI PIERWOTNEJ
Etap VIII. Badanie autokorelacji składnika losowego
Pojęcie autokorelacji opisano na planszy 128; chodzi o istotność korelacji ru , u
t

tk

Badanie autokorelacji można przeprowadzić:

• testem R istotności korelacji ru

t

,ut  k

d obl

• testem Durbina-Watsona
NIE MA AUTOK.

d1

?

d2 JEST AUTOKORELACJA

ETAP VIII OBOWIĄZUJE DLA MODELI TENDENCJI ROZWOJOWEJ
ETAP VIII PRZEPROWADZA SIĘ DLA TRANSFORMATY

Matematyczne techniki zarządzania - 142
Etap IX. Badanie normalności składnika losowego
Celem etapu jest stwierdzenie, czy reszty mają rozkład normalny
Analiza reszt — oddzielny dział analizy regresji i korelacji
Jeżeli reszty mają rozkład normalny, statystyk otrzymuje „ulgi”
ETAP 6. PRAKTYCZNA INTERPRETACJA MODELU



Celem etapu jest wydobycie z modelu całej nowej wiedzy, której nie widać
„gołym okiem”
INTERPRETUJĄC MODEL (RÓWNANIE REGRESJI) NALEŻY UŻYWAĆ WYŁĄCZNIE
PROSTEJ TERMINOLOGII EKONOMICZNEJ ZROZUMIAŁEJ DLA KLIENTA
NIE NALEŻY UŻYWAĆ TERMINOLOGII MATEMATYCZNEJ ZROZUMIAŁEJ TYLKO DLA
TWÓRCÓW MODELU
INTERPRETOWAĆ WOLNO TYLKO MODEL ZWERYFIKOWANY
CAŁY TRUD MODELOWANIA NIE MOŻE BYĆ „SZTUKĄ DLA SZTUKI”, LECZ MA
SŁUŻYĆ UZYSKANIU KONKRETNYCH WNIOSKÓW PRAKTYCZNYCH

Interpretacja modelu przyczynowo-skutkowego

Polega ona na określeniu wpływu poszczególnych czynników na badane
zjawisko:
• podział wszystkich czynników na trzy grupy

Matematyczne techniki zarządzania - 143
A — czynniki nie mające wpływu na Y
B — czynniki mające wpływ na Y i wprowadzone do modelu
C — czynniki mające wpływ na Y, ale nie występujące w modelu
• ocena jakościowa wpływu czynników B i C
• ocena ilościowa wpływu czynników B i C
Ocena jakościowa



Na podstawie znaków stojących przy współczynnikach r oraz ai możemy
stwierdzić, że wpływ jest:

• dodatni (im lepsze zaliczenie, tym lepszy wynik egzaminu; im więcej
wydatków na reklamę, tym większy zysk; itd.)
• ujemny (im więcej zatrudnionych, tym gorszy wynik finansowy; im
mniej braków, tym wyższy zysk; im mniejsza absencja, tym wyższe
wynagrodzenie; itd.)

Ocena ilościowa
• model liniowy
Przykład 33. Zinterpretuj zweryfikowany model zależności miesięcznych
kosztów działalności przedsiębiorstwa (tys. zł) od wielkości produkcji
(sztuk) i liczby reklamacji:
y i  50 , 8  14 , 5 x 1  3 , 9 x 2  

Matematyczne techniki zarządzania - 144
a0 = 50,8

poziom kosztów stałych; jeśli firma nie będzie prowadzić
żadnej działalności, poniesie koszty w wysokości 50,8 tys. zł

a1 = 14,5

każda sztuka produktu firmy kosztuje ją przeciętnie 14,5
tys. zł; jeżeli firma zwiększy produkcję o 2 sztuki, koszty
wzrosną o 29,0 tys. zł

a2 = 3,9każda wniesiona reklamacja powiększa koszty przeciętnie o
3,9 tys. zł
• model potęgowy
Przykłąd 34. Zinterpretuj zweryfikowaną funkcję produkcji Cobba-Douglasa
0 , 65

Pi  45 , 2 M i

0 , 73

Zi

e

0 , 04



Funkcja produkcji to specjalny model, określający zależność pomiędzy
produkcją (P) a czynnikami produkcji: majątkiem trwałym (M) i nakładami
robocizny (Z).



Funkcje produkcji to modele umożliwiające „prześwietlenie”
przedsiębiorstwa (szereg czasowy) lub branży (dane przekrojowe) i określenie poziomu gospodarowania oraz postępu
technicznego i organizacyjnego.
Elastyczność  to współczynnik określający reakcję zmiany
jednej zmiennej na inną zmienną — na przykład elastyczność
cenowa popytu (jak popyt zmienia się wraz z ceną towaru).

EKSPERCI
ZACHODNI

Matematyczne techniki zarządzania - 145

 

y
y

:

x

FUNKCJA POTĘGOWA JEST JEDYNĄ FUNKCJĄ O STAŁEJ ELASTYCZNOŚCI

x

Izolinie funkcji produkcji

T1
M

Produkcję P można osiągnąć różnymi
kombinacjami majątku i robocizny:

T2

• T1— technika kapitałochłonna, np.
pełna automatyzacja
• T2 — pośredni poziom techniki

T3
P  const

• T3 — niski poziom techniki, produkcja
pracochłonna
P. LOWE

Z
Efekt poprawy zarządzania bez
zmiany techniki (lepsze wykorzystanie ludzi i sprzętu):

P2
M

ZARZĄDZANIE
TECHNOLOGIĄ

P1

T

• zmniejszenie kapitałochłonności

• zmniejszenie pracochłonności
• zwiększenie produkcji (przejście z
funkcji P1 na P2)

Można też rozpatrzyć łączne efekty
zmiany techniki i zarządzania

Z

Matematyczne techniki zarządzania - 146
Wszystkie informacje tego typu można odczytać w trakcie interpretacji
0 , 65
0 , 73 0 , 04
funkcji produkcji:
Pi  45 , 2 M i
Zi
e

• wartości 45,2 nie interpretuje się
• wartość 0,65 to współczynnik elastyczności majątkowej (kapitałowej)
produkcji: zmiana majątku o 10% daje średnio zmianę produkcji o 6,5%
• wartość 0,73 to współczynnik elastyczności zatrudnieniowej produkcji:
zmiana zatrudnienia o 10% daje zmianę produkcji średnio o 7,3%
• suma obu współczynników k=0,65+0,73=1,38 to współczynnik skali
produkcji:

— jeżeli k<1, to firma rozwija się ekstensywnie
— jeżeli k>1, to firma rozwija się intensywnie
• wartość  = 0,04 to współczynnik postępu organizacyjnego:
— jeżeli  >O, to miał miejsce postęp organizacyjny

— jeżeli  <0, to miał miejsce regres organizacyjny
Interpretacja modelu tendencji rozwojowej

DODAMY
TROCHĘ
TEORII

Przypomnienie: t — zmienna objaśniająca (stałe przyrosty)
y — zmienna objaśniana; rozdzielana w ogólności na trzy
części: trend, wahania okresowe, wahania losowe ()

Matematyczne techniki zarządzania - 147
Wykres z planszy 117 (zużycie energii elektrycznej przez WZ AGH)
WAHANIA OKRESOWE OKREŚLA SIĘ WZGLĘDEM TRENDU A
NIE WZGLĘDEM OSI CZASU

y

trend

t
1995

1996

1997

1998

1999

Te trzy części trzeba zidentyfikować, a potem złożyć razem w model:

• addytywny (jeśli amplituda wahań jest stała)
• multiplikatywny (jeśli amplituda wahań rośnie lub maleje regularnie)
Wyznaczanie trendu
Metody mechaniczne:

• wskaźniki bezwzględne (stały przyrost =
postęp arytmetyczny = funkcja liniowa)
• wskaźniki względne (przyrost o stały procent =
postęp geometryczny = funkcja potęgowa)
• średnia ruchoma (wygładzanie danych linią łamaną)

JAK OBLICZYĆ O
ILE PROCENT ROCZNIE SPADAŁA
ŚREDNIO LICZBA
WIDZÓW W
KINACH:
1982 - 193,7 MLN
1989 - 141,3 MLN

Matematyczne techniki zarządzania - 148
Średnia ruchoma: mając szereg czasowy y1, y2,....., yn, przyjmujemy
długość kroku k = 3, lub 5, lub 7 itd. i liczymy
y  ...  y k
y  ...  y k  1
y k / 2 0 ,5  1
a następnie y k / 2  1 , 5  2
itd.
k
k
y  y2  y3
y  y3  y4
dla k=3:
y2  1
y3  2
itd.
3
3
Przykład 35. Wyznacz trend metodą średniej ruchomej dla następujących
danych:
okres
t
wartość yt

1
5

2
4

3
7

4
6

5
8

12

y2 
10

y3 

y

8

y4 

6
4

y5 

2

y6 

0
0

1

2

3

4

5

czas, t

6

7

8

9

y7 

547

6
10

 5 , 67

CECHY
ŚREDNIEJ
RUCHOMEJ:

 7 , 00

• TRACI SIĘ
k-1 DANYCH

3
768

8
8

 5 , 33

3
476

7
9

3
6  8  10

 8 , 00

3
8  10  9

 9 , 00

3
10  9  8

 9 , 00

• IM
WIĘKSZE k,
TYM
BARDZIEJ
SZTYWNY
TREND

3

Metody statystyczne: analiza regresji i korelacji, różne funkcje oparte na
modelach ekonomii

Matematyczne techniki zarządzania - 149
Wyznaczanie wahań okresowych: dobowych, tygodniowych, miesięcznych,
kwartalnych, rocznych, wieloletnich
Trzy metody:

— metoda wskaźników sezonowości
— metoda zmiennych zero-jedynkowych (0-1)

— metoda harmoniczna
Wszystkie metody mają jeden cel:
uzyskanie przeciętnego obrazu jednego cyklu

+

Ws
[t ]
[%]
trend

I

II



III

IV

WADY:
• KONIECZNOŚĆ
KOREKTY
• BRAK
WERYFIKACJI
STATYSTYCZNEJ

Metoda wskaźników sezonowości

• obliczenie surowych wskaźników sezonowości (wyeliminowanie trendu):
y

S s  yt  yt
S s  t
yt
addytywny multiplikatywny
wynik: n wartości odchyleń od trendu

• obliczenie oczyszczonych wskaźników
sezonowości (wyeliminowanie wahań
losowych):
 Ss
So 
k-liczba okresów
k
jednoimiennych
m-długość cyklu wynik: m wartości śr. odchyleń od trendu

Matematyczne techniki zarządzania - 150
Metoda zmiennych zero-jedynkowych (0-1)
m

y t  a 0  a1 t   bi Q i  
i 1

bi — przeciętne odchylenie od trendu dla
okresu i-tego
Qi — zmienna 0-1

wahania losowe
trend

wahania okresowe

t
1
2
3
4
5
6
7
8
9

yt
y1
y2
y3
y4
y5
y6
y7
y8
y9

Q1
1
0
0
0
1
0
0
0
1

Q2
0
1
0
0
0
1
0
0
0

Q3
0
0
1
0
0
0
1
0
0

Q4
0
0
0
1
0
0
0
1
0

Metoda harmoniczna (szeregi Fouriera)
Wahania okresowe przedstawia się jako sumę określonej liczby drgań harmonicznych (sinusoid i cosinusoid) przesuniętych w fazie, lecz o jednakowym okresie
m /2
2 i m / 2
2 i
y t  a 0  a 1 t   b1 i sin
  b 2 i cos

m
m
i 1
i 1
Obie metody dają taki sam wynik, istnieje możliwość weryfikacji
statystycznej
W metodzie 0-1 dostajemy bi = Ws, natomiast w metodzie harmonicznej Ws
jest sumą wartości poszczególnych sinusoid dla danego momentu czasu