Korelacija_i_regresija
Download
Report
Transcript Korelacija_i_regresija
KORELACIJSKA I REGRESIJSKA
ANALIZA
prof. dr. sc. Nikola Šakić
Planiranje i analiza pokusa
Zagreb, 18. i 19. svibnja 2010.
Osnovni pojmovi
• KORELACIJA
– međusobna uzajamna povezanost među pojavama
varijablama (eng. correlation)
• VRSTE KORELACIJA
– jednostruka, višestruka
– linearna, nelinearna
– pozitivna, negativna
• MJERENJE JAČINE POVEZANOSTI
– koeficijent korelacije, (r)
– koeficijent determinacije R2
Planiranje i analiza pokusa
Zagreb, 18. i 19. svibnja 2010.
• prikaz rasprostiranja podataka
– grafički prikaz podataka u x,y dijagramu
y
r=0
y
y
r = 0,8
x
• između varijable x i y
nema povezanosti
Planiranje i analiza pokusa
• pozitivna povezanost
porast varijable x
porast varijable y
r = – 0,8
x
• negativna povezanost
porast varijable x
smanjenje varijable y
Zagreb, 18. i 19. svibnja 2010.
• Regresija
– izračun matematičkog modela povezanosti (utjecaja) varijable x
(uzroka) i varijable y (posljedice): y = f(x)
– oblici regresije – linearna, nelinearna
y
y
y b0 b1 x b2 x 2
y b0 b1 x
x
x
y
y
y b0 x b
y b0 b1 x
b2 x 2 b3 x3
x
Planiranje i analiza pokusa
x
Zagreb, 18. i 19. svibnja 2010.
• višestruka linearna regresija:
– x1, x2, ... , xk – nezavisne varijable (uzroci)
– y
– zavisna varijabla (posljedica)
y
y b0 b1 x1 b2 x2 ...
x1
x2
Planiranje i analiza pokusa
Zagreb, 18. i 19. svibnja 2010.
Utvrđivanje korelacije
• koeficijent korelacije (linearne):
n
r
(x x ) ( y y)
i
i 1
i
n
n
( x x ) ( y y )
2
i 1
sxy
i
i 1
2
sxy
sx2 s y2
i
n
1
( xi x ) ( yi y ) 2 kovarijanca varijabli x i y
n 1 i 1
1 n
s
( xi x )2
n 1 i 1
2
x
nepristrana procjena varijance varijable x
1 n
s
( yi y )2
nepristrana procjena varijance varijable y
n 1 i 1
n broj parova podataka ( xi , yi ), i 1, 2, , n
2
y
1 r 1
Planiranje i analiza pokusa
Zagreb, 18. i 19. svibnja 2010.
• značenje koeficijenta korelacije uzorka, r:
– r predstavlja nepristranu procjenu koeficijenta korelacije
osnovnog skupa (populacije),
( x, y )
kovarijanca ( x, y)
varijanca ( x) varijanca ( y) x y
Planiranje i analiza pokusa
Zagreb, 18. i 19. svibnja 2010.
Testiranje hipoteza u vezi r i
• u slučaju = 0 → koeficijent
korelacije r ponaša se kao
varijabla Studentove t-razdiobe
s k = n – 2 stup. sl.:
t
f (r )
–1
r n2
1 r2
0
r
+1
0.8
f (r )
• u slučaju ≠ 0 → koristiti
z-transformaciju
–1
Planiranje i analiza pokusa
+1
r
Zagreb, 18. i 19. svibnja 2010.
Koeficijent determinacije
SKOREGRESIJE
R
SKOUKUPNO
suma kvadrata odstupanja
objašnjena regresijskom funkcijom
2
suma kvadrata odstupanja
podataka od aritmetičke sredine
n
SKOREGRESIJE
R
SKOUKUPNO
2
2
ˆ
(
y
y
)
i
i 1
n
2
(
y
y
)
i
i 1
0 R2 1
Planiranje i analiza pokusa
Zagreb, 18. i 19. svibnja 2010.
y
20
( xi , yi )
( yi yˆ )
15
yˆ reg . b0 b1 x
( yi y )
( yˆ y )
10
y 9
5
0
5
Planiranje i analiza pokusa
10
x 14
15
20
xi
yi
6
2
10
5
10
7
18
11
20
17
20
12
x 14
y 9
x
Zagreb, 18. i 19. svibnja 2010.
n
n
(x x ) 0
i 1
n
(x x )
i 1
( y y) 0
i
i
2
i
i 1
n
( y y)
184
2
i
i 1
146
n
( x x ) ( y y ) 154
i 1
R2
i
i
2
154
0.883
184 146
koeficijent determinacije
r R 2 0.883 0.94
koeficijent korelacije
značajnost koef. korelacije:
H0 : 0
H1 : 0
t
Planiranje i analiza pokusa
r n2
1 r
2
0.94 8
1 0.94
2
7.793
Zagreb, 18. i 19. svibnja 2010.
Regresijska jednadžba
•
yˆi b0 b1 xi
yi 0 1xi i
i slučajno odstupanje ( yi yˆi )
n
• koeficijenti (b0, b1) određuje se iz uvjeta: ( yi yˆi )2 MINIMUM
i 1
• b1 (koeficijent smjera pravca)
b1
• b0 (odsječak na y osi)
Planiranje i analiza pokusa
n
SKOxy
SKOxx
(x x ) ( y y)
i 1
i
i
n
2
(
x
x
)
i
i 1
b0 y b1 x
Zagreb, 18. i 19. svibnja 2010.
• za primjer: (xi: 6, 10, 10, 18, 20, 20);(yi: 2, 5, 7, 11, 17, 12)
y
20
154
0.837
184
b0 9 0.837 14 2.72
b1
15
yˆi : 2.30, 5.65, 5.65,
12.346, 14.02, 14.02
10
y 9
yˆi 2.72 0.837 xi
5
0
5
10
x 14
15
20
x
-2.72
Planiranje i analiza pokusa
Zagreb, 18. i 19. svibnja 2010.