Korelacija_i_regresija

Download Report

Transcript Korelacija_i_regresija

KORELACIJSKA I REGRESIJSKA
ANALIZA
prof. dr. sc. Nikola Šakić
Planiranje i analiza pokusa
Zagreb, 18. i 19. svibnja 2010.
Osnovni pojmovi
• KORELACIJA
– međusobna uzajamna povezanost među pojavama 
varijablama (eng. correlation)
• VRSTE KORELACIJA
– jednostruka, višestruka
– linearna, nelinearna
– pozitivna, negativna
• MJERENJE JAČINE POVEZANOSTI
– koeficijent korelacije, (r)
– koeficijent determinacije R2
Planiranje i analiza pokusa
Zagreb, 18. i 19. svibnja 2010.
• prikaz rasprostiranja podataka
– grafički prikaz podataka u x,y dijagramu
y
r=0
y
y
r = 0,8
x
• između varijable x i y
nema povezanosti
Planiranje i analiza pokusa
• pozitivna povezanost
porast varijable x 
porast varijable y
r = – 0,8
x
• negativna povezanost
porast varijable x 
smanjenje varijable y
Zagreb, 18. i 19. svibnja 2010.
• Regresija
– izračun matematičkog modela povezanosti (utjecaja) varijable x
(uzroka) i varijable y (posljedice): y = f(x)
– oblici regresije – linearna, nelinearna
y
y
y  b0  b1  x  b2  x 2
y  b0  b1  x
x
x
y
y
y  b0  x b
y  b0  b1  x 
 b2  x 2  b3  x3
x
Planiranje i analiza pokusa
x
Zagreb, 18. i 19. svibnja 2010.
• višestruka linearna regresija:
– x1, x2, ... , xk – nezavisne varijable (uzroci)
– y
– zavisna varijabla (posljedica)
y
y  b0  b1  x1  b2  x2  ...
x1
x2
Planiranje i analiza pokusa
Zagreb, 18. i 19. svibnja 2010.
Utvrđivanje korelacije
• koeficijent korelacije (linearne):
n
r
(x  x )  ( y  y)
i
i 1
i
n
n
 ( x  x )  ( y  y )
2
i 1
sxy 

i
i 1
2
sxy
sx2  s y2
i
n
1
( xi  x )  ( yi  y ) 2  kovarijanca varijabli x i y

n  1 i 1
1 n
s 
( xi  x )2

n  1 i 1
2
x
 nepristrana procjena varijance varijable x
1 n
s 
( yi  y )2
 nepristrana procjena varijance varijable y

n  1 i 1
n  broj parova podataka ( xi , yi ), i  1, 2, , n
2
y
1  r  1
Planiranje i analiza pokusa
Zagreb, 18. i 19. svibnja 2010.
• značenje koeficijenta korelacije uzorka, r:
– r predstavlja nepristranu procjenu koeficijenta korelacije
osnovnog skupa (populacije), 
 ( x, y )
kovarijanca ( x, y)


varijanca ( x)  varijanca ( y)  x   y
Planiranje i analiza pokusa
Zagreb, 18. i 19. svibnja 2010.
Testiranje hipoteza u vezi r i 
• u slučaju  = 0 → koeficijent
korelacije r ponaša se kao
varijabla Studentove t-razdiobe
s k = n – 2 stup. sl.:
t 
f (r )
–1
r n2
1 r2
 0
r
+1
  0.8
f (r )
• u slučaju  ≠ 0 → koristiti
z-transformaciju
–1
Planiranje i analiza pokusa
+1
r
Zagreb, 18. i 19. svibnja 2010.
Koeficijent determinacije
SKOREGRESIJE
R 
SKOUKUPNO
suma kvadrata odstupanja
objašnjena regresijskom funkcijom
2
suma kvadrata odstupanja
podataka od aritmetičke sredine
n
SKOREGRESIJE
R 

SKOUKUPNO
2
2
ˆ
(
y

y
)
 i
i 1
n
2
(
y

y
)
 i
i 1
0  R2  1
Planiranje i analiza pokusa
Zagreb, 18. i 19. svibnja 2010.
y
20
( xi , yi )
( yi  yˆ )
15
yˆ reg .  b0  b1  x
( yi  y )
( yˆ  y )
10
y 9
5
0
5
Planiranje i analiza pokusa
10
x  14
15
20
xi
yi
6
2
10
5
10
7
18
11
20
17
20
12
x  14
y 9
x
Zagreb, 18. i 19. svibnja 2010.
n
n
 (x  x )  0
i 1
n
 (x  x )
i 1
( y  y)  0
i
i
2
i
i 1
n
( y  y)
 184
2
i
i 1
 146
n
 ( x  x )  ( y  y )  154
i 1
R2 
i
i
2
154
 0.883
184 146
koeficijent determinacije
r   R 2   0.883  0.94
koeficijent korelacije
značajnost koef. korelacije:
H0 :   0
H1 :   0
t 
Planiranje i analiza pokusa
r n2
1 r
2

0.94  8
1  0.94
2
 7.793
Zagreb, 18. i 19. svibnja 2010.
Regresijska jednadžba
•
yˆi  b0  b1  xi
yi  0  1xi   i
 i  slučajno odstupanje ( yi  yˆi )
n
• koeficijenti (b0, b1) određuje se iz uvjeta: ( yi  yˆi )2  MINIMUM
i 1
• b1 (koeficijent smjera pravca)
b1 
• b0 (odsječak na y osi)
Planiranje i analiza pokusa
n
SKOxy
SKOxx

 (x  x )  ( y  y)
i 1
i
i
n
2
(
x

x
)
 i
i 1
b0  y  b1  x
Zagreb, 18. i 19. svibnja 2010.
• za primjer: (xi: 6, 10, 10, 18, 20, 20);(yi: 2, 5, 7, 11, 17, 12)
y
20
154
 0.837
184
b0  9  0.837 14  2.72
b1 
15
yˆi : 2.30, 5.65, 5.65,
12.346, 14.02, 14.02
10
y 9
yˆi  2.72  0.837  xi
5
0
5
10
x  14
15
20
x
-2.72
Planiranje i analiza pokusa
Zagreb, 18. i 19. svibnja 2010.