Korelacijska analiza

Download Report

Transcript Korelacijska analiza

Doc. dr. sci. Darko Datzer
Uvod
 Često opažamo da dvije pojave pokazuju međusobnu
ovisnost, povezanost, asocijaciju (npr. viši ljudi su u
prosjeku teži od nižih, lošiji ekonomski status
nerijetko implicira lošije zdravstveno stanje, itd.)
Uvod
 Korelacijska analiza je statističko sredstvo koje služi za
ispitivanje jakosti linearne veze između dvaju varijabli, i
ona daje matematički okvir koji izražava povezanost
između obilježja
 Korelacijom se mogu odrediti varijacije obilježja dvaju
raspona podataka, tj.:
 jesu li velike vrijednosti jednog skupa pridružene velikim
vrijednostima drugoga (pozitivna korelacija)
 jesu li male vrijednosti jednog skupa pridružene velikim
vrijednostima drugoga (negativna korelacija), odnosno
 jesu li vrijednosti u oba skupa nepovezane (korelacija blizu
0).
Svojstva korelacije
 Bitna svojstva koeficijenta korelacije su:
 a)-1 ≤ r ≤ 1
 b) koeficijent korelacije r i nagib pravca regresije b1
imaju isti predznak
 c) ako je vrijednost koeficijenta korelacije r blizu nule
ili jednaka nuli, to znači da je veza između varijabli x i
y slaba ili ne postoji; što je vrijednost koeficijenta
korelacije bliža ili jednaka 1 ili -1, to je veza između
varijabli x i y jača
Vrste koeficijenata korelacije
 Koeficijent korelacije je numerička vrijednost kojom se
izražava stupanj povezanosti dvije društvene pojave
Pearsonov koeficijent korelacije r
Rang korelacija ρ (Ro)
Point-biserijalni koeficijent korelacije
Interpretiranje koeficijenta
korelacije
 Da li ćemo korelaciju proglasiti visokom ili niskom,
ovisi o nizu faktora
 Ako je istraživanje provedeno na velikom broju
slučajeva, kao aproksimacija visine povezanosti služi
sljedeća tablica:
 r od 0,00 do ± 0,20 znači nikakvu ili neznatnu povez.
 r od 0,20 do ± 0,40 znači laku povezanost
 r od 0,40 do ± 0,70 znači stvarnu značajnu povezanost
 r od 0,70 do ± 1,00 znači visok ili vrlo visoku povez.
Koeficijent determinacije
 Česta pogreška u interpretaciji koeficijenta korelacije
je da se njegova vrijednost interpretira kao postotak
zajedničkih faktora; to nije tačno- približno se količina
zajedničkih faktora određuje uz pomoć koeficijenta
determinacije (kvadriranjem koeficijenta korelacije)
Računanje korelacijeu SPSS-u
 Pearson-ov koeficijent linearne korelacije
 Spearman-ov koeficijent korelacije
 Kendall’s tau-b koeficijent korelacije
Pearson-ov koeficijent linearne korelacije
 Ratio i intervalne skale
 Obje varijable trebaju imati normalne distribucije
 Osjetljiv na ekstremne vrijednosti (outliers)
Spearman-ov koeficijent korelacije
 Ratio i intervalne skale – normalna distribucija nije
uslov za računanje ovog koeficijenta
 Ordinalne varijable
Kendall’s tau-b koeficijent korelacije
 Isti uslovi kao i kod Spearman-ovog koeficijenta
korelacije
 Koristi se kod malih uzoraka s velikim brojem rangova
gdje većina observacija spada u jedan rang
Korištenje padajćih menija u SPSS-u
Analyze
Correlate
Bivariate...
Pearson-ov koeficijent - output
Spearman-ov koeficijent - output
Kendall’s tau-b koeficijent – output