Regresijska analiza
Download
Report
Transcript Regresijska analiza
Doc. dr. sci. Darko Datzer
Uvod
Korelacijska analiza je vrlo smislena i često sasvim
dovoljna; no, ponekad želimo iz podataka jedne
varijable zaključiti koji joj rezultat najvjerojatnije
odgovara u drugoj varijabli
Varijabla iz koje predviđamo vrijednost druge se naziva
prediktor, a ona čiju vrijednost predviđamo ovisna
Uvod
Odnos između varijabli x i y definiramo kao skup svih
vrijednosti koje označava zadana jednadžba y = α+ βx, gdje
su α i β konstante, a x i y predstavljaju varijable čiji se
odnos može definirati različitim vrijednostima x i y koji
zadovoljava dana jednadžba
U analizama je najveći problem kako izračunati parametre
regresije (α i β); u statističkoj praksi najčešće se
primjenjuju tri metode, od kojih je nama najzanimljivija
metoda najmanjih kvadrata
Ona kreira pravac regresije koji ima najmanju sumu
kvadrata odstupanja pojedinačnih y rezultata od tog pravca
Uvod (primjer)
Pretpostavke multiple regresije
Četiri temeljne pretpostavke:
između ovisnih i neovisnih varijabli postoji linearan
odnos;
b) ovisna varijabla mora biti neprekidna ili barem
intervalna (mjerena na kvantitativnoj skali);
c) empirijska odstupanja oko regresijske površine
moraju biti ista za sve vrijednosti neovisnih varijabli
(homoskedastičnost) i
d) između parova podataka, tj. empirijskih vrijednosti
varijabli ne bi smjelo biti korelacije
Implementacija linearne
regresije u SPSS-u
Inicijalna razmatranja vezana za primjenu modela
Veličina uzorka
Dummy varijable
Implementacija Regresijskog Modela u SPSS-u
Analiza SPSS outputa
Pretpostavke za primjenu modela
prema A. Fieldu
Tipovi varijabli
Varijansa različita od nule
Odsustvo perfektne multikolinearnosti
Zavisne varijable ne trebaju biti korelirane sa vanjskim
varijablama
Homoskedastičnost
Neovisne greške (odsustvo autokorelacije)
Normalno distribuirane greške
Nezavisnost
Linearnost
Tipovi varijabli
Neovisne varijable trebaju biti:
Kvantitativne, ili
Kategoričke s dvije kategorije
Ovisne varijable trebaju biti
Kvantitativne
Kontinuirane
Neograničene (u smislu čitavog opsega predviđanja )
Veličina uzorka
Postoji više kriterija
Što veći uzorak, to bolje
10 do 15 slučajeva za svaku neovisnu varijablu (najčešće)
50+8*k (Green – testiranje čitavog modela)
104+k (Green – testiranje svih ovisnih varijabli)
100 (dobar model - ovisne varijable dobro objašnjavaju ovisnu)
200 (model srednjeg kvaliteta)
600 (loš model - ovisne varijable loše objašnjavaju ovisnu)
Dummy varijable
Kategoričke varijable s dvije kategorije
Vrijednosti su 0 i 1
Primjer: transformacija varijable Obrazovanje
Implementacija Regresijskog
Modela u SPSS-u
Analyse
Regression
Linear...