Regresijska analiza

Download Report

Transcript Regresijska analiza

Doc. dr. sci. Darko Datzer
Uvod
 Korelacijska analiza je vrlo smislena i često sasvim
dovoljna; no, ponekad želimo iz podataka jedne
varijable zaključiti koji joj rezultat najvjerojatnije
odgovara u drugoj varijabli
 Varijabla iz koje predviđamo vrijednost druge se naziva
prediktor, a ona čiju vrijednost predviđamo ovisna
Uvod
 Odnos između varijabli x i y definiramo kao skup svih
vrijednosti koje označava zadana jednadžba y = α+ βx, gdje
su α i β konstante, a x i y predstavljaju varijable čiji se
odnos može definirati različitim vrijednostima x i y koji
zadovoljava dana jednadžba
 U analizama je najveći problem kako izračunati parametre
regresije (α i β); u statističkoj praksi najčešće se
primjenjuju tri metode, od kojih je nama najzanimljivija
metoda najmanjih kvadrata
 Ona kreira pravac regresije koji ima najmanju sumu
kvadrata odstupanja pojedinačnih y rezultata od tog pravca
Uvod (primjer)
Pretpostavke multiple regresije
 Četiri temeljne pretpostavke:
 između ovisnih i neovisnih varijabli postoji linearan
odnos;
 b) ovisna varijabla mora biti neprekidna ili barem
intervalna (mjerena na kvantitativnoj skali);
 c) empirijska odstupanja oko regresijske površine
moraju biti ista za sve vrijednosti neovisnih varijabli
(homoskedastičnost) i
 d) između parova podataka, tj. empirijskih vrijednosti
varijabli ne bi smjelo biti korelacije
Implementacija linearne
regresije u SPSS-u
 Inicijalna razmatranja vezana za primjenu modela
 Veličina uzorka
 Dummy varijable
 Implementacija Regresijskog Modela u SPSS-u
 Analiza SPSS outputa
Pretpostavke za primjenu modela
prema A. Fieldu
 Tipovi varijabli
 Varijansa različita od nule
 Odsustvo perfektne multikolinearnosti
 Zavisne varijable ne trebaju biti korelirane sa vanjskim
varijablama
 Homoskedastičnost
 Neovisne greške (odsustvo autokorelacije)
 Normalno distribuirane greške
 Nezavisnost
 Linearnost
Tipovi varijabli
 Neovisne varijable trebaju biti:
 Kvantitativne, ili
 Kategoričke s dvije kategorije
 Ovisne varijable trebaju biti
 Kvantitativne
 Kontinuirane
 Neograničene (u smislu čitavog opsega predviđanja )
Veličina uzorka
 Postoji više kriterija
 Što veći uzorak, to bolje
 10 do 15 slučajeva za svaku neovisnu varijablu (najčešće)
 50+8*k (Green – testiranje čitavog modela)
 104+k (Green – testiranje svih ovisnih varijabli)
 100 (dobar model - ovisne varijable dobro objašnjavaju ovisnu)
 200 (model srednjeg kvaliteta)
 600 (loš model - ovisne varijable loše objašnjavaju ovisnu)
Dummy varijable
 Kategoričke varijable s dvije kategorije
 Vrijednosti su 0 i 1
 Primjer: transformacija varijable Obrazovanje
Implementacija Regresijskog
Modela u SPSS-u
Analyse
Regression
Linear...