Faktorska analiza - Learnadaptive.com

Download Report

Transcript Faktorska analiza - Learnadaptive.com

Matematički institut SANU
FAKTORSKA ANALIZA
Lazar Velimirović, Miodrag Đorđević,
Miomir Stanković, Zoran Ognjanović
Faktorska analiza
Opis međusobne zavisnosti velikog broja promenljivih
korišćenjem manjeg broja osnovnih, ali neopažljivih
slučajnih promenljivih poznatih kao faktori, metodom
višedimenzionalne (multivarijacione) analize, naziva se
faktorska analiza.
Faktorska analiza
Opšta svrha faktorsko analitičkih tehnika je pronalaženje
načina da se sažmu informacije sadržane u velikom broju
originalnih promenljivih, u manji skup novih, kompozitnih
dimenzija ili varijanti (faktora), uz minimalni gubitak
informacija.
Faktorska analiza
Tabela 1. Orginalna korelaciona matrica
V1
V2
V3
V4
V5
V6
V7
V8
V1 Cenovni nivo
1.000
V2 Osoblje radnje
0,427
1.000
V3 Politika
reklamacije
0,302
0,771
1.000
V4 Dostupnost
proizvoda
0,470
0,497
0,427
1.000
V5 Kvalitet
proizvoda
0,765
0,406
0,307
0,472
1.000
V6 Dubina
asortimana
0,281
0,445
0,423
0,713
0,325
1.000
V7 Širina
asortimana
0,354
0,490
0,471
0,719
0,378
0,724
1.000
V8 Usluga u
radnji
0,242
0,719
0,733
0,428
0,240
0,311
0,435
1.000
V9 Atmosfera u
radnji
0,372
0,737
0,774
0,479
0,326
0,429
0,466
0,710
V9
1000
Faktorska analiza
Tabela 2. Korelaciona matrica nakon grupisanja promenljivih u faktore
V3
V8
V9
V2
V6
V7
V4
V1
V3 Politika
reklamacije
1.000
V8 Usluga u
radnji
0,733
1.000
V9 Atmosfera u
radnji
0,774
0,710
1.000
V2 Osoblje
radnje
0,741
0,719
0,787
1.000
V6 Dubina
asortimana
0,423
0,311
0,429
0,445
1.000
V7 Širina
asortimana
0,471
0,435
0,468
0,490
0,724
1.000
V4 Dostupnost
proizvoda
0,427
0,428
0,479
0,497
0,713
0,719
1.000
V1 Cenovni
nivo
0,302
0,242
0,372
0,427
0,281
0,354
0,470
1.000
V5 Kvalitet
proizvoda
0,307
0,240
0,326
0,406
0,325
0,378
0,472
0,765
iskustvo kupaca u radnji
ponuda proizvoda
vrednost
V5
1.000
Faze u faktorskoj analizi
 Proces odlučivanja u faktorskoj analizi sastoji se od šest
faza, plus dodatna faza (faza 7):
1. Ciljevi faktorske analize
2. Dizajniranje faktorske analize
3. Pretpostavke u faktorskoj analizi
4. Izvodjenje faktora i procenjivanje opšteg uklapanja
5. Interpretiranje faktora
6. Potvrda faktorske analize
7. Dodatne upotrebe rezultata faktorske analize
Ciljevi faktorske analize
 Tehnikom faktorske analize može se ostvariti jedan od dva
cilja:
1. Identifikovanje strukture kroz sumarizaciju podataka
2. Redukcija podataka
Ciljevi faktorske analize
Identifikovanje strukture kroz sumarizaciju podataka
Faktorska analiza može identifikovati strukturu odnosa
među promenljivima ili respondentima, putem ispitivanja
korelacija između promenljivih ili korelacija među
respondentima. Ovo je najčešći tip faktorske analize i zove se
R faktorska analiza.
R faktorska analiza analizira skup promenljivih da bi se
identifikovale dimenzije koje su latentne (ne opažaju se
lako).
Ciljevi faktorske analize
Identifikovanje strukture kroz sumarizaciju podataka
Faktorska analiza se takodje može primeniti na korelacionu
matricu individualnih respondenata na bazi njihovih
karakteristika. To se zove Q faktorska analiza.
Pristup Q faktorske analize se ne koristi baš često, zbog
računskih teškoća.
Ciljevi faktorske analize
Redukcija podataka
Redukcija podataka se vrši na dva načina:
1. Identifikovati reprezentativne promenljive iz mnogo većeg
skupa
promenljivih,
za
upotrebu
u
narednim
multivarijacionim analizama
2. kreirati potpuno nov skup promenljivih, brojčano mnogo
manji, da delimično ili potpuno zameni originalni skup
promenljivih
U oba slučaja, svrha je zadržati prirodu i karakter originalnih
promenljivih, ali redukovati njihov broj da bi se pojednostavila
analiza.
Dizajniranje faktorske analize
Dizajn faktorske analize uključuje tri osnovne odluke:
1. kalkulaciju ulaznih podataka (korelaciona matrica) da bi se
zadovoljili zadati ciljevi grupisanja promenljivih ili
respondenata
2. dizajn studije u smislu broja promenljivih, mernih odlika
promenljivih, i tipova dopustljivih promenljivih
3. potrebnu veličinu uzorka.
Dizajniranje faktorske analize
Formiranje korelacione matrica
Prva odluka u procesu faktorske analize odnosi se na način
na koji će korelaciona matrica biti formirana (u zavisnosti od
svrhe istraživanja), kao i koji ce tip analize (R ili Q tip) biti
primenjen.
Dizajniranje faktorske analize
Pitanja selekcije i merenja promenljivih
Za promenljive za faktorsku analizu se generalno
pretpostavlja da su metričke mere. U nekim slučajevima, se
mogu koristiti veštačke promenljive (obeležene 0-1) iako se
one smatraju nemetričkim. Ako su sve promenljive, veštačke
promenljive, onda su adekvatnije specijalizovane forme
faktorske analize, kao što je Boolean faktorska analiza.
Istraživač treba takođe da pokuša da minimizira broj
uključenih promenljivih, ali da ipak održi razuman broj
promenljivih po faktoru.
Dizajniranje faktorske analize
Veličina uzorka
Opšte pravilo: što veći uzorak, to bolji rezultati
U malim uzorcima, koeficijenti korelacije između
promenljivih manje su pouzdani, pa su i dobijeni rezultati
lošiji
Najmanji broj uzoraka oko 300
Ukoliko rešenja imaju nekoliko promenljivih velike težine
(iznad 0.8), dovoljan broj uzoraka je 150
Zahtevana veličina uzoraka se sve više smanjuje kako se s
godinama ta tema sve više istražuje
Dizajniranje faktorske analize
Veličina uzorka
Nije toliko važna veličina uzorka već količnik broja učesnika
i broja promenljivih
Preporučuje se količnik 10 prema 1, tj. deset slučajeva
(opservacija) za svaku stavku koju treba faktorski analizirati
U većini slučajeva dovoljno je pet opservacija po stavki
Pretpostavke u faktorskoj analizi
Konceptualne pretpostavke koje se nalaze u osnovi faktorske
analize, u vezi su sa skupom selektovanih promenljivih i
odabranim uzorkom. Osnovna pretpostavka faktorske
analize je da u skupu selektovanih promenljivih postoji neka
osnovna struktura. Odgovornost je istraživača da osigura da
su uočene šeme konceptualno validne i adekvatne za
proučavanje sa faktorskom analizom. Npr. mešanje zavisnih
i nezavisnih promenljivih u jednoj faktorskoj analizi i onda
korišćenje izvedenih faktora da podrže odnose zavisnosti, je
neprikladno. Istraživač mora takođe da osigura da je uzorak
homogen u pogledu osnovne faktorske strukture.
Pretpostavke u faktorskoj analizi
Da bi se opravdala primena faktorske analize, istraživač
mora da osigura da matrica podataka ima dovoljno
korelacija. Jačina korelacije među promenljivama i
opravdanost primene faktorske analize se moze odrediti
pomoću dva testa:
1. Bartletov test sferičnosti - primena faktorske analize je
opravdana ako je p<0.05
2. Kajzer-Mejer-Olkinov pokazatelj adekvantosti uzoraka –
najmanji iznos prihvatljiv za dobru faktorsku analizu je 0.6
Izvodjenje faktora i procenjivanje opšteg uklapanja
Kada se promenljive specifikuju i korelaciona matrica
pripremi, istraživač je spreman da primeni faktorsku
analizu da identifikuje osnovnu strukturu odnosa. Pri tome,
moraju se doneti odluke u vezi metoda izdvajanja
(ekstrahovanja) faktora i broja faktora odabranih da
predstavljaju osnovnu strukturu u podacima. Selekcija
metoda izdvajanja faktora zavisi od cilja istraživača.
Izvodjenje faktora i procenjivanje opšteg uklapanja
Istraživač može da koristi dva osnovna modela da dođe do
faktorskih rešenja:
1. Faktorska analiza u užem smislu – indentifikuje osnovne
faktore koji odražavaju zajedničke karakteristike
promenljivih
2. Komponenetna analiza - sumira većinu originalnih
informacija u minimalan broj faktora za svrhe
predvidjanja
Izvodjenje faktora i procenjivanje opšteg uklapanja
Izbor modela (metoda izdvajanja) zavisi od:
1. Ciljeva faktorske analize
2. Obima prethodnog znanja o promenljivama
 Kada je doneta odluka o faktorskom modelu, istraživač je
spreman da izdvoji inicijalne nerotirane faktore.
Ispitivanjem nerotirane faktorske matrice, istraživač može
da istraži mogućnosti redukcije podataka za skup
promenljivih, i dobije preliminarnu procenu broja faktora
za izdvajanje.
Izvodjenje faktora i procenjivanje opšteg uklapanja
Kriterijumi za broj faktora za izdvajanje (ekstrakciju)
1.
2.
3.
4.
5.
Kriterijum latentnog korena
A priori kriterijum
Kriterijum procenta varijanse
Kriterijum skri (scree) testa
Heterogenost respondenata
Izvodjenje faktora i procenjivanje opšteg uklapanja
Kriterijum latentnog korena
 Najčešće korišćena tehnika je kriterijum latentnog korena.
Obrazloženje za kriterijum latentnog korena je da bilo koji
individualni faktor treba da objasni varijansu bar jedne
promenljive, ako ga treba zadržati za interpretaciju. Svaka
promenljiva doprinosi vrednost 1, ukupnoj karakterističnoj
vrednosti. Stoga, samo se faktori koji imaju latentne korene
ili karakteristične vrednosti veće od 1, smatraju značajnim;
svi faktori sa latentnim korenima manjim od 1, se smatraju
neznačajnim i oni se izostavljaju.
Izvodjenje faktora i procenjivanje opšteg uklapanja
A priori kriterijum
 A priori kriterijum je jednostavan a ipak razuman
kriterijum pod izvesnim okolnostima. Kada ga primenjuje,
istraživač već zna koliko faktora da izdvoji, pre
preduzimanja faktorske analize. Istraživač jednostavno
daje instrukcije kompjuteru da zaustavi analizu kada se
izdvoji željeni broj faktora. Ovaj pristup je koristan kada
se testira teorija ili hipoteza o broju faktora koje treba
izdvojiti.
Izvodjenje faktora i procenjivanje opšteg uklapanja
Kriterijum procenta varijanse
 Kriterijum procenta varijanse je pristup baziran na
ostvarenju navedenog kumulativnog procenta ukupne
varijanse, ekstrahovane uzastopnim faktorima. U
prirodnim naukama, proceduru faktorisanja obično ne
treba zaustavljati dok izdvojeni faktori ne objasne bar 95%
varijanse, ili dok poslednji faktor ne objasni samo mali deo
(manje od 5%). Suprotno tome, u društvenim naukama,
gde su informacije često manje precizne, nije neuobičajeno
da se rešenje koje objašnjava 60% ukupne varijanse (a u
nekim slučajevima čak i manje), smatra zadovoljavajućim.
Izvodjenje faktora i procenjivanje opšteg uklapanja
Kriterijum skri (scree) testa
 Scree test se koristi da identifikuje optimalni broj faktora
koji se mogu izdvojiti pre nego što obim jedinstvene
varijanse počne da dominira strukturom zajedničke
varijanse. Scree test se izvodi putem ucrtavanja latentnih
korena, u odnosu na broj faktora po njihovom redosledu
izdvajanja, a oblik rezultirajuće krive se koristi za
evaluaciju tačke prekida (granične vrednosti).
Izvodjenje faktora i procenjivanje opšteg uklapanja
Heterogenost respondenata
 Osnovna pretpostavka je da se deljena varijansa proteže
preko čitavog uzorka. Ako je uzorak heterogen u pogledu
bar jednog podskupa promenljivih, onda će prvi faktori
predstavljati one promenljive koje su homogenije preko
čitavog uzorka.
Izvodjenje faktora i procenjivanje opšteg uklapanja
 U praksi, većina istraživača retko koristi samo jedan
kriterijum u odlučivanju koliko faktora da izdvoji. Umesto
toga, oni inicijalno koriste kirterijum kao što je latentni
koren, kao smernicu za prvi pokušaj u interpretaciji.
Takođe se interpretiraju faktori identifikovani pomoću
drugih kriterijuma.
 Postoje negativne posledice, ako se odabere previše ili
premalo faktora da predstavljaju podatke. Ako se koristi
premalo faktora, onda nije otkrivena ispravna struktura i
važne dimenzije mogu biti izostavljene. Ako se zadrži
previše faktora, onda interpretacija postaje teža kada se
rezultati rotiraju.
Interpretiranje faktora
Interpretacija faktora i selekcija finalnog faktorskog rešenja
uključuje tri koraka :
1. Izračunava se inicijalna nerotirana faktorska matrica koja
pomaže u dobijanju preliminarnog broja faktora za
ekstrakciju
2. Rotacija faktora ostvaruje jednostavnija i teoretski
značajnija faktorska rešenja.
3. Istraživač procenjuje potrebu da respecifikuje faktorski
model zbog (1) brisanja promenljivih iz analize, (2) želje da
se koristi drugačiji rotacioni metod za interpretaciju, (3)
potrebe da se izdvoji drugačiji broj faktora, ili (4) želje da
se predje sa jednog metoda ekstrakcije, na drugi.
Interpretiranje faktora
Rotacija faktora
Efekat rotiranja faktorske matrice je da se redistribuira
varijansa sa ranijih faktora na kasnije faktore, s ciljem da se
ostvari jednostavnija teoretski značajnija faktorska matrica
Rotacija može biti:
1. Ortogonalna rotacija – u geometrijskom smislu predstavlja
rotaciju koordinatnih osa za izvestan ugao, pri čemu njihov
međusobni odnos ostaje nepromenjen, što znači da su ose i
dalje međusobom ortogonalne tj. pod uglom od 90 stepeni
2. Kosa rotacija – fleksibilniji i realističniji metod jer
faktorske ose ne moraju biti ortogonalne i ne pretpostavlja
se da su teorijski važne osnovne dimenzije, nekorelirane
jedna sa drugom
Interpretiranje faktora
Metodi ortogonalne rotacije
U praksi, cilj svih metoda rotacije je da se pojednostave
kolone i redovi faktorske matrice, da bi se olakšala
interpretacija. U faktorskoj matrici, kolone predstavljaju
faktore, gde svaki red korespondira sa opterećenjem
promenljive medju faktorima. Pod uprošćavanjem redova,
podrazumevamo da se što više vrednosti u svakom redu, što
više približi nuli (tj. maksimiranje opterećenja promenljive
na jednom faktoru). Pod uprošćavanjem kolona,
podrazumevamo da se što više vrednosti u svakoj koloni, što
više približi nuli (tj. što je moguće više smanjiti broj
„visokih“ opterećenja).
Interpretiranje faktora
Metodi ortogonalne rotacije
Postoje tri glavna ortogonalna pristupa:
1. QUARTIMAX – cilj je da se pojednostave (uproste) redovi
faktorske matrice tj. ovaj metod se fokusira na rotiranje
inicijalnog faktora, tako da je opterećenje promenljive
visoko na jednom faktoru, i što je moguće niže na svim
ostalim faktorima
2. VARIMAX – varijansu opterećenja računamo za svaku
kolonu posebno, pa se dobija veći broj zajedničkih faktora
3. EQUIMAX – kompromis između predhodna dva pristupa,
nije široko prihvaćen i ne koristi se često
Interpretiranje faktora
Kriterijumi za značajnost faktorskih opterećenja
U interpretiranju faktora, mora se doneti odluka u vezi toga
koja faktorska opterećenja su vredna razmatranja.
Faktorska opterećenja su korelacija svake promenljive i
faktora koje indiciraju stepen korespondentnosti između
promenljivih i faktora, gde veća opterećenja čine
promenljivu reprezentom faktora.
Interpretiranje faktora
Kriterijumi za značajnost faktorskih opterećenja
1. Obezbeđenje praktične značajnosti – što je veća apsolutna
veličina faktorskog opterećenja, to je važnije to opterećenje
u interpretaciji faktorske matrice
2. Procenjivanje statističke značajnosti – test statističke
značajnosti koeficijenta korelacije se direktno primenjuje
na elemente matrice faktorskog opterećenja
Interpretiranje faktora
Kriterijumi za značajnost faktorskih opterećenja
1. Obezbeđenje praktične značajnosti – što je veća apsolutna
veličina faktorskog opterećenja, to je važnije to opterećenje
u interpretaciji faktorske matrice
2. Procenjivanje statističke značajnosti – test statističke
značajnosti koeficijenta korelacije se direktno primenjuje
na elemente matrice faktorskog opterećenja
Interpretiranje faktora
Smernice za identifikovanje značajnih faktorskih opterećenja, na bazi
veličine uzorka
Faktorsko opterećenje
Veličina uzorka potrebna za
značajnost
0.30
0.35
0.40
0.45
0.50
0.55
0.60
0.65
0.70
0.75
350
250
200
150
120
100
85
70
60
50
Značajnost se bazira na nivou značajnosti 0,05, nivou moći od 80%, i
standardnim greškama za koje se pretpostavlja da su dva puta veće od onih
kod konvecionalnih koeficijenata korelacije
Interpretiranje faktora
Kriterijumi za značajnost faktorskih opterećenja
Sumiranjem kriterijuma
opterećenja, zaključujemo:
za
značajnost
faktorskih
1. Što je uzorak veći manje je opterećenje koje će se smatrati
značajnim
2. Što je veći broj promenljivih koje se analiziraju, manje je
opterećenje koje će se smatrati značajnim
3. Što je veći broj faktora, veća je veličina opterećenja na
kasnijim faktorima, koja će se smatrati značajnim za
interpretaciju
Interpretiranje faktora
Interpretiranje faktorske matrice – procedura
Interpretiranje kompleksnih medjuodnosa predstavljenih u
faktorskoj matrici, nije jednostavno. Međutim, prateći
proceduru opisanu u narednim koracima, znatno se može
pojednostaviti procedura faktorske interpretacije:
1.
2.
3.
4.
Ispitati faktorsku matricu opterećenja
Identifikovati najviše opterećenje za svaku promenljivu
Proceniti komunalitete promenljivih
Označiti faktore
Interpretiranje faktora
Ispitivanje faktorske matrice opterećenja
Svaka kolona brojeva u faktorskoj matrici, predstavlja
odvojeni faktor. Kolone brojeva su faktorska opterećenja za
svaku promenljivu na svakom faktoru. Ako se koristi kosa
rotacija, obezbeđene su dve faktorske matrice opterećenja.
Prva je matrica faktorskog sklopa, koja ima opterećenja
koja predstavljaju jedinstven doprinos svake promenljive
faktoru. Druga je matrica faktorske strukture, koja ima
proste korelacije između promenljivih i faktora, ali ova
opterećenja sadrže i jedinstvenu varijansu između
promenljivih i faktora, i korelaciju među faktorima. Većina
istraživača prijavljuje rezultate matrice faktorskog sklopa.
Interpretiranje faktora
Identifikacija najvišeg opterećenja za svaku promenljivu
Interpretacija treba da započne sa prvom promenljivom na
prvom faktoru i da se kreće horizontalno sa leva na desno,
tražeći najviše opterećenje za tu promenljivu na bilo kom
faktoru. Kada se identifikuje najviše opterećenje treba ga
podvući ako je značajno. Onda se pažnja fokusira na drugu
promenljivu. Ovu proceduru treba nastaviti za svaku
promenljivu, sve dok se ne podvuku sve promenljive, za
njihovo najviše opterećenje na faktoru. Proces podvlačenja
samo jednog najvišeg opterećenja kao značajnog za svaku
promenljivu, je ideal kome treba težiti, ali se on retko može
ostvariti. U praksi, mnoge promenljive mogu imati nekoliko
opterećenja umerene veličine, od kojih su sva značajna, i
onda je interpretiranje faktora mnogo teže.
Interpretiranje faktora
Procena komunaliteta promenljivih
Kada su sve promenljive podvučene na svojim
odgovarajućim faktorima, istraživač treba da ispita
faktorsku matricu da identifikuje promenljive koje nisu
podvučene, i stoga ne vrše opterećenje ni na kom faktoru.
Istraživač treba da posmatra komunalitet svake promenljive,
da bi procenio da li on zadovoljava prihvatljive nivoe
objašnjenja. Ako postoje promenljive koje ne vrše
opterećenje ni na jednom faktoru ili čiji se komunaliteti
smatraju previše niskim, raspoložive su dve opcije: (1)
interpretirati rešenje onako kako jeste i jednostavno
ignorisati te promenljive, ili (2) evaluirati svaku od tih
promenljivih za moguće brisanje.
Interpretiranje faktora
Označavanje faktora
Kada je dobijeno faktorsko rešenje u kome sve promenljive
imaju značajno opterećenje na faktoru, istraživač pokušava
da dodeli izvesno značenje šemi (sklopu) faktorskih
opterećenja. Promenljive sa višim opterećenjima se smatraju
važnijima, i imaju veći uticaj na ime ili oznaku koja je
odabrana da predstavlja faktor. Stoga će istraživač ispitati
sve podvučene promenljive za određeni faktor, i stavljajući
veći naglasak na one promenljive sa višim opterećenjima,
pokušaće da dodeli ime ili oznaku faktoru koji tačno
odražava promenljive koje vrše opterećenje na tom faktoru.
Potvrda faktorske analize
Uključuje procenu stepena uopštljivosti rezultata za
populaciju i potencijalni uticaj individualnih slučajeva na
opšte rezultate
Faktorska stabilnost kao aspekt uopštljivosti je zavisna od
veličine uzorka i broja slučajeva po promenljivoj
Detekcija uticajnih opservacija - istraživač se podstiče da
proceni model sa i bez opservacija da bi procenio njihov
uticaj na rezultate
Dodatne upotrebe rezultata faktorske analize
U zavisnosti od ciljeva primene faktorske analize, istraživač
može da prestane sa faktorskom interpretacijom ili daljim
učestvovanjem u jednom od metoda za redukciju podataka.
Ako je cilj jednostavno identifikovati logične kombinacije
promenljivih i bolje shvatiti međuodnose među
promenljivima, onda će faktorska intepretacija biti dovoljna.
To obezbeđuje empirijsku osnovu za ocenu strukture
promenljivih i uticaja ove strukture kada se intepretiraju
rezultati iz drugih multivarijacionih tehnika. Međutim, ako
je cilj identifikovati odgovarajuće promenljive za narednu
primenu na druge statističke tehnike, onda će se koristiti
neki oblik redukcije podataka.
Dodatne upotrebe rezultata faktorske analize
Selekcija surogat promenljivih za narednu analizu –
istraživač ima opciju ispitivanja faktorske matrice i selekciju
promenljive sa najvišim faktorskim opterećenjem na svakom
faktoru, koja deluje kao surogat promenljiva koja je
predstavnik tog faktora
Kreiranje sumiranih skala – formiraju se kombinovanjem
nekoliko individualnih promenljivih u jednu kompozitnu
meru
Izračunavanje faktorskih skorova – faktorski skorovi su
kompozitne mere svakog faktora izračunate za svaki subjekt.
Faktorski skor se izračunava na osnovu faktorskih
opterećenja svih promenljivih na faktoru
Dodatne upotrebe rezultata faktorske analize
Kreiranje sumiranih skala
Sumirana skala pruža dve specifične koristi:
1. Omogućava da se u izvesnoj meri savlada greška merenja
(redukuje grešku merenja korišćenjem višestrukih
indikatora (promenljivih))
2. Njena sposobnost da predstavlja više aspekata koncepta u
jednoj meri
 Četiri pitanja koja su osnovna za konstruisanje bilo koje
sumirane skale su:
1. Konceptualana definicija
2. Dimenzionalnost
3. Pouzdanost
4. Valjanost
Dodatne upotrebe rezultata faktorske analize
Odabir među tri opcije redukcije podataka vrši se
poredjenjem njihovih prednosti i mana:
1. Prednosti surogat promenljive – jednostavna za
upravljanje i interpretiranje, a nedostatak je da je sklona
grešci merenja
2. Prednost faktorskih skorova – predstavljaju kompozit svih
promenljivih koje vrše opterećenje na faktoru, a nedostatak
je da promenljive imaju izvestan stepen uticaja u
izračunavanju
faktorskih
skorova,
i
otežavaju
interpretaciju.
3. Prednost sumirane skale – kompozitna mera koja redukuje
grešku merenja, a nedostatk je da uključuje samo
promenljive koje vrše visoko opterećenje na faktoru, a
isključuje one koji imaju mali uticaj.
Faktorska analiza - zaključak
1. Korisna i moćna višedimenzionalna (multivarijaciona)
statistička tehnika koja služi za efektivno izdvajanje
informacija iz velikih baza podataka
2. Ukazuje na interesantne odnose koji ne bi možda bili
očigledni iz ispitivanja samo sirovih podataka ili čak
korelacione matrice
3. Ima sposobnost da identifikuje skupove srodnih
promenljivih i time nudi istraživaču moćan alat u
ostvarenju boljeg razumevanja strukture podataka
Faktorska analiza - zaključak
Tri ograničenja faktorske analize su:
1. Postoji nedoumica oko toga koja tehnika je najbolja
2. Subjektivni aspekti faktorske analize
3. Problem pouzdanosti je realan zbog toga što analiza
započinje sa setom nesavršenih podataka.
Faktorska analiza – primer SPSS
Skala pozitivnih i negativnih osećanja
1.
2.
3.
4.
5.
6.
7.
vrlo malo
malo
1
2
zainteresovano
uzrujano
prestravljeno
ponosno
posramljeno
odlučno
aktivno
umereno
prilično
3
8. ucveljeno
9. snažno
10. odbojno
11. razdražljivo
12. nadahnuto
13. pažljivo
14. uplašeno
4
izuzetno mnogo
5
15.uzbuđeno
16. kao krivac
17. oduševljeno
18. čilo
19. nervozno
20. usplahireno
Faktorska analiza – primer SPSS
Correlation Matrix
PN 1
PN 2
PN 3
PN 4
PN 5
PN 6
PN 7
PN 8
PN 9
PN 10
PN 11
PN 12
PN 13
PN 14
PN 15
PN 16
PN 17
PN 18
PN 19
PN 20
PN 1
PN 2
PN 3
PN 4
PN 5
PN 6
PN 7
PN 8
1,000
-0,13
-0,15
0,346
-0,07
0,352
0,407
-0,25
0,416
-0,12
-0,21
0,482
0,491
-0,15
0,413
-0,17
0,562
0,466
-0,14
-0,17
-0,13
1,000
0,462
-0,14
0,271
-0,12
-0,19
0,645
-0,18
0,411
0,500
-0,20
-0,17
0,406
-0,13
0,314
-0,20
-0,19
0,459
0,425
-0,15
0,462
1,000
-0,12
0,247
-0,09
-0,25
0,494
-0,20
0,234
0,333
-0,13
-0,16
0,810
-0,08
0,330
-0,19
-0,18
0,560
0,424
0,346
-0,14
-0,12
1,000
-0,15
0,295
0,331
-0,15
0,396
-0,05
-0,17
0,315
0,329
-0,10
0,317
-0,12
0,368
0,338
-0,12
-0,17
-0,07
0,271
0,247
-0,15
1,000
-0,06
-0,24
0,278
-0,20
0,258
0,266
-0,06
-0,13
0,302
-0,06
0,539
-0,15
-0,18
0,285
0,245
0,352
-0,12
-0,09
0,295
-0,06
1,000
0,329
-0,04
0,426
0,077
-0,04
0,401
0,336
-0,09
0,276
-0,09
0,396
0,451
-0,05
-0,03
0,407
-0,19
-0,25
0,331
-0,24
0,329
1,000
-0,23
0,481
-0,09
-0,21
0,400
0,391
-0,27
0,329
-0,22
0,484
0,458
-0,23
-0,20
-0,25
0,645
0,494
-0,15
0,27
-0,04
-0,23
1,000
-0,18
0,380
0,464
-0,17
-0,19
0,459
-0,09
0,378
-0,21
-0,23
0,458
0,431
…
…
…
PN 20
-0,12
0,411
0,234
-0,05
0,258
0,07
-0,09
0,380
-0,07
0,583
-0,07
-0,11
0,263
-0,06
0,314
-0,13
-0,06
0,339
0,367
1,000
Faktorska analiza – primer SPSS
KMO and Bartlett’s Test
Kaiser-Meyer-Olkin Measure of Sampling Adequacy.
Bartlett’s Test of Sphericity
Approx. Chi-Square
df
Sig
0,874
3966,539
190
0.000
Faktorska analiza – primer SPSS
Total Variance Explained
Comp
onent
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Initial Elgenvalues
Extraction Sums
Total
% of
variance
Cumulative
%
Total
6,250
3,396
1,223
1,158
0,898
0,785
0,731
0,655
0,650
0,601
0,586
0,499
0,491
0,393
0,375
0,331
0,299
0,283
0,223
0,175
31,249
16,979
6,113
5,788
4,490
3,926
3,655
3,275
3,248
3,004
2,928
2,495
2,456
1,964
1,875
1,653
1,496
1,414
1,117
0,874
31,249
48,228
54,341
60,130
64,619
68,546
72,201
75,476
78,724
81,728
84,656
87,151
89,607
91,571
93,446
95,100
96,595
98,010
99,126
100,00
6,250
3,396
1,223
1,158
Rotati
% of
Cumulative on
Sums
variance
%
31,249
16,979
6,113
5,788
31,249
48,228
54,341
60,130
5,254
4,410
2,639
2,428
Faktorska analiza – primer SPSS
Screeplot
7
6
E
i
g
e
n
v
a
l
u
e
5
4
3
2
1
0
1
2
3
4
5
Component Number
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Faktorska analiza – primer SPSS
Rezultati paralelne analize
Number of variables:
Number of subjects:
Number of replications:
Eingenvalue
20
435
100
Random Eigenvalue
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
1,3984
1,3277
1,2733
1,2233
1,1832
1,1433
1,1057
1,0679
1,0389
1,0033
0,9712
0,9380
0,9051
0,8733
0,8435
0,8107
0,7804
0,7449
0,7090
0,6587
Standard Dev
0,0422
0,0282
0,0262
0,0236
0,0191
0,0206
0,0192
0,0193
0,0186
0,0153
0,0180
0,0175
0,0187
0,0179
0,0187
0,0185
0,0190
0,0194
0,0224
0,0242
Faktorska analiza – primer SPSS
Poređenje karakterističnih vrednosti dobijenih u SPSS-u i
vrednosti praga dobijenih paralelnom analizom
Redni broj
komponente
Stvarna
karakteristična
vrednost iz SPSS
Vrednost dobijena
paralelnom
analizom
Odluka
1
6,250
1,3984
prihvatiti
2
3,396
1,3277
prihvatiti
3
1,223
1,2733
odbaciti
4
1,158
1,2233
odbaciti
5
0,898
1,1832
odbaciti
Faktorska analiza – primer SPSS
Component Matrix
Component
PN 17
PN 18
PN 7
PN 8
PN 9
PN 13
PN 1
PN 2
PN 3
PN 14
PN 12
PN 19
PN 11
PN 20
PN 4
PN 15
PN 6
PN 10
PN 5
PN 16
1
2
0,679
0,639
0,621
-0,614
0,609
0,607
0,600
-0,591
-0,584
-0,583
0,582
-0,569
-0,554
-0,545
0,474
0,477
0,432
-0,416
-0,429
-0,474
0,474
0,404
0,420
0,323
0,413
0,381
0,408
0,449
0,456
0,497
0,545
0,366
0,459
0,483
0,437
0,426
0,357
3
4
-0,457
-0,451
0,462
0,563
0,649
0,566
Faktorska analiza – primer SPSS
Pattern Matrix
Component
1
PN 17
PN 12
PN 13
PN 18
PN 15
PN 1
PN 9
PN 6
PN 7
PN 4
PN 3
PN 14
PN 19
PN 20
PN 8
PN 10
PN 11
PN 2
PN 5
PN 16
2
3
4
0,836
0,795
0,735
0,732
0,721
0,708
0,638
0,604
0,578
0,531
0,909
0,888
0,799
0,677
0,477
0,434
0,413
0,808
0,707
0,473
0,830
0,773
Faktorska analiza – primer SPSS
Total Variance Explained
Comp
onent
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Initial Elgenvalues
Extraction Sums
Total
% of
variance
Cumulative
%
Total
6,250
3,396
1,223
1,158
0,898
0,785
0,731
0,655
0,650
0,601
0,586
0,499
0,491
0,393
0,375
0,331
0,299
0,283
0,223
0,175
31,249
16,979
6,113
5,788
4,490
3,926
3,655
3,275
3,248
3,004
2,928
2,495
2,456
1,964
1,875
1,653
1,496
1,414
1,117
0,874
31,249
48,228
54,341
60,130
64,619
68,546
72,201
75,476
78,724
81,728
84,656
87,151
89,607
91,571
93,446
95,100
96,595
98,010
99,126
100,00
6,250
3,396
Rotati
% of
Cumulative on
Sums
variance
%
31,249
16,979
31,249
48,228
5,254
5,157
Faktorska analiza – primer SPSS
Component Correlation Matrix
Component
1
2
1
2
1,000
-0,277
-0,277
1,000
Faktorska analiza – primer SPSS
Pattern Matrix
Component
1
PN 17
PN 12
PN 18
PN 13
PN 15
PN 1
PN 9
PN 6
PN 7
PN 4
PN 19
PN 14
PN 3
PN 8
PN 20
PN 2
PN 11
PN 10
PN 16
PN 5
2
0,825
0,781
0,742
0,728
0,703
0,698
0,656
0,635
0,599
0,540
0,806
0,739
0,734
0,728
0,718
0,704
0,645
0,613
0,589
0,490
Faktorska analiza – primer SPSS
Structure Matrix
Component
1
PN 17
PN 12
PN 18
PN 13
PN 1
PN 9
PN 15
PN 7
PN 6
PN 4
PN 19
PN 8
PN 14
PN 3
PN 2
PN 20
PN 11
PN 16
PN 10
PN 5
0,828
0,763
0,755
0,733
0,710
0,683
0,670
0,646
0,605
0,553
2
-0,338
0,784
0,742
0,740
0,737
0,717
0,712
0,661
0,593
0,590
0,505
Faktorska analiza – primer SPSS
Structure Matrix
PN 1
PN 2
PN 3
PN 4
PN 5
PN 6
PN 7
PN 8
PN 9
PN 10
PN 11
PN 12
PN 13
PN 14
PN 15
PN 16
PN 17
PN 18
PN 19
PN 20
Initial
Extraction
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
0,505
0,516
0,543
0,308
0,258
0,377
0,445
0,553
0,475
0,355
0,440
0,586
0,538
0,548
0,462
0,352
0,686
0,572
0,620
0,507
Predstavljanje rezultata faktorske analize
Prilikom predstavljanja rezultata faktorske analize treba
navesti pojedinosti o:
1. upotrebljenoj metodi izdvajanja faktora
2. kriterijumima pomoću kojih je određen broj faktora (među
njima obavezno i paralelnoj analizi)
3. upotrebljenoj vrsti rotacije
4. ukupnoj objašnjenoj varijansi
5. početnim iznosima karakterističnih vrednosti i iznosima
nakon rotacije
Predstavljanje rezultata faktorske analize
Izveštaj:
-
-
20 stavki skale pozitivnih i negativnih osećanja bilo je podvrgnuto
analizi glavnih komponenti u 18. veriziji SPSS-a. Pre sprovođenja
analize bila je ocenjena prikladnost podataka za faktorsku analizu.
Pregledom korelacione matrice otkriveno je mnogo koeficijenata
vrednosti 0,3 i više. Vrednost Kajzer-Mejer-Oklinovog pokazatelja bio
je 0,87, što premašuje preporučenu vrednost 0,6. Bartletov test
sferičnosti dostigao je statističku značajnost, što sve ukazuje na
faktorabilnost korelacione matrice.
Analiza glavnih komponenata otkrila je prisustvo četiri komponente s
karakterističnim vrednostima preko 1, koje objašnjavaju 31,2%, 17%,
6,1% i 5,8% varijanse. Pregledom dijagrama prevoja utvrđeno je
postojanje jasne tačke loma iza druge komponente. Na osnovu
Katelovog kriterijuma odlučeno je da se za dalje istraživanje zadrže dve
komponente. To su podržali i rezultati paralelne analize, sa samo dve
komponente čije karakteristične vrednosti premašuju odgovarajuće
vrednosti praga dobijene pomoću jednako velike matrice slučajnih
brojeva (20 promenljivih x 435 ispitanika).
Predstavljanje rezultata faktorske analize
Izveštaj:
-
To dvokomponentno rešenje objasnilo je ukupno 48,2% varijanse, pri
čemu je doprinos 1. komponente 31,25% a 2. komponente17,0%. Da bi
se lakše protumačile te dve komponente, sprovedena je oblimin rotacija.
Tumačenje te dve komponente bilo je saglasno s prethodnim
istraživanjima skale, pri čemu su stavke pozitivnih osećanja dale velike
težine komponenti 1, a stavke negativnih osećanja velike težine
komponenti 2. Između ta dva faktora postoji slaba negativna korelacija
(r = -0,28). Rezultati ove analize podržavaju korišćenje stavki pozitivnih
osećanja i stavki negativnih osećanja u obliku zasebnih skala, kao što su
predložili autori skale.
Predstavljanje rezultata faktorske analize
Matrica faktorskih težina i korelacija promenljivih i faktora sa oblimin
rotacijom dvofaktorskog rešenja za stavke skale poz. i neg. osećanja
Stavka
17. oduševljeno
12. nadahnuto
18. čilo
13. pažljivo
15. uzbuđeno
1. zainteresovano
9. snažno
6. odlučno
7. aktivno
4. ponosno
19. nervozno
14. uplašeno
3. prestravljeno
8. ucveljeno
20. usplahireno
2. uzrujano
11. razdražljivo
10. odbojno
16. kao krivac
5. posramljeno
Faktorske težine
Koeficijenti korelacije
promenljivih i faktora
Komponenta
1
Komponenta
2
Komponenta
1
Komponenta
2
0,825
0,781
0,742
0,728
0,703
0,698
0,656
0,635
0,599
0,540
0,079
-0,003
-0,010
-0,052
0,024
-0,047
-0,057
0,080
-0,013
-0,055
-0,012
0,067
-0,047
-0,020
0,119
-0,043
-0,097
0,107
-0,172
-0,045
0,806
0,739
0,734
0,728
0,718
0,704
0,645
0,613
0,589
0,490
0,828
0,763
0,755
0,733
0,710
0,683
0,670
0,646
0,605
0,553
-0,144
-0,253
-0,207
-0,213
-0,242
-0,175
-0,236
-0,176
-0,090
-0,191
-0,241
-0,149
-0,253
-0,221
-0,236
-0,278
-0,076
-0,338
-0,069
-0,195
0,784
0,742
0,740
0,737
0,717
0,712
0,661
0,593
0,590
0,505
Deo varijanse objašnjen
zajedničkim faktorima
0,686
0,586
0,572
0,538
0,462
0,505
0,475
0,377
0,445
0,308
0,620
0,548
0,543
0,553
0,507
0,516
0,440
0,355
0,352
0,258
HVALA!
Contact e-mail:
[email protected]