Lucidi 7_1 - e

Download Report

Transcript Lucidi 7_1 - e

Corso di Laurea magistrale in Psicologia Clinica, dello Sviluppo e Neuropsicologia Esame di

Analisi Multivariata dei Dati

Introduzione all

analisi fattoriale.

A cura di Matteo Forgiarini

1

L ’ analisi fattoriale è una tecnica di analisi multivariata solitamente impiegata per: • semplificare e ridurre la quantità di informazioni di cui si dispone su un determinato oggetto di studio; le informazioni vengono infatti sintetizzate per poter essere comprese e gestite in modo più agevole.

• Individuare le dimensioni latenti – spesso chiamate fattori o componenti – sottostanti all ’ insieme di variabili osservato.

Tali scopi sono strettamente legati e vengono raggiunti mediante l ’ individuazione dei fattori comuni e delle saturazioni che indicano la “ forza ” del legame tra le variabili osservate e i fattori individuati.

Per portare a temine correttamente una analisi fattoriale occorre eseguire differenti tipologie di analisi; Dopo avere compreso la natura dei dati di cui si dispone e avere fissato gli obiettivi dell ’ analisi, è possibile riassumere le operazioni da svolgere in 2 macro

steps

: • estrarre i fattori; • interpretare la soluzione ottenuta.

2

Utilizziamo il file “ Adjective list ” .

Il file contiene i dati relativi ad una ricerca effettuata per identificare 5 tratti di personalità mediante un questionario auto-compilato; il questionario è stato strutturato con lo scopo di raccogliere i punteggi su una scala da 0 a 10 indicanti, relativamente alle qualità espresse da ogni aggettivo, il possesso che i soggetti si riconoscono di tali qualità.

Scopo della ricerca è quindi individuare le dimensioni latenti sottostanti – i fattori – che semplificano, riassumono e permettono di spiegare i punteggi osservati sulle 25 variabili.

Il questionario è stato sottoposto a 300 soggetti; il file risulta quindi formato da una matrice 300 X 25: ogni riga contiene i punteggi di un soggetto per tutte le 25 variabili. Ogni colonna contiene i punteggi di una variabile per tutti i 300 soggetti.

La variabile genere discrimina i soggetti maschi (1) dai soggetti di genere femminile (0).

3

Estrazione dei fattori

Per estrarre i fattori latenti scegliamo il metodo delle “ componenti principali ” (Principal Component Analysis): tale metodo a partire da un numero N di variabili osservate, permette di individuare N componenti latenti ortogonali tra loro; l ’ insieme delle N componenti individuate permette di riprodurre interamente la matrice di varianza-covarianza delle variabili osservate.

4

Le componenti principali sono estratte in modo tale massimizzare la proporzione di varianza spiegata; ogni componente spiega la massima parte della varianza delle N variabili che non è ancora stata spiegata dalle componenti precedentemente estratte. La varianza spiegata da ogni componente è chiamata autovalore della componente.

Risulta interessante analizzare il grafico della serie di autovalori (Scree-plot) associati ad ogni componente estratta.

Come detto ogni componente è estratta in modo tale da massimizzare la varianza spiegata dalla componente rispetto alla varianza totale delle N variabili osservate. Pertanto gli autovalori hanno valore decrescente in quanto ogni componente spiega una quantità di varianza osservata necessariamente minore rispetto alle precedenti componenti estratte. In caso contrario la componente sarebbe stata estratta ad un passo precedente (!) 5

Selezionare l ’ opzione scree-plot per ottenere il grafico degli autovalori.

Come vedremo, inizialmente vengono estratte le componenti con autovalore>1.

6

Selezionare questa opzione in modo tale che negli output le variabili siano ordinate in ordine decrescente rispetto alle saturazioni.

7

Riportiamo la sintassi di SPSS relativa al modello analizzato: FACTOR /VARIABLES v1 v2 v3 v4 v5 v6 v7 v8 v9 v10 v11 v12 v13 v14 v15 v16 v17 v18 v19 v20 v21 v22 v23 v24 v25 /MISSING LISTWISE /ANALYSIS v1 v2 v3 v4 v5 v6 v7 v8 v9 v10 v11 v12 v13 v14 v15 v16 v17 v18 v19 v20 v21 v22 v23 v24 v25 /PRINT INITIAL EXTRACTION /FORMAT SORT /PLOT EIGEN /CRITERIA MINEIGEN(1) ITERATE(25) /EXTRACTION PC /ROTATION NOROTATE /METHOD=CORRELATION .

8

Analisi degli output

L ’ analisi degli autovalori delle componenti viene utilizzata per determinare il numero dei fattori adeguato a spiegare l ’ insieme delle variabili osservate.

Infatti occorre escludere dal modello le componenti che presentano un autovalore minore di 1: tale componente infatti permetterebbe di spiegare una quantità di varianza inferiore alla varianza di una variabile; ricordiamo che utilizzando la PCA, la matrice di varianza-covarianza osservata presenta tutti 1 sulla diagonale principale (le variabili vengono standardizzate, pertanto hanno media=0 e varianza=1) e le componenti estratte riproducono l ’ intera varianza delle variabili osservate.

Una componente avente un autovalore <1 renderebbe quindi il modello meno parsimonioso, non permetterebbe di semplificare i dati osservati e renderebbe la soluzione più difficile da interpretare senza apportare un significativo vantaggio in termini di potenza esplicativa.

9

3 2 1

Scree Plot

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25

Component Number

MINEIGEN Dal grafico risulta che le prime 8 componenti hanno un autovalore >1. Possiamo quindi escludere dal modello tutte le ultime 17 componenti.

Si noti che, come previsto dal metodo delle componenti principali, il numero di autovalori, che è pari al numero di componenti estratte, corrisponde al numero di variabili osservate.

Ora, sapendo che la PCA permette di riprodurre interamente la matrice di var-covar osservata, è possibile calcolare la somma di tutti gli autovalori estratti.

10

Scree Plot

3 2 1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25

Component Number

SCREE-TEST Tracciamo una retta interpolante i peggiori autovalori.

I fattori associati agli autovalori sovrastanti la retta sono i fattori da tenere.

11

Ordine di estrazione delle componenti Valori degli autovalori estratti per ogni componente 21 22 23 24 25 7 8 9 10 11 12 13 14 15 16 17 18 19 20 4 5 6 Component 1 2 3 Total 3,062 2,317 1,991 1,550 1,370 1,125 1,078 1,020 ,951 ,910 ,874 ,826 ,781 ,750 ,742 ,713 ,659 ,647 ,620 ,593 ,548 ,501 ,474 ,458 ,441 Initial Eigenvalues % of Variance 12,247 9,268 Cumulative % 12,247 21,515 7,964 6,199 5,480 4,500 4,314 4,082 3,803 3,639 3,496 3,303 3,125 3,001 2,968 2,853 2,637 2,588 2,482 2,372 2,192 2,002 1,895 1,831 1,763

Total Variance Explained

Extraction Sums of Squared Loadings Total 3,062 2,317 % of Variance 12,247 9,268 Cumulative % 12,247 21,515 1,991 1,550 1,370 1,125 1,078 1,020 7,964 6,199 5,480 4,500 4,314 4,082 29,478 35,677 41,157 45,656 49,970 54,051 Extraction Method: Principal Component Analysis.

Tot=25

29,478 35,677 41,157 45,656 49,970 54,051 57,855 61,493 64,989 68,292 71,417 74,418 77,385 80,239 82,875 85,463 87,944 90,317 92,509 94,512 96,406 98,237 100,000 % della varianza spiegata da ogni componente rispetto alla varianza totale delle 25 variabili. λ 1 =3.062; varianza totale osservata= =25 X 1=25; proporzione di varianza spiegata da λ λ 1 1 =3.062/25=0.1224

% di varianza spiegata da =0.1224 X 100=12.24.

Si noti che le 25 componenti complessivamente spiegano il 100% della varianza delle variabili osservate. La somma degli autovalori è quindi pari a 25.

12

Total Variance Explained

Component 1 Total 3,062 Initial Eigenvalues % of Variance 12,247 Cumulative % 12,247 Extraction Sums of Squared Loadings Total 3,062 % of Variance 12,247 Cumulative % 12,247 2 3 2,317 1,991 9,268 7,964 21,515 29,478 2,317 1,991 9,268 7,964 21,515 29,478 4 1,550 6,199 35,677 1,550 6,199 35,677 5 6 1,370 1,125 5,480 4,500 41,157 45,656 1,370 1,125 5,480 4,500 41,157 45,656 7 1,078 4,314 49,970 1,078 4,314 49,970 8 9 1,020 4,082 54,051 1,020 4,082 54,051 10 ,951 ,910 3,803 3,639 57,855 61,493 11 ,874 3,496 64,989 12 ,826 3,303 68,292 13 Come detto, inizialmente SPSS calcola la soluzione estraendo le componenti con λ>1.

15 ,742 2,968 77,385 16 17 ,781 3,125 71,417 ,713 ,659 2,853 2,637 80,239 82,875 varianza delle variabili osservate.

19 ,620 2,588 2,482 20 21 85,463 87,944 ,593 ,548 2,372 2,192 90,317 92,509 22 23 diapositive successive.) 25 ,501 ,474 ,458 ,441 2,002 1,895 1,831 1,763 94,512 96,406 98,237 100,000 Extraction Method: Principal Component Analysis.

Ora, cosa possiamo dire rispetto ad ogni singola variabile osservata? Le 8 componenti come sono legate alle variabili? E quanta varianza permettono di spiegare di ogni variabile? 13

Sereno Romantico Sicuro Diligente Cos cienzios o Stabile Divertente generos o Espans ivo Ricettivo Estroverso Colorito Innovativo Spens ierato Forte Stravagante Tollerante Originale Aperto Ospitale leale Scherzoso Prudente Previdente Progres sis ta 1 ,584 ,562 ,518 ,497 ,496 ,446 ,419 ,052 ,084 ,200 ,164 ,270 ,392 ,387 ,372 ,223 ,049 ,066 ,197 -,082 ,350 ,075 ,373 ,447 ,330 Extraction Method: Principal Component Analysis .

a. 8 components extracted.

2 -,106 -,140 -,211 -,101 -,220 -,018 ,265 ,673 ,616 ,580 ,407 ,385 -,005 -,151 -,168 ,138 ,316 ,178 ,089 ,274 -,037 ,354 -,264 -,083 ,376 3 -,184 -,173 -,199 -,112 -,160 ,371 -,398 -,155 ,015 ,183 -,078 ,223 ,575 ,507 ,478 ,420 ,169 ,253 ,092 -,062 -,470 -,098 -,083 -,200 -,251

Component Matrix a

Component 4 ,036 5 -,065 ,023 ,168 ,161 -,066 ,050 ,054 ,048 -,044 -,175 ,089 ,066 ,190 -,307 -,241 -,203 -,283 -,197 ,250 ,509 ,314 ,270 -,253 ,218 ,114 -,284 ,121 -,010 ,168 ,085 -,097 -,396 ,226 ,509 ,439 ,124 ,133 -,393 ,152 ,093 -,324 ,014 -,355 ,679 -,017 ,014 ,293 -,077 -,181 6 -,176 -,208 ,051 ,052 -,189 -,003 -,285 -,003 -,165 ,078 ,247 -,068 -,207 ,185 ,153 ,073 ,132 -,225 ,275 -,050 ,471 ,411 ,392 -,172 -,059 7 -,050 ,223 ,007 -,235 -,319 ,154 ,071 ,210 ,135 -,186 -,259 ,084 -,060 ,075 ,023 ,243 ,068 -,291 -,151 ,085 ,213 ,126 -,145 ,464 -,428 8 -,122 -,085 ,199 ,303 -,164 ,225 ,057 -,083 ,313 -,089 -,360 -,178 ,059 ,077 -,153 -,102 -,421 ,129 ,307 ,167 -,060 ,355 -,110 -,108 ,004 In questa matrice vengono riportate le saturazioni delle 8 componenti sulle 25 variabili. Come richiesto, SPSS ordina le variabili in modo tale da mettere in evidenza le saturazioni più elevate e i gruppi di variabili massimamente spiegati da un fattore; Utilizzando il metodo della ACP, le saturazioni delle soluzioni iniziali possono essere interpretate come la correlazione tra il fattore e la rispettiva variabile.

14

Component Matrix a

Sereno 1 ,584 2 -,106 3 -,184 Component 4 ,036 5 -,065 6 -,176 7 -,050 8 -,122 Romantico Sicuro ,562 ,518 -,140 -,211 -,173 -,199 ,023 ,168 -,066 ,050 -,208 ,051 ,223 ,007 -,085 ,199 Diligente ,497 -,101 -,112 ,161 ,054 ,052 -,235 ,303 Cos cienzios o Stabile ,496 ,446 -,220 -,018 -,160 ,371 ,048 -,044 ,314 ,270 -,189 -,003 -,319 ,154 -,164 ,225 Divertente ,419 ,265 -,398 -,175 -,253 -,285 ,071 ,057 generos o Espans ivo ,084 ,616 ,015 ,066 ,114 -,165 ,135 ,313 Ora, dato che le componenti estratte sono ortogonali, è possibile calcolare la proporzione Estroverso Colorito ,164 ,270 ,407 ,385 -,078 ,223 -,307 -,241 ,121 -,010 ,247 -,068 -,259 ,084 -,360 -,178 Innovativo Spens ierato ,392 saturazioni, ovvero sommando i quadrati delle correlazioni tra la variabile e ciascuna ,387 -,005 -,151 ,575 ,507 -,203 -,283 ,168 ,085 -,207 ,185 -,060 ,075 ,059 ,077 componente.

Forte Stravagante ,372 ,223 -,168 ,138 ,478 ,420 -,197 ,250 -,097 -,396 ,153 ,073 ,023 ,243 -,153 -,102 Tollerante ,052 ,049 ,066 ,673 ,316 ,178 -,155 ,169 “ ,089 ,509 sereno ” : ,218 ,226 ,014 -,003 ,132 -,225 ,210 ,068 -,291 -,083 -,421 ,129 Originale Aperto 0,584 2 + 0,106 2 + 0,184 2 leale ,197 + 0,36 2 ,350 ,089 ,092 ,439 + 0,065 -,037 2 -,470 + 0,176 ,133 2 -,355 + 0,05 2 -,017 ,275 -,151 ,307 + 0,122 2 =0,44.

,471 ,213 ,167 -,060 Scherzoso Prudente variabile “ sereno ” .

Progres sis ta ,075 ,373 ,354 -,264 -,098 -,083 -,393 ,152 ,014 ,293 ,411 ,392 ,126 -,145 ,355 -,110 ,447 ,330 -,083 ,376 -,200 -,251 ,093 -,324 -,077 -,181 -,172 -,059 ,464 -,428 -,108 ,004 Extraction Method: Principal Component Analysis .

a. 8 components extracted.

15

Communalities

Scherzoso Estroverso Espans ivo Divertente Colorito Ospitale leale Tollerante generos o Romantico Prudente Cos cienzios o Diligente Previdente Sereno Sicuro Stabile Forte Spens ierato Innovativo Ricettivo Originale Aperto Stravagante Progres sista Initial 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 Extraction ,606 ,565 ,548 ,589 ,373 ,599 ,633 ,640 ,586 ,471 ,512 ,585 ,448 ,517 ,440 ,425 ,486 ,491 ,563 ,604 ,576 ,511 ,567 ,539 ,639 Extraction Method: Principal Component Analys is .

In questa matrice vengono riportate le comunalità delle 25 variabili. In particolare vengono distinte: - le comunalità calcolate sulla base delle 8 componenti selezionate: ogni valore è pari alla somma dei quadrati delle saturazioni contenute nella “ Come stimato precedentemente utilizzando i valori delle saturazioni, la comunalità della variabile “

component matrix

sereno ” ” precedentemente analizzata.

è pari a 0,44.

- le comunalità calcolate sulla base di tutte le 25 componenti: utilizzando tutte le componenti, la PCA permette di riprodurre l ’ intera varianza delle variabili e di avere quindi per ogni variabile una comunalità pari ad 1.

16

Sereno Romantico Sicuro Diligente Cos cienzios o Stabile Divertente generos o Espans ivo Ricettivo Estroverso Colorito Innovativo Spens ierato Forte Stravagante Tollerante Originale Aperto Ospitale leale Scherzoso Prudente Previdente Progres sis ta ,387 ,372 ,223 ,049 ,066 ,197 -,082 ,350 ,075 ,373 ,447 ,330 1 ,584 ,562 ,518 ,497 ,496 ,446 ,419 ,052 ,084 ,200 ,164 ,270 ,392 Extraction Method: Principal Component Analysis .

a. 8 components extracted.

-,151 -,168 ,138 ,316 ,178 ,089 ,274 -,037 ,354 -,264 -,083 ,376 2 -,106 -,140 -,211 -,101 -,220 -,018 ,265 ,673 ,616 ,580 ,407 ,385 -,005 ,507 ,478 ,420 ,169 ,253 ,092 -,062 -,470 -,098 -,083 -,200 -,251 3 -,184 -,173 -,199 -,112 -,160 ,371 -,398 -,155 ,015 ,183 -,078 ,223 ,575

Component Matrix a

-,283 -,197 ,250 ,509 ,509 ,439 ,124 ,133 -,393 ,152 ,093 -,324 Component 4 ,036 ,023 5 -,065 -,066 ,168 ,161 ,048 -,044 -,175 ,089 ,066 ,190 -,307 -,241 -,203 ,050 ,054 ,314 ,270 -,253 ,218 ,114 -,284 ,121 -,010 ,168 ,085 -,097 -,396 ,226 ,014 -,355 ,679 -,017 ,014 ,293 -,077 -,181 ,185 ,153 ,073 ,132 -,225 ,275 -,050 ,471 ,411 ,392 -,172 -,059 6 -,176 -,208 ,051 ,052 -,189 -,003 -,285 -,003 -,165 ,078 ,247 -,068 -,207 ,075 ,023 ,243 ,068 -,291 -,151 ,085 ,213 ,126 -,145 ,464 -,428 7 -,050 ,223 ,007 -,235 -,319 ,154 ,071 ,210 ,135 -,186 -,259 ,084 -,060 ,077 -,153 -,102 -,421 ,129 ,307 ,167 -,060 ,355 -,110 -,108 ,004 8 -,122 -,085 ,199 ,303 -,164 ,225 ,057 -,083 ,313 -,089 -,360 -,178 ,059 Continuiamo l ’ analisi della component matrix.

Dall ’ analisi delle saturazioni risulta che 2 componenti su 8 hanno saturazioni elevate con una sola variabile; inoltre la variabile “ progressista ” risulta spiegata in maniera diffusa dalle componenti estratte.

Il modello risulta quindi poco parsimonioso e i fattori non risultano facilmente interpretabili.

Occorre ridurre il numero dei fattori per semplificare maggiormente i dati: utilizziamo i risultati dello scree test.

17

Inoltre sappiamo che le 25 variabili rappresentano 25 item misurati con lo scopo di individuare 5 tratti di personalità dei 300 soggetti.

Anche da un punto di vista teorico appare quindi appropriato utilizzare 5 fattori.

Eseguiamo nuovamente l ’ analisi imponendo che vengano estratte 5 componenti.

18

Riportiamo la sintassi del modello con 5 fattori: FACTOR /VARIABLES v1 v2 v3 v4 v5 v6 v7 v8 v9 v10 v11 v12 v13 v14 v15 v16 v17 v18 v19 v20 v21 v22 v23 v24 v25 /MISSING LISTWISE /ANALYSIS v1 v2 v3 v4 v5 v6 v7 v8 v9 v10 v11 v12 v13 v14 v15 v16 v17 v18 v19 v20 v21 v22 v23 v24 v25 /PRINT INITIAL EXTRACTION /FORMAT SORT /PLOT EIGEN /CRITERIA FACTORS(5) ITERATE(25) /EXTRACTION PC /ROTATION NOROTATE /METHOD=CORRELATION .

19

12 13 14 15 16 17 18 19 20 21 22 23 24 25 5 6 7 8 Component 1 2 3 4 9 10 11 Total 3,062 2,317 1,991 1,550 1,370 1,125 1,078 1,020 ,951 ,910 ,874 ,826 ,781 ,750 ,742 ,713 ,659 ,647 ,620 ,593 ,548 ,501 ,474 ,458 ,441

Total Variance Explained

Initial Eigenvalues % of Variance 12,247 9,268 7,964 6,199 5,480 4,500 4,314 4,082 3,803 3,639 3,496 3,303 3,125 3,001 2,968 2,853 2,637 2,588 2,482 2,372 2,192 2,002 1,895 1,831 1,763 Cumulative % Extraction Method: Principal Component Analysis.

12,247 21,515 29,478 35,677 41,157 45,656 49,970 54,051 57,855 61,493 64,989 68,292 71,417 74,418 77,385 80,239 82,875 85,463 87,944 90,317 92,509 94,512 96,406 98,237 100,000 Extraction Sums of Squared Loadings Total 3,062 % of Variance 12,247 Cumulative % 12,247 2,317 1,991 9,268 7,964 21,515 29,478 1,550 1,370 6,199 5,480 35,677 41,157 Complessivamente le 5 componenti spiegano il 41,15% della varianza osservata.

20

Component Matrix a

Sereno Rom antico Sicuro Diligente Cos cienzios o Previdente Stabile Divertente Prudente generos o Espans ivo Ricettivo Estroverso Colorito Progres sis ta Innovativo Spens ierato Forte leale Stravagante Tollerante Originale Aperto Scherzoso Ospitale 1 ,584 ,562 ,518 ,497 ,496 ,447 ,446 ,419 ,373 ,052 ,084 ,200 ,164 ,270 ,330 ,392 ,387 ,372 ,350 ,223 ,049 ,066 ,197 ,075 -,082 Extraction Method: Principal Com ponent Analysis .

a. 5 com ponents extracted.

2 -,106 -,140 -,211 -,101 -,220 -,083 -,018 ,265 -,264 ,673 ,616 ,580 ,407 ,385 ,376 -,005 -,151 -,168 -,037 ,138 ,316 ,178 ,089 ,354 ,274 Com ponent 3 -,184 -,173 -,199 -,112 -,160 -,200 ,371 -,398 -,083 -,155 ,015 ,183 -,078 ,223 -,251 ,575 ,507 ,478 -,470 ,420 ,169 ,253 ,092 -,098 -,062 4 ,036 ,023 ,168 ,161 ,048 ,093 -,044 -,175 ,152 ,089 ,066 ,190 -,307 -,241 -,324 -,203 -,283 -,197 ,133 ,250 ,509 ,509 ,439 -,393 ,124 5 -,065 -,066 ,050 ,054 ,314 -,077 ,270 -,253 ,293 ,218 ,114 -,284 ,121 -,010 -,181 ,168 ,085 -,097 -,017 -,396 ,226 ,014 -,355 ,014 ,679 Estraendo 5 fattori le variabili formano 4 gruppi; la variabile “ ospitale Proviamo ora a calcolare la comunalità della variabile sereno: 0,584 2 + 0,106 2 + 0,184 2 + 0,036 2 + 0,065 2 =0,39 ” risulta spiegata prevalentemente dalla quinta componente 21

Communalities

Scherzoso Estroverso Espans ivo Divertente Colorito Ospitale leale Tollerante generos o Romantico Prudente Cos cienzios o Diligente Previdente Sereno Sicuro Stabile Forte Spens ierato Innovativo Ricettivo Originale Aperto Stravagante Progres sista Initial 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 Extraction ,295 ,307 ,405 ,499 ,329 ,562 ,362 ,442 ,535 ,370 ,325 ,420 ,298 ,261 ,392 ,382 ,412 ,444 ,517 ,554 ,527 ,359 ,374 ,464 ,452 Extraction Method: Principal Component Analys is .

Notiamo che rispetto al modello con 8 componenti le comunalità sono inferiori.

Per esempio la variabile “ sereno ” , in accordo con la stima ottenuta utilizzando le saturazioni, ha una comunalità di 0,39: le 5 componenti spiegano complessivamente il 39% della sua varianza.

Nel modello con 8 componenti la comunalità della stessa variabile era pari al 44%.

Estraendo 5 componenti è possibile spiegare meno varianza osservata, ma il modello permette di semplificare maggiormente i dati e di ottenere fattori più facilmente interpretabili.

Vedremo nella prossima esercitazione come sia possibile ruotare la soluzione per chiarire maggiormente il significato dei fattori.

22

Creazione ed utilizzo dei punteggi fattoriali

I punteggi fattoriali esprimono i punteggi di ogni soggetto in un fattore comune estratto; insieme alle saturazioni permettono di riprodurre i punteggi dei soggetti nelle variabili osservate: Z ik =F i1 a k1 + F i2 a k2 + ... + U ik • Z ik è il punteggio standardizzato che il soggetto i ottiene nella variabile k; • F i1 è il punteggio fattoriale del soggetto i nel fattore 1; • A k1 è la saturazione del fattore 1 per la variabile k; • U ki è il punteggio standardizzato ottenuto dal soggetto i nel fattore unico della variable k.

Utilizzando i punteggi fattoriali è possibile riassumere i valori delle variabili osservate e quindi eseguire analisi dei dati più sintetiche e chiare.

23

Selezionare l ’ opzione “ salva come variabili ” per salvare all ’ interno del file di SPSS i punteggi fattoriali per ogni soggetto rispetto alle 5 componenti estratte.

Selezionando questa opzione, viene visualizzata la matrice di varianza-covarianza dei punteggi fattoriali di tutte le componenti.

24

Scherzoso Estroverso Espans ivo Divertente Colorito Ospitale leale Tollerante generos o Rom antico Prudente Cos cienzios o Diligente Previdente Sereno Sicuro Stabile Forte Spens ierato Innovativo Ricettivo Originale Aperto Stravagante Progres sis ta ,162 ,146 ,191 ,169 ,146 ,122 ,126 ,128 ,065 ,021 ,064 ,073 ,108 1 ,024 ,054 ,027 ,137 ,088 -,027 ,114 ,016 ,017 ,184 ,122 ,162

Component Score Coefficient Matrix

-,043 -,036 -,046 -,091 -,008 -,072 -,065 -,002 ,251 ,077 ,038 ,059 ,162 2 ,153 ,175 ,266 ,114 ,166 ,118 -,016 ,136 ,290 -,060 -,114 -,095 Com ponent 3 -,049 -,039 ,007 -,200 ,112 -,031 -,236 ,085 -,078 -,087 -,042 -,080 -,056 -,101 -,093 -,100 ,187 ,240 ,255 ,289 ,092 ,127 ,046 ,211 -,126 ,104 ,060 ,023 ,108 -,028 -,127 -,183 -,131 ,122 ,328 ,284 ,161 -,209 4 -,253 -,198 ,043 -,113 -,155 ,080 ,086 ,329 ,057 ,015 ,098 ,031 Extraction Method: Principal Com ponent Analysis . Com ponent Scores .

,039 -,056 -,048 ,036 ,197 -,071 ,062 ,122 -,207 ,010 -,259 -,289 -,132 5 ,011 ,088 ,083 -,185 -,007 ,496 -,013 ,165 ,159 -,048 ,214 ,229 La matrice dei coefficient i dei punteggi fattoriali permette di ruotare la matrice delle saturazioni e di ottenere i punteggi fattoriali; I coefficienti dei punteggi fattoriali permettono di stimare attraverso il metodo della regressione i punteggi fattoriali a partire dai punteggi standardizzati nelle variabili osservate.

25

Component 1 2 3 4 5

Component Score Covariance Matrix

1 1,000 ,000 ,000 ,000 ,000 2 ,000 1,000 ,000 ,000 ,000 3 ,000 ,000 1,000 ,000 ,000 4 ,000 ,000 ,000 1,000 ,000 Extraction Method: Principal Component Analys is. Component Scores .

5 ,000 ,000 ,000 ,000 1,000 Notiamo come tutte le covarianze tra le componenti siano 0: in accordo con la PCA infatti, nelle soluzioni iniziali tutte le componenti e quindi anche i rispettivi punteggi fattoriali sono ortogonali.

26

Utilizzando la variabile “ genere ” è possibile verificare se esista una differenza significativa tra i maschi e le femmine nei punteggi ottenuti nel fattore 1.

In questo modo ci chiediamo se i due gruppi differiscono in modo significativo nei valori espressi complessivamente nelle 9 variabili che afferiscono al fattore 1.

Per eseguire questa analisi utilizziamo il Test T.

Utilizziamo come variabile di gruppo la variabile “ genere ” ; Come variabile dipendente utilizziamo la variabile che contiene i punteggi fattoriali del fattore 1.

27

REGR factor s core 1 for analysis 1 Equal variances ass umed Equal variances not as sumed Levene's Test for Equality of Variances F 14,291 Sig.

,000

Independent Samples Test

t 2,358 2,683 df 298 t-tes t for Equality of Means Sig. (2-tailed) ,019 Mean Difference ,28886443 Std. Error Difference 95% Confidence Interval of the Difference Lower Upper ,12250103 ,04778772 ,52994114 262,251 ,008 ,28886443 ,10765247 ,07689122 ,50083764 Il test risulta significativo, possiamo pertanto concludere che i punteggi fattoriali del fattore 1 differiscono in modo significativo tra maschi e femmine.

Ovvero...

Possiamo concludere che i maschi e le femmine differiscono in modo significativo per quanto riguarda il fattore 1.

28