II Esercitazione: L`Analisi delle Componenti Principali con SPSS

Download Report

Transcript II Esercitazione: L`Analisi delle Componenti Principali con SPSS

L’Analisi Fattoriale (PCA)
con SPSS
Cristina Zogmaister




Aprire lib/psico/corsi/zogmaister
Trascinare SECONDA LEZIONE nel vostro
spazio
Lanciare SPSS PASW 18
Aprire dal vostro spazio il file
customer_satisfaction.sav
L’Analisi Fattoriale è un processo
iterativo
Passi preliminari
•
Selezionare e misurare un insieme di variabili
•
verificare l’adeguatezza delle variabili – es.
normalità delle distribuzioni, presenza di outlier,
linearità delle relazioni, rapporto tra nr. di variabili
e nr. di fattori attesi, rapporto tra nr. di variabili e
nr. di soggetti.
L’Analisi Fattoriale è un processo
iterativo
Analisi fattoriale (processo iterativo)
Eseguire una prima analisi fattoriale
Determinare il numero di fattori
Eseguire la rotazione
1.
2.
3.
a)
b)
prima obliqua,
poi eventualmente ortogonale
4.
Interpretare i risultati e dare un nome ai fattori

Il criterio che guida l’AF è l’interpretabilità
Una buona AF ‘ha senso’, una cattiva AF ‘non ha
senso’

L’Analisi Fattoriale è un processo
iterativo
Passi successivi:

verificare la struttura fattoriale (replicabilità),

stabilire la validità di costrutto dei fattori
(correlazioni con altre variabili; effetto delle
manipolazioni sui punteggi fattoriali)
File dati: customer_satisfaction.sav



Intervista a 200 clienti di un ristorante
Obiettivo: capire quali sono gli aspetti che
determinano il livello di soddisfazione nei
confronti del ristorante
Ipotesi di partenza: 4 aspetti




Qualità del cibo
Qualità del servizio (cortesia del personale)
Ambiente
Prezzo
Il questionario

12 domande relative ai quattro aspetti ipotizzati alla
base della soddisfazione dei clienti (x1 – x12)




Qualità del cibo
Qualità del servizio (cortesia del personale)
Ambiente
Prezzo

3 domande sulla soddisfazione (d1 – d3)

3 domande sociodemografiche
E’ possibile riassumere le risposte relative
alla soddisfazione nelle 4 dimensioni
ipotizzate?

Sono rispettati i prerequisiti per un’analisi fattoriale?
 Ampiezza del campione


Adeguato numero di variabili




Almeno 3 per ogni fattore (meglio di più)
Ci sono outlier univariati (e multivariati)?
Le variabili sono distribuite normalmente?


idealmente 300 casi o più, ma dipende da numero di fattori, forza
delle relazioni tra le variabili
Se le variabili non sono normali, la soluzione è meno chiara (e non si
possono applicare test statistici che implicano la normalità)
Le relazioni tra le coppie di variabili sono lineari?
La matrice è fattorializzabile?


correlazioni bivariate sufficientemente elevate (>|.30|)
test di Bartlett (troppo sensibile)
L’analisi fattoriale

Analizza
 Riduzione dimensione
 Fattoriale
Scegliamo le variabili su cui vogliamo
operare la PCA (x1 – x12)
Indicazioni di base



Chiediamo la matrice delle correlazioni
Metodo di estrazione: PCA
Numero di fattori (per il momento non lo
conosciamo)

Scree plot
Default: PCA
Default: criterio
mineigen
Esaminiamo l’output

Matrice di correlazioni iniziali: diversi r>|.30|
Comunalità

È la somma dei quadrati delle correlazioni della variabile con i
fattori. Indica quanta della varianza della variabile è spiegata dai
fattori
Varianza totale spiegata
La varianza totale
spiegata dai fattori
(prima della
rotazione)
3.159 / 12 = .26325 = 25%
Mineigen
Scree plot
Sia lo scree plot, sia il criterio mineigen suggeriscono la presenza di 4
componenti
Matrice delle componenti
Matrice di correlazione
tra le componenti e le
variabili.
Tutti e quattro i fattori
sono correlati in maniera
sostanziale (r>|.32|) con
molte variabili e le
variabili sono correlate
con più fattori.
La soluzione non è chiara
(perché non è stata fatta
la rotazione)
Eseguiamo la rotazione

Ortogonale o obliqua?

Prima obliqua, se non ci sono correlazioni
sostanziali passiamo a una rotazione
ortogonale.
Matrice di correlazione tra le componenti
(in fondo all’output)
Rotazione ortogonale (varimax)

Varianza totale spiegata:
una nuova parte della tabella indica la varianza spiegata
dai fattori dopo la rotazione
La varianza totale non cambia rispetto a prima della rotazione, ma è suddivisa in
maniera diversa tra i fattori
Matrice delle componenti ruotata
Più chiara!!!
Ogni variabile ha saturazioni
importanti su una sola
componente.
Interpretiamo le componenti
1=?
2=?
3=?
4=?
Report dell’analisi

E’ stata condotta l’analisi delle componenti principali. Un primo esame dello
screeplot suggeriva la presenza di 4 componenti. Anche il criterio Mineigen
suggeriva una soluzione a 4 componenti. Questa numerosità corrispondeva a
quella che era stata precedentemente ipotizzata in fase di costruzione del
questionario.

Le analisi successive hanno confermato la presenza di 4 componenti, non
correlate. Con una rotazione obliqua (criterio oblimin) emergeva una
correlazione massima tra le componenti di r = |.167|, perciò è stata condotta una
rotazione ortogonale (criterio varimax).

La soluzione a quattro componenti spiega il 75% della varianza osservata nelle
variabili.

Le quattro componenti sono interpretate come: qualità del cibo, qualità del
servizio, ambiente, prezzo.

La matrice delle componenti ruotate è presentata in Tab. 1.
Domanda n. 2:
Le domande sulla soddisfazione (d1, d2, d3)
possono essere riassunte in un unico
punteggio? (la scala è monofattoriale?)

Svolgete la PCA e provate a dare una
risposta.
Risposta

La PCA ha confermato la presenza di un
unico fattore sottostante alle domande
relative alla soddisfazione. I tre item sono
altamente correlati tra di loro (correlazione
minima r = .81) e un’unica componente
spiega il 90 % della varianza.
Domanda n. 3
Legame tra le 4 componenti e la
soddisfazione

Calcolo dei punteggi nei fattori

Punteggio fattoriale
Punteggio sommato

Calcolo dei punteggi fattoriali

Conduciamo l’analisi fattoriale




Estrazione: PCA
Nr. componenti: 4
Rotazione: Varimax
Calcolo dei punteggi fattoriali
Date etichette appropriate
Calcolare il punteggio fattoriale per la
soddisfazione

Correlazione tra i quattro fattori di valutazione
e il fattore di soddisfazione
Calcoliamo i punteggi sommati
s.cibo = x1 + x4 + x9
s.personale = x6 + x11 + x12.
s.ambiente = x2 + x7 + x8.
s.prezzo = x3 + x 5 + x10.
s.Sodd = d1 + d2 + d3.
Correlazioni

Tra punteggi fattoriali e punteggi sommati:
sono molto alte

Tra punteggi sommati e soddisfazione:
rivelano gli stessi legami già visti in
precedenza.
Ora da soli: file personalità.sav

A 459 persone è stato somministrato un questionario di self-report di
personalità

Dovevano valutare quanto si sentivano descritti da ciascuno di 44
diversi aggettivi

Ipotesi: 5 componenti (big five)





Energia
Amicalità
Coscienziosità
Stabilità emotiva
Apertura mentale
Quante sono le componenti?
Sono ortogonali o oblique?
Corrispondono alle 5 componenti ipotizzate?
Quante sono le componenti?
Mineigen: 10
Quante sono le componenti?




Mineigen: massimo 10
Scree plot: 5
Attesa teorica: 5
Partiamo da 5 componenti, vediamo se la
soluzione è interpretabile
Le componenti sono correlate? (Rotazione
oblimin)
No
Rotazione Varimax – prima componente
coscienziosità
Seconda componente: energia
Terza componente: (in)stabilità emotiva
Quarta componente: (mancanza di)
amicalità
Quinta componente: apertura mentale
Da soli: BimbiCompetenze.sav


177 bambini della scuola per l’infanzia.
Batteria di 10 test

Questi punteggi possono essere ridotti a un numero inferiore di
dimensioni?
Quante?
Quali?
Sono correlate tra di loro?
Quale percentuale di varianza osservata viene spiegata
complessivamente, quale percentuale di varianza viene spiegata
da ciascuna dimensione?
Ci sono variabili pure? Quali?

Suggerimenti per migliorare la batteria di test?




