Transcript Slide 1

EDUC 612
ΑΝΩΤΕΡΕΣ ΜΟΡΦΕΣ ΣΤΑΤΙΣΤΙΚΗΣ
ΑΝΑΛΥΣΗΣ
Έλενα Παπαναστασίου
STRUCTURAL EQUATION MODELING (SEM)
ΔΟΜΙΚΑ ΜΟΝΤΕΛΑ ΕΞΙΣΩΣΕΩΝ
.53
dsimp
dmimp
df imp
.36
.55
.31
science is important
f or self
science is important
f or mother
.62
dsat
.56
science is important
f or f ather
.60
.29
science is important
f or f riend
.54
.09
.00
drimp
.30
science
importance
prior science
perf ormance
dimp
.22
.38
.60
dclike
like chem is try
.30
.61
-.50
.72
.27
.85
dsatt
like phys ics
dplike
.37
science attitudes
.14
delike
.37
.08
like earth s cience
.25
.06
.56 -.26
.16
TIMSS
science score
dscore
like biology
dblike
ΕΙΣΑΓΩΓΙΚΑ ΣΗΜΕΙΑ

Απαραίτητη η εις βάθος γνώση του θεματικού σας
αντικειμένου




 μας καθοδηγεί η θεωρία
Τα εργαλεία μέτρησης να έχουν καλές
ψυχομετρικές ιδιότητες
Λογισμικό: ΑΜΟS 18: (Analysis of Moment
Structures)
Causal modeling: αλλά ΔΕΝ αποδεικνύουν
αιτιώδης σχέσεις
… ΕΙΣΑΓΩΓΙΚΑ ΣΗΜΕΙΑ



Χρειάζεται μεγάλα δείγματα
Δεν δίνεται τόση σημασία στη στατιστική
σημαντικότητα
Το SEM ανήκει στην ίδια οικογένεια αναλύσεων
όπως η παλινδρομική ανάλυση και το ANOVA

Χρειάζεστε καλή γνώση παλινδρομικής ανάλυσης και
συσχετίσεων
ΓΙΑΤΙ ΝΑ ΤΑ ΧΡΗΣΙΜΟΠΟΙΟΥΜΕ;


Περιγράφει τις σχέσεις μεταξύ μεταβλητών
διαγραμματικά
Οι μεταβλητές μπορούν να λειτουργήσουν
ταυτόχρονα και σαν εξαρτημένες και σαν
ανεξάρτητες μεταβλητές.
ΓΙΑΤΙ ΝΑ ΤΑ ΧΡΗΣΙΜΟΠΟΙΟΥΜΕ;

Μέθοδοι εργασίας:




Καθαρά επιβεβαιωτική ανάλυση μοντέλων (strictly
confirmatory)
Εναλλακτικά μοντέλα (alternative models)
Παραγωγή μοντέλων (model-generating applications)
Διάκριση μεταξύ μετρήσιμων μεταβλητών
(οbserved variables ) και latent variables
Άλλες αναλύσεις δεν κάνουν αυτή τη διάκριση
 Η παραγοντική ανάλυση δεν μπορεί να προκαθορίσει
τους λειτουργικούς ορισμούς
 Λαμβάνει υπόψη τα βαθμό αξιοπιστίας των δεδομένων
και ότι υπάρχει σφάλμα μέτρησης

ΕΠΑΝΑΛΗΨΗ ΣΤΑΤΙΣΤΙΚΩΝ ΕΝΝΟΙΩΝ
Κλίμακες μέτρησης
 Οργάνωση δεδομένων
 Συσχετίσεις
 Παλινδρομική ανάλυση

Κλίμακες μέτρησης
ΑΛΛΑ ΠΑΡΑΔΕΙΓΜΑΤΑ:
ΚΑΤΗΓΟΡΙΑΚΕΣ ΜΕΤΑΒΛΗΤΕΣ
● Φύλο
● Θρήσκευμα
● Εθνικότητα
9
ΆΛΛΕΣ ΔΙΑΤΑΚΤΙΚΕΣ ΜΕΤΑΒΛΗΤΕΣ
● Σειρά αθλητών στον μαραθώνιο
● Πόσο αγαπάς το μάθημα των μαθηματικών;
1. καθόλου
2. λίγο
3. πολύ
4. πάρα πολύ
10
ΆΛΛΕΣ ΙΣΟΔΙΑΣΤΗΜΙΚΕΣ ΜΕΤΑΒΛΗΤΕΣ
●
●
Θερμοκρασία
Βαθμοί μαθηματικών
11
ΆΛΛΕΣ ΑΝΑΛΟΓΙΚΕΣ ΜΕΤΑΒΛΗΤΕΣ
●
●
●
Μισθός
Βάρος
Ύψος
12
ΜΕ ΠΟΙΕΣ ΚΛΙΜΑΚΕΣ ΜΕΤΡΗΣΗΣ ΜΠΟΡΟΥΝ ΝΑ
ΜΕΤΡΗΘΟΥΝ ΟΙ ΠΙΟ ΚΑΤΩ ΜΕΤΑΒΛΗΤΕΣ;
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
Θερμοκρασία
Θέμα σπουδών
Είδη κατοικίδιων ζώων
Αριθμός κατοικίδιων ζώων
Φύλο
Τιμή του καφέ
Είδος καφέ
Άγχος
Αισιοδοξία
Στάσεις
Άγαμος/ έγγαμος
13
ΚΑΤΑΧΩΡΗΣΗ ΔΕΔΟΜΕΝΩΝ ΣΤΟ SPSS

Γράψτε κάτω τα εξής στοιχεία από 5 άτομα που
απάντησαν ένα ερωτηματολόγιο
14
15
ΒΑΣΙΚΕΣ ΓΝΩΣΕΙΣ SPSS
Καταχώρηση δεδομένων στο SPSS (data view)
 Περιγραφή δεδομένων στο variable view
 Έλεγχος δεδομένων
 Στατιστικές αναλύσεις





Τυπική απόκλιση
Συσχετίσεις
Συνδιασπορά
Παλινδρομική ανάλυση
ΤΥΠΙΚΗ ΑΠΟΚΛΙΣΗ σ
(STANDARD DEVIATION, SD)
ΣΥΣΧΕΤΙΣΕΙΣ
Η συσχέτιση μας δείχνει το μέτρο σχέσης μεταξύ 2
μεταβλητών
 Περιγράφει ΕΥΘΥΓΡΑΜΜΕΣ ΣΧΕΙΣ
 Κυμαίνεται από το -1.0 στο 1.0

19
Συσχετίσεις
PEARSON PRODUCT MOMENT CORRELATION (r)
Προσπαθούμε να βρούμε σχέσεις μεταξύ
μεταβλητών, και ΌΧΙ αιτιώδης σχέσεις.
 Χρειάζονται τουλάχιστον 2 ποσοτικές
μεταβλητές
 Μέγεθος δείγματος:
>30
>150

20
Συσχετίσεις
PEARSON PRODUCT MOMENT CORRELATION (r)

Από το συντελεστή συσχέτισης μπορούμε να
πάρουμε πληροφορίες για

Την κατεύθυνση της σχέσης

Τη δύναμη της σχέσης
21
Κατεύθυνση συσχέτισης

Θετικό πρόσημο (r>0 ) θετική συσχέτιση
Όσο αυξάνεται η μια μεταβλητή, αυξάνεται η άλλη
 Π.χ. όσο αυξάνεται η κατανάλωση παγωτού,
αυξάνονται και οι πνιγμοί στη θάλασσα


Αρνητικό πρόσημο (r<0 ) αρνητική συσχέτιση
Όσο αυξάνεται η μια μεταβλητή, μειώνεται η άλλη
 Π.χ. όσο αυξάνεται η συμμετοχή των φοιτητών στα
συνδικαλιστικά κινήματα, τόσο μειώνονται οι ώρες
διαβάσματος τους

22
Κατεύθυνση συσχέτισης

Καθορίστε την κατεύθυνση της σχέσης των
πιο κάτω μεταβλητών
Αθλητική
επίδοση, κάπνισμα
Απουσίες, βαθμοί
Θερμίδες, βάρος
Ηλικία σπιτιού, αξία σπιτιού
Ώρες διαβάσματος, βαθμοί
23
Θετική συσχέτιση
6.4
6.2
6.0
5.8
5.6
5.4
HEIGHT
5.2
5.0
4.8
80
100
120
140
160
180
200
220
240
260
WEIGHT
24
Αρνητική συσχέτιση
10
20
18
8
16
6
14
12
4
10
2
8
LEISURE
6
4
2
-2
LEISURE
0
2
4
6
8
0
-2
10
2
4
6
8
10
12
14
16
18
STUDYHRS
25
20
Δύναμη σχέσης
 Βαθμοί
συσχέτισης κοντά στο +1 ή στο -1
αντιπροσωπεύουν δυνατές σχέσεις
 Βαθμοί συσχέτισης κοντά στο 0 δείχνουν
ότι δεν υπάρχουν ευθύγραμμες σχέσεις
μεταξύ των μεταβλητών




-.5
.350
-1
-.7
.2
.78
0
-.3
26
ΣΥΝΔΙΑΣΠΟΡΑ
 Covage,height=rage,height*
SD age*SD height
Παλινδρομική ανάλυση
REGRESSION

Προσπαθεί να εξηγήσει και να προβλέψει τη
σχέση μεταξύ μεταβλητών

Πως επηρεάζουν οι ώρες διαβάσματος το βαθμό των
μαθητών στην επιστήμη;
Ανεξάρτητη Μεταβλητή
( πιθανή αιτία)
Ώρες διαβάσματος
Επηρεάζει
Εξαρτημένη Μεταβλητή
( αποτέλεσμα)
Βαθμός επιστήμης
28
Παλινδρομική ανάλυση
REGRESSION

Πως επηρεάζει το φύλο και το ΚΟΕ τις επιδόσεις των
Κυπρίων φοιτητών στο πανεπιστήμιο;
29
Παλινδρομική ανάλυση
REGRESSION
Εξαρτημένη μεταβλητή: ποσοτική
 Ανεξάρτητες μεταβλητές: ποσοτικές, ή ποιοτικές
με 2 υποκατηγορίες (π.χ. ναι/όχι, άνδρας/γυναίκα)

Ανεξάρτητη μεταβλητή = εξωγενής μεταβλητή
 Εξαρτημένη μεταβλητή = ενδογενής μεταβλητή

30
Παλινδρομική ανάλυση
Χ
Υ
1
2
3
2
4
6
Ποια εξίσωση μπορεί να περιγράψει
τη σχέση αυτών των αριθμών;
Υ=
Παλινδρομική ανάλυση
Χ
Υ
1
2
3
3
5
7
4
9
Ποια εξίσωση μπορεί να περιγράψει
τη σχέση αυτών των αριθμών;
Υ=
Παλινδρομική ανάλυση
Ποια εξίσωση μπορεί να περιγράψει τη
σχέση αυτών των αριθμών;
Ώρες διαβάσματος Βαθμός
1
2
3
4
3
5
7
9
REGRESSION RESULTS
(Y=Research grade)
Unstandardized
Coefficients
(Constant)
Statistics course
grade
High school GPA
B
Std. Error
-23.575
19.143
-.076
.932
2.324
.793
Standardized
Coefficients
Beta
t
Sig.
-1.231
.223
-.010
-.082
.935
.319
2.929
.005
Y= βο+β1*Statisticsgrade +β2 *HighschoolGPA +e
Y=-23.575-0.76*Statisticsgrade +2.324HighschoolGPA +e
Y= -0.010*Statisticsgrade +0.319HighschoolGPA +e
ΈΝΝΟΙΕΣ ΑΠΟ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ


Απλή: Ŷ = (B0 + B1 X1) , όπου B1 = r SY/SX
Standardized regression: b1 = rY1 (beta weight)
Πολλαπλή: Ŷ = (B0 + B1 X1 + B2 X2)
To Ŷ είναι composite, ένας σταθμικός γραμμικός
συνδυασμός των Χ1 και Χ2
Standardized regression: bi ≠ rYi και συνήθως bi < rYi τα bi
προσαρμόζονται για ενδοσυσχετίσεις των Χi και Υ
Statistics
grade
High
School
GPA
-0.10
Research
grade
0.319