Transcript Slide 1
EDUC 612 ΑΝΩΤΕΡΕΣ ΜΟΡΦΕΣ ΣΤΑΤΙΣΤΙΚΗΣ ΑΝΑΛΥΣΗΣ Έλενα Παπαναστασίου STRUCTURAL EQUATION MODELING (SEM) ΔΟΜΙΚΑ ΜΟΝΤΕΛΑ ΕΞΙΣΩΣΕΩΝ .53 dsimp dmimp df imp .36 .55 .31 science is important f or self science is important f or mother .62 dsat .56 science is important f or f ather .60 .29 science is important f or f riend .54 .09 .00 drimp .30 science importance prior science perf ormance dimp .22 .38 .60 dclike like chem is try .30 .61 -.50 .72 .27 .85 dsatt like phys ics dplike .37 science attitudes .14 delike .37 .08 like earth s cience .25 .06 .56 -.26 .16 TIMSS science score dscore like biology dblike ΕΙΣΑΓΩΓΙΚΑ ΣΗΜΕΙΑ Απαραίτητη η εις βάθος γνώση του θεματικού σας αντικειμένου μας καθοδηγεί η θεωρία Τα εργαλεία μέτρησης να έχουν καλές ψυχομετρικές ιδιότητες Λογισμικό: ΑΜΟS 18: (Analysis of Moment Structures) Causal modeling: αλλά ΔΕΝ αποδεικνύουν αιτιώδης σχέσεις … ΕΙΣΑΓΩΓΙΚΑ ΣΗΜΕΙΑ Χρειάζεται μεγάλα δείγματα Δεν δίνεται τόση σημασία στη στατιστική σημαντικότητα Το SEM ανήκει στην ίδια οικογένεια αναλύσεων όπως η παλινδρομική ανάλυση και το ANOVA Χρειάζεστε καλή γνώση παλινδρομικής ανάλυσης και συσχετίσεων ΓΙΑΤΙ ΝΑ ΤΑ ΧΡΗΣΙΜΟΠΟΙΟΥΜΕ; Περιγράφει τις σχέσεις μεταξύ μεταβλητών διαγραμματικά Οι μεταβλητές μπορούν να λειτουργήσουν ταυτόχρονα και σαν εξαρτημένες και σαν ανεξάρτητες μεταβλητές. ΓΙΑΤΙ ΝΑ ΤΑ ΧΡΗΣΙΜΟΠΟΙΟΥΜΕ; Μέθοδοι εργασίας: Καθαρά επιβεβαιωτική ανάλυση μοντέλων (strictly confirmatory) Εναλλακτικά μοντέλα (alternative models) Παραγωγή μοντέλων (model-generating applications) Διάκριση μεταξύ μετρήσιμων μεταβλητών (οbserved variables ) και latent variables Άλλες αναλύσεις δεν κάνουν αυτή τη διάκριση Η παραγοντική ανάλυση δεν μπορεί να προκαθορίσει τους λειτουργικούς ορισμούς Λαμβάνει υπόψη τα βαθμό αξιοπιστίας των δεδομένων και ότι υπάρχει σφάλμα μέτρησης ΕΠΑΝΑΛΗΨΗ ΣΤΑΤΙΣΤΙΚΩΝ ΕΝΝΟΙΩΝ Κλίμακες μέτρησης Οργάνωση δεδομένων Συσχετίσεις Παλινδρομική ανάλυση Κλίμακες μέτρησης ΑΛΛΑ ΠΑΡΑΔΕΙΓΜΑΤΑ: ΚΑΤΗΓΟΡΙΑΚΕΣ ΜΕΤΑΒΛΗΤΕΣ ● Φύλο ● Θρήσκευμα ● Εθνικότητα 9 ΆΛΛΕΣ ΔΙΑΤΑΚΤΙΚΕΣ ΜΕΤΑΒΛΗΤΕΣ ● Σειρά αθλητών στον μαραθώνιο ● Πόσο αγαπάς το μάθημα των μαθηματικών; 1. καθόλου 2. λίγο 3. πολύ 4. πάρα πολύ 10 ΆΛΛΕΣ ΙΣΟΔΙΑΣΤΗΜΙΚΕΣ ΜΕΤΑΒΛΗΤΕΣ ● ● Θερμοκρασία Βαθμοί μαθηματικών 11 ΆΛΛΕΣ ΑΝΑΛΟΓΙΚΕΣ ΜΕΤΑΒΛΗΤΕΣ ● ● ● Μισθός Βάρος Ύψος 12 ΜΕ ΠΟΙΕΣ ΚΛΙΜΑΚΕΣ ΜΕΤΡΗΣΗΣ ΜΠΟΡΟΥΝ ΝΑ ΜΕΤΡΗΘΟΥΝ ΟΙ ΠΙΟ ΚΑΤΩ ΜΕΤΑΒΛΗΤΕΣ; 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. Θερμοκρασία Θέμα σπουδών Είδη κατοικίδιων ζώων Αριθμός κατοικίδιων ζώων Φύλο Τιμή του καφέ Είδος καφέ Άγχος Αισιοδοξία Στάσεις Άγαμος/ έγγαμος 13 ΚΑΤΑΧΩΡΗΣΗ ΔΕΔΟΜΕΝΩΝ ΣΤΟ SPSS Γράψτε κάτω τα εξής στοιχεία από 5 άτομα που απάντησαν ένα ερωτηματολόγιο 14 15 ΒΑΣΙΚΕΣ ΓΝΩΣΕΙΣ SPSS Καταχώρηση δεδομένων στο SPSS (data view) Περιγραφή δεδομένων στο variable view Έλεγχος δεδομένων Στατιστικές αναλύσεις Τυπική απόκλιση Συσχετίσεις Συνδιασπορά Παλινδρομική ανάλυση ΤΥΠΙΚΗ ΑΠΟΚΛΙΣΗ σ (STANDARD DEVIATION, SD) ΣΥΣΧΕΤΙΣΕΙΣ Η συσχέτιση μας δείχνει το μέτρο σχέσης μεταξύ 2 μεταβλητών Περιγράφει ΕΥΘΥΓΡΑΜΜΕΣ ΣΧΕΙΣ Κυμαίνεται από το -1.0 στο 1.0 19 Συσχετίσεις PEARSON PRODUCT MOMENT CORRELATION (r) Προσπαθούμε να βρούμε σχέσεις μεταξύ μεταβλητών, και ΌΧΙ αιτιώδης σχέσεις. Χρειάζονται τουλάχιστον 2 ποσοτικές μεταβλητές Μέγεθος δείγματος: >30 >150 20 Συσχετίσεις PEARSON PRODUCT MOMENT CORRELATION (r) Από το συντελεστή συσχέτισης μπορούμε να πάρουμε πληροφορίες για Την κατεύθυνση της σχέσης Τη δύναμη της σχέσης 21 Κατεύθυνση συσχέτισης Θετικό πρόσημο (r>0 ) θετική συσχέτιση Όσο αυξάνεται η μια μεταβλητή, αυξάνεται η άλλη Π.χ. όσο αυξάνεται η κατανάλωση παγωτού, αυξάνονται και οι πνιγμοί στη θάλασσα Αρνητικό πρόσημο (r<0 ) αρνητική συσχέτιση Όσο αυξάνεται η μια μεταβλητή, μειώνεται η άλλη Π.χ. όσο αυξάνεται η συμμετοχή των φοιτητών στα συνδικαλιστικά κινήματα, τόσο μειώνονται οι ώρες διαβάσματος τους 22 Κατεύθυνση συσχέτισης Καθορίστε την κατεύθυνση της σχέσης των πιο κάτω μεταβλητών Αθλητική επίδοση, κάπνισμα Απουσίες, βαθμοί Θερμίδες, βάρος Ηλικία σπιτιού, αξία σπιτιού Ώρες διαβάσματος, βαθμοί 23 Θετική συσχέτιση 6.4 6.2 6.0 5.8 5.6 5.4 HEIGHT 5.2 5.0 4.8 80 100 120 140 160 180 200 220 240 260 WEIGHT 24 Αρνητική συσχέτιση 10 20 18 8 16 6 14 12 4 10 2 8 LEISURE 6 4 2 -2 LEISURE 0 2 4 6 8 0 -2 10 2 4 6 8 10 12 14 16 18 STUDYHRS 25 20 Δύναμη σχέσης Βαθμοί συσχέτισης κοντά στο +1 ή στο -1 αντιπροσωπεύουν δυνατές σχέσεις Βαθμοί συσχέτισης κοντά στο 0 δείχνουν ότι δεν υπάρχουν ευθύγραμμες σχέσεις μεταξύ των μεταβλητών -.5 .350 -1 -.7 .2 .78 0 -.3 26 ΣΥΝΔΙΑΣΠΟΡΑ Covage,height=rage,height* SD age*SD height Παλινδρομική ανάλυση REGRESSION Προσπαθεί να εξηγήσει και να προβλέψει τη σχέση μεταξύ μεταβλητών Πως επηρεάζουν οι ώρες διαβάσματος το βαθμό των μαθητών στην επιστήμη; Ανεξάρτητη Μεταβλητή ( πιθανή αιτία) Ώρες διαβάσματος Επηρεάζει Εξαρτημένη Μεταβλητή ( αποτέλεσμα) Βαθμός επιστήμης 28 Παλινδρομική ανάλυση REGRESSION Πως επηρεάζει το φύλο και το ΚΟΕ τις επιδόσεις των Κυπρίων φοιτητών στο πανεπιστήμιο; 29 Παλινδρομική ανάλυση REGRESSION Εξαρτημένη μεταβλητή: ποσοτική Ανεξάρτητες μεταβλητές: ποσοτικές, ή ποιοτικές με 2 υποκατηγορίες (π.χ. ναι/όχι, άνδρας/γυναίκα) Ανεξάρτητη μεταβλητή = εξωγενής μεταβλητή Εξαρτημένη μεταβλητή = ενδογενής μεταβλητή 30 Παλινδρομική ανάλυση Χ Υ 1 2 3 2 4 6 Ποια εξίσωση μπορεί να περιγράψει τη σχέση αυτών των αριθμών; Υ= Παλινδρομική ανάλυση Χ Υ 1 2 3 3 5 7 4 9 Ποια εξίσωση μπορεί να περιγράψει τη σχέση αυτών των αριθμών; Υ= Παλινδρομική ανάλυση Ποια εξίσωση μπορεί να περιγράψει τη σχέση αυτών των αριθμών; Ώρες διαβάσματος Βαθμός 1 2 3 4 3 5 7 9 REGRESSION RESULTS (Y=Research grade) Unstandardized Coefficients (Constant) Statistics course grade High school GPA B Std. Error -23.575 19.143 -.076 .932 2.324 .793 Standardized Coefficients Beta t Sig. -1.231 .223 -.010 -.082 .935 .319 2.929 .005 Y= βο+β1*Statisticsgrade +β2 *HighschoolGPA +e Y=-23.575-0.76*Statisticsgrade +2.324HighschoolGPA +e Y= -0.010*Statisticsgrade +0.319HighschoolGPA +e ΈΝΝΟΙΕΣ ΑΠΟ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Απλή: Ŷ = (B0 + B1 X1) , όπου B1 = r SY/SX Standardized regression: b1 = rY1 (beta weight) Πολλαπλή: Ŷ = (B0 + B1 X1 + B2 X2) To Ŷ είναι composite, ένας σταθμικός γραμμικός συνδυασμός των Χ1 και Χ2 Standardized regression: bi ≠ rYi και συνήθως bi < rYi τα bi προσαρμόζονται για ενδοσυσχετίσεις των Χi και Υ Statistics grade High School GPA -0.10 Research grade 0.319