p - Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης

Download Report

Transcript p - Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης

Slide 1

Στατιστική Ανάλυση
στην Εκπαιδευτική Έρευνα
(Έκανα το πείραμα και πήρα τα δεδομένα…και τώρα τι κάνω;
Χρήσιμες συμβουλές για αρχάριους)

Δρ. Παντελής Μ. Παπαδόπουλος
Τμήμα Πληροφορικής
Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης

Δρ. Παντελής Μ. Παπαδόπουλος

Στατιστική Ανάλυση


Slide 2

Περιεχόμενα
Σχεδίαση έρευνας
Βασικά στοιχεία στατιστικής
Test assumptions
Κανονική κατανομή και outliers
Σύγκριση ομάδων με παραμετρικά και μη παραμετρικά τεστ
T-test, ANOVA, ANCOVA, Mann-Whitney, Kruskal-Wallis

Effect size
Συσχέτιση μεταβλητών
Αξιοπιστία
Παράρτημα Α: Τα τεστ στο SPSS
Παράρτημα Β: Αγγλο-ελληνικό λεξικό στατιστικών όρων
Πηγές

Δρ. Παντελής Μ. Παπαδόπουλος

2 / 48

Στατιστική Ανάλυση


Slide 3

Σχεδίαση Έρευνας (1/5)
Εξαιρετική προσοχή στη σχεδίαση της έρευνας!!!
Η σχεδίαση της έρευνας προηγείται όλων των άλλων φάσεων ενός
πειράματος – αν γίνει λάθος, δύσκολα διορθώνεται
Σχεδίαση έρευνας, εκτέλεση έρευνας, συγκομιδή αποτελεσμάτων,
ανάλυση αποτελεσμάτων, παρουσίαση συμπερασμάτων, eternal glory

Σαφής καθορισμός συνθηκών / ομάδων
Έλεγχος των μεταβλητών που επηρεάζουν το πείραμα
Για τον έλεγχο μίας μεταβλητής Χ με Ν διαβαθμίσεις, χρειαζόμαστε
Ν ομάδες οι οποίες να διαφέρουν μόνο στη μεταβλητή Χ
Control group: συνθήκη που προσομοιάζει περισσότερο σε
συνθήκες τυπικής δραστηριότητας (μπορεί να μην υπάρχει)
Treatment group: συνθήκη στην οποία εφαρμόζουμε τη μέθοδο
που θέλουμε να ελέγξουμε (μπορούμε να έχουμε πολλά)
Δρ. Παντελής Μ. Παπαδόπουλος

3 / 48

Στατιστική Ανάλυση


Slide 4

Σχεδίαση Έρευνας (2/5)
Παράδειγμα 1
Μεταβλητή: Επίδραση γραφημάτων σε κείμενο
Control group: μελέτη με κείμενο χωρίς γραφήματα
Treatment group: μελέτη με κείμενο που περιέχει γραφήματα
Ισοδύναμος πληθυσμός: (χαρακτηριστικά που σχετίζονται με την
έρευνα, π.χ. μορφωτικό επίπεδο, ηλικία, φύλο, ζώδιο)
Ισοδύναμο υλικό: η πληροφορία που δίνεται στις δύο ομάδες
πρέπει να είναι η ίδια (τα γραφήματα αναδιατυπώνουν τα όσα
εμφανίζονται στο κείμενο, δεν προσθέτουν νέα πληροφορία)
Εργαλεία: επιλογή κατάλληλων εργαλείων (ερωτηματολογίων, τεστ,
κτλ) για την καταγραφή των δεδομένων που μας ενδιαφέρουν
Έλεγχος: μέθοδος για την παρακολούθηση του πειράματος κατά
την εκτέλεσή του
Δρ. Παντελής Μ. Παπαδόπουλος

4 / 48

Στατιστική Ανάλυση


Slide 5

Σχεδίαση Έρευνας (3/5)
Παράδειγμα 2
Μεταβλητή: Επίδραση χρώματος κειμένου
Treatment group 1: μελέτη με μαύρο κείμενο
Treatment group 2: μελέτη με μπλε κείμενο
Treatment group 3: μελέτη με κόκκινο κείμενο
Treatment…κτλ για όσα χρώματα μας ενδιαφέρει
Ισοδύναμος πληθυσμός και ίδιες συνθήκες για όλες τις ομάδες

Δρ. Παντελής Μ. Παπαδόπουλος

5 / 48

Στατιστική Ανάλυση


Slide 6

Σχεδίαση Έρευνας (4/5)
Παράδειγμα 3
Μεταβλητή 1: Επίδραση γραφημάτων σε κείμενο
Μεταβλητή 2: Επίδραση μικρών-κεφαλαίων
Για περισσότερες από μία παραμέτρους χρειαζόμαστε ΝxΜxΚx…
ομάδες, όπου Ν, Μ, Κ, κτλ οι διαβαθμίσεις των μεταβλητών
Factorial design 2x2
Γραφήματα
Μέγεθος
γραμμάτων

Ναι

Όχι

Μικρά

ΓραΜι

ΚειΜι

Κεφαλαία

ΓραΚε

ΚειΚε

Δρ. Παντελής Μ. Παπαδόπουλος

6 / 48

Στατιστική Ανάλυση


Slide 7

Σχεδίαση Έρευνας (5/5)
Ανεξάρτητες και εξαρτημένες μεταβλητές
Ανεξάρτητη μεταβλητή: Μεταβλητή που προκαλεί ένα αποτέλεσμα
Π.χ. Η ύπαρξη ή μη γραφημάτων σε κείμενο
Οι ανεξάρτητες μεταβλητές χρησιμοποιούνται για τον καθορισμό
ομάδων σε μία έρευνα

Εξαρτημένη μεταβλητή: Μεταβλητές των οποίων η τιμή αλλάζει με
βάση τις ανεξάρτητες μεταβλητές
Π.χ. Οι επιδόσεις των φοιτητών σε ένα τεστ
Οι επιδόσεις στο τεστ καθορίζονται από την ύπαρξη ή μη γραφημάτων
σε κείμενο

Δρ. Παντελής Μ. Παπαδόπουλος

7 / 48

Στατιστική Ανάλυση


Slide 8

Βασικά Στοιχεία Στατιστικής (1/3)
Όροι στατιστικής
Group size (N): το μέγεθος του δείγματος
Mean (M): μέσος όρος τιμών του δείγματος
Standard Deviation (SD): τυπική απόκλιση δείγματος
Πόσο διάσπαρτες είναι οι τιμές μέσα στο δείγμα
Μικρή τιμή δηλώνει ότι το δείγμα συμπεριφέρθηκε με έναν κοινό τρόπο
Μεγάλη τιμή δηλώνει σημαντικές διαφορές στη
συμπεριφορά/επιδόσεις/προτιμήσεις ατόμων του ίδιου δείγματος

Probability (p): η πιθανότητα να ισχύει μία υπόθεση
Confidence level (α): η ανεκτή πιθανότητα στατιστικού σφάλματος
Συνηθισμένη τιμή στην εκπαιδευτική έρευνα: 0.05
1 στα 20 τεστ θα παρουσιάσει εσφαλμένο αποτέλεσμα
Confidence interval: 1 – α
Δρ. Παντελής Μ. Παπαδόπουλος

8 / 48

Στατιστική Ανάλυση


Slide 9

Βασικά Στοιχεία Στατιστικής (2/3)
Διατύπωση υποθέσεων
Null hypothesis (H0): μηδενική υπόθεση
Υπόθεση που κάνετε εσείς ή το τεστ που εκτελείτε
Ισχύει αν p > α

Alternative hypothesis (Ha): εναλλακτική υπόθεση
Διατυπώνεται εφόσον δεν ισχύει η μηδενική

Παράδειγμα
H0α: "Οι φοιτητές της Ομάδας Α θα έχουν τις ίδιες επιδόσεις με τους
φοιτητές της Ομάδας Β σε ένα τεστ για την προσληφθείσα γνώση
πεδίου"
Αποτελέσματα
Α: (M=7.87, SD=1.24) B: (M=6.54, SD=1.27) p=0.06
(α=0.05)
Η0α: Δεκτή γιατί p > α
Δρ. Παντελής Μ. Παπαδόπουλος

9 / 48

Στατιστική Ανάλυση


Slide 10

Βασικά Στοιχεία Στατιστικής (3/3)
Είδη σφαλμάτων (ψιλά γράμματα, αλλά μπορεί να σας τύχει)
Type I Error (α error): Απορρίπτεται λανθασμένα η μηδενική
υπόθεση
Type II Error (β error): Γίνεται λανθασμένα δεκτή η μηδενική
υπόθεση
Κλασικό παράδειγμα: Ερωτηματολόγιο με πολλές ερωτήσεις και
ξεχωριστή εκτέλεση στατιστικού ελέγχου σε κάθε ερώτηση
…θυμάστε το "1 στα 20 τεστ θα παρουσιάσει σφάλμα";

Διόρθωση του α
Bonferroni correction: α/ν, όπου ν ο αριθμός των τεστ συνολικά στο
πείραμα
Καλή τύχη στην απόρριψη μηδενικών υποθέσεων!

Benjamini-Hochberg: σταδιακή μείωση του α και καλύτερα
αποτελέσματα στην αποδοχή/απόρριψη μηδενικών υποθέσεων
Google
Δρ. Παντελής Μ. Παπαδόπουλος

10 / 48

Στατιστική Ανάλυση


Slide 11

Test Assumptions
"Αν η Γιαγιά μου είχε καρούλια…θα ήταν πατίνι"
Κάθε στατιστικό τεστ βασίζεται σε ένα σύνολο υποθέσεων
(κριτηρίων)
Αν οι υποθέσεις δεν ισχύουν, το αποτέλεσμα του ελέγχου μπορεί
να είναι λανθασμένο
Δυστυχώς, πολύ συχνά δεν γίνεται έλεγχος των υποθέσεων
Ο κυριότερος έλεγχος που μας ενδιαφέρει είναι αν μπορούμε να
χρησιμοποιήσουμε στη στατιστική μας ανάλυση παραμετρικά τεστ
Τα παραμετρικά τεστ εμφανίζονται περισσότερο στη βιβλιογραφία
Είναι πιο ισχυρά και έχουν καλύτερη αντιμετώπιση από τους reviewers
Τα μη παραμετρικά τεστ είναι η εναλλακτική που έχουμε
Δρ. Παντελής Μ. Παπαδόπουλος

11 / 48

Στατιστική Ανάλυση


Slide 12

Test Assumptions
Υποθέσεις παραμετρικών τεστ
1. Independence
Δεν βασίζεται σε κάποιο στατιστικό τεστ, αλλά στη λογική της έρευνας
Μία μέτρηση, π.χ. ο βαθμός ενός φοιτητή σε ένα τεστ, θα πρέπει να
μην επηρεάζεται από τους βαθμούς άλλων φοιτητών
Ανάλογα με το σχεδίαση της έρευνας, μπορεί να δοθεί διαφορετικό
νόημα στην ανεξαρτησία
Σε έρευνες συνεργατικής μάθησης, η ομάδα των φοιτητών θεωρείται μία
οντότητα, οπότε η ανεξαρτησία αφορά στην ανεξαρτησία συνεργατικών
ομάδων

2. Interval data
Συνεχείς τιμές σε κλίμακα τιμών (π.χ. 1-10)
Αν η βαθμολογία δύο φοιτητών σε ένα τεστ γνώσης είναι 7 και 10
αντίστοιχα, η διαφορά στην κλίμακα θα πρέπει να αντιπροσωπεύει
αντίστοιχη πραγματική διαφορά στη γνώση
Δεν υπάρχει στατιστικό τεστ για τον έλεγχο – βασίζεται στη λογική
Δρ. Παντελής Μ. Παπαδόπουλος

12 / 48

Στατιστική Ανάλυση


Slide 13

Test Assumptions
Υποθέσεις παραμετρικών τεστ
3. Homogeneity of variance
Η διασπορά των δεδομένων θα πρέπει να είναι ίδια σε όλο το σύνολο
δεδομένων που εξετάζουμε
Ελέγχεται με το Levene's test

4. Normally distributed data
Τα δεδομένα θα πρέπει να ακολουθούν κανονική κατανομή
Ελέγχεται με το Kolmogorov-Smirov ή το Shapiro-Wilk test

Αν θέλετε να χρησιμοποιήσετε παραμετρικά τεστ σε διαφορετικές
ομάδες, θα πρέπει να κάνετε έλεγχο των παραπάνω υποθέσεων
για κάθε ομάδα ξεχωριστά
Δρ. Παντελής Μ. Παπαδόπουλος

13 / 48

Στατιστική Ανάλυση


Slide 14

Κανονική Κατανομή και Outliers (1/2)
Όταν ένα δείγμα με μέσο όρο Μ
και τυπική απόκλιση SD είναι σε
κανονική κατανομή, τότε το
διάγραμμα συχνοτήτων-τιμών
σχηματίζει μία "καμπάνα" με το Μ
στην κορυφή
Στο διάστημα (Μ-SD, M+SD)
υπάρχει το 68% των δεδομένων
Λανθασμένη σχεδίαση της έρευνας
και παρουσία outliers μπορεί να
"γείρει" την καμπάνα δεξιά ή
αριστερά
Τότε παραβιάζεται το κριτήριο της
κανονικής κατανομής
Αυτός είναι ο πιο συχνός λόγος για
απόρριψη των παραμετρικών τεστ
Δρ. Παντελής Μ. Παπαδόπουλος

14 / 48

Στατιστική Ανάλυση


Slide 15

Κανονική Κατανομή και Outliers (2/2)
Outliers σε ένα δείγμα είναι ακραίες τιμές που επηρεάζουν κατά
πολύ τις τιμές Μ, SD του δείγματος
Τυπικά βρίσκονται σε απόσταση ± 3 SD από το M
Π.χ. Αν σε ένα δείγμα φοιτητών Μ=8.5, SD=1.00, τότε ένας φοιτητής με
βαθμό 4.00 είναι outlier

Ειδικά στην εκπαιδευτική έρευνα ο όρος του outlier μπορεί να
περιλαμβάνει και φοιτητές που βρίσκονται πιο κοντά στο M
Π.χ. Αν Μ=7.00, SD=2.00, τυπικά μόνο οι φοιτητές με βαθμό 1.00 θα
είναι outliers. Ωστόσο μπορούν να χαρακτηριστούν έτσι και φοιτητές οι
οποίοι εμφανώς δεν ασχολήθηκαν με τη δραστηριότητα και είχα βαθμό
μικρότερο π.χ. του 4.
Προσοχή! Χρειάζεται έλεγχος και για τυχόν outliers με πολύ υψηλότερη
βαθμολογία από το υπόλοιπο δείγμα

Η αφαίρεση των outliers από ένα δείγμα μπορεί να διορθώσει το
σχήμα της καμπάνας!
Δρ. Παντελής Μ. Παπαδόπουλος

15 / 48

Στατιστική Ανάλυση


Slide 16

Σύγκριση Δύο Ομάδων: T-test
Σημ.: Σε όλα τα τεστ, το μέγεθος των δειγμάτων μπορεί να διαφέρει, αν
και είναι καλό αυτή η διαφορά να είναι όσο το δυνατό μικρότερη
T-test (ή Student's t-test)
Παραμετρικό τεστ
Fun fact: Δημιουργήθηκε από τον William Sealy Gosset, χημικός
που εργαζόταν στο εργοστάσιο παρασκευής της μπύρας Guinness.
Χρησιμοποίησε το όνομα "Student" κατά τη δημοσίευση του τεστ
για λόγους εμπορικού απορρήτου.
H0: Οι Μ των δύο δειγμάτων είναι ισοδύναμοι
Αν p < α (0.05): η μηδενική υπόθεση του τεστ απορρίπτεται
Hα: Υπάρχει στατιστικά σημαντική διαφορά μεταξύ των δύο
δειγμάτων
Δρ. Παντελής Μ. Παπαδόπουλος

16 / 48

Στατιστική Ανάλυση


Slide 17

Σύγκριση Δύο Ομάδων: Mann-Whitney
Mann-Whitney
Μη παραμετρικό τεστ
Είναι το αντίστοιχο του t-test
H0: Οι Μ των δύο δειγμάτων είναι ισοδύναμοι
Αν p < α (0.05): η μηδενική υπόθεση του τεστ απορρίπτεται
Hα: Υπάρχει στατιστικά σημαντική διαφορά μεταξύ των δύο
δειγμάτων

Δρ. Παντελής Μ. Παπαδόπουλος

17 / 48

Στατιστική Ανάλυση


Slide 18

Σύγκριση Περισσότερων Ομάδων: ANOVA
Analysis of variance (ANOVA)
Παραμετρικό τεστ
Είναι το αντίστοιχο του t-test για περισσότερες από δύο ομάδες
Για δύο ομάδες θα δώσει το ίδιο αποτέλεσμα με ένα t-test
Εξετάζει αν υπάρχει στατιστικά σημαντική διαφορά μεταξύ όλων
των ομάδων, αλλά και κατά ζεύγη
H0: Οι Μ των δύο δειγμάτων είναι ισοδύναμοι
Αν p < α (0.05): η μηδενική υπόθεση του τεστ απορρίπτεται
Hα: Υπάρχει στατιστικά σημαντική διαφορά μεταξύ των δειγμάτων
Post hoc tests: επιπλέον έλεγχοι για συγκρίσεις ανά ζεύγη
Συνηθέστεροι: Fisher's LSD (ισοδύναμο του t-test), Bonferroni, Tukey
LSD: Least Significant Difference
(καμία σχέση με το διαιθυλαμίδιο του λυσεργικού οξέος!)
Δρ. Παντελής Μ. Παπαδόπουλος

18 / 48

Στατιστική Ανάλυση


Slide 19

Σύγκριση Περισσότερων Ομάδων: ANCOVA
Analysis of covariance (ANCOVA)
Παραμετρικό τεστ
Παρόμοιο της ANOVA: εκτός από τη μεταβλητή που μας
ενδιαφέρει, λαμβάνει υπόψη και συμμεταβλητές (covariates) οι
οποίες μπορεί να επηρεάζουν το αποτέλεσμα
Π.χ. Ανεξάρτητη μεταβλητή: χρόνος δρομέα, Εξαρτημένη μεταβλητή:
φύλο δρομέα, Συμμεταβλητή: ηλικία δρομέα

Συνηθέστερη εμφάνιση σε έρευνες με pre-test, post-test
Το αποτέλεσμα του post-test είναι η εξαρτημένη μεταβλητή
Η πρότερη γνώση του φοιτητή (pre-test) είναι η συμμεταβλητή

Δρ. Παντελής Μ. Παπαδόπουλος

19 / 48

Στατιστική Ανάλυση


Slide 20

Σύγκριση Περισσότερων Ομάδων: ANCOVA
Analysis of covariance (ANCOVA) (συν.)
Δύο επιπλέον προϋποθέσεις
1. Independence of the covariate and the treatment effect
Η επίδραση της συμμεταβλητής θα πρέπει να είναι ανεξάρτητη της
επίδρασης της ανεξάρτητης μεταβλητής στο τελικό αποτέλεσμα της
εξαρτημένης μεταβλητής (!!!)
Π.χ. Τόσο το φύλο (ανεξάρτητη) όσο και η ηλικία (συμμεταβλητή) του
δρομέα μπορεί να επιδρούν στο χρόνο του (εξαρτημένη). Ωστόσο, η
επίδραση πχ του φύλου θα πρέπει να είναι ανεξάρτητη της ηλικίας στον
χρόνο.
Με άλλα (πολύ πιο απλά) λόγια, η συμμεταβλητή θα πρέπει να
κυμαίνεται με τον ίδιο τρόπο στα διάφορα δείγματα.
Άρα μπορούμε να κάνουμε ένα t-test (ή ANOVA) παίρνοντας τη
συμμεταβλητή ως εξαρτημένη μεταβλητή. Αν δεν υπάρχουν σημαντικά
στατιστικές διαφορές, ισχύει το κριτήριο
Δρ. Παντελής Μ. Παπαδόπουλος

20 / 48

Στατιστική Ανάλυση


Slide 21

Σύγκριση Περισσότερων Ομάδων: ANCOVA
Analysis of covariance (ANCOVA) (συν.)
Δύο επιπλέον προϋποθέσεις
2. Homogeneity of regression slopes
Η σχέση της εξαρτημένης μεταβλητής και της συμμεταβλητής θα
πρέπει να είναι ίδια σε όλα τα δείγματα
Ο έλεγχος μπορεί να γίνει με εκτέλεση ANCOVA για custom model
Αναλυτική περιγραφή των βημάτων στην ενότητα 11.7, σελ. 413 του
βιβλίου: Andy Field (2009). Discovering Statistics Using SPSS 3rd Edition

Δρ. Παντελής Μ. Παπαδόπουλος

21 / 48

Στατιστική Ανάλυση


Slide 22

Σύγκριση Περισσότερων Ομάδων: Kruskal-Wallis
Kruskal-Wallis
Μη παραμετρικό τεστ
Είναι το αντίστοιχο της ANOVA
H0: Οι Μ των δύο δειγμάτων είναι ισοδύναμοι
Αν p < α (0.05): η μηδενική υπόθεση του τεστ απορρίπτεται
Hα: Υπάρχει στατιστικά σημαντική διαφορά μεταξύ των δύο
δειγμάτων
Για ελέγχους κατά ζεύγη, εκτέλεση του Mann-Whitney με όλους
τους δυνατούς συνδυασμούς
Δεν υπάρχει αντίστοιχο μη παραμετρικό τεστ της ANCOVA

Δρ. Παντελής Μ. Παπαδόπουλος

22 / 48

Στατιστική Ανάλυση


Slide 23

Effect Size
Η στατιστικά σημαντική διαφορά μεταξύ δειγμάτων δεν λέει από
μόνη της πολλά
Διαφορετικά δείγματα με διαφορετικό μέγεθος ή διαφορετική κλίμακα
μπορεί να εμφανίσουν τις ίδιες διαφορές

Το effect size είναι ένας τρόπος να συγκρίνουμε διαφορετικά
αποτελέσματα μεταξύ τους
Αντικειμενικό μέγεθος που μετράει την επίδραση μίας μεταβλητής σε
μία άλλη (π.χ. η ανεξάρτητη στην εξαρτημένη)

Υπάρχουν πολλοί διαφορετικοί τύποι υπολογισμού του effect size
Συνηθέστεροι:
T-test: Cohen's d
ANOVA, ANCOVA: partial η2

Το effect size είναι απαραίτητο μόνο όταν υπάρχει στατιστικά
σημαντική διαφορά
<0.4: small
0.4-0.75: medium
>0.75: large
Δρ. Παντελής Μ. Παπαδόπουλος
23 / 48
Στατιστική Ανάλυση


Slide 24

Συσχέτιση Μεταβλητών: Pearson's r
Pearson's correlation coefficient r
Ελέγχει τη σχέση που διέπει δύο μεταβλητές
Π.χ. ο χρόνος μελέτης ενός φοιτητή με το βαθμό στο τεστ

Αν p < α τότε υπάρχει στατιστικά σημαντική συσχέτιση μεταξύ των
δύο μεταβλητών
Αν η τιμή του r είναι θετική, οι δύο μεταβλητές μεταβάλλονται με τον
ίδιο τρόπο
Αύξηση του χρόνου μελέτης σημαίνει και αύξηση του βαθμού στο τεστ

Αν η τιμή του r είναι αρνητική, οι δύο μεταβλητές μεταβάλλονται
αντίθετα
Αύξηση του χρόνου μελέτης σημαίνει μείωση του βαθμού στο τεστ (!!!)

Spearman's ρ: το αντίστοιχο μη παραμετρικό τεστ
Δρ. Παντελής Μ. Παπαδόπουλος

24 / 48

Στατιστική Ανάλυση


Slide 25

Αξιοπιστία: Cronbach's α
Cronbach's α
Ελέγχει την αξιοπιστία ενός συνόλου μεταβλητών
Ιδιαίτερα χρήσιμο για αξιολόγηση ερωτηματολογίων, τεστ, κτλ
Κάθε ερώτηση είναι μία μεταβλητή
Σε ένα αξιόπιστο ερωτηματολόγιο, ο φοιτητής απαντάει με τον ίδιο
τρόπο κάθε απάντηση
Σε ένα μη αξιόπιστο ερωτηματολόγιο, οι απαντήσεις παρουσιάζουν
αντικρουόμενες απόψεις
Όλες οι ερωτήσεις κατά την στατιστική ανάλυση θα πρέπει να έχουν την
ίδια κατεύθυνση (π.χ. μία αρνητικά φορτισμένη απάντηση να
αντιστραφεί σε θετική με αντίστοιχη αλλαγή τιμής 15, 24, κτλ)

Όσο μεγαλύτερο το Cronbach's α, τόσο πιο αξιόπιστο το
ερωτηματολόγιο
Ιδανικά, α > 0.8

Δρ. Παντελής Μ. Παπαδόπουλος

25 / 48

Στατιστική Ανάλυση


Slide 26

Παράρτημα Α
Τα τεστ στο SPSS

Δρ. Παντελής Μ. Παπαδόπουλος

Στατιστική Ανάλυση


Slide 27

T-test (1/3)
Analyze>>Compare Means>>Independent-Samples T-test
Test Variables: Οι εξαρτημένες μεταβλητές
Grouping Variables: η ανεξάρτητη μεταβλητή
Απόδοση αριθμητικών τιμών σε όλα τα πεδία
π.χ. φύλο: Άνδρας=1, Γυναίκα=2

Δρ. Παντελής Μ. Παπαδόπουλος

27 / 48

Στατιστική Ανάλυση


Slide 28

T-test (2/3)
Levene's Test: αν το Sig. (p) είναι >0.05, τότε το κριτήριο για
homogeneity of variance ισχύει
Λαμβάνεται υπόψη η πρώτη γραμμή του πίνακα (αλλιώς, η δεύτερη)

t: το αποτέλεσμα του t-test
Όσο μεγαλύτερο το t, τόσο πιο μεγάλο θα είναι και το effect size
Το πρόσημο δεν μας απασχολεί (σχετίζεται με το ποια ομάδα βάλαμε
πρώτη)

df: βαθμοί ελευθερίας
Sig. (2-tailed): αυτό είναι το p

Δρ. Παντελής Μ. Παπαδόπουλος

28 / 48

Στατιστική Ανάλυση


Slide 29

T-test (3/3)
Παράδειγμα αναφοράς αποτελέσματος
"Τα αποτελέσματα του t-test έδειξαν ότι υπάρχει στατιστικά
σημαντική διαφορά μεταξύ των δύο ομάδων (t[22]=2.521, p=0.027,
d=0.65) με την ομάδα πειράματος να εμφανίζει υψηλότερη
βαθμολογία στο τεστ μετα-ελέγχου"

Δρ. Παντελής Μ. Παπαδόπουλος

29 / 48

Στατιστική Ανάλυση


Slide 30

ANOVA (1/3)
Analyze>>Compare Means>>One-way ANOVA
Dependent List: Οι εξαρτημένες μεταβλητές
Factor: η ανεξάρτητη μεταβλητή
Στα post hoc επιλέγετε
Tukey, LSD, Bonferroni

Δρ. Παντελής Μ. Παπαδόπουλος

30 / 48

Στατιστική Ανάλυση


Slide 31

ANOVA (2/3)
Στα options υπάρχει το homogeneity of variance
τεστ (θα πρέπει να είναι >0.05 για να ισχύει το
κριτήριο)
df: βαθμοί ελευθερίας ανάμεσα στις ομάδες
Ο αριθμός των ομάδων - 1

df: βαθμοί ελευθερίας μέσα στις ομάδες
Ο αριθμός όλου του πληθυσμού – αριθμός ομάδων

F: το αποτέλεσμα της ANOVA
Όσο μεγαλύτερο το F, τόσο πιο μεγάλο θα είναι και
το effect size

Sig.: αυτό είναι το p

Δρ. Παντελής Μ. Παπαδόπουλος

31 / 48

Στατιστική Ανάλυση


Slide 32

ANOVA (3/3)
Παράδειγμα αναφοράς αποτελέσματος
"Τα αποτελέσματα ελέγχου ανάλυσης διακύμανσης (ANOVA) έδειξαν
ότι υπάρχει στατιστικά σημαντική διαφορά μεταξύ των ομάδων
(F(2,15)=7.447, p=0.006, η2=0.54). Τα αποτελέσματα των Tukey
post hoc τεστ έδειξαν ότι η Ομάδα Α είχε στατιστικά σημαντική
διαφορά και από την Ομάδα Β (p=0.36) και από την Ομάδα Γ
(p=0.25) έχοντας την υψηλότερη βαθμολογία στο τεστ μετα-ελέγχου.
Αντιθέτως οι ομάδες Β και Γ δεν παρουσίασαν μεταξύ τους
στατιστικά σημαντική διαφορά."

Δρ. Παντελής Μ. Παπαδόπουλος

32 / 48

Στατιστική Ανάλυση


Slide 33

ANCOVA (1/3)
Analyze>>General Linear Model>>Univariate
Dependent List: Η εξαρτημένη μεταβλητή
Fixed Factor(s): οι ανεξάρτητες μεταβλητές
Covariates: οι συμμεταβλητές
Στα options επιλέγεται
Homogeneity of variance
Estimates of effect size

Στο Post Hoc επιλέγετε
LSD, Bonferonni, Tukey

Δρ. Παντελής Μ. Παπαδόπουλος

33 / 48

Στατιστική Ανάλυση


Slide 34

ANCOVA (2/3)
Αποτελέσματα ανεξάρτητης μεταβλητής (Group)
Αποτελέσματα συμμεταβλητής (Pre)
Για τα F, df, Sig. ισχύει ότι και στην ANOVA
Η τελευταία στήλη (Partial Eta Squared) είναι το effect size της
ANCOVA

Δρ. Παντελής Μ. Παπαδόπουλος

34 / 48

Στατιστική Ανάλυση


Slide 35

ANCOVA (3/3)
Παράδειγμα αναφοράς αποτελέσματος
"Τα αποτελέσματα ελέγχου ανάλυσης συνδιακύμανσης (ANCOVA)
έδειξαν ότι υπάρχει στατιστικά σημαντική διαφορά μεταξύ των
ομάδων (F(2,50)=9.017, p=0.000, η2=0.265). Τα αποτελέσματα των
Tukey posthoc τεστ έδειξαν ότι η Ομάδα Α είχε στατιστικά σημαντική
διαφορά και από την Ομάδα Β (p=0.36) και από την Ομάδα Γ
(p=0.25) έχοντας την υψηλότερη βαθμολογία στο τεστ μετα-ελέγχου.
Αντιθέτως οι ομάδες Β και Γ δεν παρουσίασαν μεταξύ τους
στατιστικά σημαντική διαφορά."

Δρ. Παντελής Μ. Παπαδόπουλος

35 / 48

Στατιστική Ανάλυση


Slide 36

Mann-Whitney (1/2)
Analyze>>Nonparametric Tests>>2 Independent Samples
Test Variable List: οι εξαρτημένες μεταβλητές
Grouping Variable: η ανεξάρτητη μεταβλητή
Επιλέγετε το Mann-Whitney U

Δρ. Παντελής Μ. Παπαδόπουλος

36 / 48

Στατιστική Ανάλυση


Slide 37

Mann-Whitney(2/2)
Mann-Whitney U: το αποτέλεσμα του τεστ
Asymp. Sig. (2-tailed): το p
Παράδειγμα αναφοράς αποτελέσματος
"Τα αποτελέσματα ελέγχου Mann-Whitney U έδειξαν ότι υπάρχει
στατιστικά σημαντική διαφορά μεταξύ των δύο ομάδων
(U(22)=98.500, p=0.029) με την ομάδα πειράματος να εμφανίζει
υψηλότερη βαθμολογία στο τεστ μετα-ελέγχου "

Δρ. Παντελής Μ. Παπαδόπουλος

37 / 48

Στατιστική Ανάλυση


Slide 38

Kruskal-Wallis (1/2)
Analyze>>Nonparametric Tests>>K Independent Samples
Test Variable List: Οι εξαρτημένες μεταβλητές
Grouping Variable: η ανεξάρτητη μεταβλητή
Επιλέγετε Kruskal-Wallis H

Δρ. Παντελής Μ. Παπαδόπουλος

38 / 48

Στατιστική Ανάλυση


Slide 39

Kruskal-Wallis (2/2)
Chi-Square (Χ2): το αποτέλεσμα του τεστ
Asymp. Sig.: το p
Παράδειγμα αναφοράς αποτελέσματος
"Τα αποτελέσματα ελέγχου Kruskal-Wallis H έδειξαν ότι υπάρχει
στατιστικά σημαντική διαφορά μεταξύ των ομάδων (Χ2(2)=14.763,
p=0.001). Τα αποτελέσματα του post hoc ελέγχου Mann-Whitney U
για τη σύγκριση των ομάδων κατά ζεύγη έδειξαν ότι…"

Δρ. Παντελής Μ. Παπαδόπουλος

39 / 48

Στατιστική Ανάλυση


Slide 40

Pearson's r (1/2)
Analyze>>Correlate>>Bivariate
Variables: οι μεταβλητές που θέλουμε να εξετάσουμε
Για παραμετρικό τεστ επιλέγετε Pearson, για μη παραμετρικό,
Spearman

Δρ. Παντελής Μ. Παπαδόπουλος

40 / 48

Στατιστική Ανάλυση


Slide 41

Pearson's r (2/2)
Pearson Correlation: το αποτέλεσμα του τεστ
Sig. (2-tailed): το p
Παράδειγμα αναφοράς αποτελέσματος
"Τα αποτελέσματα ελέγχου Pearson's r έδειξαν ότι υπάρχει
στατιστικά σημαντική θετική συσχέτιση μεταξύ των μεταβλητών
FirstSen και SecondSen (r=0.518, p=0.008)."

Δρ. Παντελής Μ. Παπαδόπουλος

41 / 48

Στατιστική Ανάλυση


Slide 42

Cronbach's α
Analyze>>Scale>>Reliability Analysis
Items: οι μεταβλητές που θέλουμε να εξετάσουμε (ενός
ερωτηματολογίου Κ)
Το τεστ δίνει την τιμή του α
Παράδειγμα αναφοράς αποτελέσματος
"Η αξιοπιστία του ερωτηματολογίου ήταν ικανοποιητική (α=0.78)."

Δρ. Παντελής Μ. Παπαδόπουλος

42 / 48

Στατιστική Ανάλυση


Slide 43

Kolmogorov-Smirov & Shapiro-Wilk (1/2)
Analyze>>Descriptive Statistics>>Explore
Dependent List: οι εξαρτημένες μεταβλητές
Factor List: οι ανεξάρτητες μεταβλητές
Επιλέγετε Plots
Επιλέγετε Normality plots

Δρ. Παντελής Μ. Παπαδόπουλος

43 / 48

Στατιστική Ανάλυση


Slide 44

Kolmogorov-Smirov & Shapiro-Wilk (2/2)
Για δείγμα μεγέθους >30 λαμβάνετε υπόψη το Kolmogorv-Smirnov
Για δείγμα μεγέθους <30 λαμβάνετε υπόψη το Shapiro-Wilk
Θα πρέπει p < α, δηλ. p < 0.05 για να ισχύει το κριτήριο
Γενικά, δεν αναφέρετε τα αποτελέσματα των ελέγχων που κάνετε
για επιλογή παραμετρικών ή μη τεστ
Παράδειγμα
"Πραγματοποιήθηκαν οι έλεγχοι των υποθέσεων για χρήση
παραμετρικών τεστ και τα αποτελέσματα έδειξαν ότι κανένα
κριτήριο δεν παραβιάστηκε."

Δρ. Παντελής Μ. Παπαδόπουλος

44 / 48

Στατιστική Ανάλυση


Slide 45

Παράρτημα Β
Αγγλο-Ελληνικό Λεξικό Στατιστικών Όρων

Δρ. Παντελής Μ. Παπαδόπουλος

Στατιστική Ανάλυση


Slide 46

alternative hypothesis
(εναλλακτική υπόθεση)
analysis of covariance (ανάλυση
συνδιακύμανσης)
analysis of variance (ανάλυση
διακύμανσης)
confidence level (επίπεδο
εμπιστοσύνης)
control group (ομάδα ελέγχου)
correlation (συσχέτιση)
covariate (συμμεταβλητή)
dependent variable (εξαρτημένη
μεταβλητή)
effect size (μέγεθος επίδρασης)
factorial design (παραγοντική
σχεδίαση)
homogeneity of variance
(ομοιογένεια διακύμανσης)
independence (ανεξαρτησία)

Δρ. Παντελής Μ. Παπαδόπουλος

independent variable (ανεξάρτητη
μεταβλητή)
mean (μέσος όρος)
median (μέσος)
null hypothesis (μηδενική
υπόθεση)
outlier (έκτροπες παρατηρήσεις)
Pearson's correlation coefficient
(συντελεστής συσχέτισης
Pearson)
post-test (μετα-έλεγχος)
pre-test (προ-έλεγχος)
probability (πιθανότητα)
reliability (αξιοπιστία)
standard deviation (τυπική
απόκλιση)
treatment group (ομάδα
πειράματος)
variable (μεταβλητή)

46 / 48

Στατιστική Ανάλυση


Slide 47

Πηγές
Andy Field (2009). Discovering Statistics Using SPSS (and sex and
drugs and rock 'n' roll) 3rd Edition. SAGE Publications.
Ελληνικό Στατιστικό Ινστιτούτο (2009). Λεξικό Στατιστικής
Ορολογίας. Εκδόσεις Νέων Τεχνολογιών.
Η παρουσίαση:
http://users.auth.gr/pmpapad/statistics_pmpapad.pps
Αρχείο για τον εύκολο υπολογισμό του Cohen's d
http://users.auth.gr/pmpapad/Effect_Sizes_Spreadsheet.xls

Δρ. Παντελής Μ. Παπαδόπουλος

47 / 48

Στατιστική Ανάλυση


Slide 48

Ερωτήσεις;

Δρ. Παντελής Μ. Παπαδόπουλος

48 / 48

Στατιστική Ανάλυση