Transcript p - Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης
Slide 1
Στατιστική Ανάλυση
στην Εκπαιδευτική Έρευνα
(Έκανα το πείραμα και πήρα τα δεδομένα…και τώρα τι κάνω;
Χρήσιμες συμβουλές για αρχάριους)
Δρ. Παντελής Μ. Παπαδόπουλος
Τμήμα Πληροφορικής
Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης
Δρ. Παντελής Μ. Παπαδόπουλος
Στατιστική Ανάλυση
Slide 2
Περιεχόμενα
Σχεδίαση έρευνας
Βασικά στοιχεία στατιστικής
Test assumptions
Κανονική κατανομή και outliers
Σύγκριση ομάδων με παραμετρικά και μη παραμετρικά τεστ
T-test, ANOVA, ANCOVA, Mann-Whitney, Kruskal-Wallis
Effect size
Συσχέτιση μεταβλητών
Αξιοπιστία
Παράρτημα Α: Τα τεστ στο SPSS
Παράρτημα Β: Αγγλο-ελληνικό λεξικό στατιστικών όρων
Πηγές
Δρ. Παντελής Μ. Παπαδόπουλος
2 / 48
Στατιστική Ανάλυση
Slide 3
Σχεδίαση Έρευνας (1/5)
Εξαιρετική προσοχή στη σχεδίαση της έρευνας!!!
Η σχεδίαση της έρευνας προηγείται όλων των άλλων φάσεων ενός
πειράματος – αν γίνει λάθος, δύσκολα διορθώνεται
Σχεδίαση έρευνας, εκτέλεση έρευνας, συγκομιδή αποτελεσμάτων,
ανάλυση αποτελεσμάτων, παρουσίαση συμπερασμάτων, eternal glory
Σαφής καθορισμός συνθηκών / ομάδων
Έλεγχος των μεταβλητών που επηρεάζουν το πείραμα
Για τον έλεγχο μίας μεταβλητής Χ με Ν διαβαθμίσεις, χρειαζόμαστε
Ν ομάδες οι οποίες να διαφέρουν μόνο στη μεταβλητή Χ
Control group: συνθήκη που προσομοιάζει περισσότερο σε
συνθήκες τυπικής δραστηριότητας (μπορεί να μην υπάρχει)
Treatment group: συνθήκη στην οποία εφαρμόζουμε τη μέθοδο
που θέλουμε να ελέγξουμε (μπορούμε να έχουμε πολλά)
Δρ. Παντελής Μ. Παπαδόπουλος
3 / 48
Στατιστική Ανάλυση
Slide 4
Σχεδίαση Έρευνας (2/5)
Παράδειγμα 1
Μεταβλητή: Επίδραση γραφημάτων σε κείμενο
Control group: μελέτη με κείμενο χωρίς γραφήματα
Treatment group: μελέτη με κείμενο που περιέχει γραφήματα
Ισοδύναμος πληθυσμός: (χαρακτηριστικά που σχετίζονται με την
έρευνα, π.χ. μορφωτικό επίπεδο, ηλικία, φύλο, ζώδιο)
Ισοδύναμο υλικό: η πληροφορία που δίνεται στις δύο ομάδες
πρέπει να είναι η ίδια (τα γραφήματα αναδιατυπώνουν τα όσα
εμφανίζονται στο κείμενο, δεν προσθέτουν νέα πληροφορία)
Εργαλεία: επιλογή κατάλληλων εργαλείων (ερωτηματολογίων, τεστ,
κτλ) για την καταγραφή των δεδομένων που μας ενδιαφέρουν
Έλεγχος: μέθοδος για την παρακολούθηση του πειράματος κατά
την εκτέλεσή του
Δρ. Παντελής Μ. Παπαδόπουλος
4 / 48
Στατιστική Ανάλυση
Slide 5
Σχεδίαση Έρευνας (3/5)
Παράδειγμα 2
Μεταβλητή: Επίδραση χρώματος κειμένου
Treatment group 1: μελέτη με μαύρο κείμενο
Treatment group 2: μελέτη με μπλε κείμενο
Treatment group 3: μελέτη με κόκκινο κείμενο
Treatment…κτλ για όσα χρώματα μας ενδιαφέρει
Ισοδύναμος πληθυσμός και ίδιες συνθήκες για όλες τις ομάδες
Δρ. Παντελής Μ. Παπαδόπουλος
5 / 48
Στατιστική Ανάλυση
Slide 6
Σχεδίαση Έρευνας (4/5)
Παράδειγμα 3
Μεταβλητή 1: Επίδραση γραφημάτων σε κείμενο
Μεταβλητή 2: Επίδραση μικρών-κεφαλαίων
Για περισσότερες από μία παραμέτρους χρειαζόμαστε ΝxΜxΚx…
ομάδες, όπου Ν, Μ, Κ, κτλ οι διαβαθμίσεις των μεταβλητών
Factorial design 2x2
Γραφήματα
Μέγεθος
γραμμάτων
Ναι
Όχι
Μικρά
ΓραΜι
ΚειΜι
Κεφαλαία
ΓραΚε
ΚειΚε
Δρ. Παντελής Μ. Παπαδόπουλος
6 / 48
Στατιστική Ανάλυση
Slide 7
Σχεδίαση Έρευνας (5/5)
Ανεξάρτητες και εξαρτημένες μεταβλητές
Ανεξάρτητη μεταβλητή: Μεταβλητή που προκαλεί ένα αποτέλεσμα
Π.χ. Η ύπαρξη ή μη γραφημάτων σε κείμενο
Οι ανεξάρτητες μεταβλητές χρησιμοποιούνται για τον καθορισμό
ομάδων σε μία έρευνα
Εξαρτημένη μεταβλητή: Μεταβλητές των οποίων η τιμή αλλάζει με
βάση τις ανεξάρτητες μεταβλητές
Π.χ. Οι επιδόσεις των φοιτητών σε ένα τεστ
Οι επιδόσεις στο τεστ καθορίζονται από την ύπαρξη ή μη γραφημάτων
σε κείμενο
Δρ. Παντελής Μ. Παπαδόπουλος
7 / 48
Στατιστική Ανάλυση
Slide 8
Βασικά Στοιχεία Στατιστικής (1/3)
Όροι στατιστικής
Group size (N): το μέγεθος του δείγματος
Mean (M): μέσος όρος τιμών του δείγματος
Standard Deviation (SD): τυπική απόκλιση δείγματος
Πόσο διάσπαρτες είναι οι τιμές μέσα στο δείγμα
Μικρή τιμή δηλώνει ότι το δείγμα συμπεριφέρθηκε με έναν κοινό τρόπο
Μεγάλη τιμή δηλώνει σημαντικές διαφορές στη
συμπεριφορά/επιδόσεις/προτιμήσεις ατόμων του ίδιου δείγματος
Probability (p): η πιθανότητα να ισχύει μία υπόθεση
Confidence level (α): η ανεκτή πιθανότητα στατιστικού σφάλματος
Συνηθισμένη τιμή στην εκπαιδευτική έρευνα: 0.05
1 στα 20 τεστ θα παρουσιάσει εσφαλμένο αποτέλεσμα
Confidence interval: 1 – α
Δρ. Παντελής Μ. Παπαδόπουλος
8 / 48
Στατιστική Ανάλυση
Slide 9
Βασικά Στοιχεία Στατιστικής (2/3)
Διατύπωση υποθέσεων
Null hypothesis (H0): μηδενική υπόθεση
Υπόθεση που κάνετε εσείς ή το τεστ που εκτελείτε
Ισχύει αν p > α
Alternative hypothesis (Ha): εναλλακτική υπόθεση
Διατυπώνεται εφόσον δεν ισχύει η μηδενική
Παράδειγμα
H0α: "Οι φοιτητές της Ομάδας Α θα έχουν τις ίδιες επιδόσεις με τους
φοιτητές της Ομάδας Β σε ένα τεστ για την προσληφθείσα γνώση
πεδίου"
Αποτελέσματα
Α: (M=7.87, SD=1.24) B: (M=6.54, SD=1.27) p=0.06
(α=0.05)
Η0α: Δεκτή γιατί p > α
Δρ. Παντελής Μ. Παπαδόπουλος
9 / 48
Στατιστική Ανάλυση
Slide 10
Βασικά Στοιχεία Στατιστικής (3/3)
Είδη σφαλμάτων (ψιλά γράμματα, αλλά μπορεί να σας τύχει)
Type I Error (α error): Απορρίπτεται λανθασμένα η μηδενική
υπόθεση
Type II Error (β error): Γίνεται λανθασμένα δεκτή η μηδενική
υπόθεση
Κλασικό παράδειγμα: Ερωτηματολόγιο με πολλές ερωτήσεις και
ξεχωριστή εκτέλεση στατιστικού ελέγχου σε κάθε ερώτηση
…θυμάστε το "1 στα 20 τεστ θα παρουσιάσει σφάλμα";
Διόρθωση του α
Bonferroni correction: α/ν, όπου ν ο αριθμός των τεστ συνολικά στο
πείραμα
Καλή τύχη στην απόρριψη μηδενικών υποθέσεων!
Benjamini-Hochberg: σταδιακή μείωση του α και καλύτερα
αποτελέσματα στην αποδοχή/απόρριψη μηδενικών υποθέσεων
Google
Δρ. Παντελής Μ. Παπαδόπουλος
10 / 48
Στατιστική Ανάλυση
Slide 11
Test Assumptions
"Αν η Γιαγιά μου είχε καρούλια…θα ήταν πατίνι"
Κάθε στατιστικό τεστ βασίζεται σε ένα σύνολο υποθέσεων
(κριτηρίων)
Αν οι υποθέσεις δεν ισχύουν, το αποτέλεσμα του ελέγχου μπορεί
να είναι λανθασμένο
Δυστυχώς, πολύ συχνά δεν γίνεται έλεγχος των υποθέσεων
Ο κυριότερος έλεγχος που μας ενδιαφέρει είναι αν μπορούμε να
χρησιμοποιήσουμε στη στατιστική μας ανάλυση παραμετρικά τεστ
Τα παραμετρικά τεστ εμφανίζονται περισσότερο στη βιβλιογραφία
Είναι πιο ισχυρά και έχουν καλύτερη αντιμετώπιση από τους reviewers
Τα μη παραμετρικά τεστ είναι η εναλλακτική που έχουμε
Δρ. Παντελής Μ. Παπαδόπουλος
11 / 48
Στατιστική Ανάλυση
Slide 12
Test Assumptions
Υποθέσεις παραμετρικών τεστ
1. Independence
Δεν βασίζεται σε κάποιο στατιστικό τεστ, αλλά στη λογική της έρευνας
Μία μέτρηση, π.χ. ο βαθμός ενός φοιτητή σε ένα τεστ, θα πρέπει να
μην επηρεάζεται από τους βαθμούς άλλων φοιτητών
Ανάλογα με το σχεδίαση της έρευνας, μπορεί να δοθεί διαφορετικό
νόημα στην ανεξαρτησία
Σε έρευνες συνεργατικής μάθησης, η ομάδα των φοιτητών θεωρείται μία
οντότητα, οπότε η ανεξαρτησία αφορά στην ανεξαρτησία συνεργατικών
ομάδων
2. Interval data
Συνεχείς τιμές σε κλίμακα τιμών (π.χ. 1-10)
Αν η βαθμολογία δύο φοιτητών σε ένα τεστ γνώσης είναι 7 και 10
αντίστοιχα, η διαφορά στην κλίμακα θα πρέπει να αντιπροσωπεύει
αντίστοιχη πραγματική διαφορά στη γνώση
Δεν υπάρχει στατιστικό τεστ για τον έλεγχο – βασίζεται στη λογική
Δρ. Παντελής Μ. Παπαδόπουλος
12 / 48
Στατιστική Ανάλυση
Slide 13
Test Assumptions
Υποθέσεις παραμετρικών τεστ
3. Homogeneity of variance
Η διασπορά των δεδομένων θα πρέπει να είναι ίδια σε όλο το σύνολο
δεδομένων που εξετάζουμε
Ελέγχεται με το Levene's test
4. Normally distributed data
Τα δεδομένα θα πρέπει να ακολουθούν κανονική κατανομή
Ελέγχεται με το Kolmogorov-Smirov ή το Shapiro-Wilk test
Αν θέλετε να χρησιμοποιήσετε παραμετρικά τεστ σε διαφορετικές
ομάδες, θα πρέπει να κάνετε έλεγχο των παραπάνω υποθέσεων
για κάθε ομάδα ξεχωριστά
Δρ. Παντελής Μ. Παπαδόπουλος
13 / 48
Στατιστική Ανάλυση
Slide 14
Κανονική Κατανομή και Outliers (1/2)
Όταν ένα δείγμα με μέσο όρο Μ
και τυπική απόκλιση SD είναι σε
κανονική κατανομή, τότε το
διάγραμμα συχνοτήτων-τιμών
σχηματίζει μία "καμπάνα" με το Μ
στην κορυφή
Στο διάστημα (Μ-SD, M+SD)
υπάρχει το 68% των δεδομένων
Λανθασμένη σχεδίαση της έρευνας
και παρουσία outliers μπορεί να
"γείρει" την καμπάνα δεξιά ή
αριστερά
Τότε παραβιάζεται το κριτήριο της
κανονικής κατανομής
Αυτός είναι ο πιο συχνός λόγος για
απόρριψη των παραμετρικών τεστ
Δρ. Παντελής Μ. Παπαδόπουλος
14 / 48
Στατιστική Ανάλυση
Slide 15
Κανονική Κατανομή και Outliers (2/2)
Outliers σε ένα δείγμα είναι ακραίες τιμές που επηρεάζουν κατά
πολύ τις τιμές Μ, SD του δείγματος
Τυπικά βρίσκονται σε απόσταση ± 3 SD από το M
Π.χ. Αν σε ένα δείγμα φοιτητών Μ=8.5, SD=1.00, τότε ένας φοιτητής με
βαθμό 4.00 είναι outlier
Ειδικά στην εκπαιδευτική έρευνα ο όρος του outlier μπορεί να
περιλαμβάνει και φοιτητές που βρίσκονται πιο κοντά στο M
Π.χ. Αν Μ=7.00, SD=2.00, τυπικά μόνο οι φοιτητές με βαθμό 1.00 θα
είναι outliers. Ωστόσο μπορούν να χαρακτηριστούν έτσι και φοιτητές οι
οποίοι εμφανώς δεν ασχολήθηκαν με τη δραστηριότητα και είχα βαθμό
μικρότερο π.χ. του 4.
Προσοχή! Χρειάζεται έλεγχος και για τυχόν outliers με πολύ υψηλότερη
βαθμολογία από το υπόλοιπο δείγμα
Η αφαίρεση των outliers από ένα δείγμα μπορεί να διορθώσει το
σχήμα της καμπάνας!
Δρ. Παντελής Μ. Παπαδόπουλος
15 / 48
Στατιστική Ανάλυση
Slide 16
Σύγκριση Δύο Ομάδων: T-test
Σημ.: Σε όλα τα τεστ, το μέγεθος των δειγμάτων μπορεί να διαφέρει, αν
και είναι καλό αυτή η διαφορά να είναι όσο το δυνατό μικρότερη
T-test (ή Student's t-test)
Παραμετρικό τεστ
Fun fact: Δημιουργήθηκε από τον William Sealy Gosset, χημικός
που εργαζόταν στο εργοστάσιο παρασκευής της μπύρας Guinness.
Χρησιμοποίησε το όνομα "Student" κατά τη δημοσίευση του τεστ
για λόγους εμπορικού απορρήτου.
H0: Οι Μ των δύο δειγμάτων είναι ισοδύναμοι
Αν p < α (0.05): η μηδενική υπόθεση του τεστ απορρίπτεται
Hα: Υπάρχει στατιστικά σημαντική διαφορά μεταξύ των δύο
δειγμάτων
Δρ. Παντελής Μ. Παπαδόπουλος
16 / 48
Στατιστική Ανάλυση
Slide 17
Σύγκριση Δύο Ομάδων: Mann-Whitney
Mann-Whitney
Μη παραμετρικό τεστ
Είναι το αντίστοιχο του t-test
H0: Οι Μ των δύο δειγμάτων είναι ισοδύναμοι
Αν p < α (0.05): η μηδενική υπόθεση του τεστ απορρίπτεται
Hα: Υπάρχει στατιστικά σημαντική διαφορά μεταξύ των δύο
δειγμάτων
Δρ. Παντελής Μ. Παπαδόπουλος
17 / 48
Στατιστική Ανάλυση
Slide 18
Σύγκριση Περισσότερων Ομάδων: ANOVA
Analysis of variance (ANOVA)
Παραμετρικό τεστ
Είναι το αντίστοιχο του t-test για περισσότερες από δύο ομάδες
Για δύο ομάδες θα δώσει το ίδιο αποτέλεσμα με ένα t-test
Εξετάζει αν υπάρχει στατιστικά σημαντική διαφορά μεταξύ όλων
των ομάδων, αλλά και κατά ζεύγη
H0: Οι Μ των δύο δειγμάτων είναι ισοδύναμοι
Αν p < α (0.05): η μηδενική υπόθεση του τεστ απορρίπτεται
Hα: Υπάρχει στατιστικά σημαντική διαφορά μεταξύ των δειγμάτων
Post hoc tests: επιπλέον έλεγχοι για συγκρίσεις ανά ζεύγη
Συνηθέστεροι: Fisher's LSD (ισοδύναμο του t-test), Bonferroni, Tukey
LSD: Least Significant Difference
(καμία σχέση με το διαιθυλαμίδιο του λυσεργικού οξέος!)
Δρ. Παντελής Μ. Παπαδόπουλος
18 / 48
Στατιστική Ανάλυση
Slide 19
Σύγκριση Περισσότερων Ομάδων: ANCOVA
Analysis of covariance (ANCOVA)
Παραμετρικό τεστ
Παρόμοιο της ANOVA: εκτός από τη μεταβλητή που μας
ενδιαφέρει, λαμβάνει υπόψη και συμμεταβλητές (covariates) οι
οποίες μπορεί να επηρεάζουν το αποτέλεσμα
Π.χ. Ανεξάρτητη μεταβλητή: χρόνος δρομέα, Εξαρτημένη μεταβλητή:
φύλο δρομέα, Συμμεταβλητή: ηλικία δρομέα
Συνηθέστερη εμφάνιση σε έρευνες με pre-test, post-test
Το αποτέλεσμα του post-test είναι η εξαρτημένη μεταβλητή
Η πρότερη γνώση του φοιτητή (pre-test) είναι η συμμεταβλητή
Δρ. Παντελής Μ. Παπαδόπουλος
19 / 48
Στατιστική Ανάλυση
Slide 20
Σύγκριση Περισσότερων Ομάδων: ANCOVA
Analysis of covariance (ANCOVA) (συν.)
Δύο επιπλέον προϋποθέσεις
1. Independence of the covariate and the treatment effect
Η επίδραση της συμμεταβλητής θα πρέπει να είναι ανεξάρτητη της
επίδρασης της ανεξάρτητης μεταβλητής στο τελικό αποτέλεσμα της
εξαρτημένης μεταβλητής (!!!)
Π.χ. Τόσο το φύλο (ανεξάρτητη) όσο και η ηλικία (συμμεταβλητή) του
δρομέα μπορεί να επιδρούν στο χρόνο του (εξαρτημένη). Ωστόσο, η
επίδραση πχ του φύλου θα πρέπει να είναι ανεξάρτητη της ηλικίας στον
χρόνο.
Με άλλα (πολύ πιο απλά) λόγια, η συμμεταβλητή θα πρέπει να
κυμαίνεται με τον ίδιο τρόπο στα διάφορα δείγματα.
Άρα μπορούμε να κάνουμε ένα t-test (ή ANOVA) παίρνοντας τη
συμμεταβλητή ως εξαρτημένη μεταβλητή. Αν δεν υπάρχουν σημαντικά
στατιστικές διαφορές, ισχύει το κριτήριο
Δρ. Παντελής Μ. Παπαδόπουλος
20 / 48
Στατιστική Ανάλυση
Slide 21
Σύγκριση Περισσότερων Ομάδων: ANCOVA
Analysis of covariance (ANCOVA) (συν.)
Δύο επιπλέον προϋποθέσεις
2. Homogeneity of regression slopes
Η σχέση της εξαρτημένης μεταβλητής και της συμμεταβλητής θα
πρέπει να είναι ίδια σε όλα τα δείγματα
Ο έλεγχος μπορεί να γίνει με εκτέλεση ANCOVA για custom model
Αναλυτική περιγραφή των βημάτων στην ενότητα 11.7, σελ. 413 του
βιβλίου: Andy Field (2009). Discovering Statistics Using SPSS 3rd Edition
Δρ. Παντελής Μ. Παπαδόπουλος
21 / 48
Στατιστική Ανάλυση
Slide 22
Σύγκριση Περισσότερων Ομάδων: Kruskal-Wallis
Kruskal-Wallis
Μη παραμετρικό τεστ
Είναι το αντίστοιχο της ANOVA
H0: Οι Μ των δύο δειγμάτων είναι ισοδύναμοι
Αν p < α (0.05): η μηδενική υπόθεση του τεστ απορρίπτεται
Hα: Υπάρχει στατιστικά σημαντική διαφορά μεταξύ των δύο
δειγμάτων
Για ελέγχους κατά ζεύγη, εκτέλεση του Mann-Whitney με όλους
τους δυνατούς συνδυασμούς
Δεν υπάρχει αντίστοιχο μη παραμετρικό τεστ της ANCOVA
Δρ. Παντελής Μ. Παπαδόπουλος
22 / 48
Στατιστική Ανάλυση
Slide 23
Effect Size
Η στατιστικά σημαντική διαφορά μεταξύ δειγμάτων δεν λέει από
μόνη της πολλά
Διαφορετικά δείγματα με διαφορετικό μέγεθος ή διαφορετική κλίμακα
μπορεί να εμφανίσουν τις ίδιες διαφορές
Το effect size είναι ένας τρόπος να συγκρίνουμε διαφορετικά
αποτελέσματα μεταξύ τους
Αντικειμενικό μέγεθος που μετράει την επίδραση μίας μεταβλητής σε
μία άλλη (π.χ. η ανεξάρτητη στην εξαρτημένη)
Υπάρχουν πολλοί διαφορετικοί τύποι υπολογισμού του effect size
Συνηθέστεροι:
T-test: Cohen's d
ANOVA, ANCOVA: partial η2
Το effect size είναι απαραίτητο μόνο όταν υπάρχει στατιστικά
σημαντική διαφορά
<0.4: small
0.4-0.75: medium
>0.75: large
Δρ. Παντελής Μ. Παπαδόπουλος
23 / 48
Στατιστική Ανάλυση
Slide 24
Συσχέτιση Μεταβλητών: Pearson's r
Pearson's correlation coefficient r
Ελέγχει τη σχέση που διέπει δύο μεταβλητές
Π.χ. ο χρόνος μελέτης ενός φοιτητή με το βαθμό στο τεστ
Αν p < α τότε υπάρχει στατιστικά σημαντική συσχέτιση μεταξύ των
δύο μεταβλητών
Αν η τιμή του r είναι θετική, οι δύο μεταβλητές μεταβάλλονται με τον
ίδιο τρόπο
Αύξηση του χρόνου μελέτης σημαίνει και αύξηση του βαθμού στο τεστ
Αν η τιμή του r είναι αρνητική, οι δύο μεταβλητές μεταβάλλονται
αντίθετα
Αύξηση του χρόνου μελέτης σημαίνει μείωση του βαθμού στο τεστ (!!!)
Spearman's ρ: το αντίστοιχο μη παραμετρικό τεστ
Δρ. Παντελής Μ. Παπαδόπουλος
24 / 48
Στατιστική Ανάλυση
Slide 25
Αξιοπιστία: Cronbach's α
Cronbach's α
Ελέγχει την αξιοπιστία ενός συνόλου μεταβλητών
Ιδιαίτερα χρήσιμο για αξιολόγηση ερωτηματολογίων, τεστ, κτλ
Κάθε ερώτηση είναι μία μεταβλητή
Σε ένα αξιόπιστο ερωτηματολόγιο, ο φοιτητής απαντάει με τον ίδιο
τρόπο κάθε απάντηση
Σε ένα μη αξιόπιστο ερωτηματολόγιο, οι απαντήσεις παρουσιάζουν
αντικρουόμενες απόψεις
Όλες οι ερωτήσεις κατά την στατιστική ανάλυση θα πρέπει να έχουν την
ίδια κατεύθυνση (π.χ. μία αρνητικά φορτισμένη απάντηση να
αντιστραφεί σε θετική με αντίστοιχη αλλαγή τιμής 15, 24, κτλ)
Όσο μεγαλύτερο το Cronbach's α, τόσο πιο αξιόπιστο το
ερωτηματολόγιο
Ιδανικά, α > 0.8
Δρ. Παντελής Μ. Παπαδόπουλος
25 / 48
Στατιστική Ανάλυση
Slide 26
Παράρτημα Α
Τα τεστ στο SPSS
Δρ. Παντελής Μ. Παπαδόπουλος
Στατιστική Ανάλυση
Slide 27
T-test (1/3)
Analyze>>Compare Means>>Independent-Samples T-test
Test Variables: Οι εξαρτημένες μεταβλητές
Grouping Variables: η ανεξάρτητη μεταβλητή
Απόδοση αριθμητικών τιμών σε όλα τα πεδία
π.χ. φύλο: Άνδρας=1, Γυναίκα=2
Δρ. Παντελής Μ. Παπαδόπουλος
27 / 48
Στατιστική Ανάλυση
Slide 28
T-test (2/3)
Levene's Test: αν το Sig. (p) είναι >0.05, τότε το κριτήριο για
homogeneity of variance ισχύει
Λαμβάνεται υπόψη η πρώτη γραμμή του πίνακα (αλλιώς, η δεύτερη)
t: το αποτέλεσμα του t-test
Όσο μεγαλύτερο το t, τόσο πιο μεγάλο θα είναι και το effect size
Το πρόσημο δεν μας απασχολεί (σχετίζεται με το ποια ομάδα βάλαμε
πρώτη)
df: βαθμοί ελευθερίας
Sig. (2-tailed): αυτό είναι το p
Δρ. Παντελής Μ. Παπαδόπουλος
28 / 48
Στατιστική Ανάλυση
Slide 29
T-test (3/3)
Παράδειγμα αναφοράς αποτελέσματος
"Τα αποτελέσματα του t-test έδειξαν ότι υπάρχει στατιστικά
σημαντική διαφορά μεταξύ των δύο ομάδων (t[22]=2.521, p=0.027,
d=0.65) με την ομάδα πειράματος να εμφανίζει υψηλότερη
βαθμολογία στο τεστ μετα-ελέγχου"
Δρ. Παντελής Μ. Παπαδόπουλος
29 / 48
Στατιστική Ανάλυση
Slide 30
ANOVA (1/3)
Analyze>>Compare Means>>One-way ANOVA
Dependent List: Οι εξαρτημένες μεταβλητές
Factor: η ανεξάρτητη μεταβλητή
Στα post hoc επιλέγετε
Tukey, LSD, Bonferroni
Δρ. Παντελής Μ. Παπαδόπουλος
30 / 48
Στατιστική Ανάλυση
Slide 31
ANOVA (2/3)
Στα options υπάρχει το homogeneity of variance
τεστ (θα πρέπει να είναι >0.05 για να ισχύει το
κριτήριο)
df: βαθμοί ελευθερίας ανάμεσα στις ομάδες
Ο αριθμός των ομάδων - 1
df: βαθμοί ελευθερίας μέσα στις ομάδες
Ο αριθμός όλου του πληθυσμού – αριθμός ομάδων
F: το αποτέλεσμα της ANOVA
Όσο μεγαλύτερο το F, τόσο πιο μεγάλο θα είναι και
το effect size
Sig.: αυτό είναι το p
Δρ. Παντελής Μ. Παπαδόπουλος
31 / 48
Στατιστική Ανάλυση
Slide 32
ANOVA (3/3)
Παράδειγμα αναφοράς αποτελέσματος
"Τα αποτελέσματα ελέγχου ανάλυσης διακύμανσης (ANOVA) έδειξαν
ότι υπάρχει στατιστικά σημαντική διαφορά μεταξύ των ομάδων
(F(2,15)=7.447, p=0.006, η2=0.54). Τα αποτελέσματα των Tukey
post hoc τεστ έδειξαν ότι η Ομάδα Α είχε στατιστικά σημαντική
διαφορά και από την Ομάδα Β (p=0.36) και από την Ομάδα Γ
(p=0.25) έχοντας την υψηλότερη βαθμολογία στο τεστ μετα-ελέγχου.
Αντιθέτως οι ομάδες Β και Γ δεν παρουσίασαν μεταξύ τους
στατιστικά σημαντική διαφορά."
Δρ. Παντελής Μ. Παπαδόπουλος
32 / 48
Στατιστική Ανάλυση
Slide 33
ANCOVA (1/3)
Analyze>>General Linear Model>>Univariate
Dependent List: Η εξαρτημένη μεταβλητή
Fixed Factor(s): οι ανεξάρτητες μεταβλητές
Covariates: οι συμμεταβλητές
Στα options επιλέγεται
Homogeneity of variance
Estimates of effect size
Στο Post Hoc επιλέγετε
LSD, Bonferonni, Tukey
Δρ. Παντελής Μ. Παπαδόπουλος
33 / 48
Στατιστική Ανάλυση
Slide 34
ANCOVA (2/3)
Αποτελέσματα ανεξάρτητης μεταβλητής (Group)
Αποτελέσματα συμμεταβλητής (Pre)
Για τα F, df, Sig. ισχύει ότι και στην ANOVA
Η τελευταία στήλη (Partial Eta Squared) είναι το effect size της
ANCOVA
Δρ. Παντελής Μ. Παπαδόπουλος
34 / 48
Στατιστική Ανάλυση
Slide 35
ANCOVA (3/3)
Παράδειγμα αναφοράς αποτελέσματος
"Τα αποτελέσματα ελέγχου ανάλυσης συνδιακύμανσης (ANCOVA)
έδειξαν ότι υπάρχει στατιστικά σημαντική διαφορά μεταξύ των
ομάδων (F(2,50)=9.017, p=0.000, η2=0.265). Τα αποτελέσματα των
Tukey posthoc τεστ έδειξαν ότι η Ομάδα Α είχε στατιστικά σημαντική
διαφορά και από την Ομάδα Β (p=0.36) και από την Ομάδα Γ
(p=0.25) έχοντας την υψηλότερη βαθμολογία στο τεστ μετα-ελέγχου.
Αντιθέτως οι ομάδες Β και Γ δεν παρουσίασαν μεταξύ τους
στατιστικά σημαντική διαφορά."
Δρ. Παντελής Μ. Παπαδόπουλος
35 / 48
Στατιστική Ανάλυση
Slide 36
Mann-Whitney (1/2)
Analyze>>Nonparametric Tests>>2 Independent Samples
Test Variable List: οι εξαρτημένες μεταβλητές
Grouping Variable: η ανεξάρτητη μεταβλητή
Επιλέγετε το Mann-Whitney U
Δρ. Παντελής Μ. Παπαδόπουλος
36 / 48
Στατιστική Ανάλυση
Slide 37
Mann-Whitney(2/2)
Mann-Whitney U: το αποτέλεσμα του τεστ
Asymp. Sig. (2-tailed): το p
Παράδειγμα αναφοράς αποτελέσματος
"Τα αποτελέσματα ελέγχου Mann-Whitney U έδειξαν ότι υπάρχει
στατιστικά σημαντική διαφορά μεταξύ των δύο ομάδων
(U(22)=98.500, p=0.029) με την ομάδα πειράματος να εμφανίζει
υψηλότερη βαθμολογία στο τεστ μετα-ελέγχου "
Δρ. Παντελής Μ. Παπαδόπουλος
37 / 48
Στατιστική Ανάλυση
Slide 38
Kruskal-Wallis (1/2)
Analyze>>Nonparametric Tests>>K Independent Samples
Test Variable List: Οι εξαρτημένες μεταβλητές
Grouping Variable: η ανεξάρτητη μεταβλητή
Επιλέγετε Kruskal-Wallis H
Δρ. Παντελής Μ. Παπαδόπουλος
38 / 48
Στατιστική Ανάλυση
Slide 39
Kruskal-Wallis (2/2)
Chi-Square (Χ2): το αποτέλεσμα του τεστ
Asymp. Sig.: το p
Παράδειγμα αναφοράς αποτελέσματος
"Τα αποτελέσματα ελέγχου Kruskal-Wallis H έδειξαν ότι υπάρχει
στατιστικά σημαντική διαφορά μεταξύ των ομάδων (Χ2(2)=14.763,
p=0.001). Τα αποτελέσματα του post hoc ελέγχου Mann-Whitney U
για τη σύγκριση των ομάδων κατά ζεύγη έδειξαν ότι…"
Δρ. Παντελής Μ. Παπαδόπουλος
39 / 48
Στατιστική Ανάλυση
Slide 40
Pearson's r (1/2)
Analyze>>Correlate>>Bivariate
Variables: οι μεταβλητές που θέλουμε να εξετάσουμε
Για παραμετρικό τεστ επιλέγετε Pearson, για μη παραμετρικό,
Spearman
Δρ. Παντελής Μ. Παπαδόπουλος
40 / 48
Στατιστική Ανάλυση
Slide 41
Pearson's r (2/2)
Pearson Correlation: το αποτέλεσμα του τεστ
Sig. (2-tailed): το p
Παράδειγμα αναφοράς αποτελέσματος
"Τα αποτελέσματα ελέγχου Pearson's r έδειξαν ότι υπάρχει
στατιστικά σημαντική θετική συσχέτιση μεταξύ των μεταβλητών
FirstSen και SecondSen (r=0.518, p=0.008)."
Δρ. Παντελής Μ. Παπαδόπουλος
41 / 48
Στατιστική Ανάλυση
Slide 42
Cronbach's α
Analyze>>Scale>>Reliability Analysis
Items: οι μεταβλητές που θέλουμε να εξετάσουμε (ενός
ερωτηματολογίου Κ)
Το τεστ δίνει την τιμή του α
Παράδειγμα αναφοράς αποτελέσματος
"Η αξιοπιστία του ερωτηματολογίου ήταν ικανοποιητική (α=0.78)."
Δρ. Παντελής Μ. Παπαδόπουλος
42 / 48
Στατιστική Ανάλυση
Slide 43
Kolmogorov-Smirov & Shapiro-Wilk (1/2)
Analyze>>Descriptive Statistics>>Explore
Dependent List: οι εξαρτημένες μεταβλητές
Factor List: οι ανεξάρτητες μεταβλητές
Επιλέγετε Plots
Επιλέγετε Normality plots
Δρ. Παντελής Μ. Παπαδόπουλος
43 / 48
Στατιστική Ανάλυση
Slide 44
Kolmogorov-Smirov & Shapiro-Wilk (2/2)
Για δείγμα μεγέθους >30 λαμβάνετε υπόψη το Kolmogorv-Smirnov
Για δείγμα μεγέθους <30 λαμβάνετε υπόψη το Shapiro-Wilk
Θα πρέπει p < α, δηλ. p < 0.05 για να ισχύει το κριτήριο
Γενικά, δεν αναφέρετε τα αποτελέσματα των ελέγχων που κάνετε
για επιλογή παραμετρικών ή μη τεστ
Παράδειγμα
"Πραγματοποιήθηκαν οι έλεγχοι των υποθέσεων για χρήση
παραμετρικών τεστ και τα αποτελέσματα έδειξαν ότι κανένα
κριτήριο δεν παραβιάστηκε."
Δρ. Παντελής Μ. Παπαδόπουλος
44 / 48
Στατιστική Ανάλυση
Slide 45
Παράρτημα Β
Αγγλο-Ελληνικό Λεξικό Στατιστικών Όρων
Δρ. Παντελής Μ. Παπαδόπουλος
Στατιστική Ανάλυση
Slide 46
alternative hypothesis
(εναλλακτική υπόθεση)
analysis of covariance (ανάλυση
συνδιακύμανσης)
analysis of variance (ανάλυση
διακύμανσης)
confidence level (επίπεδο
εμπιστοσύνης)
control group (ομάδα ελέγχου)
correlation (συσχέτιση)
covariate (συμμεταβλητή)
dependent variable (εξαρτημένη
μεταβλητή)
effect size (μέγεθος επίδρασης)
factorial design (παραγοντική
σχεδίαση)
homogeneity of variance
(ομοιογένεια διακύμανσης)
independence (ανεξαρτησία)
Δρ. Παντελής Μ. Παπαδόπουλος
independent variable (ανεξάρτητη
μεταβλητή)
mean (μέσος όρος)
median (μέσος)
null hypothesis (μηδενική
υπόθεση)
outlier (έκτροπες παρατηρήσεις)
Pearson's correlation coefficient
(συντελεστής συσχέτισης
Pearson)
post-test (μετα-έλεγχος)
pre-test (προ-έλεγχος)
probability (πιθανότητα)
reliability (αξιοπιστία)
standard deviation (τυπική
απόκλιση)
treatment group (ομάδα
πειράματος)
variable (μεταβλητή)
46 / 48
Στατιστική Ανάλυση
Slide 47
Πηγές
Andy Field (2009). Discovering Statistics Using SPSS (and sex and
drugs and rock 'n' roll) 3rd Edition. SAGE Publications.
Ελληνικό Στατιστικό Ινστιτούτο (2009). Λεξικό Στατιστικής
Ορολογίας. Εκδόσεις Νέων Τεχνολογιών.
Η παρουσίαση:
http://users.auth.gr/pmpapad/statistics_pmpapad.pps
Αρχείο για τον εύκολο υπολογισμό του Cohen's d
http://users.auth.gr/pmpapad/Effect_Sizes_Spreadsheet.xls
Δρ. Παντελής Μ. Παπαδόπουλος
47 / 48
Στατιστική Ανάλυση
Slide 48
Ερωτήσεις;
Δρ. Παντελής Μ. Παπαδόπουλος
48 / 48
Στατιστική Ανάλυση
Στατιστική Ανάλυση
στην Εκπαιδευτική Έρευνα
(Έκανα το πείραμα και πήρα τα δεδομένα…και τώρα τι κάνω;
Χρήσιμες συμβουλές για αρχάριους)
Δρ. Παντελής Μ. Παπαδόπουλος
Τμήμα Πληροφορικής
Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης
Δρ. Παντελής Μ. Παπαδόπουλος
Στατιστική Ανάλυση
Slide 2
Περιεχόμενα
Σχεδίαση έρευνας
Βασικά στοιχεία στατιστικής
Test assumptions
Κανονική κατανομή και outliers
Σύγκριση ομάδων με παραμετρικά και μη παραμετρικά τεστ
T-test, ANOVA, ANCOVA, Mann-Whitney, Kruskal-Wallis
Effect size
Συσχέτιση μεταβλητών
Αξιοπιστία
Παράρτημα Α: Τα τεστ στο SPSS
Παράρτημα Β: Αγγλο-ελληνικό λεξικό στατιστικών όρων
Πηγές
Δρ. Παντελής Μ. Παπαδόπουλος
2 / 48
Στατιστική Ανάλυση
Slide 3
Σχεδίαση Έρευνας (1/5)
Εξαιρετική προσοχή στη σχεδίαση της έρευνας!!!
Η σχεδίαση της έρευνας προηγείται όλων των άλλων φάσεων ενός
πειράματος – αν γίνει λάθος, δύσκολα διορθώνεται
Σχεδίαση έρευνας, εκτέλεση έρευνας, συγκομιδή αποτελεσμάτων,
ανάλυση αποτελεσμάτων, παρουσίαση συμπερασμάτων, eternal glory
Σαφής καθορισμός συνθηκών / ομάδων
Έλεγχος των μεταβλητών που επηρεάζουν το πείραμα
Για τον έλεγχο μίας μεταβλητής Χ με Ν διαβαθμίσεις, χρειαζόμαστε
Ν ομάδες οι οποίες να διαφέρουν μόνο στη μεταβλητή Χ
Control group: συνθήκη που προσομοιάζει περισσότερο σε
συνθήκες τυπικής δραστηριότητας (μπορεί να μην υπάρχει)
Treatment group: συνθήκη στην οποία εφαρμόζουμε τη μέθοδο
που θέλουμε να ελέγξουμε (μπορούμε να έχουμε πολλά)
Δρ. Παντελής Μ. Παπαδόπουλος
3 / 48
Στατιστική Ανάλυση
Slide 4
Σχεδίαση Έρευνας (2/5)
Παράδειγμα 1
Μεταβλητή: Επίδραση γραφημάτων σε κείμενο
Control group: μελέτη με κείμενο χωρίς γραφήματα
Treatment group: μελέτη με κείμενο που περιέχει γραφήματα
Ισοδύναμος πληθυσμός: (χαρακτηριστικά που σχετίζονται με την
έρευνα, π.χ. μορφωτικό επίπεδο, ηλικία, φύλο, ζώδιο)
Ισοδύναμο υλικό: η πληροφορία που δίνεται στις δύο ομάδες
πρέπει να είναι η ίδια (τα γραφήματα αναδιατυπώνουν τα όσα
εμφανίζονται στο κείμενο, δεν προσθέτουν νέα πληροφορία)
Εργαλεία: επιλογή κατάλληλων εργαλείων (ερωτηματολογίων, τεστ,
κτλ) για την καταγραφή των δεδομένων που μας ενδιαφέρουν
Έλεγχος: μέθοδος για την παρακολούθηση του πειράματος κατά
την εκτέλεσή του
Δρ. Παντελής Μ. Παπαδόπουλος
4 / 48
Στατιστική Ανάλυση
Slide 5
Σχεδίαση Έρευνας (3/5)
Παράδειγμα 2
Μεταβλητή: Επίδραση χρώματος κειμένου
Treatment group 1: μελέτη με μαύρο κείμενο
Treatment group 2: μελέτη με μπλε κείμενο
Treatment group 3: μελέτη με κόκκινο κείμενο
Treatment…κτλ για όσα χρώματα μας ενδιαφέρει
Ισοδύναμος πληθυσμός και ίδιες συνθήκες για όλες τις ομάδες
Δρ. Παντελής Μ. Παπαδόπουλος
5 / 48
Στατιστική Ανάλυση
Slide 6
Σχεδίαση Έρευνας (4/5)
Παράδειγμα 3
Μεταβλητή 1: Επίδραση γραφημάτων σε κείμενο
Μεταβλητή 2: Επίδραση μικρών-κεφαλαίων
Για περισσότερες από μία παραμέτρους χρειαζόμαστε ΝxΜxΚx…
ομάδες, όπου Ν, Μ, Κ, κτλ οι διαβαθμίσεις των μεταβλητών
Factorial design 2x2
Γραφήματα
Μέγεθος
γραμμάτων
Ναι
Όχι
Μικρά
ΓραΜι
ΚειΜι
Κεφαλαία
ΓραΚε
ΚειΚε
Δρ. Παντελής Μ. Παπαδόπουλος
6 / 48
Στατιστική Ανάλυση
Slide 7
Σχεδίαση Έρευνας (5/5)
Ανεξάρτητες και εξαρτημένες μεταβλητές
Ανεξάρτητη μεταβλητή: Μεταβλητή που προκαλεί ένα αποτέλεσμα
Π.χ. Η ύπαρξη ή μη γραφημάτων σε κείμενο
Οι ανεξάρτητες μεταβλητές χρησιμοποιούνται για τον καθορισμό
ομάδων σε μία έρευνα
Εξαρτημένη μεταβλητή: Μεταβλητές των οποίων η τιμή αλλάζει με
βάση τις ανεξάρτητες μεταβλητές
Π.χ. Οι επιδόσεις των φοιτητών σε ένα τεστ
Οι επιδόσεις στο τεστ καθορίζονται από την ύπαρξη ή μη γραφημάτων
σε κείμενο
Δρ. Παντελής Μ. Παπαδόπουλος
7 / 48
Στατιστική Ανάλυση
Slide 8
Βασικά Στοιχεία Στατιστικής (1/3)
Όροι στατιστικής
Group size (N): το μέγεθος του δείγματος
Mean (M): μέσος όρος τιμών του δείγματος
Standard Deviation (SD): τυπική απόκλιση δείγματος
Πόσο διάσπαρτες είναι οι τιμές μέσα στο δείγμα
Μικρή τιμή δηλώνει ότι το δείγμα συμπεριφέρθηκε με έναν κοινό τρόπο
Μεγάλη τιμή δηλώνει σημαντικές διαφορές στη
συμπεριφορά/επιδόσεις/προτιμήσεις ατόμων του ίδιου δείγματος
Probability (p): η πιθανότητα να ισχύει μία υπόθεση
Confidence level (α): η ανεκτή πιθανότητα στατιστικού σφάλματος
Συνηθισμένη τιμή στην εκπαιδευτική έρευνα: 0.05
1 στα 20 τεστ θα παρουσιάσει εσφαλμένο αποτέλεσμα
Confidence interval: 1 – α
Δρ. Παντελής Μ. Παπαδόπουλος
8 / 48
Στατιστική Ανάλυση
Slide 9
Βασικά Στοιχεία Στατιστικής (2/3)
Διατύπωση υποθέσεων
Null hypothesis (H0): μηδενική υπόθεση
Υπόθεση που κάνετε εσείς ή το τεστ που εκτελείτε
Ισχύει αν p > α
Alternative hypothesis (Ha): εναλλακτική υπόθεση
Διατυπώνεται εφόσον δεν ισχύει η μηδενική
Παράδειγμα
H0α: "Οι φοιτητές της Ομάδας Α θα έχουν τις ίδιες επιδόσεις με τους
φοιτητές της Ομάδας Β σε ένα τεστ για την προσληφθείσα γνώση
πεδίου"
Αποτελέσματα
Α: (M=7.87, SD=1.24) B: (M=6.54, SD=1.27) p=0.06
(α=0.05)
Η0α: Δεκτή γιατί p > α
Δρ. Παντελής Μ. Παπαδόπουλος
9 / 48
Στατιστική Ανάλυση
Slide 10
Βασικά Στοιχεία Στατιστικής (3/3)
Είδη σφαλμάτων (ψιλά γράμματα, αλλά μπορεί να σας τύχει)
Type I Error (α error): Απορρίπτεται λανθασμένα η μηδενική
υπόθεση
Type II Error (β error): Γίνεται λανθασμένα δεκτή η μηδενική
υπόθεση
Κλασικό παράδειγμα: Ερωτηματολόγιο με πολλές ερωτήσεις και
ξεχωριστή εκτέλεση στατιστικού ελέγχου σε κάθε ερώτηση
…θυμάστε το "1 στα 20 τεστ θα παρουσιάσει σφάλμα";
Διόρθωση του α
Bonferroni correction: α/ν, όπου ν ο αριθμός των τεστ συνολικά στο
πείραμα
Καλή τύχη στην απόρριψη μηδενικών υποθέσεων!
Benjamini-Hochberg: σταδιακή μείωση του α και καλύτερα
αποτελέσματα στην αποδοχή/απόρριψη μηδενικών υποθέσεων
Δρ. Παντελής Μ. Παπαδόπουλος
10 / 48
Στατιστική Ανάλυση
Slide 11
Test Assumptions
"Αν η Γιαγιά μου είχε καρούλια…θα ήταν πατίνι"
Κάθε στατιστικό τεστ βασίζεται σε ένα σύνολο υποθέσεων
(κριτηρίων)
Αν οι υποθέσεις δεν ισχύουν, το αποτέλεσμα του ελέγχου μπορεί
να είναι λανθασμένο
Δυστυχώς, πολύ συχνά δεν γίνεται έλεγχος των υποθέσεων
Ο κυριότερος έλεγχος που μας ενδιαφέρει είναι αν μπορούμε να
χρησιμοποιήσουμε στη στατιστική μας ανάλυση παραμετρικά τεστ
Τα παραμετρικά τεστ εμφανίζονται περισσότερο στη βιβλιογραφία
Είναι πιο ισχυρά και έχουν καλύτερη αντιμετώπιση από τους reviewers
Τα μη παραμετρικά τεστ είναι η εναλλακτική που έχουμε
Δρ. Παντελής Μ. Παπαδόπουλος
11 / 48
Στατιστική Ανάλυση
Slide 12
Test Assumptions
Υποθέσεις παραμετρικών τεστ
1. Independence
Δεν βασίζεται σε κάποιο στατιστικό τεστ, αλλά στη λογική της έρευνας
Μία μέτρηση, π.χ. ο βαθμός ενός φοιτητή σε ένα τεστ, θα πρέπει να
μην επηρεάζεται από τους βαθμούς άλλων φοιτητών
Ανάλογα με το σχεδίαση της έρευνας, μπορεί να δοθεί διαφορετικό
νόημα στην ανεξαρτησία
Σε έρευνες συνεργατικής μάθησης, η ομάδα των φοιτητών θεωρείται μία
οντότητα, οπότε η ανεξαρτησία αφορά στην ανεξαρτησία συνεργατικών
ομάδων
2. Interval data
Συνεχείς τιμές σε κλίμακα τιμών (π.χ. 1-10)
Αν η βαθμολογία δύο φοιτητών σε ένα τεστ γνώσης είναι 7 και 10
αντίστοιχα, η διαφορά στην κλίμακα θα πρέπει να αντιπροσωπεύει
αντίστοιχη πραγματική διαφορά στη γνώση
Δεν υπάρχει στατιστικό τεστ για τον έλεγχο – βασίζεται στη λογική
Δρ. Παντελής Μ. Παπαδόπουλος
12 / 48
Στατιστική Ανάλυση
Slide 13
Test Assumptions
Υποθέσεις παραμετρικών τεστ
3. Homogeneity of variance
Η διασπορά των δεδομένων θα πρέπει να είναι ίδια σε όλο το σύνολο
δεδομένων που εξετάζουμε
Ελέγχεται με το Levene's test
4. Normally distributed data
Τα δεδομένα θα πρέπει να ακολουθούν κανονική κατανομή
Ελέγχεται με το Kolmogorov-Smirov ή το Shapiro-Wilk test
Αν θέλετε να χρησιμοποιήσετε παραμετρικά τεστ σε διαφορετικές
ομάδες, θα πρέπει να κάνετε έλεγχο των παραπάνω υποθέσεων
για κάθε ομάδα ξεχωριστά
Δρ. Παντελής Μ. Παπαδόπουλος
13 / 48
Στατιστική Ανάλυση
Slide 14
Κανονική Κατανομή και Outliers (1/2)
Όταν ένα δείγμα με μέσο όρο Μ
και τυπική απόκλιση SD είναι σε
κανονική κατανομή, τότε το
διάγραμμα συχνοτήτων-τιμών
σχηματίζει μία "καμπάνα" με το Μ
στην κορυφή
Στο διάστημα (Μ-SD, M+SD)
υπάρχει το 68% των δεδομένων
Λανθασμένη σχεδίαση της έρευνας
και παρουσία outliers μπορεί να
"γείρει" την καμπάνα δεξιά ή
αριστερά
Τότε παραβιάζεται το κριτήριο της
κανονικής κατανομής
Αυτός είναι ο πιο συχνός λόγος για
απόρριψη των παραμετρικών τεστ
Δρ. Παντελής Μ. Παπαδόπουλος
14 / 48
Στατιστική Ανάλυση
Slide 15
Κανονική Κατανομή και Outliers (2/2)
Outliers σε ένα δείγμα είναι ακραίες τιμές που επηρεάζουν κατά
πολύ τις τιμές Μ, SD του δείγματος
Τυπικά βρίσκονται σε απόσταση ± 3 SD από το M
Π.χ. Αν σε ένα δείγμα φοιτητών Μ=8.5, SD=1.00, τότε ένας φοιτητής με
βαθμό 4.00 είναι outlier
Ειδικά στην εκπαιδευτική έρευνα ο όρος του outlier μπορεί να
περιλαμβάνει και φοιτητές που βρίσκονται πιο κοντά στο M
Π.χ. Αν Μ=7.00, SD=2.00, τυπικά μόνο οι φοιτητές με βαθμό 1.00 θα
είναι outliers. Ωστόσο μπορούν να χαρακτηριστούν έτσι και φοιτητές οι
οποίοι εμφανώς δεν ασχολήθηκαν με τη δραστηριότητα και είχα βαθμό
μικρότερο π.χ. του 4.
Προσοχή! Χρειάζεται έλεγχος και για τυχόν outliers με πολύ υψηλότερη
βαθμολογία από το υπόλοιπο δείγμα
Η αφαίρεση των outliers από ένα δείγμα μπορεί να διορθώσει το
σχήμα της καμπάνας!
Δρ. Παντελής Μ. Παπαδόπουλος
15 / 48
Στατιστική Ανάλυση
Slide 16
Σύγκριση Δύο Ομάδων: T-test
Σημ.: Σε όλα τα τεστ, το μέγεθος των δειγμάτων μπορεί να διαφέρει, αν
και είναι καλό αυτή η διαφορά να είναι όσο το δυνατό μικρότερη
T-test (ή Student's t-test)
Παραμετρικό τεστ
Fun fact: Δημιουργήθηκε από τον William Sealy Gosset, χημικός
που εργαζόταν στο εργοστάσιο παρασκευής της μπύρας Guinness.
Χρησιμοποίησε το όνομα "Student" κατά τη δημοσίευση του τεστ
για λόγους εμπορικού απορρήτου.
H0: Οι Μ των δύο δειγμάτων είναι ισοδύναμοι
Αν p < α (0.05): η μηδενική υπόθεση του τεστ απορρίπτεται
Hα: Υπάρχει στατιστικά σημαντική διαφορά μεταξύ των δύο
δειγμάτων
Δρ. Παντελής Μ. Παπαδόπουλος
16 / 48
Στατιστική Ανάλυση
Slide 17
Σύγκριση Δύο Ομάδων: Mann-Whitney
Mann-Whitney
Μη παραμετρικό τεστ
Είναι το αντίστοιχο του t-test
H0: Οι Μ των δύο δειγμάτων είναι ισοδύναμοι
Αν p < α (0.05): η μηδενική υπόθεση του τεστ απορρίπτεται
Hα: Υπάρχει στατιστικά σημαντική διαφορά μεταξύ των δύο
δειγμάτων
Δρ. Παντελής Μ. Παπαδόπουλος
17 / 48
Στατιστική Ανάλυση
Slide 18
Σύγκριση Περισσότερων Ομάδων: ANOVA
Analysis of variance (ANOVA)
Παραμετρικό τεστ
Είναι το αντίστοιχο του t-test για περισσότερες από δύο ομάδες
Για δύο ομάδες θα δώσει το ίδιο αποτέλεσμα με ένα t-test
Εξετάζει αν υπάρχει στατιστικά σημαντική διαφορά μεταξύ όλων
των ομάδων, αλλά και κατά ζεύγη
H0: Οι Μ των δύο δειγμάτων είναι ισοδύναμοι
Αν p < α (0.05): η μηδενική υπόθεση του τεστ απορρίπτεται
Hα: Υπάρχει στατιστικά σημαντική διαφορά μεταξύ των δειγμάτων
Post hoc tests: επιπλέον έλεγχοι για συγκρίσεις ανά ζεύγη
Συνηθέστεροι: Fisher's LSD (ισοδύναμο του t-test), Bonferroni, Tukey
LSD: Least Significant Difference
(καμία σχέση με το διαιθυλαμίδιο του λυσεργικού οξέος!)
Δρ. Παντελής Μ. Παπαδόπουλος
18 / 48
Στατιστική Ανάλυση
Slide 19
Σύγκριση Περισσότερων Ομάδων: ANCOVA
Analysis of covariance (ANCOVA)
Παραμετρικό τεστ
Παρόμοιο της ANOVA: εκτός από τη μεταβλητή που μας
ενδιαφέρει, λαμβάνει υπόψη και συμμεταβλητές (covariates) οι
οποίες μπορεί να επηρεάζουν το αποτέλεσμα
Π.χ. Ανεξάρτητη μεταβλητή: χρόνος δρομέα, Εξαρτημένη μεταβλητή:
φύλο δρομέα, Συμμεταβλητή: ηλικία δρομέα
Συνηθέστερη εμφάνιση σε έρευνες με pre-test, post-test
Το αποτέλεσμα του post-test είναι η εξαρτημένη μεταβλητή
Η πρότερη γνώση του φοιτητή (pre-test) είναι η συμμεταβλητή
Δρ. Παντελής Μ. Παπαδόπουλος
19 / 48
Στατιστική Ανάλυση
Slide 20
Σύγκριση Περισσότερων Ομάδων: ANCOVA
Analysis of covariance (ANCOVA) (συν.)
Δύο επιπλέον προϋποθέσεις
1. Independence of the covariate and the treatment effect
Η επίδραση της συμμεταβλητής θα πρέπει να είναι ανεξάρτητη της
επίδρασης της ανεξάρτητης μεταβλητής στο τελικό αποτέλεσμα της
εξαρτημένης μεταβλητής (!!!)
Π.χ. Τόσο το φύλο (ανεξάρτητη) όσο και η ηλικία (συμμεταβλητή) του
δρομέα μπορεί να επιδρούν στο χρόνο του (εξαρτημένη). Ωστόσο, η
επίδραση πχ του φύλου θα πρέπει να είναι ανεξάρτητη της ηλικίας στον
χρόνο.
Με άλλα (πολύ πιο απλά) λόγια, η συμμεταβλητή θα πρέπει να
κυμαίνεται με τον ίδιο τρόπο στα διάφορα δείγματα.
Άρα μπορούμε να κάνουμε ένα t-test (ή ANOVA) παίρνοντας τη
συμμεταβλητή ως εξαρτημένη μεταβλητή. Αν δεν υπάρχουν σημαντικά
στατιστικές διαφορές, ισχύει το κριτήριο
Δρ. Παντελής Μ. Παπαδόπουλος
20 / 48
Στατιστική Ανάλυση
Slide 21
Σύγκριση Περισσότερων Ομάδων: ANCOVA
Analysis of covariance (ANCOVA) (συν.)
Δύο επιπλέον προϋποθέσεις
2. Homogeneity of regression slopes
Η σχέση της εξαρτημένης μεταβλητής και της συμμεταβλητής θα
πρέπει να είναι ίδια σε όλα τα δείγματα
Ο έλεγχος μπορεί να γίνει με εκτέλεση ANCOVA για custom model
Αναλυτική περιγραφή των βημάτων στην ενότητα 11.7, σελ. 413 του
βιβλίου: Andy Field (2009). Discovering Statistics Using SPSS 3rd Edition
Δρ. Παντελής Μ. Παπαδόπουλος
21 / 48
Στατιστική Ανάλυση
Slide 22
Σύγκριση Περισσότερων Ομάδων: Kruskal-Wallis
Kruskal-Wallis
Μη παραμετρικό τεστ
Είναι το αντίστοιχο της ANOVA
H0: Οι Μ των δύο δειγμάτων είναι ισοδύναμοι
Αν p < α (0.05): η μηδενική υπόθεση του τεστ απορρίπτεται
Hα: Υπάρχει στατιστικά σημαντική διαφορά μεταξύ των δύο
δειγμάτων
Για ελέγχους κατά ζεύγη, εκτέλεση του Mann-Whitney με όλους
τους δυνατούς συνδυασμούς
Δεν υπάρχει αντίστοιχο μη παραμετρικό τεστ της ANCOVA
Δρ. Παντελής Μ. Παπαδόπουλος
22 / 48
Στατιστική Ανάλυση
Slide 23
Effect Size
Η στατιστικά σημαντική διαφορά μεταξύ δειγμάτων δεν λέει από
μόνη της πολλά
Διαφορετικά δείγματα με διαφορετικό μέγεθος ή διαφορετική κλίμακα
μπορεί να εμφανίσουν τις ίδιες διαφορές
Το effect size είναι ένας τρόπος να συγκρίνουμε διαφορετικά
αποτελέσματα μεταξύ τους
Αντικειμενικό μέγεθος που μετράει την επίδραση μίας μεταβλητής σε
μία άλλη (π.χ. η ανεξάρτητη στην εξαρτημένη)
Υπάρχουν πολλοί διαφορετικοί τύποι υπολογισμού του effect size
Συνηθέστεροι:
T-test: Cohen's d
ANOVA, ANCOVA: partial η2
Το effect size είναι απαραίτητο μόνο όταν υπάρχει στατιστικά
σημαντική διαφορά
<0.4: small
0.4-0.75: medium
>0.75: large
Δρ. Παντελής Μ. Παπαδόπουλος
23 / 48
Στατιστική Ανάλυση
Slide 24
Συσχέτιση Μεταβλητών: Pearson's r
Pearson's correlation coefficient r
Ελέγχει τη σχέση που διέπει δύο μεταβλητές
Π.χ. ο χρόνος μελέτης ενός φοιτητή με το βαθμό στο τεστ
Αν p < α τότε υπάρχει στατιστικά σημαντική συσχέτιση μεταξύ των
δύο μεταβλητών
Αν η τιμή του r είναι θετική, οι δύο μεταβλητές μεταβάλλονται με τον
ίδιο τρόπο
Αύξηση του χρόνου μελέτης σημαίνει και αύξηση του βαθμού στο τεστ
Αν η τιμή του r είναι αρνητική, οι δύο μεταβλητές μεταβάλλονται
αντίθετα
Αύξηση του χρόνου μελέτης σημαίνει μείωση του βαθμού στο τεστ (!!!)
Spearman's ρ: το αντίστοιχο μη παραμετρικό τεστ
Δρ. Παντελής Μ. Παπαδόπουλος
24 / 48
Στατιστική Ανάλυση
Slide 25
Αξιοπιστία: Cronbach's α
Cronbach's α
Ελέγχει την αξιοπιστία ενός συνόλου μεταβλητών
Ιδιαίτερα χρήσιμο για αξιολόγηση ερωτηματολογίων, τεστ, κτλ
Κάθε ερώτηση είναι μία μεταβλητή
Σε ένα αξιόπιστο ερωτηματολόγιο, ο φοιτητής απαντάει με τον ίδιο
τρόπο κάθε απάντηση
Σε ένα μη αξιόπιστο ερωτηματολόγιο, οι απαντήσεις παρουσιάζουν
αντικρουόμενες απόψεις
Όλες οι ερωτήσεις κατά την στατιστική ανάλυση θα πρέπει να έχουν την
ίδια κατεύθυνση (π.χ. μία αρνητικά φορτισμένη απάντηση να
αντιστραφεί σε θετική με αντίστοιχη αλλαγή τιμής 15, 24, κτλ)
Όσο μεγαλύτερο το Cronbach's α, τόσο πιο αξιόπιστο το
ερωτηματολόγιο
Ιδανικά, α > 0.8
Δρ. Παντελής Μ. Παπαδόπουλος
25 / 48
Στατιστική Ανάλυση
Slide 26
Παράρτημα Α
Τα τεστ στο SPSS
Δρ. Παντελής Μ. Παπαδόπουλος
Στατιστική Ανάλυση
Slide 27
T-test (1/3)
Analyze>>Compare Means>>Independent-Samples T-test
Test Variables: Οι εξαρτημένες μεταβλητές
Grouping Variables: η ανεξάρτητη μεταβλητή
Απόδοση αριθμητικών τιμών σε όλα τα πεδία
π.χ. φύλο: Άνδρας=1, Γυναίκα=2
Δρ. Παντελής Μ. Παπαδόπουλος
27 / 48
Στατιστική Ανάλυση
Slide 28
T-test (2/3)
Levene's Test: αν το Sig. (p) είναι >0.05, τότε το κριτήριο για
homogeneity of variance ισχύει
Λαμβάνεται υπόψη η πρώτη γραμμή του πίνακα (αλλιώς, η δεύτερη)
t: το αποτέλεσμα του t-test
Όσο μεγαλύτερο το t, τόσο πιο μεγάλο θα είναι και το effect size
Το πρόσημο δεν μας απασχολεί (σχετίζεται με το ποια ομάδα βάλαμε
πρώτη)
df: βαθμοί ελευθερίας
Sig. (2-tailed): αυτό είναι το p
Δρ. Παντελής Μ. Παπαδόπουλος
28 / 48
Στατιστική Ανάλυση
Slide 29
T-test (3/3)
Παράδειγμα αναφοράς αποτελέσματος
"Τα αποτελέσματα του t-test έδειξαν ότι υπάρχει στατιστικά
σημαντική διαφορά μεταξύ των δύο ομάδων (t[22]=2.521, p=0.027,
d=0.65) με την ομάδα πειράματος να εμφανίζει υψηλότερη
βαθμολογία στο τεστ μετα-ελέγχου"
Δρ. Παντελής Μ. Παπαδόπουλος
29 / 48
Στατιστική Ανάλυση
Slide 30
ANOVA (1/3)
Analyze>>Compare Means>>One-way ANOVA
Dependent List: Οι εξαρτημένες μεταβλητές
Factor: η ανεξάρτητη μεταβλητή
Στα post hoc επιλέγετε
Tukey, LSD, Bonferroni
Δρ. Παντελής Μ. Παπαδόπουλος
30 / 48
Στατιστική Ανάλυση
Slide 31
ANOVA (2/3)
Στα options υπάρχει το homogeneity of variance
τεστ (θα πρέπει να είναι >0.05 για να ισχύει το
κριτήριο)
df: βαθμοί ελευθερίας ανάμεσα στις ομάδες
Ο αριθμός των ομάδων - 1
df: βαθμοί ελευθερίας μέσα στις ομάδες
Ο αριθμός όλου του πληθυσμού – αριθμός ομάδων
F: το αποτέλεσμα της ANOVA
Όσο μεγαλύτερο το F, τόσο πιο μεγάλο θα είναι και
το effect size
Sig.: αυτό είναι το p
Δρ. Παντελής Μ. Παπαδόπουλος
31 / 48
Στατιστική Ανάλυση
Slide 32
ANOVA (3/3)
Παράδειγμα αναφοράς αποτελέσματος
"Τα αποτελέσματα ελέγχου ανάλυσης διακύμανσης (ANOVA) έδειξαν
ότι υπάρχει στατιστικά σημαντική διαφορά μεταξύ των ομάδων
(F(2,15)=7.447, p=0.006, η2=0.54). Τα αποτελέσματα των Tukey
post hoc τεστ έδειξαν ότι η Ομάδα Α είχε στατιστικά σημαντική
διαφορά και από την Ομάδα Β (p=0.36) και από την Ομάδα Γ
(p=0.25) έχοντας την υψηλότερη βαθμολογία στο τεστ μετα-ελέγχου.
Αντιθέτως οι ομάδες Β και Γ δεν παρουσίασαν μεταξύ τους
στατιστικά σημαντική διαφορά."
Δρ. Παντελής Μ. Παπαδόπουλος
32 / 48
Στατιστική Ανάλυση
Slide 33
ANCOVA (1/3)
Analyze>>General Linear Model>>Univariate
Dependent List: Η εξαρτημένη μεταβλητή
Fixed Factor(s): οι ανεξάρτητες μεταβλητές
Covariates: οι συμμεταβλητές
Στα options επιλέγεται
Homogeneity of variance
Estimates of effect size
Στο Post Hoc επιλέγετε
LSD, Bonferonni, Tukey
Δρ. Παντελής Μ. Παπαδόπουλος
33 / 48
Στατιστική Ανάλυση
Slide 34
ANCOVA (2/3)
Αποτελέσματα ανεξάρτητης μεταβλητής (Group)
Αποτελέσματα συμμεταβλητής (Pre)
Για τα F, df, Sig. ισχύει ότι και στην ANOVA
Η τελευταία στήλη (Partial Eta Squared) είναι το effect size της
ANCOVA
Δρ. Παντελής Μ. Παπαδόπουλος
34 / 48
Στατιστική Ανάλυση
Slide 35
ANCOVA (3/3)
Παράδειγμα αναφοράς αποτελέσματος
"Τα αποτελέσματα ελέγχου ανάλυσης συνδιακύμανσης (ANCOVA)
έδειξαν ότι υπάρχει στατιστικά σημαντική διαφορά μεταξύ των
ομάδων (F(2,50)=9.017, p=0.000, η2=0.265). Τα αποτελέσματα των
Tukey posthoc τεστ έδειξαν ότι η Ομάδα Α είχε στατιστικά σημαντική
διαφορά και από την Ομάδα Β (p=0.36) και από την Ομάδα Γ
(p=0.25) έχοντας την υψηλότερη βαθμολογία στο τεστ μετα-ελέγχου.
Αντιθέτως οι ομάδες Β και Γ δεν παρουσίασαν μεταξύ τους
στατιστικά σημαντική διαφορά."
Δρ. Παντελής Μ. Παπαδόπουλος
35 / 48
Στατιστική Ανάλυση
Slide 36
Mann-Whitney (1/2)
Analyze>>Nonparametric Tests>>2 Independent Samples
Test Variable List: οι εξαρτημένες μεταβλητές
Grouping Variable: η ανεξάρτητη μεταβλητή
Επιλέγετε το Mann-Whitney U
Δρ. Παντελής Μ. Παπαδόπουλος
36 / 48
Στατιστική Ανάλυση
Slide 37
Mann-Whitney(2/2)
Mann-Whitney U: το αποτέλεσμα του τεστ
Asymp. Sig. (2-tailed): το p
Παράδειγμα αναφοράς αποτελέσματος
"Τα αποτελέσματα ελέγχου Mann-Whitney U έδειξαν ότι υπάρχει
στατιστικά σημαντική διαφορά μεταξύ των δύο ομάδων
(U(22)=98.500, p=0.029) με την ομάδα πειράματος να εμφανίζει
υψηλότερη βαθμολογία στο τεστ μετα-ελέγχου "
Δρ. Παντελής Μ. Παπαδόπουλος
37 / 48
Στατιστική Ανάλυση
Slide 38
Kruskal-Wallis (1/2)
Analyze>>Nonparametric Tests>>K Independent Samples
Test Variable List: Οι εξαρτημένες μεταβλητές
Grouping Variable: η ανεξάρτητη μεταβλητή
Επιλέγετε Kruskal-Wallis H
Δρ. Παντελής Μ. Παπαδόπουλος
38 / 48
Στατιστική Ανάλυση
Slide 39
Kruskal-Wallis (2/2)
Chi-Square (Χ2): το αποτέλεσμα του τεστ
Asymp. Sig.: το p
Παράδειγμα αναφοράς αποτελέσματος
"Τα αποτελέσματα ελέγχου Kruskal-Wallis H έδειξαν ότι υπάρχει
στατιστικά σημαντική διαφορά μεταξύ των ομάδων (Χ2(2)=14.763,
p=0.001). Τα αποτελέσματα του post hoc ελέγχου Mann-Whitney U
για τη σύγκριση των ομάδων κατά ζεύγη έδειξαν ότι…"
Δρ. Παντελής Μ. Παπαδόπουλος
39 / 48
Στατιστική Ανάλυση
Slide 40
Pearson's r (1/2)
Analyze>>Correlate>>Bivariate
Variables: οι μεταβλητές που θέλουμε να εξετάσουμε
Για παραμετρικό τεστ επιλέγετε Pearson, για μη παραμετρικό,
Spearman
Δρ. Παντελής Μ. Παπαδόπουλος
40 / 48
Στατιστική Ανάλυση
Slide 41
Pearson's r (2/2)
Pearson Correlation: το αποτέλεσμα του τεστ
Sig. (2-tailed): το p
Παράδειγμα αναφοράς αποτελέσματος
"Τα αποτελέσματα ελέγχου Pearson's r έδειξαν ότι υπάρχει
στατιστικά σημαντική θετική συσχέτιση μεταξύ των μεταβλητών
FirstSen και SecondSen (r=0.518, p=0.008)."
Δρ. Παντελής Μ. Παπαδόπουλος
41 / 48
Στατιστική Ανάλυση
Slide 42
Cronbach's α
Analyze>>Scale>>Reliability Analysis
Items: οι μεταβλητές που θέλουμε να εξετάσουμε (ενός
ερωτηματολογίου Κ)
Το τεστ δίνει την τιμή του α
Παράδειγμα αναφοράς αποτελέσματος
"Η αξιοπιστία του ερωτηματολογίου ήταν ικανοποιητική (α=0.78)."
Δρ. Παντελής Μ. Παπαδόπουλος
42 / 48
Στατιστική Ανάλυση
Slide 43
Kolmogorov-Smirov & Shapiro-Wilk (1/2)
Analyze>>Descriptive Statistics>>Explore
Dependent List: οι εξαρτημένες μεταβλητές
Factor List: οι ανεξάρτητες μεταβλητές
Επιλέγετε Plots
Επιλέγετε Normality plots
Δρ. Παντελής Μ. Παπαδόπουλος
43 / 48
Στατιστική Ανάλυση
Slide 44
Kolmogorov-Smirov & Shapiro-Wilk (2/2)
Για δείγμα μεγέθους >30 λαμβάνετε υπόψη το Kolmogorv-Smirnov
Για δείγμα μεγέθους <30 λαμβάνετε υπόψη το Shapiro-Wilk
Θα πρέπει p < α, δηλ. p < 0.05 για να ισχύει το κριτήριο
Γενικά, δεν αναφέρετε τα αποτελέσματα των ελέγχων που κάνετε
για επιλογή παραμετρικών ή μη τεστ
Παράδειγμα
"Πραγματοποιήθηκαν οι έλεγχοι των υποθέσεων για χρήση
παραμετρικών τεστ και τα αποτελέσματα έδειξαν ότι κανένα
κριτήριο δεν παραβιάστηκε."
Δρ. Παντελής Μ. Παπαδόπουλος
44 / 48
Στατιστική Ανάλυση
Slide 45
Παράρτημα Β
Αγγλο-Ελληνικό Λεξικό Στατιστικών Όρων
Δρ. Παντελής Μ. Παπαδόπουλος
Στατιστική Ανάλυση
Slide 46
alternative hypothesis
(εναλλακτική υπόθεση)
analysis of covariance (ανάλυση
συνδιακύμανσης)
analysis of variance (ανάλυση
διακύμανσης)
confidence level (επίπεδο
εμπιστοσύνης)
control group (ομάδα ελέγχου)
correlation (συσχέτιση)
covariate (συμμεταβλητή)
dependent variable (εξαρτημένη
μεταβλητή)
effect size (μέγεθος επίδρασης)
factorial design (παραγοντική
σχεδίαση)
homogeneity of variance
(ομοιογένεια διακύμανσης)
independence (ανεξαρτησία)
Δρ. Παντελής Μ. Παπαδόπουλος
independent variable (ανεξάρτητη
μεταβλητή)
mean (μέσος όρος)
median (μέσος)
null hypothesis (μηδενική
υπόθεση)
outlier (έκτροπες παρατηρήσεις)
Pearson's correlation coefficient
(συντελεστής συσχέτισης
Pearson)
post-test (μετα-έλεγχος)
pre-test (προ-έλεγχος)
probability (πιθανότητα)
reliability (αξιοπιστία)
standard deviation (τυπική
απόκλιση)
treatment group (ομάδα
πειράματος)
variable (μεταβλητή)
46 / 48
Στατιστική Ανάλυση
Slide 47
Πηγές
Andy Field (2009). Discovering Statistics Using SPSS (and sex and
drugs and rock 'n' roll) 3rd Edition. SAGE Publications.
Ελληνικό Στατιστικό Ινστιτούτο (2009). Λεξικό Στατιστικής
Ορολογίας. Εκδόσεις Νέων Τεχνολογιών.
Η παρουσίαση:
http://users.auth.gr/pmpapad/statistics_pmpapad.pps
Αρχείο για τον εύκολο υπολογισμό του Cohen's d
http://users.auth.gr/pmpapad/Effect_Sizes_Spreadsheet.xls
Δρ. Παντελής Μ. Παπαδόπουλος
47 / 48
Στατιστική Ανάλυση
Slide 48
Ερωτήσεις;
Δρ. Παντελής Μ. Παπαδόπουλος
48 / 48
Στατιστική Ανάλυση