Transcript Slide 3-4
© 2002 Thomson / South-Western
ΚΕΦΑΛΑΙΟ 3 Περιγραφική Στατιστική Slide 3-1
Στόχοι του Μαθήματος
• Διάκριση μεταξύ μέτρων κεντρικής τάσης, μέτρων διασποράς και μέτρων σχήματος κατανομής.
• Κατανόηση της σημασίας του μέσου, της διαμέσου και της επικρατούσας τιμής, του τεταρτημορίου, του εκατοστημορίου και του εύρους.
• Υπολογισμός μέσου, διαμέσου, επικρατούσας τιμής, τεταρτημορίου, εκατοστημορίου, εύρους, διακύμανσης, τυπικής απόκλισης και μέσης απόλυτης απόκλισης.
© 2002 Thomson / South-Western
Slide 3-2
Στόχοι του Μαθήματος-Συνέχεια
• Διάκριση μεταξύ δειγματικής και πληθυσμιακής διακύμανσης και τυπικής απόκλισης.
• Κατανόηση της σημασίας της τυπικής απόκλισης όπως αυτή εφαρμόζεται χρησιμοποιώντας τον εμπειρικό κανόνα.
• Κατανόηση του θηκογράμματος, της ασυμμετρίας και της κύρτωσης.
© 2002 Thomson / South-Western
Slide 3-3
Μέτρα Κεντρικής Τάσης
• Τα Μέτρα Κεντρικής Τάσης παρέχουν πληροφορίες για ‘συγκεκριμένες θέσεις ή τοποθεσίες ενός συνόλου αριθμών’.
• Κοινά μέτρα θέσης της κατανομής –Επικρατούσα Τιμή –Διάμεσος –Μέσος –Εκατοστημόρια –Τεταρτημόρια © 2002 Thomson / South-Western
Slide 3-4
Επικρατούσα Τιμή
• Η πιο συχνά εμφανιζόμενη τιμή σε ένα σύνολο δεδομένων. • Εφαρμόζεται σε όλα τα επίπεδα μέτρησης δεδομένων (ονομαστικά, διατάξιμα, διαστηματικής κλίμακας και κλίμακας λόγου).
• Bimodal – Δεδομένα που εμφανίζουν 2 επικρατούσας τιμές.
• Multimodal – Δεδομένα που περιλαμβάνουν περισσότερες από 2 επικρατούσας τιμές.
© 2002 Thomson / South-Western
Slide 3-5
Επικρατούσα Τιμή- Παράδειγμα
• Η επικρατούσα τιμή είναι 44.
• Η τιμή 44 εμφανίζεται περισσότερες φορές από οποιαδήποτε άλλη τιμή.
35 37 37 39 41 44 45 41 44 46 43 44 46 43 44 46 40 43 44 46
© 2002 Thomson / South-Western
40 43 45 48 Slide 3-6
Διάμεσος
• Είναι η ενδιάμεση τιμή σε ένα διατεταγμένο σύνολο αριθμών. • Εφαρμόζεται στα διατάξιμα δεδομένα, στα δεδομένα διαστηματικής κλίμακας και κλίμακας λόγου. • Δεν εφαρμόζεται στα ονομαστικά δεδομένα.
• Δεν επηρεάζεται από τις υπερβολικά υψηλές και από τις υπερβολικά χαμηλές τιμές.
© 2002 Thomson / South-Western
Slide 3-7
Διάμεσος: Υπολογιστική Λειτουργία
• Πρώτη Λειτουργία – Τοποθέτηση των παρατηρήσεων σε ένα διατεταγμένο σύνολο.
– Αν ο αριθμών των στοιχείων είναι μονός, η διάμεσος είναι το μέσο στοιχείο του διατεταγμένου συνόλου. – Αν ο αριθμών των στοιχείων είναι ζυγός, η διάμεσος είναι ο μέσος όρος των δυο μέσων στοιχείων. • Δεύτερη Λειτουργία – Η θέση της διαμέσου σε ένα διατεταγμένο σύνολο δίνεται από (n+1)/2.
© 2002 Thomson / South-Western
Slide 3-8
Διάμεσος: Παράδειγμα με μονό αριθμό στοιχείων
Το διατεταγμένο σύνολο περιλαμβάνει: 3 4 5 7 8 9 11 14 15 16 16 17 19 19 20 21 22 • Υπάρχουν 17 στοιχεία στο διατεταγμένο σύνολο.
• Θέση της Διαμέσου = (n+1)/2 = (17+1)/2 = 9 • Η διάμεσος είναι το 9 ο στοιχείο, δηλ. το15.
• Αν το 22 αντικατασταθεί από το 100, η διάμεσος παραμένει το 15.
• Αν το 3 αντικατασταθεί από το -103, η διάμεσος παραμένει το 15.
© 2002 Thomson / South-Western
Slide 3-9
Μέσος
• Είναι ο μέσος όρος μιας ομάδας αριθμών.
• Εφαρμόζεται στα δεδομένα διαστηματικής κλίμακας και κλίμακας λόγου, δεν εφαρμόζεται στα ονομαστικά ή διατάξιμα δεδομένα.
• Επηρεάζεται από κάθε παρατήρηση, περιλαμβανομένων και των υπερβολικών τιμών.
• Υπολογίζεται αθροίζοντας όλες τις παρατηρήσεις και διαιρώντας με τον αριθμό τους.
© 2002 Thomson / South-Western
Slide 3-10
Πληθυσμιακός Μέσος
X N
93 5 5
N
3
X
N
© 2002 Thomson / South-Western
Slide 3-11
Δειγματικός Μέσος
X
n X
X X X
n
3 6 379 6
X
n
© 2002 Thomson / South-Western
Slide 3-12
Τεταρτημόρια
Είναι Μέτρα Κεντρικής Τάσης που χωρίζουν το σύνολο των δεδομένων σε 4 υποσύνολα.
• Q • Q • Q 1 2 3 : 25% : 50% : 75% των δεδομένων ανήκει στο πρώτο τεταρτημόριο.
των δεδομένων ανήκει στο δεύτερο τεταρτημόριο των δεδομένων ανήκει στο τρίτο τεταρτημόριο © 2002 Thomson / South-Western
Slide 3-13
Τεταρτημόρια-Συνέχεια
• Το Q 1 είναι ίσο με το 25 ο εκατοστημόριο • Το Q 2 τοποθετείται στο 50 εκατοστημόριο και είναι ίσο με τη διάμεσο ο • Το Q 3 είναι ίσο με το 75 ο εκατοστημόριο Οι τιμές των τεταρτημορίων δεν είναι αναγκαστικά κομμάτι των δεδομένων.
© 2002 Thomson / South-Western
Slide 3-14
Τεταρτημόρια
Q 1 25% 25% Q 2 25% Q 3 25% © 2002 Thomson / South-Western
Slide 3-15
Τεταρτημόρια: Παράδειγμα
• Διατεταγμένο σύνολο: 106, 109, 114, 116, 121, 122, 125, 129 • Q • Q • Q 1 2 3 : : :
i
25 100 ( )
i
50 100 ( )
i
75 100 ( )
Q
1
Q
2
Q
3 2 2 2 © 2002 Thomson / South-Western
Slide 3-16
Μέτρα Διασποράς
• Τα Μέτρα Διασποράς περιγράφουν την απόκλιση ή την διασπορά ενός συνόλου δεδομένων.
• Κοινά Μέτρα Διασποράς –Εύρος –Ενδοτεταρτημοριακό Εύρος –Μέση Απόλυτη Απόκλιση –Διακύμανση –Τυπική Απόκλιση – Z scores –Συντελεστής Μεταβλητότητας © 2002 Thomson / South-Western
Slide 3-17
Μεταβλητότητα
Μη Μεταβλητότητα των Χρηματορροών Μεταβλητότητα των Χρηματορροών
Μέσος Mean © 2002 Thomson / South-Western
Slide 3-18
Μεταβλητότητα
Μεταβλητότητα
© 2002 Thomson / South-Western
Μη Μεταβλητότητα Slide 3-19
Εύρος
• Η διαφορά μεταξύ της υψηλότερης και της χαμηλότερης τιμής σε ένα σύνολο δεδομένων.
• Εύκολο να υπολογιστεί.
• Αγνοεί όλα τα στοιχεία των δεδομένων εκτός από τις τιμές που βρίσκονται στα 2 άκρα.
• Παράδειγμα: Εύρος =
35 37 37 39 41 41 43 43 44 44 44 44 45 46 46 46
= Υψηλότερη-Χαμηλότερη τιμή
40 43 44 46
= 48 - 35 = 13
40 43 45 48
© 2002 Thomson / South-Western
Slide 3-20
Ενδοτεταρτημοριακό Εύρος
• Εύρος τιμών μεταξύ του πρώτου και του τρίτου τεταρτημορίου. • Εύρος του “middle half”.
• Λιγότερο επηρεασμένο από τις ακραίες τιμές.
ό
ύ
Q
3
Q
1 © 2002 Thomson / South-Western
Slide 3-21
Απόκλιση από το μέσο
• Παρατηρήσεις: 5, 9, 16, 17, 18 • Μέσος:
N X
65 5 13 • Αποκλίσεις από το μέσο: -8, -4, 3, 4, 5
+5 +3 +4
-8 -4
0 5 10
15 20
© 2002 Thomson / South-Western
Slide 3-22
Μέση Απόλυτη Απόκλιση
• Μέσος όρος των απόλυτων αποκλίσεων από τον μέσο.
X
5 9 16 17 18
X
-8 -4 +3 +4 +5 0
X
+8 +4 +3 +4 +5 24
.
24 5
X N
© 2002 Thomson / South-Western
Slide 3-23
Πληθυσμιακή Διακύμανση
• Μέσος όρος τετραγωνικών αποκλίσεων από τον αριθμητικό μέσο.
X
5 9 16 17 18
X
X
2
-8 -4 +3 +4 +5 0 64 16 9 16 25 130
2
X N
2 1 3 0 5 © 2002 Thomson / South-Western
Slide 3-24
Πληθυσμιακή Τυπική Απόκλιση
• Τετραγωνική ρίζα της διακύμανσης
X
X
5 9 16 17 18 -8 -4 +3 +4 +5 0
X
2
64 16 9 16 25 130
2
X N
2 1 3 0 5 2
Slide 3-25
© 2002 Thomson / South-Western
Εμπειρικός Κανόνας
• Τα δεδομένα ακολουθούν την κανονική κατανομή (ή κατά προσέγγιση κανονική) Απόσταση από το μέσο 1 2 3 © 2002 Thomson / South-Western Ποσοστό των τιμών που βρίσκεται πλησίον του μέσου 68 95 99.7
Slide 3-26
Δειγματική Διακύμανση
• Μέσος όρος των τετραγωνικών αποκλίσεων από τον αριθμητικό μέσο.
X
2,398 1,844 1,539 1,311 7,092
X
X
625 71 -234 -462 0
X
X
2
390,625 5,041 54,756 213,444 663,866
S
2
X n
1
X
2 3 © 2002 Thomson / South-Western
Slide 3-27
Δειγματική Τυπική Απόκλιση
• Τετραγωνική ρίζα της δειγματικής διακύμανσης
X X
X
X
X
2
2,398 1,844 1,539 1,311 7,092 625 71 -234 -462 0 390,625 5,041 54,756 213,444 663,866
S
2
S
X n
1
X
2
S
2 3
Slide 3-28
© 2002 Thomson / South-Western
Συντελεστής Μεταβλητότητας
• Εύρος της τυπικής απόκλισης από το μέσο, εκφρασμένο ως ποσοστό.
• Μέτρο της σχετικής διασποράς.
C V
100 © 2002 Thomson / South-Western
Slide 3-29
Συντελεστής Μεταβλητότητας
1 1 29
C V
1 1 1 100 29 100 © 2002 Thomson / South-Western 2 2
C V
2 84 10 2 2 100 10 84 100
Slide 3-30
Μέτρα Σχήματος
• • •
Ασυμμετρία
– Απουσία συμμετρίας – Ακραίες τιμές στη μια πλευρά της κατανομής
Κύρτωση
– Κορυφή μιας κατανομής
Θηκόγραμμα
– Γραφική απεικόνιση μιας κατανομής – Αποκαλύπτει ασυμμετρία © 2002 Thomson / South-Western
Slide 3-31
Ασυμμετρία
Αρνητική Ασυμμετρία Συμμετρία Θετική Ασυμμετρία
© 2002 Thomson / South-Western
Slide 3-32
Ασυμμετρία
Μέσος Επικρατούσα Τιμή Διάμεσος Μέσος Διάμεσος Επικρατούσα Τιμή Αρνητική Ασυμμετρία Συμμετρία Επικρατούσα Τιμή Διάμεσος Μέσος Θετική Ασυμμετρία
© 2002 Thomson / South-Western
Slide 3-33
Συντελεστής Ασυμμετρίας
• Συνοπτικό μέτρο ασυμμετρίας
S
3
M d
• Αν S < 0, η κατανομή είναι αρνητικά ασύμμετρη (ασύμμετρη στα αριστερά).
• Αν S = 0, η κατανομή είναι συμμετρική (όχι ασύμμετρη).
• Αν S > 0, η κατανομή είναι θετικά ασύμμετρη (ασύμμετρη στα δεξιά).
© 2002 Thomson / South-Western
Slide 3-34
Συντελεστής Ασυμμετρίας
1 23
M d
1 1 26
S
1 3 1 1
M d
1 2 26
M d
2 2 26
S
2 3 2 2
M d
2 3 29
M d
3 3 26
S
3 3 3 3
M d
3 .
© 2002 Thomson / South-Western 0 .
Slide 3-35
Κύρτωση
• Κορυφή μιας κατανομής – Λεπτόκυρτη: ψηλή και λεπτή – Μεσόκυρτη κανονική στο σχήμα – Πλατύκυρτη: επίπεδη και εξαπλωμένη προς τα έξω
Λεπτόκυρτη Μεσόκυρτη Πλατόκυρτη
© 2002 Thomson / South-Western
Slide 3-36
Θηκόγραμμα
•
Χρησιμοποιούνται 5 συγκεκριμένες τιμές:
–
Διάμεσος, Q 2
–
Πρώτο τεταρτημόριο, Q 1
–
Τρίτο τεταρτημόριο, Q 3
–
Ελάχιστη τιμή στο σύνολο δεδομένων
–
Μέγιστη τιμή στο σύνολο δεδομένων
© 2002 Thomson / South-Western
Slide 3-37
Θηκόγραμμα-Συνέχεια
• •
Εσωτερικά Όρια
–
IQR = Q 3 - Q 1
–
Χαμηλότερο εσωτερικό όριο =
–
Q 1 - 1.5 IQR Υψηλότερο εσωτερικό όριο = Q 3 + 1.5 IQR Εξωτερικά Όρια
–
Χαμηλότερο εξωτερικό όριο =
–
Q 1 - 3.0 IQR Υψηλότερο εξωτερικό όριο = Q 3 + 3.0 IQR
© 2002 Thomson / South-Western
Slide 3-38
Θηκόγραμμα
Ελάχιστη τιμή
Q 1 Q 2 Q 3
Μέγιστη τιμή © 2002 Thomson / South-Western
Slide 3-39
Ασυμμετρία: Θηκογράμματα και Συντελεστής Ασυμμετρίας
S < 0 S = 0 S > 0 Αρνητική Ασυμμετρία
© 2002 Thomson / South-Western
Συμμετρία Θετική Ασυμμετρία Slide 3-40