Transcript Slide 3-4

© 2002 Thomson / South-Western

ΚΕΦΑΛΑΙΟ 3 Περιγραφική Στατιστική Slide 3-1

Στόχοι του Μαθήματος

• Διάκριση μεταξύ μέτρων κεντρικής τάσης, μέτρων διασποράς και μέτρων σχήματος κατανομής.

• Κατανόηση της σημασίας του μέσου, της διαμέσου και της επικρατούσας τιμής, του τεταρτημορίου, του εκατοστημορίου και του εύρους.

• Υπολογισμός μέσου, διαμέσου, επικρατούσας τιμής, τεταρτημορίου, εκατοστημορίου, εύρους, διακύμανσης, τυπικής απόκλισης και μέσης απόλυτης απόκλισης.

© 2002 Thomson / South-Western

Slide 3-2

Στόχοι του Μαθήματος-Συνέχεια

• Διάκριση μεταξύ δειγματικής και πληθυσμιακής διακύμανσης και τυπικής απόκλισης.

• Κατανόηση της σημασίας της τυπικής απόκλισης όπως αυτή εφαρμόζεται χρησιμοποιώντας τον εμπειρικό κανόνα.

• Κατανόηση του θηκογράμματος, της ασυμμετρίας και της κύρτωσης.

© 2002 Thomson / South-Western

Slide 3-3

Μέτρα Κεντρικής Τάσης

• Τα Μέτρα Κεντρικής Τάσης παρέχουν πληροφορίες για ‘συγκεκριμένες θέσεις ή τοποθεσίες ενός συνόλου αριθμών’.

• Κοινά μέτρα θέσης της κατανομής –Επικρατούσα Τιμή –Διάμεσος –Μέσος –Εκατοστημόρια –Τεταρτημόρια © 2002 Thomson / South-Western

Slide 3-4

Επικρατούσα Τιμή

• Η πιο συχνά εμφανιζόμενη τιμή σε ένα σύνολο δεδομένων. • Εφαρμόζεται σε όλα τα επίπεδα μέτρησης δεδομένων (ονομαστικά, διατάξιμα, διαστηματικής κλίμακας και κλίμακας λόγου).

• Bimodal – Δεδομένα που εμφανίζουν 2 επικρατούσας τιμές.

• Multimodal – Δεδομένα που περιλαμβάνουν περισσότερες από 2 επικρατούσας τιμές.

© 2002 Thomson / South-Western

Slide 3-5

Επικρατούσα Τιμή- Παράδειγμα

• Η επικρατούσα τιμή είναι 44.

• Η τιμή 44 εμφανίζεται περισσότερες φορές από οποιαδήποτε άλλη τιμή.

35 37 37 39 41 44 45 41 44 46 43 44 46 43 44 46 40 43 44 46

© 2002 Thomson / South-Western

40 43 45 48 Slide 3-6

Διάμεσος

• Είναι η ενδιάμεση τιμή σε ένα διατεταγμένο σύνολο αριθμών. • Εφαρμόζεται στα διατάξιμα δεδομένα, στα δεδομένα διαστηματικής κλίμακας και κλίμακας λόγου. • Δεν εφαρμόζεται στα ονομαστικά δεδομένα.

• Δεν επηρεάζεται από τις υπερβολικά υψηλές και από τις υπερβολικά χαμηλές τιμές.

© 2002 Thomson / South-Western

Slide 3-7

Διάμεσος: Υπολογιστική Λειτουργία

• Πρώτη Λειτουργία – Τοποθέτηση των παρατηρήσεων σε ένα διατεταγμένο σύνολο.

– Αν ο αριθμών των στοιχείων είναι μονός, η διάμεσος είναι το μέσο στοιχείο του διατεταγμένου συνόλου. – Αν ο αριθμών των στοιχείων είναι ζυγός, η διάμεσος είναι ο μέσος όρος των δυο μέσων στοιχείων. • Δεύτερη Λειτουργία – Η θέση της διαμέσου σε ένα διατεταγμένο σύνολο δίνεται από (n+1)/2.

© 2002 Thomson / South-Western

Slide 3-8

Διάμεσος: Παράδειγμα με μονό αριθμό στοιχείων

Το διατεταγμένο σύνολο περιλαμβάνει: 3 4 5 7 8 9 11 14 15 16 16 17 19 19 20 21 22 • Υπάρχουν 17 στοιχεία στο διατεταγμένο σύνολο.

• Θέση της Διαμέσου = (n+1)/2 = (17+1)/2 = 9 • Η διάμεσος είναι το 9 ο στοιχείο, δηλ. το15.

• Αν το 22 αντικατασταθεί από το 100, η διάμεσος παραμένει το 15.

• Αν το 3 αντικατασταθεί από το -103, η διάμεσος παραμένει το 15.

© 2002 Thomson / South-Western

Slide 3-9

Μέσος

• Είναι ο μέσος όρος μιας ομάδας αριθμών.

• Εφαρμόζεται στα δεδομένα διαστηματικής κλίμακας και κλίμακας λόγου, δεν εφαρμόζεται στα ονομαστικά ή διατάξιμα δεδομένα.

• Επηρεάζεται από κάθε παρατήρηση, περιλαμβανομένων και των υπερβολικών τιμών.

• Υπολογίζεται αθροίζοντας όλες τις παρατηρήσεις και διαιρώντας με τον αριθμό τους.

© 2002 Thomson / South-Western

Slide 3-10

Πληθυσμιακός Μέσος

  

X N

   93 5  5  

N

3

X

N

© 2002 Thomson / South-Western

Slide 3-11

Δειγματικός Μέσος

X

 

n X

  

X X X

n

3    6  379 6 

X

n

© 2002 Thomson / South-Western

Slide 3-12

Τεταρτημόρια

Είναι Μέτρα Κεντρικής Τάσης που χωρίζουν το σύνολο των δεδομένων σε 4 υποσύνολα.

• Q • Q • Q 1 2 3 : 25% : 50% : 75% των δεδομένων ανήκει στο πρώτο τεταρτημόριο.

των δεδομένων ανήκει στο δεύτερο τεταρτημόριο των δεδομένων ανήκει στο τρίτο τεταρτημόριο © 2002 Thomson / South-Western

Slide 3-13

Τεταρτημόρια-Συνέχεια

• Το Q 1 είναι ίσο με το 25 ο εκατοστημόριο • Το Q 2 τοποθετείται στο 50 εκατοστημόριο και είναι ίσο με τη διάμεσο ο • Το Q 3 είναι ίσο με το 75 ο εκατοστημόριο Οι τιμές των τεταρτημορίων δεν είναι αναγκαστικά κομμάτι των δεδομένων.

© 2002 Thomson / South-Western

Slide 3-14

Τεταρτημόρια

Q 1 25% 25% Q 2 25% Q 3 25% © 2002 Thomson / South-Western

Slide 3-15

Τεταρτημόρια: Παράδειγμα

• Διατεταγμένο σύνολο: 106, 109, 114, 116, 121, 122, 125, 129 • Q • Q • Q 1 2 3 : : :

i

 25 100 ( )

i

 50 100 ( )

i

 75 100 ( )

Q

1 

Q

2 

Q

3  2 2 2    © 2002 Thomson / South-Western

Slide 3-16

Μέτρα Διασποράς

• Τα Μέτρα Διασποράς περιγράφουν την απόκλιση ή την διασπορά ενός συνόλου δεδομένων.

• Κοινά Μέτρα Διασποράς –Εύρος –Ενδοτεταρτημοριακό Εύρος –Μέση Απόλυτη Απόκλιση –Διακύμανση –Τυπική Απόκλιση – Z scores –Συντελεστής Μεταβλητότητας © 2002 Thomson / South-Western

Slide 3-17

Μεταβλητότητα

Μη Μεταβλητότητα των Χρηματορροών Μεταβλητότητα των Χρηματορροών

Μέσος Mean © 2002 Thomson / South-Western

Slide 3-18

Μεταβλητότητα

Μεταβλητότητα

© 2002 Thomson / South-Western

Μη Μεταβλητότητα Slide 3-19

Εύρος

• Η διαφορά μεταξύ της υψηλότερης και της χαμηλότερης τιμής σε ένα σύνολο δεδομένων.

• Εύκολο να υπολογιστεί.

• Αγνοεί όλα τα στοιχεία των δεδομένων εκτός από τις τιμές που βρίσκονται στα 2 άκρα.

• Παράδειγμα: Εύρος =

35 37 37 39 41 41 43 43 44 44 44 44 45 46 46 46

= Υψηλότερη-Χαμηλότερη τιμή

40 43 44 46

= 48 - 35 = 13

40 43 45 48

© 2002 Thomson / South-Western

Slide 3-20

Ενδοτεταρτημοριακό Εύρος

• Εύρος τιμών μεταξύ του πρώτου και του τρίτου τεταρτημορίου. • Εύρος του “middle half”.

• Λιγότερο επηρεασμένο από τις ακραίες τιμές.

 

ό

ύ



Q

3 

Q

1 © 2002 Thomson / South-Western

Slide 3-21

Απόκλιση από το μέσο

• Παρατηρήσεις: 5, 9, 16, 17, 18 • Μέσος:   

N X

 65 5  13 • Αποκλίσεις από το μέσο: -8, -4, 3, 4, 5

+5 +3 +4

-8 -4

0 5 10

15 20

© 2002 Thomson / South-Western

Slide 3-22

Μέση Απόλυτη Απόκλιση

• Μέσος όρος των απόλυτων αποκλίσεων από τον μέσο.

X

5 9 16 17 18

X

 

-8 -4 +3 +4 +5 0

X

 

+8 +4 +3 +4 +5 24

.

   24 5 

X N

  © 2002 Thomson / South-Western

Slide 3-23

Πληθυσμιακή Διακύμανση

• Μέσος όρος τετραγωνικών αποκλίσεων από τον αριθμητικό μέσο.

X

5 9 16 17 18

X

  

X

   2

-8 -4 +3 +4 +5 0 64 16 9 16 25 130

 2   

X N

  2 1 3 0 5 © 2002 Thomson / South-Western

Slide 3-24

Πληθυσμιακή Τυπική Απόκλιση

• Τετραγωνική ρίζα της διακύμανσης

X

X

 

5 9 16 17 18 -8 -4 +3 +4 +5 0

X

   2

64 16 9 16 25 130

 2       

X N

  2 1 3 0 5  2

Slide 3-25

© 2002 Thomson / South-Western

Εμπειρικός Κανόνας

• Τα δεδομένα ακολουθούν την κανονική κατανομή (ή κατά προσέγγιση κανονική) Απόσταση από το μέσο       1 2 3    © 2002 Thomson / South-Western Ποσοστό των τιμών που βρίσκεται πλησίον του μέσου 68 95 99.7

Slide 3-26

Δειγματική Διακύμανση

• Μέσος όρος των τετραγωνικών αποκλίσεων από τον αριθμητικό μέσο.

X

2,398 1,844 1,539 1,311 7,092

X

X

625 71 -234 -462 0

X

X

 2

390,625 5,041 54,756 213,444 663,866

S

2 

X n

1

X

 2   3 © 2002 Thomson / South-Western

Slide 3-27

Δειγματική Τυπική Απόκλιση

• Τετραγωνική ρίζα της δειγματικής διακύμανσης

X X

X

X

X

 2

2,398 1,844 1,539 1,311 7,092 625 71 -234 -462 0 390,625 5,041 54,756 213,444 663,866

S

2 

S

      

X n

  1

X

 2

S

2 3

Slide 3-28

© 2002 Thomson / South-Western

Συντελεστής Μεταβλητότητας

• Εύρος της τυπικής απόκλισης από το μέσο, εκφρασμένο ως ποσοστό.

• Μέτρο της σχετικής διασποράς.

C V

    100  © 2002 Thomson / South-Western

Slide 3-29

Συντελεστής Μεταβλητότητας

  1 1   29

C V

1    1 1  100   29  100   © 2002 Thomson / South-Western   2 2

C V

2  84   10   2 2  100   10 84  100  

Slide 3-30

Μέτρα Σχήματος

• • •

Ασυμμετρία

– Απουσία συμμετρίας – Ακραίες τιμές στη μια πλευρά της κατανομής

Κύρτωση

– Κορυφή μιας κατανομής

Θηκόγραμμα

– Γραφική απεικόνιση μιας κατανομής – Αποκαλύπτει ασυμμετρία © 2002 Thomson / South-Western

Slide 3-31

Ασυμμετρία

Αρνητική Ασυμμετρία Συμμετρία Θετική Ασυμμετρία

© 2002 Thomson / South-Western

Slide 3-32

Ασυμμετρία

Μέσος Επικρατούσα Τιμή Διάμεσος Μέσος Διάμεσος Επικρατούσα Τιμή Αρνητική Ασυμμετρία Συμμετρία Επικρατούσα Τιμή Διάμεσος Μέσος Θετική Ασυμμετρία

© 2002 Thomson / South-Western

Slide 3-33

Συντελεστής Ασυμμετρίας

• Συνοπτικό μέτρο ασυμμετρίας

S

 3    

M d

 • Αν S < 0, η κατανομή είναι αρνητικά ασύμμετρη (ασύμμετρη στα αριστερά).

• Αν S = 0, η κατανομή είναι συμμετρική (όχι ασύμμετρη).

• Αν S > 0, η κατανομή είναι θετικά ασύμμετρη (ασύμμετρη στα δεξιά).

© 2002 Thomson / South-Western

Slide 3-34

Συντελεστής Ασυμμετρίας

 1  23

M d

 1 1   26

S

1     3   1  1

M d

 1   2  26

M d

 2 2   26

S

2     3   2  2 

M d

 2  3  29

M d

 3 3   26

S

3     3   3  3

M d

 3    .

© 2002 Thomson / South-Western  0   .

Slide 3-35

Κύρτωση

• Κορυφή μιας κατανομής – Λεπτόκυρτη: ψηλή και λεπτή – Μεσόκυρτη κανονική στο σχήμα – Πλατύκυρτη: επίπεδη και εξαπλωμένη προς τα έξω

Λεπτόκυρτη Μεσόκυρτη Πλατόκυρτη

© 2002 Thomson / South-Western

Slide 3-36

Θηκόγραμμα

Χρησιμοποιούνται 5 συγκεκριμένες τιμές:

Διάμεσος, Q 2

Πρώτο τεταρτημόριο, Q 1

Τρίτο τεταρτημόριο, Q 3

Ελάχιστη τιμή στο σύνολο δεδομένων

Μέγιστη τιμή στο σύνολο δεδομένων

© 2002 Thomson / South-Western

Slide 3-37

Θηκόγραμμα-Συνέχεια

• •

Εσωτερικά Όρια

IQR = Q 3 - Q 1

Χαμηλότερο εσωτερικό όριο =

Q 1 - 1.5 IQR Υψηλότερο εσωτερικό όριο = Q 3 + 1.5 IQR Εξωτερικά Όρια

Χαμηλότερο εξωτερικό όριο =

Q 1 - 3.0 IQR Υψηλότερο εξωτερικό όριο = Q 3 + 3.0 IQR

© 2002 Thomson / South-Western

Slide 3-38

Θηκόγραμμα

Ελάχιστη τιμή

Q 1 Q 2 Q 3

Μέγιστη τιμή © 2002 Thomson / South-Western

Slide 3-39

Ασυμμετρία: Θηκογράμματα και Συντελεστής Ασυμμετρίας

S < 0 S = 0 S > 0 Αρνητική Ασυμμετρία

© 2002 Thomson / South-Western

Συμμετρία Θετική Ασυμμετρία Slide 3-40