STATISTIK DESKRIPTIF: UKURAN SEBARAN Rohani Ahmad Tarmizi - EDU5950 1

Download Report

Transcript STATISTIK DESKRIPTIF: UKURAN SEBARAN Rohani Ahmad Tarmizi - EDU5950 1

STATISTIK DESKRIPTIF:
UKURAN SEBARAN
Rohani Ahmad Tarmizi - EDU5950
1
UKURAN-UKURAN SEBARAN
 JULAT
 SISIHAN MIN
 VARIANS
 SISIHAN PIAWAI
UKURAN SEBARAN
 Setelah mempelajari ukuran kecenderungan
memusat UKURAN TAHAP , maka persoalannya
seterusnya adalah bagaimanakah skor-skor itu
bersebar sama ada tersebar-sebar atau terkumpulkumpul.
 Ini membawa kepada konsep UKURAN SEBARAN
IA ITU suatu indeks atau petunjuk sejauh mana
skor-skor dalam taburan tersebar.
 Ukuran kecenderungan memusat dan ukuran
sebaran merupakan petunjuk yang sangat penting
untuk data kuantitatif, oleh itu sangat kerap
digunakan oleh penyelidik dan dilaporkan dalam
sesuatu penulisan.
TEKNIK MEMPERIHAL DATA - UKURAN SEBARAN
JULAT - ukuran paling mudah tetapi kasar
SISIHAN MIN - ukuran purata beza mutlak bagi
skor-skor daripada min
VARIANS - purata hasil tambah kuasa dua sisihan
skor-skor daripada min
SISIHAN PIAWAI - punca kuasa dua bagi purata
hasil tambah kuasa dua sisihan skor-skor
daripada min
UKS - JULAT
 Julat adalah skor beza antara skor tertinggi dan
terendah
 Set A: 21 22 23 24 25 26 27
6
 Set B: 15 18 21 24 27 30 33
18
JULAT
 Ukuran yang paling mudah ia itu dengan





menentukan beza antara skor tertinggi dengan
terendah.
Skor yang tinggi (SET B = 18) memberi gambaran
bahawa ukuran sebarannya lebih besar daripada
(SET A = 6).
Dengan itu kita dapat memperkatakan
sungguhpun min kedua-dua set adalah sama
tetapi sebarannya berbeza.
Ini menggambarkan kompsisi skor-skor dalam
taburan tersebut.
Walau bagaimanapun kegunaan julat adalah
terlalu terhad oleh kerana ia mengguna dua skor
dalam sesuatu set.
Oleh itu, ia hanya diguna untuk mendapat
gambaran yang cepat.
SISIHAN MIN
 Sisihan min merupakan ukuran purata bagi
perbezaan skor-skor daripada min.
 Untuk mengira sisihan min
 L1: Tentukan min bagi taburan
 L2: Tentukan sisihan bagi setiap skor daripada min
taburan tersebut
 L3: Tentukan nilai mutlak bagi setiap nilai sisihansisihan
 L4: Jumlahkan kesemua sisihan-sisihan
 L5: Bahagikan jumlah tersebut dengan bilangan
skor dalam taburan tersebut
UKS - SISIHAN MIN
Set A: 21 22 23 24 25 26 27
X
21
SM -3
SM 3
22
-2
2
23
-1
1
24
0
0
25
1
1
26
2
2
27
3
3
UKS - SISIHAN MIN
Set B: 15 18
X
15
SM -9
SM 9
18
-6
6
21
21
-3
3
24
24
0
0
27
27
3
3
30 33
30
6
6
33
9
9
VARIANS
 Varians ditakrifkan sebagai purata hasil
tambah kuasa dua sisihan-sisihan daripada
min.
 Untuk mengira varians
 L1: Tentukan min bagi taburan
 L2: Tentukan sisihan bagi setiap skor daripada
min taburan tersebut
 L3: Tentukan nilai kuasa dua bagi setiap nilai
sisihan-sisihan
 L4: Jumlahkan kesemua sisihan-sisihan yang
telah dikuasakan dua
 L5: Bahagikan jumlah tersebut dengan
bilangan skor dalam taburan tersebut.
UKS - VARIANS
X
21 22
-3 -2
X-
(X-)2 9 4
X
X-
(X-)2
15 18
-9 -6
81 36
23
-1
1
24
0
0
25
1
1
26
2
4
27
3
9
21
-3
9
24
0
0
27
3
9
30
6
36
33
9
81
SISIHAN PIAWAI
 Sisihan piawai pula ditakrif sebagai punca kuasa
dua nilai varians
 Ini bermakna setelah menentukan varians, anda
boleh kirakan sisihan piawai dengan menentukan
nilai kuasa dua bagi varians.
 Nilai sisihan piawai adalah kecil dan dikatakan
dalam unit yang diukur manakala nilai varians
adalah besar oleh kerana ia merupakan hasil kuasa
dua sisihan-sisihan.
 Oleh itu, nilai sishan piawai lebih cekap bagi
menggambarkan sebaran
PENGIRAAN VARIANS DATA BERKUMPUL
KELAS
FREK.
X TT
(X TT – )2 f(X TT – )2
5-9
2
7
103.63
207.26
10-14
11
12
26.83
295.13
15-19
26
17
0.03
0.78
20-24
17
22
23.23
394.91
Min
=
962/56
=
17.1785
=
17.18
PENGIRAAN VARIANS DATA BERKUMPUL
KELAS
FREK.
X TT
(X TT – )2 f(X TT – )2
5-9
2
7
103.63
207.26
10-14
11
12
26.83
295.13
15-19
26
17
0.03
0.78
20-24
17
22
23.23
394.91
S2 = 898.08/56 = 16.04
S = 4.0046
S = 4.00
LATIHAN:
PENGIRAAN VARIANS DATA BERKUMPUL
KELAS
FREK.
X TT (X TT – X)2
5-9
2
7
10-14
11
12
15-19
26
17
20-24
17
22
25-29
8
27
F(X TT – X)2
RINGKASAN
 Ukuran kecenderungan memusat dan ukuran
sebaran merupakan ukuran yang paling popular
digunakan untuk pemerihalan data disamping
menyaji data secara jadual/carta atau graf.
 UKM menunjukkan tahap (level) manakala UKS
menunjukkan kebolehubahan
(homogeneity/heterogeneity)
 UKM yang paling kerap digunakan adalah min
manakala UKS yang disertai adalah sisihan piawai.
 Cuba anda beri sebab kenapa min dan sisihan
piawai kerap digunakan.
TAFSIRAN UKURAN SEBARAN
 Ukuran yang besar menunjukkan
sebaran/serakan/variasi yang besar.
 Ukuran yang besar mennunjukkan skor-skor adalah
heterogen (jauh berbeza-beza).
 Ukuran yang yang kecil menunjukkan
sebaran/serakan/variasi yang kecil
 Ukuran yang kecil menunjukkan skor adalah homogen
(hampir sama).
RINGKASAN
 Ukuran kecenderungan memusat dan ukuran
sebaran merupakan ukuran yang paling popular
digunakan untuk pemerihalan data disamping
menyaji data secara jadual/carta atau graf.
 UKM menunjukkan tahap (level) manakala UKS
menunjukkan kebolehubahan
(homogeneity/heterogeneity)
 UKM yang paling kerap digunakan adalah min
manakala UKS yang disertai adalah sisihan piawai.
 Cuba anda beri sebab kenapa min dan sisihan
piawai kerap digunakan.
Descriptive
Statistics
Lets
look at the following
set of data from two groups of students
undergoing two different approaches in learning The mean, the
median and the mode for each were as follows
Closely
alike
Mean = 61.5
Median =62
Mode= 67
PBL Approach
56
56
57
58
61
63
63
67
67
67
Traditional Approach
33
Very
42
different
48
52
57
67
67 Mean = 61.5
Median =62
77 Mode= 67
82
90 Nota Tambahan
Measures of Variability/Dispersion
 Measure or index which convey about the degree to
which the scores differ from one another.
 Measures that reflect the amount of variation in the
scores of a distribution.
Nota Tambahan
Measures of Variability/Dispersion
♠ Provides a measure of the dispersion of your data
♠ Measures include:
i) Range – presented as the lowest to the highest values
ii) Variance – the average of squared deviations from mean
iii) Standard deviation – provides a measure of deviation
from mean which is calculated as square root of the
variance
♠ Amongst the three measures of dispersion, standard
deviation is the most frequently used.
Nota Tambahan
Measures of Variability
Range= Maximum value-Minimum value
Range of scores for Set A = 67 - 56 = 11
Range of scores for Set B = 90 - 33 = 57
The range only uses 2 numbers from a data set,
therefore it is only a rough and quick measure.
Nota Tambahan
Population Variance
Population Variance:
The sum of the squares of the deviations, divided by
N.

2
( x   ) 2

N
Nota Tambahan
SET A (PBL APPROACH) - Variance
x
56
56
57
58
61
63
63
67
67
67
-5.5
-5.5
-4.5
-3.5
-0.5
1.5
1.5
5.5
5.5
5.5
Sum of squares
(x  )2
30.25
30.25
20.25
12.25
0.25
2.25
2.25
30.25
30.25
30.25
188.50

2
( x 

N
2 
 )2
188.50
 18.85
10
Nota Tambahan
SET B (TRADITIONAL APPROACH- Variance
33
42
48
52
57
67
67
77
82
90
x
(x  )2
-28.5
-19.5
-13.5
-9.5
-4.5
5.5
5.5
15.5
20.5
28.5
812.25
380.25
182.25
90.25
20.25
30.25
30.25
240.25
420.25
812.25
Sum of squares
2988.25


2
2
( x 

N
 )2
2988.25

 298.825
10
Nota Tambahan
Population Standard Deviation
Population Standard Deviation The square root of
the population variance.
 

2
  18.85  4.34
The population standard deviation for students in the PBL group
is 4.34
Nota Tambahan
Population Standard Deviation
Population Standard Deviation The square root of
the population variance.
 

2
  298.825  17.287
The population standard deviation for students in the Traditional
group is 17.29
Nota Tambahan
Sample Variance (Set A)
To calculate a sample variance divide the sum of
squares by n-1.
s2
( x  x ) 2

n 1
188.5
s 
 20.944
9
2
Nota Tambahan
Sample Variance (Set B)
To calculate a sample variance divide the sum of
squares by n-1.
s2
s
2
B
( x  x ) 2

n 1
2988.25

 332.03
9
Nota Tambahan
Sample Standard Deviation (Set A)
s
2
( x  x )

n 1
s s
2
2
The sample standard
deviation, s is found by
taking the square root of the
sample variance.
s  20.94  4.58
Nota Tambahan
Sample Standard Deviation (Set B)
s
2
( x  x )

n 1
s s
2
2
The sample standard
deviation, s is found by
taking the square root of the
sample variance.
s  332.03  18.22
Nota Tambahan
Summary
Range= Maximum value-Minimum value
Population Variance

2
( x   ) 2

N
 
Population Standard Deviation
2
2
( x  x )

n 1
Sample Variance
s
Sample Standard Deviation
s
2
s2
Nota Tambahan
Board Demonstration
Calculate range, variance and std dev for the 3 data set
1.
Raw data
♠ Range = 9 – 3
♠ Variance (s²)
Before you can solve for variance,
you need to determine:
n = 15
ΣΧ² -(ΣΧ)²
ΣΧ = 96
n
s²
=
ΣΧ² = 652
n-1
♠ Std dev (s)
s = √s²
s = √2.686
s = 1.639
652 -(96)²
15
s² = 15 - 1
37.6
s² = 14
= 2.686
Data set 1:
5
9
6
6
7
5
7
4
8
7
8
7
6
3
8
Nota Tambahan
Board Demonstration
Calculate range, variance and std dev for the 3 data set
1.
Raw data
♠ Range = 16 – 3
♠ Variance (s²)
Before you can solve for variance,
you need to determine:
n = 15
ΣΧ² -(ΣΧ)²
ΣΧ = 146
n
s²
=
ΣΧ² = 1868
n-1
♠ Std dev (s)
s = √s²
s = √31.924
s = 5.65
1868 -(146)²
15
s² = 15 - 1
446.933
s² = 14
= 31.924
Data set 2:
15
9
16
16
7
15
7
14
8
7
8
7
6
3
8
Nota Tambahan
…Cont.
2.
Frequency distribution
♠ Range = 45 – 25
= 20
♠ Variance (s²)
Before you can solve for variance,
you need to determine:
n = 71
ΣfΧ² (ΣfΧ)²
n
s²
ΣfΧ = 2,434
n
=
ΣfΧ² = 85,810
♠ Std dev (s)
s = √s²
s = √33.357
= 5.776
= 5.78
Data set:
X
f fx__
25 6 150
28 9 252
30 12 360
34 17 578
38 15 570
43
8 344
45 4 180
Total
71 2434
85810 -2434²
71
s² =
71
2368.37
s² = 71
= 33.357
Nota Tambahan
…Cont.
3.
Grouped Frequency distribution
♠ Range
Not relevant
♠ Variance (s²)
Before you can solve for variance,
you need to determine:
Xmidpt
= 25.5, 35.5 and 45.5
n = 71
Σf Xmidpt = 2,370.5
Σf Xmidpt ² = 82,727.75
Data set:
group
f
21 – 30 27
31 – 40 32
41 – 50 12
Total
71
♠ Std dev (s)
s = √s²
s = √50.466
= 7.104
Nota Tambahan
Grouped Data
To approximate the mean of the data in a frequency distribution, treat
each value as if it occurs at the midpoint of its class. Class midpoint =
x.
( x  f )
x
n
Class
n=f
x 
2991
 99.7
30
f
Midpt
x*f
67- 78
3
72.5
217.5
79- 90
5
84.5
422.5
91- 102
8
96.5
772
103-114
9
108.5
976.5
115-126
5
120.5
602.5
30
2991
Nota Tambahan
Grouped Data
To approximate the standard deviation of the data in a frequency distribution,
use class midpoint = x.
( x  x ) 2  f
s
n 1
Class
n=f
f
x  99.7
Midpoint
( x  x )2
( x  x )2 * f
67- 78
3
72.5
739.84
2119.52
79- 90
5
84.5
231.04
1155.20
91- 102
8
96.5
10.24
81.92
103-114
9
108.5
77.44
696.96
115-126
5
120.5
602.5
3012.50
30
s
7138.1

29
7061.1
246.1414  15.69
Nota Tambahan