第二章集中量數

Download Report

Transcript 第二章集中量數

第二章 集中量數
集中趨勢量數(Measures of central tendency),簡稱集
中量數,是全部資料中央位置的數值,故又名中
心位置量數(measure of central location),一般可
以用它陳述一組統計資料之代表值。
集中量數之作用有下列三項:
1. 簡化作用-能用一數據,很清楚扼要地表示
一事實現象之特性。
2. 比較作用-有了平均數就能比較一些不同的
分配及不同的母體。
3. 代表作用-可以由樣本推論至母體,亦即有
代表母體之作用。
集中量數常用的有下列幾項:
1. 算術平均數(Arithmetic Mean)。
2. 中位數(Median)
3. 分割量數,如:四分位數(Quartiles)、十分位數
(Deciles)、百分位數(Percentiles)。
4. 眾數(Mode)。
5. 幾何平均數(Geometric Mean)。
6. 調和平均數(Harmonic Mean)。
2-1 算術平均數
(一) 算術平均數的意義
算術平均數(Arithmetic Mean)常簡稱平均數(Mean),
是最常用的集中趨勢量數。設一群資料含X1、X2、
X3…Xn等N個數,則可用M來代表此群數字資料的平
均數,而一般較常用 X(讀做X bar)來表示變數X
的平均數。
(二) 算術平均數的算法
1.未分組資料的平均數:
1
X
X  M  (X 1  X 2  X 3    X n ) 
N
N
2. 分組資料的平均數:
  fd 
X  AM  
i
 N 
其中N:總次數,i:組距,X:組中點,f:次數
AM:假設值,一般選次數最多那一組的組中點
X'  AM
d
i
3.加權算數平均數:
 fX
Xw 
N
(三) 平均數的特性及限制
求平均數時,資料中的每一個數值都會被
使用到,若沒有極端分數,它最能代表一組
資料的集中趨勢;但相對的,它易被特大或
特小的數值所影響。它適用於等距及比率變
數。
2-2 中位數
(一) 中位數的意義
一組數字資料按大小順序排列後,位置居於中間
的數值即為中位數(Median),一般以 Me 或 Md 來
表示。
(二) 中位數的算法
1.未分組資料的中位數:
2.分組資料的中位數:
(三) 中位數的特性及限制
2-3 其他分割量數
一、四分位數
(一) 四分位數的意義
將資料由小至大排序,再分成四等分,位居第一個
等分位置的數值稱為第一四分位數(first quartile),
記為Q1又稱下四分位數;位居第二等分位置的數值,
稱為第二四分位數(second quartile),記為Q2,其實
Q2就是中位數Me;而位居第三等分位置的數值,
就稱為第三四分位數(third quartile),記為Q3又稱上
四分位數。
(二) 四分位數的算法
1.未分組資料的四分位數:
2.分組資料的四分位數:
二、百分位數
(一) 百分位數的意義
百分位數是將順序資料均分成一百等分的數值。
第i個百分位數記為Pi(其中i = 1 , 2 , 3 ,……或
99),是指至少有i/100的觀察值小於等於該數值,
至少有(100-i)/100的觀察值大於等於該數值。
(二) 百分位數的算法
1.未分組資料的百分位數:
第i個百分位值Pi,是指在一個已排列順序的資
n
料集合中之第 i 
項的值,其中i為百分位
100
的號碼,n是指樣本大小。
2. 分組資料的百分位數:
n

 hi
Pi  Li   i 
 Fi  
 100
 fi
i  1, 2, ... ...,99
其中
Pi:第i個百分位數。
Li:所在組之組真正下限。
fi : Pi 所在組之次數。
Hi:Pi所在之之組距。
Fi :Pi 前一組之累積次數。
2-4 眾數
(一) 眾數的意義
眾數(Mode)是指一組統計資料中次數
出現最多的那一個數值,一般以Mo來
表示。
(二) 眾數的算法
1. 未分組資料的眾數:
把資料歸類,找出出現次數最多的數
值,即為眾數。
2. 分組資料的眾數:
(1) 皮爾森(K. Pearson)的經驗法:
Mo  M  3( M  Me)
其中 Mo :眾數
M:算術平均數
Me:中位數
(2) 金氏(W.I. King)的插補法
f2
Mo  L 
i
f1  f 2
其中 L:眾數組的下限
f1:組值小於眾數組之相鄰組的次數
f2:組值大於眾數組之相鄰組的次數
i:為眾數組的組距
(3) 克魯伯氏(E. Czuber)的比例法:
f1  f
Mo  L 
i
f1  f 2  2 f
其中f:為眾數組的次數
其餘符號同以上公式
(三) 眾數的特性
眾數是數列中出現次數最多的數值,故計
算簡便,且不受極端量數的影響。但是眾
數易受抽樣變動影響及組距或組限變動影
響,甚不穩定,並且當資料次數不多時,
眾數就缺乏代表性。
2-5 幾何平均數
(一) 幾何平均數的定義
幾何平均數(Geometric Mean)為n個數值之
乘積的n次方根
(二) 幾何平均數的算法
1. 未分組資料的幾何平均數
幾何平均數以G來表示,未分組樣本資料
X1,X2,…,Xn之幾何平均數公式如下:
G  n X 1  X 2  ...  X n
2. 已分組資料的幾何平均數
在已分組資料中,若X1,X2,……,
Xk為各組的組中點,且其對應次數為
f1,f2,……,fk,Sfi=n,則已分組資
料之幾何平均數公式如下:
G  X  X  ......  X
n
f1
1
f2
2
fk
k
3.加權幾何平均數:
已知k個數值X1,X2,……,Xk,及其對應的權數
W1,W2,……,Wk,且SWi=n,則加權幾何平
均數公式如下:
GW  X
n
W1
1
X
W2
2
   X
Wk
k
(三) 幾何平均數的特性及限制
一數列的幾何平均數小於算術平均數,
即G ≤ M,而當各數值均相同時,幾何平均數
才會等於算術平均數。
未分組資料的各數值中,若有一數值為零,
或已分組資料的某一組之組中點為零,則依公
式所求的結果就為0;然而0非各數值的代表值,
故若有一數值為0,則不宜採用幾何平均數。
2-6 調和平均數
(一) 調和平均數的定義
調和平均數(Harmonic Mean)亦稱為倒數平均數,
乃各個數值倒數的平均數的倒數,以H表示之。
(二) 調和平均數的求法
1.未分組資料的調和平均數:
一樣本數列的n個數值X1,X2,……,Xn之調和平
均數公式如下:
H
1
1 1
1
1
(

  
)
n X1 X 2
Xn

n
n

i 1
1
(
)
Xi
2. 分組資料的調和平均數:
若分組資料各組的組中點為X1,X2,……,Xn,
且其對應次數為f1,f2,……,fn,fi=n,則分組
後調和平均數公式為:
H
n
fn
f1
f2

  
X1 X 2
Xn

n
n

i 1
fi
(
)
Xi
3.加權調和平均數:
已知一數列X1,X2,……,Xn,及其對應權數
W1,W2,……,Wn,且Wi=n,則加權調和平
均數公式為:
n
Hw  n
Wi
( )

i 1 X i
(三) 調和平均數的特性
一數列的調和平均數小於幾何平均數,即HG,
當各數值均相同時,調和平均數始等於幾何平
均數。
2-7 各種集中量數之關係與比較