抽樣分配 樣本均值( x )的統計性質 • 隨機樣本X1,X2,X3…Xn來自於無限母體抽樣  x  E x      Var X  x 2 n • 標準誤(standard error) : –

Download Report

Transcript 抽樣分配 樣本均值( x )的統計性質 • 隨機樣本X1,X2,X3…Xn來自於無限母體抽樣  x  E x      Var X  x 2 n • 標準誤(standard error) : –

抽樣分配
1
樣本均值( x )的統計性質
• 隨機樣本X1,X2,X3…Xn來自於無限母體抽樣
 x  E x   
  Var X  
2
x
2
n
• 標準誤(standard error) :
– 樣本變異數的平方根,稱作標準誤。標準誤和標準差
的性質相同,只是構成的基本元素不同而已。
SE ( X )   x 
x
n
2
重複抽樣
平均數
平均數
0,0
0
0
0,1
1/2
0.5
0,2
1
1
0,3
3/2
1.5
1,0
1/2
0.5
1,1
1
1
1,2
3/2
1.5
1,3
2
2
2,0
1
1
2,1
3/2
1.5
2,2
2
2
2,3
5/2
2.5
3,0
3/2
1.5
3,1
2
2
3,2
5/2
2.5
3,3
3
3
n=2
example:一個母體包括0,1,2,3。
重複抽出n=2的樣本,抽出後放回。
 2  1.25
 x2  0.625  1.25 / 2
3
• example:
– 某母群體隨機變數X平均數為200,變異數為100,隨
機抽取25個樣本X1,X2,X3…X25,x 為樣本平均數。
– 1. x 的期望值?
– 2. x 的變異數?
– 3. x 的標準差?
• Example:
– 隨機變數X的期望值μ=30,變異數σ2=10,從母體中隨
機抽取20個樣本,求樣本平均數的期望值及變異數。
(30 , 1/2)
4
中央極限定理
•
•
•
•
中央極限定理(central limit theorem)
隨著的抽樣分配隨n的增加呈現數值向中
央集中,機率分布狀態呈常態
不論母群體的分配為何,在重複抽樣下,
只要樣本數夠大,樣本均值的分配會呈
常態分配。
樣本數n:
5
Central limit theorem
• Central limit theorem:
– 母群體變數X的期望值為μ,變異數為σ2,
– X~(μ, σ2),自母群體抽取n個樣本X1,X2,X3….Xn,
當樣本數夠大時(n>=30):
 2 

x ~ N  ,
n 

x
近似標準常態 ~ N 0,1

n
6
7
• Example:
– 某母群體X的期望值為150,變異數為25,X1,X2,X3….X64代表
從母群體抽出的64個隨機樣本, x 表示此64個樣本的平均數,則:
– 1. 的分配為何?
x
– 2.P(149.825<
<150.825)?
x
• Example:
– 母群體隨機變數X呈現右偏,其平均數為30,標準差為26,從母
群體中隨機抽出169個樣本,求
– 1.樣本均值的分配為何。(30 , 2)
– 2.計算
。(z>2)
P(X  34) 
8
• Example:
– 某班級學生統計成績呈常態分布,平均值為72,
標準差為9,試求以下機率:
• 1.自該班隨機抽出1人,其分數超過80的機率?
• 2.自該班抽出10同學,其平均成績超過80的機率?
9
T分配
10
T分配來由
• N(μ,σ)  sampling  樣本均值分配
x
Z

• 以標準化值
,但是對於小樣本不適用

n
• W.S. Gosset(1908)發表t-分配(student-t
distribution)
11
t-分配運算
t
x
S
n
Xi  X 
S2 
n 1
2
自由度 =
12
T分配的特性
• 以0為中心的鐘形曲線,類似Z分配,但會
隨自由度變化。
• 自由度(degree of freedom; d.f.),記作t(df),
df∞,t~N(0,1)。
13
• Example:(t分配表右單尾特性)
– df=5,α=0.1,則t( 0.1 , 5 )=?
– ν=9 α=0.05,則t( 0.05 , 9 )=?
– ν=9 α=0.95,則t( 0.95 , 9 )=?
• example:
– 設X代表某班統計學成績,已知其為常態分配,平均數
為72,標準差未知。今自該班抽取9位同學,得標準差
5,此9位同學之平均成績在K值以上之機率為0.05,試
求K值。
14
樣本比例的抽樣分配
15
樣本比例的抽樣分配
• X代表成功次數,n為樣本數
X
n
 p  E P   P
P
 P2  Var P  
P(1  P) pq

n
n
• 回顧二項分配:
  np
 2  npq
16
P
• 呈常態

p (1  P ) 


P ~ N  P,

n


PP
Z
P (1  P )
n
的抽樣分配
母體常態分配
抽樣分配
二項分配趨近常態
樣本比例抽樣分配
Z
Z
X 

PP
Z
Z
pq
n
X  np
npq
X 

n
17
• Example:
– 一個母體包含3個白球,2個紅球,今抽出2個球,抽出
放回,試求抽出紅球的比例分配(求μp bar σp bar):

P ~ N  P,

p (1  P) 


n

• Example:
– 今有新品種水稻300顆種子,進行發芽測試,結果有
249顆發芽,請問新品種發芽率的平均值及標準差。
(0.83 , 0.02)
18
• Example:
– 某公司有1000名員工,其中女性300人,茲隨
機抽出50名員工,則抽出女姓的機率大於0.4的
機率為何。(0.0618)
19