抽樣分配與點估計

Download Report

Transcript 抽樣分配與點估計

社會統計
第四講
抽樣分配與點估計
©Ming-chi Chen
社會統計
Page.1
Sampling Theory and Some
Important Sampling Distributions
觀
念
• 統計主要問題在於如何透過樣本的統計量來推估或
檢證母體的參數(parameters)。
• A parameter is a numerical quantity that describes
some characteristics of a population. 參數為描述母
體某些特性的數值。
• 如μ、σ、母體中位數等皆為參數。
©Ming-chi Chen
社會統計
Page.2
Sampling Theory and Some
Important Sampling Distributions
觀
念
• 為了要瞭解母體的特性,我們可以對於母
體中的所有單位進行普查(census),但普
查有很多缺點:
• (一)耗時耗力,成本高。(二)無法蒐集較為
深入、詳細的資訊,(三)普查錯誤機率大。
• 因此我們經常從母體中抽取少量的樣本,
計算樣本統計量來幫我們推估母體的性質。
©Ming-chi Chen
社會統計
Page.3
Sampling Theory and Some
Important Sampling Distributions
觀
念
• 樣本統計Sample statistics 是用來描述樣本的
特性的數量,。
• Sample mean x、sample variance S2, and
the sample proportion pˆ
• 樣本統計為觀察到的樣本之函數,樣本的統
計量隨著取樣的不同,會有不同的變化。因
此,樣本統計量本身可以被視為是一隨機變
數。
©Ming-chi Chen
社會統計
Page.4
Introduction to Sampling Distribution觀
念
• 一個樣本的統計量(如樣
本平均數)是樣本的函數
Sample樣本平均數
X
x354
x4
Population
母體參數
x
X
的特定值
x31
x4 x1005
x411 x42909
x1  x 2200000
©Ming-chi Chen
x103
x41 x49
, 
隨機變數
社會統計
x
Page.5
Introduction to Sampling Distribution觀
念
• 用於推估母體的參數(μ)的樣本統計量(如Xbar),稱為「估計式」(an estimator)。
x 
x
n
•將實際抽樣所得到的樣本帶入估計式,得到
的數值(如χ-bar)稱為估計值(estimate)
©Ming-chi Chen
社會統計
Page.6
Estimator and Estimate
觀
念
• 從母體中觀察到一組隨機樣本 x1, x2, …xn ,
母體參數的估計式estimator為一樣本統計
sample statistic ,它是一種運算規則rule,告
訴我們如何運用x1, x2, …xn去計算出母體參數
的估計值。
• 將x1, x2, …xn帶入估計式estimator所得到的數
值稱為估計值estimate 。
©Ming-chi Chen
社會統計
Page.7
Sampling distribution抽樣分配
觀
念
• 樣本的統計量為一隨機變數,每一個特定變量出現
的機率不同,因此,樣本統計量為一機率分配,稱
為樣本統計的抽樣分配(sampling distribution),為多
次抽樣結果的機率分佈。
• 例如從母體中抽固定大小n的樣本,求取每一個樣本
的平均數,這些平均數會有一個分布,這就是抽樣
分配。
• 人社系全體同學200人,每次抽25人測量其平均身高,
一共可以抽出C20025個樣本,每個樣本都有其平均身
高,把這些數值集合起來會有一個分配,這就是樣
本分配。
• 或者從母體中抽固定大小n的樣本,求取每一個樣本
具有某種特質(ex.投票給A候選人)的比例,這些
比例也會有一個分布,這也是抽樣分配。
社會統計
©Ming-chi Chen
Page.8
Desirable properties of estimators
觀
念
• 可以用來估計母體參數的樣本統計量有很多種,例
如我們可以用樣本平均數 X 來估計母體平均值μ,也
可以用樣本的中位數來估計。對於某些樣本來說,
樣本平均值並不見得是母體參數的最佳估計值。
• 究竟一個好的估計式必須具備哪些條件?我們需要
一些標準來評估各種估計式。
©Ming-chi Chen
社會統計
Page.9
好的估計式必備條件?
•
•
•
•
•
•
不偏性(unbiased)
有效性(efficiency)
最小變異不偏性
漸近不偏性
一致性
充分性
©Ming-chi Chen
社會統計
牽涉數理統計部分,
略過不談
Page.10
Sampling Error抽樣誤差
觀
念
• 首先我們希望估計的誤差愈小愈好
• 估計值與被估計的母體參數之間的差距稱為
抽樣誤差。
• 抽樣誤差隨樣本不同而有變化,如果估計量
的機率分配集中於母體參數的周遭,則抽樣
誤差較小,反之較大。
©Ming-chi Chen
社會統計
Page.11
Sampling Error抽樣誤差
觀
念
• 從母體中抽取一隨機樣本的方法有很多種,
如果從N中取n個元素(without replacement)做
為樣本,且每個n被抽到的機率相同,則稱為
簡單隨機樣本(a simple random sample)。
• 從N中取n共有NCn=N!/[n!(N-n)!]取法。每一個
隨機樣本被選取的機率為1/ NCn。
©Ming-chi Chen
社會統計
Page.12
Derivation of a Sampling Distribution
觀
抽樣分配
念
• 例題:
• 一母體中有五個元素{1,3,4,8,9},從這母體中
選取n=3的簡單隨機樣本,列出所有可能樣本
的機率分佈,並計算各樣本的平均數、中位
數,評估何者為較優良的估計量?
©Ming-chi Chen
社會統計
Page.13
Derivation of a Sampling Distribution
觀
抽樣分配
念
• {1,3,4,8,9},
Sample
1
2
3
4
5
6
7
8
9
10
sample
value
1,3,4
1,3,8
1,3,9
1,4,8
1,4,9
1,8,9
3,4,8
3,4,9
3,8,9
4,8,9
©Ming-chi Chen
母體參數μ =(1+3+4+8+9) /5 =5
N=5, 樣本個數為3的
Sample Sample
mean median Probability 樣本共有
2.67
4.00
4.33
4.33
4.67
6.00
5.00
5.33
6.67
7.00
3
3
3
4
4
8
4
4
8
8
0.1
0.1
0.1
0.1
0.1
0.1
0.1
0.1
0.1
0.1
社會統計
C53=10
簡單隨機樣本(a simple
random sample),每一
個樣本出現的機率相同。
Page.14
Derivation of a Sampling Distribution
觀
抽樣分配
念
Sample
1
2
3
4
5
6
7
8
9
10
sample Sample Sample
sampling sampling
value mean X median M Probability error of X error of M
1,3,4
2.67
3
0.1
2.33
2
1,3,8
4.00
3
0.1
1.00
2
1,3,9
4.33
3
0.1
0.67
2
1,4,8
4.33
4
0.1
0.67
1
1,4,9
4.67
4
0.1
0.33
1
1,8,9
6.00
8
0.1
1.00
3
3,4,8
5.00
4
0.1
0.00
1
3,4,9
5.33
4
0.1
0.33
1
3,8,9
6.67
8
0.1
1.67
3
4,8,9
7.00
8
0.1
2.00
3
10.00
19
中位數
的的抽
樣誤差
平均數的抽樣誤差
©Ming-chi Chen
社會統計
Page.15
Derivation of a Sampling Distribution
觀
抽樣分配
念
Sampling distribution
of sample mean
Sampling distribution of
sample median
Sample
Sample
mean X
Probability
median M Probability
2.67
0.1
3
0.3
4.00
0.1
4.33
0.2
4
0.4
4.67
0.1
8
0.3
6.00
0.1
樣本中位數
5.00
0.1
樣本平均數
的抽樣分配
5.33
0.1
的抽樣分配
6.67
0.1
社會統計
©Ming-chi
Page.16
7.00 Chen 0.1
Sampling Distribution
• 三個有關估計量的樣本分佈的問題
• (1) 估計量的抽樣分配呈現何種型態?是否為
常態分配?
• (2) 估計量的抽樣分配平均值為何?
• (3) 抽樣分配的變異數為何?
©Ming-chi Chen
社會統計
Page.17
Sampling Distribution
Sample Sample
mean X median M Probability
2.67
3
0.1
4.00
3
0.1
4.33
3
0.2
4.67
4
0.1
6.00
8
0.1
5.00
4
0.1
5.33
4
0.1
6.67
8
0.1
7.00
8
0.1
©Ming-chi Chen
• 在眾多樣本裡,有些樣
本的平均值大於母體平
均值 μ,有些小於μ,
如果計算所有樣本平均
值的「平均」,是否與
母體平均值相近?
社會統計
Page.18
Sampling Distribution
• 如果抽樣分配的平均值(期望值)等於欲估計的母
體參數,我們稱之為母體參數的「不偏估計式」
(unbiased estimator)。
• 一個不偏估計式的抽樣分配會集中於母體參數。
The sampling distribution of an unbiased
estimator is centered at the population parameter.
• 如果抽樣分配不集中於母體參數,則此估計量有偏
誤(biased)。
©Ming-chi Chen
社會統計
Page.19
Sampling Distribution
•
•
•
•
令A為母體參數 的一個估計式,如果
E(A) = 
則A為母體參數的不偏估計式。
如果E(A)≠ , 則稱A為的偏誤估計式 (a
biased estimator of ). 偏誤量為:
• Bias=E(A) - 
©Ming-chi Chen
社會統計
Page.20
Calculating E(X) and E(M)
Sampling distribution
of the sample mean
Sample
mean X
2.67
4.00
4.33
4.67
6.00
5.00
5.33
6.67
7.00
P(X) X*P(X)
0.1
0.267
0.1
0.400
0.2
0.866
0.1
0.467
0.1
0.600
0.1
0.500
0.1
0.533
0.1
0.667
0.1
0.700
E(X) = 5.00
©Ming-chi Chen
觀
念
Sampling distribution
of the sample median
Sample
median M
3
4
8
P(m) m*P(m)
0.3
0.90
0.4
1.60
0.3
2.40
E(M) = 4.90
E ( X )  μ , E(M)  μ
母體中數為4
社會統計
Page.21
Biased and unbiased estimators
Unbiased
estimator of 
Biased estimator
of 
Sampling
distribution of B
Sampling
distribution of A
E(A)
E(B)

Bias of B
©Ming-chi Chen
社會統計
Page.22
Relative Efficiency
• 假設A為的不偏估計式。儘管A的抽樣分配會集中
於,但並不代表A中的任何特定值皆剛好等於。
一個好的估計量除了抽樣分配要集中於母體參數外,
其抽樣分配的標準差要愈小愈好。
• 一個母體參數可以有很多個不同的不偏估計量,如
隨機變數為對稱分配時,樣本平均數與樣本中位數
皆為不偏估計量,但我們喜歡比較集中的估計量。
©Ming-chi Chen
社會統計
Page.23
不偏與有效
高偏差低變異
©Ming-chi Chen
高偏差高變異
社會統計
Page.24
不偏與有效
低偏差高變異
©Ming-chi Chen
低偏差低變異
社會統計
Page.25
Relative Efficiency
• 假設X~N(, 2),樣本數為n,樣本平均數
與樣本中位數何者為較好的估計值?
• 由於兩者皆為不偏估計量,因此我們傾向於
採用標準差較小的估計量X:

X


n
 M  1 . 25 (
©Ming-chi Chen

)
n
社會統計
Page.26
Relative Efficiency
• Let A and B be two unbiased estimators of
some population parameter. The relative
efficiency of A with respect to B is the ratio
of their variances; that is;
relative
efficiency

Var ( B )
Var ( A )
B
2

A
2
• The estimator A is said to be more efficient than
B if Var(A) < Var(B)
©Ming-chi Chen
社會統計
Page.27
Relative Efficiency
• 假設X~N(, 2)
Sampling distribution of X
Sampling distribution of M
E(X) = E(M) =μ
Relative
Efficienc
y
Var(M)
2

Var( X )
©Ming-chi Chen
1 . 57 ( / n )
社會統計
( / n )
2
 1 . 57
Page.28
Minimum Variance Unbiased
Estimator
• 當估計式A是母體參數的一個不偏估計式 ,
而且沒有其他的不偏估計式有更小的變異數
時,則A為 的最小變異不偏估計式
(minimum variance unbiased estimator)
• x就是μ的最小變異不偏估計式。
©Ming-chi Chen
社會統計
Page.29
Sampling Distribution of Sample Mean
• 收入的次數分配
0.30
0.25
0.20
0.15
0.10
0.05
0.00
0
10
20
30
40 50
60 70
80 90
取樣本數n=20的樣本來計算
樣本平均值
©Ming-chi Chen
社會統計
income
0 - 9.99
10 - 19.99
20 - 29.99
30 - 39.99
40 - 49.99
50 - 59.99
60 - 69.99
70 - 79.99
80 - 89.99
90 - 99.99
f
66
220
285
147
143
75
42
14
7
1
1000
f/n
0.066
0.22
0.285
0.147
0.143
0.075
0.042
0.014
0.007
0.001
1
=30.47 =16.54
Page.30
Sampling Distribution of Sample Mean
取n=20的樣本五十個,並計
算樣本平均值,其抽樣分佈:
value of X-bar f
23 - 24.99 2
25 - 26.99 1
27 - 28.99 8
29 - 30.99 19
31 - 32.99 13
33 - 34.99 5
35 - 36.99 2
50
0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
23
25
©Ming-chi Chen
27
29
31
33
35
f/n
0.04
0.02
0.16
0.38
0.26
0.10
0.04
E(X)=30.47 Sx=2.573
社會統計
Page.31
Sampling Distribution of Sample Mean
抽樣分配較原分配接近常態分配
=30.47
=16.54
E(X)=30.47
Sx=2.573
0.30
0.4
0.35
0.25
0.3
0.20
0.25
0.2
0.15
0.15
0.10
0.1
0.05
0.05
0.00
0
0
10
20
©Ming-chi Chen
30
40
50
60
70
80
90
社會統計
23
25
27
29
31
33
35
Page.32
Sampling Distribution of Sample Mean
• 無論母體為何種分配,樣本平均數的分配
呈現鐘型且接近常態分配。而且當樣本數
n愈大,趨近於常態分配的情形欲明顯。
• X的抽樣分配其平均值等於母體平均數:
uX  uX
•抽樣分配的標準差比母體標準差小。
©Ming-chi Chen
社會統計
Page.33
Very simple random sample (VSRS)觀
念
A very simple random sample is a sample whose n
observations x1, x2, …xn are independent. The
distribution of each X is the population distribution
p(x): that is
P(x1) = P( x2) … = P(xn) = population distribution P(x)
Then each observation has the mean μ and standard
deviation σof the population.
E(x) = μ, Var(X) = σ2
©Ming-chi Chen
社會統計
Page.34
Introduction to Sampling Distribution觀
念
• 樣本中每一個元素被抽到的機率皆相同
• 每一個元素的期望值為母體平均數μ
• 每一個元素的標準差為母體標準差σ
P(x1) = P( x2) … =
P(xn) = population
distribution P(x)
Population
母體參數
, 
E(x) = μ, Var(X) = σ2
x1  x 2200000
©Ming-chi Chen
社會統計
Page.35
E(X )  ?
X 
1
( x1  x 2    x n )
n
1
E ( X )  E ( x1  x 2    x n )
n
1
 E ( x1  x 2    x n )
n
1
 [ E ( x1 )  E ( x 2 )    E ( x n )]
n
1
1
 [ u  u    u ]  [ nu ]  u
n
n
©Ming-chi Chen
社會統計
Page.36
Var ( X )  ?
Var ( X )  Var [
1
n



1
n
1
2
n
1
n
2
 x1 , x 2  x n are independen
t
[Var ( x1 )  Var ( x 2 )    Var ( x n )]
[       ]
2
2
( x1  x 2    x n )]
2
[n ]
2
©Ming-chi Chen
2


2
standard
deviation
of X 

n
n
社會統計
Page.37
Standard Error of X-bar
• The typical deviation of X from its target μ
represent the estimate error, and so it is
commonly called the standard error標準誤,
or SE:
Standard
SE 
error of X

n
©Ming-chi Chen
社會統計
Page.38
Small-population sampling
• If sampling is done without replacement from
a finite population containing N elements,
then the variance of X is
N n
Var( X ) 


n  N 1 
σ
2
Finite population correction factor
有限母體修正因子,若
n/N<=5%時可忽略不計。
©Ming-chi Chen
社會統計
Page.39
Small-population sampling
N n
Var( X ) 


n  N 1 
σ
2
• 若樣本數為n=1,則是否放回無關緊要。
• 若樣本數n=N,即樣本數等於母體數,則變
異數必等於零。
• 在正常的情況下,母體數N通常都比樣本數n
要大很多,因此放回與否幾乎不造成影響:
 N  n  22 , 000 , 000  1, 000
 1 . 00


22 , 000 , 000  1
 N 1 
©Ming-chi Chen
社會統計
Page.40
Standard Error of X-bar
Standard
SE 
error of X

n
• SE的公式告訴我們:
• (1)母體的標準差愈小,SE愈小。
• (2)樣本數愈大,SE愈小。
©Ming-chi Chen
社會統計
Page.41
例題
• 設x1, x2, …xn為抽取自任意母體f(x)之一組隨
機樣本,證明樣本平均數及樣本變異數分別
為μ及σ2的不偏估計式。
E(X )  
E (S )  E[
2
1
n
(x

n 1
 x) ]  
2
i
2
i 1
©Ming-chi Chen
社會統計
Page.42
Variance of Discrete Random
Variable
  E [( X  u ) ]
2
2
E(X  2  X u  u )
2
2
 E ( X )  2u  E ( X )  E (u )
2
2
 E ( X )  2u  u  u
2
2
 E ( X )  u  E ( X )  [ E ( X )]
2
©Ming-chi Chen
2
2
社會統計
2
Page.43
E (S ) 
2

1
n 1
n
1
E [  ( xi  x ) ] 
1
2
n 1
i 1
E [ x  nx ] 
2
i
E [  ( xi  2 xi x  x )]
2
i 1
[  E ( x i )  nE ( x ) ]
2
n 1
2
i 1
 var( x )  E ( x )  [ E ( x )]
2



1
n 1
1
n 1
1
n 1
2
n
1
2
n 1
n
2
{  [Var ( x i )  [ E ( x i )] ]  n [var( x )  ( E ( x )) ]}
2
{ [    ]  n [
2
2

2
2
  ]}
2
n
{n   n     n  }
2
©Ming-chi Chen
2
2
2
社會統計

( n  1)
2
n 1
Page.44
圖3.1 某診所等待看牙時間(母體)
4500人(母體)
相 0.4
對 0.35
次
數 0.3
等待50分鐘以上的有
5%
0.25
0.2
0.15
0.1
0.05
0
©Ming-chi Chen
0
10
20
30
社會統計
40
50
60
x
候診時間
Page.45
圖3.2 等待看牙時間(樣本1,50人)
相 0.4
對0.35
次
0.3
數
等待50分鐘以上的
佔20%
0.25
0.2
0.15
0.1
0.05
0
0
©Ming-chi Chen
10
20
30
社會統計
40
50
60
候診時間
Page.46
圖3.3 等待看牙時間(樣本2,50人)
哪一個樣本比較好?
0.4
相
對 0.35
次
0.3
數
0.25
等待50分鐘以上的佔
10%
0.2
0.15
0.1
0.05
0
0
©Ming-chi Chen
10
20
30
社會統計
40
50
60
候診時間
Page.47
概念複習
• 利用樣本的統計量去推論母體的參數時,由
於母體中的各個元素本身有所不同,因此不
論抽樣是否客觀公正,樣本統計量與母體參
數之間總是會有一些差異,稱為估計誤差
(error of estimation)
• 估計誤差的來源有二:抽樣誤差與非抽樣誤
差。
©Ming-chi Chen
社會統計
Page.48
估計誤差
• 抽樣誤差
– 抽樣誤差是樣本統計量與相對應的母體參數間的
差異。此種差異來自抽樣過程的機遇(chance),
抽樣方法及推論方法的不同。
• 非抽樣誤差
– 非抽樣誤差主要來自調查時的執行與事後在記錄、
整理資料時所發生的錯誤。
©Ming-chi Chen
社會統計
Page.49
估計誤差
母體參數
樣本統計量
估計誤差
非抽樣誤差
時
的
疏
失
©Ming-chi Chen
抽樣誤差
資
料
整
理
抽
樣
方
法
社會統計
推 樣
論 本
方 數
法
Page.50
簡單隨機抽樣
• 簡單隨機抽樣的意義
– 抽取樣本時,若所有可能抽出的樣本被抽出的機
率均相等,則稱該抽樣方法為簡單隨機抽樣。
• 簡單隨機抽樣的實施方式
– 抽籤式
– 以亂數表抽取樣本
– 以電腦做隨機抽樣
©Ming-chi Chen
社會統計
Page.51
母體參數與樣本統計量
• 母體參數
– 母體參數是描述母體資料特性的統計測量數,一
般簡稱為參數或母數。參數是我們想要獲取的,
是統計的核心。
• 樣本統計量
– 樣本統計量為樣本的實數函數。
• 抽樣分配
– 樣本統計量為隨機樣本的函數,而隨機樣本是由n
個隨機變數所組成的,故樣本統計量亦為一隨機
變數,其機率分配稱為抽樣分配。
©Ming-chi Chen
社會統計
Page.52
樣本平均數的抽樣分配
設母體為隨機變數X,其機率分配為 f ( x ) ,若自母體
中簡單隨機抽取n個元素為一組樣本,表為
( X 1 , X 2 ,..., X n )
,若令
X 
n
Xi
i 1
n

,則 X 為樣本平均數。其機
率分配表為 f ( x ) ,稱為樣本平均數的抽樣分配。
©Ming-chi Chen
社會統計
Page.53
樣本平均數的抽樣分配
所有可能樣本
抽樣
母體
N
x 1 S
:
xn
x1
:
xn
x1 =
x
n
x 2=
x
n
S2
:
S 
: Cn
x1
:
xn
©Ming-chi Chen
所有樣本平均數
社會統計
x C =
n
x
n
Page.54
樣本平均數的抽樣分配
x
f
22
25
28
30
©Ming-chi Chen
1
2
1
1
N 5
社會統計
Page.55
某國家五大區域過去一年的族群衝突
次數
x
f(x)
22
1/5=0.2
25
2/5=0.4
28
1/5=0.2
30
1/5=0.2
Σf(x)=1
©Ming-chi Chen
社會統計
Page.56
族群衝突次數的母體機率分配
f ( x)
0.5
  26, 2  7.6
0.4
0.3
0.2
0.1
0
22
©Ming-chi Chen
25
社會統計
28
30
x
Page.57
樣本平均數的抽樣分配
所有可能樣本
抽樣
母體
N
x 1 S
:
xn
x1
:
xn
x1=
x
n
x 2=
x
n
S2
:
S 
: Cn
x1
:
xn
©Ming-chi Chen
所有樣本平均數
社會統計
x C =
n
x
n
Page.58
樣本平均數的機率分配
f (x)
x
N
x1
1 / Cn
N
x2
1 / Cn

xC N

N
1 / Cn
n
X 的平均數與變異數
©Ming-chi Chen
社會統計
E ( X ) 、V ( X )
Page.59
族群衝突次數的抽樣
母 體
A = 22
B = 25
C = 25
D = 28
E = 30
©Ming-chi Chen
樣本空間
隨機
抽樣
(ABC)
(ABE)
(ACE)
(BCD)
(BDE)
(ABD)
(ACD)
(ADE)
(BCE)
(CDE)
社會統計
X :樣本點的平均數
定義
X 
X1  X2  X3
3
Page.60
族群衝突的樣本平均數
樣本
樣 本 平 均x數
( ABC )  ( 22 , 25 , 25 )
( ABD )  ( 22 , 25 , 28 )
( ABE)
 ( 22 , 25 , 30 )
( ACD )  ( 22 , 25 , 28 )
( ACE )  ( 22 , 25 , 30 )
( ADE )  ( 22 , 28 , 30 )
( BCD )  ( 25 , 25 , 28 )
( BCE )  ( 25 , 25 , 30 )
24.00
25.00
25.67
25.00
25.67
26.67
26.00
( BDE )  ( 25 , 28 , 30 )
26.67
( CDE )  ( 25 , 28 , 30 )
27.67
27.67
©Ming-chi Chen
社會統計
Page.61
族群衝突的抽樣分配
f (x)
x
24.00
1 / 10  0 . 10
25.00
2 / 10  0 . 20
25.67
2 / 10  0 . 20
26.00
1 / 10  0 . 10
26.67
2 / 10  0 . 20
27.67
2 / 10  0 . 20
 f ( x )  1 . 00
©Ming-chi Chen
社會統計
Page.62
族群衝突抽樣分配圖
f ( x)
0.3
  26 ,  2  1.373
0.2
0.1
0
24.00 25.00 25.67 26.00 26.67 27.67
©Ming-chi Chen
社會統計
x
Page.63
研究助理年資的機率分配圖
0.20
  3.5 ,  2  2 .917
f (x)
1/6
0.15
0.10
0.05
0.00
1
©Ming-chi Chen
2
3
社會統計
4
5
6
x
Page.64
研究助理年資的樣本空間
母 體
A=1
B=2
C=3
D=4
E=5
F=6
樣本空間
隨機
抽樣
©Ming-chi Chen
(1,2) (1,3) (1,4)
(1,5) (1,6) (2,3)
(2,4) (2,5) (2,6)
(3,4) (3,5) (3,6)
(4,5) (4,6) (5,6)
社會統計
X :樣本點的平均數
定義
X
X1  X 2
2
Page.65
研究助理年資的樣本平均數
樣本
樣本平均數
樣本
樣本平均數
(1,2)
1.5
(2,6)
4.0
(1,3)
2.0
(3,4)
3.5
(1,4)
2.5
(3,5)
4.0
(1,5)
3.0
(3,6)
4.5
(1,6)
3.5
(4,5)
4.5
(2,3)
2.5
(4,6)
5.0
(2,4)
3.0
(5,6)
5.5
(2,5)
3.5
©Ming-chi Chen
社會統計
Page.66
研究助理年資的抽樣分配
f (x)
x
1.5
2.0
2.5
3.0
3.5
4.0
4.5
5.0
5.5
©Ming-chi Chen
1/15
1/15
2/15
2/15
3/15
2/15
2/15
1/15
1/15
社會統計
Page.67
研究助理年資抽樣分配圖
0.30
f (x)
E( X )    35
. , 2  1166
.
0.25
0.20
0.15
0.10
0.05
0.00
1.5
©Ming-chi Chen
2
2.5
3
社會統計
3.5
4
4.5
5
5.5
x
Page.68
擲骰子出現點數的機率分配圖
f (x)
 2  2.917
1/6
1
©Ming-chi Chen
2
3
社會統計
4
  3 .5
5
6
x
Page.69
擲骰子兩次的樣本平均數的機率分配
樣本
f (x)
x
(1 , 1)
1
1/36
(1 , 2)(2 , 1)
3/2
2/36
(1 , 3)(3 , 1)(2 , 2)
4/2
3/36
(1 , 4)(4 , 1)(2 , 3)(3 , 2)
5/2
4/36
(1 , 5)(5 , 1)(2 , 4)(4 , 2) (3 , 3)
6/2
5/36
(1 , 6)(6 , 1)(2 , 5)(5 , 2)(3 , 4)(4 , 3)
7/2
6/36
(2 , 6)(6 , 2)(3 , 5)(5 , 3)(4 , 4)
8/2
5/36
(3 , 6)(6 , 3)(4 , 5)(5 , 4)
9/2
4/36
(4 , 6)(6 , 4)(5 , 5)
10/2
3/36
(5 , 6)(6 , 5)
11/2
2/36
(6 , 6)
12/2
1/36
©Ming-chi Chen
社會統計
Page.70
擲骰子兩次樣本平均數的機率分配圖
0.20
f ( x)
 x 2  1. 458
0.15
0.10
0.05
0.00
1
1.5
2
2.5
3
3.5
4
4.5
5
5.5
6
x
E ( X )    3 .5
©Ming-chi Chen
社會統計
Page.71
1-1
樣本平均數的期望值與變異數

X
抽樣分配的平均數與變異數
X 抽樣分配的平均數與變異數稱為X 的平均數與變異
數 。 以 符 號  X 或 E ( X ) 及

X
2
X
或V ( X ) 分 別 表 示 。
抽樣分配的平均數
X 抽樣分配的平均數等於母體平均數,即
E(X )  X  
©Ming-chi Chen
社會統計
Page.72
1-1
X
抽樣分配的變異數與標準差
 無 限 母 體 樣 本 平 均 數 的 變 異 數 ( X )與 標 準 差 
( X )
2


2
X
X
 V (X ) 

2
n


n
 有 限 母 體 抽 出 不 放 回 樣 本 平 均 數 的 變 異 數 (
標 準 差 ( X )


2
X
X
 V (X ) 

2

V (X ) 
©Ming-chi Chen
)與
N n
n

2
X

n
N 1

N  n
N 1
社會統計
Page.73
大數法則
 大數法則
lim
n 
P (| X   |  )  1
亦即當樣本數夠大時,X 會趨近於  的機率為
1。
©Ming-chi Chen
社會統計
Page.74
圖9.16 大數法則
f (x)
n  100
n  50
n5

©Ming-chi Chen
社會統計
x
Page.75
大數法則
 大數法則
lim
n 
P (| X   |  )  1
亦 即 當 樣 本 數 夠 大 時 , X 會 趨 近 於
的機率
為 1。
©Ming-chi Chen
社會統計
Page.76
圖9.16 X 的機率分配與 X 的抽樣分配
f (x)

f (x)

©Ming-chi Chen
社會統計
x
x
Page.77
The Central Limit Theorem
• 當母體為常態分配時,無論樣本數大小,樣本平均
數的抽樣分配必為常態。
• Suppose we select a random sample of n
observations from any population having mean u
and standard deviation . If n is sufficiently large
(n=20~30), the sampling distribution of X will be:
approximat
and standard
ely a normal distributi
deviation
on with
mean
μ
/ n
The approximation improves as the sample size
increase.
©Ming-chi Chen
社會統計
Page.78
圖9.18 中央極限定理
母體分配
母體分配

©Ming-chi Chen
x
社會統計

x
Page.79
圖9.18
中央極限定理(續)
抽樣分配
抽樣分配
n =5
n =5


x
n =10
n =10

©Ming-chi Chen
x

x
社會統計
x
Page.80
圖9.18
中央極限定理(續)
抽樣分配
抽樣分配
n =30
n =30


x
x
n =50
n =50
.

©Ming-chi Chen
u
x
社會統計
x
Page.81
表9.11 的抽樣分配
樣本
母體分配
抽樣分配
大樣本
母體為常態分配
X ~ N ( ,

2
)
n
( n  30 )
母體非常態分配
X ~ N ( ,

2
)
n
小樣本
母體為常態分配
X ~ N ( ,
2
)
n
( n  30 )
母體非常態分配
註:若母體為有限母體,且
n
 0 . 05
X
的抽樣分配決定於母體分配
,則 V ( X ) 
N

2
n
若母體為有限母體,且 n / N  0 . 05 ,則
因 ( X 1 ,  , X n ) 不獨立。
©Ming-chi Chen

社會統計
X

N n
N 1
。
不一定為常態分配,
Page.82
例題
• (1) 某大班統計課學生期中考成績呈現常態分配,均
數為72分,標準差為9分。隨機抽得某生,請問其分
數超過80分的機率為何?
• (2) 任意抽取一個由10名學生所構成的樣本,請問這
10名學生平均分數超過80分的機率為何?
©Ming-chi Chen
社會統計
Page.83
例題
(1 ) Z 
X u


80  72
 . 89
9
P ( X  80 )  P ( Z  . 89 )  . 187
(1) X ~ N ( 72 ,
9
用SE來表示
 2 . 85 )
10
Z 
X u

SE
80  72
 2 . 81
2 . 85
P ( X  80 )  P ( Z  2 . 81 )  . 002
©Ming-chi Chen
社會統計
Page.84
例題
• 假設勞委會要估計化工工程師的起薪。母體的平均
數為u=$25,000,母體的標準差為$2,000。勞委會
取n=100的隨機樣本,找出樣本平均數與母體平均數
差距不會超過$400的機率?
• n=100, u=$25,000, =$2,000
• 因為n=100>30,套用中央極限定律:
X ~ N ($ 25000 ,
$ 2000
)
100
©Ming-chi Chen
社會統計
Page.85
例題
• 樣本平均數與母體平均數差距不會超過$400,即Xbar介於24,600~25,000之間。P(24,600  X-bar 
25,400)=?
X ~ N ($ 25000 ,
$ 2000
)
z1 
100
z1 
24600  25000
  2 . 00
200
25400  25000
 2 . 00
200
P ( 24600  X  25400 )
24600
25000
©Ming-chi Chen
 P (2  Z  2)
25400
 . 4772  . 4772  . 9544
社會統計
Page.86
Sampling distribution of the
difference between two sample mean
• 假設有兩獨立母體
1
2
1
X1
2
X2
21/n1
1
©Ming-chi Chen
22/n
2
社會統計
Page.87
Sampling distribution of the
difference between two sample mean
• 當樣本n很大時,樣本平均數差之抽樣分配為近
似常態分配
X1
X2
21/n1
22/n2
1
2
1
2
X1  X 2
n1
©Ming-chi Chen
1- 2
社會統計
2
2

n2
Page.88
Sampling distribution of the
difference between two sample mean
E ( X 1  X 2 )  E ( X 1 )  E ( X 2 )  1   2
 X 1  X 2 is an unbiased
estimator
of  1   2
If the two random sample are independen
Var( X 1  X 2 ) 

2
1
n1


2
2
n2
1
2
n1
©Ming-chi Chen
t,
1- 2
社會統計
2
2

n2
Page.89
例題
• 美國某發卡銀行風險分析師宣稱女性用卡人平均每
月消費是80元美金,變異數是1400,而男性平均是
80元,而變異數是1320元。取一個包含100女性用
卡人和120位男性用卡人的樣本,請問女性樣本均數
至少比男性高出5元的機率為何?
©Ming-chi Chen
社會統計
Page.90
例題
P ( X 1  X 2  5)  ?
u 1  80 ,  1  1400 , n1  100
2
u 2  80 ,  2  1320 , n 2  120
2
1
2
X 1  X 2 ~ N ( u1  u 2 ,
2

n1
u 1  u 2  80  80  0
X 1  X 2 ~ N ( 0 , 25 )
2
n2
)
1
2
2
2

n1
Z 

n2
50
1400
100

1320
 25
120
1
25
P ( X 1  X 2  5 )  P ( Z  1)  . 5  . 3413  . 1587
©Ming-chi Chen
社會統計
Page.91
例題
設若 X n 與 Y n 是從一個均數為
為  的母體中所抽出,樣本
2
的兩個獨立隨機樣本的
(1) E ( X n  Y n )  ?
(3) P ( X n  Yn 
©Ming-chi Chen

 變異數
大小為 n
均數
( 2 ) Var ( X n  Y n )  ?
)  0 . 98 , n  ?
2
社會統計
Page.92
例題
(1) E ( X n  Y n )  E ( X n )  E (Y n )  u  u  0
( 2 ) Var ( X n  Y n ) Var ( X n )  Var (Y n )


2


n
©Ming-chi Chen
2
n

2
2
n
社會統計
Page.93
例題
(3) P ( X n  Yn 

)  0 . 98 , n  ?
2

0
由 C . L .T .可知 P ( Z  2
2


0
2
2
2
 2 . 33
n
©Ming-chi Chen
)  0 . 98
2
n
2  2 . 33
2
n  43 . 431
n  44
n
社會統計
Page.94
例題
• A牌液晶銀幕的平均壽命為6.5年,標準差為0.9年;
B牌液晶螢幕平均壽命為6年,標準差為0.8年。我們
從A牌中抽出36個樣本,從B牌抽出49個樣本,請問
A牌的樣本平均壽命比B牌樣本平壽命長至少1年的
機率?
©Ming-chi Chen
社會統計
Page.95
例題
X A ~ N ( 6 . 5,
X
A
0 .9
2
)
36
 X B ~ N ( 0 .5,
P( X
A
X B ~ N ( 6,
. 81

36
. 64
0 .8
2
)
49
)
49
 X B  1)  P ( Z 
1  0 .5
. 81
36

)
. 64
49
 P ( Z  2 . 65 )  0 . 004
©Ming-chi Chen
社會統計
Page.96
Sampling Distribution of the
Sample Proportion
• P是母體中所有具有某項特質的比例(失業、
大學生)
• 為了要推測p,我們從母體中取一個大小為
n的樣本,計算其中有X個觀察值具有此項特
質。
• 我們用樣本的比例 p^ = X/n來估算p。
• q=1-p
©Ming-chi Chen
社會統計
Page.97
Sampling Distribution of the
Sample Proportion
• The Normal Approximation Rule for Proportion: If
np5, and nq 5, the random variable p^ has
approximately a normal distribution with:
E ( pˆ )  p
©Ming-chi Chen
Var( pˆ )  pq/n  pˆ 
社會統計
pq/n
Page.98
Sampling Distribution of the
Sample Proportion
• If the distribution of p^ is approximately
normal, then random variable
Z 
pˆ  p
~ N ( 0 ,1)
pq/n
©Ming-chi Chen
社會統計
Page.99
例題
• 在選舉前,有55%的選民支持歐巴馬,假設我們任
取n=400人的隨機樣本來預測歐巴馬的當選率,我們
預測歐巴馬會輸的的機率為?
n  400 , p  . 55 , q  1  . 55  . 45
np  400 (. 55 )  5 , nq  400 (. 45 )  5
pq
(. 55 )(. 45 )
pˆ ~ N (. 55 ,

 . 00062 )
n
400
(. 50 )  (. 55 )  . 05
Z 

 2
. 025
. 00062
P ( pˆ  . 5 )  P ( Z   2 )  . 0228
©Ming-chi Chen
社會統計
Page.100
例題
• Of your first 15 grandchildren, what is the chance
there will be more than 10 boys?
•“more than 10 boys””the proportion of boys
is more than 10/15”
• Use the Normal Approximation Rule:
pˆ ~ N (. 50 ,
10
Z 
pˆ  p
SE
pq / n 
(. 5 )(. 5 ) / 15 )
 .5
 15
. 129
 1 . 29
P ( pˆ  10 / 15 )  P ( Z  1 . 29 )  . 099
©Ming-chi Chen
社會統計
Page.101
•
Sampling distribution of the
difference between sample
proportions
Suppose we take independent sample of size n
1
and n2 from two population. Let p1 and p2 be the
proportion of items in each population that possess
a certain characteristics, and let q1=(1-p1), q2=(1p2). If n1p1>5, n1q1>5, n2p2>5, n2q2>5, then the
random variable (p1^-p2^) is approximately
normally distributed with
E ( pˆ 1  pˆ 2 )  p 1  p 2
Var ( pˆ 1  pˆ 2 ) 
©Ming-chi Chen
p 1 q1
n1

p2 q2
n2
社會統計
Page.102
例題
• 假設某行銷公司想要知道某電視節目在高、低收入
人口中受歡迎的程度。假設高收入的人中有40%喜
歡看此節目,在低收入人口中喜歡此節目的佔50%。
這家行銷公司從高收入的人口中抽取100人的樣本,
從低收入中抽200人的樣本。請問兩樣本比率差距小
於.05的機率?
P (  . 05  pˆ 1  pˆ 2  . 05 )  ?
©Ming-chi Chen
社會統計
Page.103
例題
p1  . 4 , q1  . 6 , n1  100
n 1 p 1  5 , n 1 q1  5
p 2  . 5 , q 2  . 5, n1  200
n 2 p 2  5, n 2 q 2  5
p 1  p 2  . 4  . 5   . 10
p1 q1

n1
P ( z1 
p2q2
n2

(. 4 )(. 6 )
100
 . 05  (  . 1)

(. 5 )(. 5 )
200
 pˆ 1  pˆ 2 
. 00365
P (. 83  pˆ 1  pˆ 2  2 . 48 )  . 1967
©Ming-chi Chen
 . 00365
社會統計
. 15
. 00365
 z2 )
Page.104