樣本 - 統計網路學習館
Download
Report
Transcript 樣本 - 統計網路學習館
統計網路學習館
統計抽樣
何謂母體與樣本
母體是什麼?
研究對象的整體。
樣本是什麼?
母體的一部份,乃從中選取具代表性的
研究對象組成的集合。
想一想?
蓋洛普(Gallup)及許多新聞機構常舉辦民意調查,探詢
民眾對某些議題的意見。這類民意調查整年都持續進
行,但到了選舉前才會特別受到注意。一個典型的民意
調查,其母體和樣本可能是以下狀況:
母體:18歲以上的居民,包括非公民、甚至非法移民。
樣本:從母體中選出,且經由電話訪談的人。其人數通
常在1000至1500之間。
註:著名的蓋洛普民意調查,通常取樣本數稍微多於
1068。
普查與抽樣的區別
普查
對整個母體進行調查
取得的資料較齊全,
但品質可能不可靠
耗時、費力、花錢
抽樣/抽查
抽取母體中的一部份
作調查
蒐集的資料較深入,
但有估計誤差的問題
省時、省力、經濟
理論上,抽樣越多,所得的資訊也越多,
統計分析的結果也越準確。但抽樣越多,
耗費的時間、金錢和人力也越多。如何在
準確度與經濟層面之間取得平衡點,就是
決定抽樣方法的因素。
調查方式的種類
面訪
電訪
郵寄問卷
網路調查
費時最久
快
速度
樣本大則費時 快
久
單位成本
最高
彈性
彈性大、適用 只能訪問到具 需有郵寄地址 需有電子帳
複雜的調查
電話者
號
情報數量
較多
問卷不宜太長 問卷不宜太長 透過生動問
卷吸引回答
正確性
較高
較高
無長途電話則 較低
成本甚低
較低
甚低
較低
常用的抽樣方法
為了取得好的、正確的、能「代表」母
體的樣本
對母體內部結構已有資訊與了解,能使
取得的樣本的成本最小、統計分析結果
更準確的抽樣方法有:
簡單隨機抽樣、系統抽樣、集群抽樣及
分層隨機抽樣
簡單隨機抽樣(SRS)
若母體數為N,預定要選取n個樣本。在
母體中,每一樣本被抽中的機率均相同。
分為
取出放回:一組樣本中有可能看到重複
出現的個體。
取出不放回:每一個體在樣本中均不會
重複出現。
範例一
欲調查小學生患有寄生蟲的狀況,基於經濟原則,由
每班隨機抽取5個學童的糞便做為研究的樣本。
步驟一:編代碼
一班有50名學童,對每一學童編一個數字號碼, 50
名學生要用2位數,所以從01至50止。
步驟二:利用隨機號碼表
從表中任一處開始,讀入第一和第二兩行(選取的行
數也是2),得到的序列號碼為
13, 04, (65), (79), (76), (51), 29, 14, 36,…
括弧內號碼因大於50,故捨棄不用。
小試一下
不妨趕快到本網站動態學習中,試試你
對「簡單隨機抽樣」的了解程度吧!
這是利用電腦軟體來抽取SRS,它只是將
範例一的步驟「自動化」而已喔!
你發現了嗎?
系統抽樣
當母體中的元素已隨機地排序,或依照某種特
性(如編號或成績高低)的大小標準排序而非
循環地出現時
只要隨機選取一個號碼,就可採固定間隔數抽
出所有樣本
k
樣本1
k
樣本2
樣本3
……
k
樣本n-1 樣本n
這種排序必須與統計者所關心的特性無關,否
則會造成抽樣偏差喔
範例二
某運輸公司計畫從本月份中9000張運貨單中抽
取1%的樣本,以便迅速了解其營運收益。
利用系統抽樣,先將此9000張運貨單順次編
號,再利用隨機號碼表,從1到100等一百個數中
任意選取1數字,若選中12,則抽出樣本為編
號第0012, 0112, 0212, …, 8812和8912等90張
運貨單。
集群抽樣
它是以地理位址或區域為考量
乃假設每一層都是母體的縮影,因此同層間的
差異要小、不同層間的差異則大。這樣不論抽
到哪一部落都能對母體具有一定的代表性。
這種抽樣方法最大的優點是只要在某些地區或
普查或抽樣,可節省時間、金錢、人力
你懂了嗎?
範例三
成功國中二年級甲班有49位學生,老師想了解全
班平均身高是多少? 利用分層隨機抽樣,從全班
中抽出7位,使抽到的7位同學的樣本平均身高與
全班平均身高相近。全班身高資料如下:(假設全
班座位安排是矮的坐前面,高的坐後面,其第一
列為1到7號,第二列為8到14號 等。)
講 台
148 148 149 149 153 154 155
155 156 156 157 157 158 158
158 158 158 159 159 160 160
160 161 162 162 162 163 163
163 163 164 164 164 164 165
165 165 165 165 166 167 167
167 167 167 168 170 172 173
解答:
因為一行內有矮的同學也有高的同學,行
內身高分散大,因此以行做部落是可行的
方案,部落分好後,隨機抽出一部落,進
行普查,得到7位同學身高資料,再求得其
平均身高。
分層隨機抽樣
將整個母體依其特性分成數個不重疊群集
分層的標準是,“物以類聚”。將特別有興趣
或者性質相近的個體分在同一層
再依每一層在母體所佔比例來分配樣本數,利
用簡單隨機抽樣來選取樣本
這種抽樣法最大的問題在於如何找到某種「特
性」做為分層的依據:基本上同層間的差異要
小、不同層間的差異則大
續範例三
解答:
可依照座位以列做分層(因為同一列身高很
接近),再由每列中隨機抽出一位,如第一
列抽出5號,第二列抽出9號等等,共可 抽
出7位同學,再求此7位的平均身高。
你來決定!
認識了這四種抽樣方法後,不妨找個例子
了解各種抽樣方法如何進行,以及比較它
們的優缺點吧!
想要感受一下怎樣模擬抽樣方法嗎?
最好的方法就是趕快造訪本網站….
統計網路學習館