標本調査とその問題点

Download Report

Transcript 標本調査とその問題点

◎標本調査とその問題点
●何らかの情報を得たい全体集団(母
集団)から、ランダムに適当な数の標
本(サンプル)を抽出し、それに対す
る調査結果から母集団に関する情報を
推定する方法
母集団
標本の抽出
標本
●全数調査(悉皆調査:国勢調査等)
と比較して、費用・時間の面で極めて
効率的
母集団についての推測
(推測統計学)
●標本調査が十分にその機能を果たすためには
母集団の「縮図」であることが必要
●そのためには
①調査目的に合致した母集団を設定している
②標本が母集団を代表している
③回収標本は母集団を代表している
④得たい情報が意図通りに得られている
→
解析結果
標本データの解析
(記述統計学)
可能な限り、標本が
<標本調査に伴う様々な誤り:事例>
①1924年度のエール大学卒業生の年間平均所得は25111ドルである(雑誌「タイム」)
(25111$≒900万円 →
当時の日本人の年間平均所得は30万円以下)
データの取得:エール大学からの郵送調査
・卒業後も住所が分かっている人は? →
人生の落伍者は少ない
・調査に協力する人は? →
所得を回答することに自信のある人
・回答は信じられるか? →
回答による偏り
②大統領選挙(ルーズベルト
VS
ランドン)予測の失敗
リテラリーダイジェスト誌の予測(標本数200万)
ギャラップ社(標本数:3000人) →
→ ランドン(約6割)
ルーズベルト →
正しい予測
標本抽出の方法
は?
リテラリーダイジェスト誌
リテラリーダイジェスト誌(ある程度社会的地位の高い層が対象)の読者
電話所有世帯(電話保有率50%程度)
ギャラップ社
→ 層化無作為標本
③「サッカー」くじに関する法案審議過程で
「新日本婦人の会」等による「サッカー」くじについての街角アンケート結果
データ数314 →
反対77%、賛成20%
データの取得方法は?
データ収集方法:「サッカーくじ反対」と書いたタスキをかけた人(調査員)が、
通りかかる人と「対話」 → 意見聴取
④人気の無いあるホテルでの調査
顧客獲得を目指して、1つの調査を行った。
調査は、そのホテルの客を対象としたもので、ホテルの設備・サービス等に関
する意見・満足度等を尋ねた。
↓
その結果、設備・サービス等に関した満足度は極めて高く、現在の状況を変え
る必要は無い、との結論に至った。この結論は、顧客増加を望めない現状から
考えて受け入れることはできない。
どこがおかしい?
母集団をどのように設定すれば良いか
<社会(標本)調査の計画と実施>
社会調査の流れ
調査の目的・枠組みの設定
調査票の作成
母集団の設定
標本の抽出
調査の実施
データ解析
①調査の目的・枠組みの設定と調査票の作成
●得たい情報が、質問項目として的確な言葉で表現されているか?
そのためには
・曖昧な表現は避ける
・ダブルバーレル(質問が複数の論点を持つ)
『女性がタバコを吸ったり、酒を飲むことに反対ですか?』
・質問の配置(回答の誘導はしない)
サッカーくじに対する態度を問う
↑
「賭事で身を滅ぼすことをどのように考えるか…」、「賭博をしたいと思うか?」
歴代大統領の人気調査(ロサンゼルスタイムズの調査、1991年9月)
この時点で健在の4人の前、元大統領の中で誰を支持するか
結果:カーター(35%)、レーガン(22%)、ニクソン(20%)、フォード(10%)
↓ この結果の問題点は
?????
・ライスケールの導入(今までウソをついたことは1度も無い、嫌いな人は1人もいない等)
②母集団の確定
*分析の目的に沿った母集団を選ぶ(費用や時間等を考慮する)
最終的な分析結果について
「・・・の集団においては~~~の傾向が認められる」
→ どのような集団に一般化するか(したいか)
③標本の抽出
*測定誤差を考慮して標本数を定める
母数と推定値との差をどの程度許容するか
標本数が少ない → 費用・時間を節約できるが誤差が大きい
標本数が多い
→ 誤差は小さく抑えられるが、費用・時間がかかる
*母集団を代表する標本を選ぶ
①有意抽出
母集団を代表することが経験的に分かっているある特定の集団を調査する
費用・時間を節約できる
経験則が常に成り立つとは限らない。誤差を見積もることができない。
②無作為抽出
母集団からくじ引きのような方法でランダムに抽出する
母集団に含まれるどの要素も同じ確率で標本に含まれる
母集団に含まれるどの要素の組み合わせも同じ確率で標本に含まれる
*無作為抽出の方法
①単純無作為抽出法:母集団の構成員全てに番号を与え、乱数により抽出する
②系統抽出法:母集団構成員リストから、等間隔に抽出する
③層化抽出法:得ようとしている情報と関連を持つと思われる指標を用いて、母集団
をいくつかのグループに分け(層化する)、そのグループごとに
抽出する
④多段抽出法:母集団を幾つかの階層に分け、その階層ごとに無作為抽出を行う方法
県を抽出 → 市町村を抽出 →
個人を抽出 ・・・3段抽出
④調査の実施
調査法
郵送法、留め置き法、訪問面接調査法、電話調査法、Webを用いた調査等
回収標本
母集団を代表する標本が得られているか、回収率は十分高いか
郵送法は回収率が極めて低い(20%程度)
一般に、若い人、男性の回収率が低い
そもそも調査に反対の人は回答しない
母集団
無作為標本
母集団の縮図
無作為抽出
分析対象標本
無作為標本
母集団の縮図とは
標本回収
偏った抜け落ち
母集団の推測
ならない