記述統計

Download Report

Transcript 記述統計

調査法B
(心理カウンセリング学科・カウンセリング研究コース)
第3講
2007年10月12日
担当:岡田佳子
1
第3講
母集団と標本・
サンプリングの方法
2
今日の授業の予定
 記述統計と推測統計の復習
(母集団と標本)
 サンプリングの方法
3
記述統計と推測統計の復習
(母集団と標本)
4
データ解析の流れ
データの収集
データの記述
(記述統計)
統計的推測
(推測統計)
⇒度数分布、平均値、
標準偏差、相関・・・等
⇒検定・推定
(t検定・分散分析・・・等)
5
記述統計と推測統計の違い
記述統計と推測統計の実例
(うん年前の私の修論より)
6
私の卒業論文より
中学生のストレスを調査(550人の中学生にアンケートを実施)
この1週間の間に,次のような状態をどのくらい経験しましたか.
1.まったくなかった,2.たまにあった,3.しばしばあった,4.大体いつもあった,
の中からひとつだけ選んで数字に○をつけて下さい
ま
かっ
った
たく
な
あた
っま
たに
し
あば
っし
た
ば
大
あ体
っい
たつ
も
1.ゆううつだ
1
2
3
4
2.気分が沈む
1
2
3
4
3.不安を感じる
1
2
3
4
4.いらいらする
1
2
3
4
5.はらがたつ
1
2
3
4
6.泣きたい気分だ
1
2
3
4
7.気がめいる
1
2
3
4
8.むなしい感じがする
1
2
3
4
・
・
・
・
・
7
中学校の校長先生に「結果を報告してください」と
言われた時・・・
データそのまま(row data)・・・550人分
Aさん
Bさん
Cさん
Dさん
Eさん
Fさん
Gくん
Hくん
Iくん
Jくん
x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12 x13 x14
2 2 2 2 2 1 1 1 2 2 2 2 2 2
1 3 1 4 1 1 1 1 2 1 2 1 1 1
1 1 1 1 1 1 1 1 1 1 1 1 1 1
1 2 1 2 1 1 1 3 4 2 4 2 1 4 ・・・・・
1 1 1 1 2 1 1 1 1 1 1 1 1 1
1 1 1 1 1 1 1 3 2 1 2 1 1 1
1 2 2 2 1 1 1 1 1 1 2 2 1 2
1 2 1 2 2 1 2 1 4 1 2 3 1 1
4 2 1 2 2 9 1 1 2 1 3 1 2 1
1 1 1 2 1 1 1 1 2 1 1 1 1 1
・
・
・
・
・・これだけ見てもなんにもわからない
⇒記述統計
8
記述統計ってなに?
ひとことで言うと「データを要約すること」
⇒度数分布、平均値、分散、相関係数といった
数値要約の指標を用いてデータを記述する
⇒データから最大限の情報を獲得する
9
度数分布・平均値(1)
4.はらがたつ
7.泣きたい気分だ
300
400
300
200
200
100
度
数
(
人
)
標準偏差 = .96
平均 = 2.1
有効数 = 535.00
0
1.0
2.0
4.はらがたつ
3.0
4.0
標準偏差 = .85
100
平均 = 1.5
度
数
有効数 = 538.00
0
1.0
2.0
3.0
4.0
7.泣きたい気分だ
10
平均値(2)
 性別や学年でストレスの度合いは違うんじゃないか
な(仮説)?
 男女、学年ごとにストレス得点の平均値を出して比
べてみる
学年別ストレス反応(怒り)の平均値の比較
学年
1年生
2年生
3年生
合計
平均値
5.59
5.58
6.33
5.86
度数
標準偏差
157
2.66
173
2.48
203
2.62
533
2.61
今回データをとった550人で
は、1,2年生より3年生の方
が怒りの平均値が高い
男女別ストレス反応(怒り)の平均値の比較
性別
男子
女子
合計
平均値
5.62
6.13
5.86
度数
標準偏差
273
2.54
260
2.65
533
2.61
今回データを取った550人で
は、男子より女子の方が怒り
の平均値が高い
11
グラフで表現する
7
6
不
安5
(4
得3
点2
男子
女子
)1
0
1年生
2年生
3年生
学年
12
ここまでが「記述統計」の話だった
復習OK?
13
でもちょっと待って!!
 私の卒業論文のタイトルは
「中学生のストレスに関する研究」
“日本の中学生全般”について研究したい
 でも、550人のデータを集計して記述統計出しても
「今回データをとらせてもらった550人の中学生のスト
レスに関する研究」
“データをとらせてもらった550人”についてしか研究で
きていない!
14
記述統計はデータをとらせてもらった学校の
校長先生に「おたくの学校の生徒さんのスト
レスは~~といった特徴がありますよ」と報告
する場合にはよい
しかし、「中学生(全般)のストレスには~~と
いった特徴がある」といった議論はできない
別の中学生550人に調査したら、結果が異
なるかもしれない
15
たまたまじゃない?
 1,2年生より3年生の方がイライラしているのは、この学校の3
年生がたまたま荒れている学年でイライラしている子が多かった
のでは?
 この学校の地域が特別受験熱が熱い地域だからじゃない?
 男子より女子の方がイライラしているのは、この学校の女子がた
またまストレスが溜まっている子が多かっただけでは?
 このような可能性に対して、記述統計だけではなにも言えない。
 かといって、日本の中学生全員に調査することは時間的にもお
金的にも不可能に近い
16
そこで「推測統計」の出番
17
記述統計と推測統計
記述統計
数量的データを整理要約し、そのデータが表す集団
の性質を出来るだけ簡潔に、また明確に記述表現
して、伝えることを可能にすることが目的
推測統計
得られた標本から母集団についての推測を行うこと
が目的
サンプリング
得られた標本
550名
全中学生
そのデータが表す集団
(母集団)
推定・検定
18
記述統計は・・・
 550人分のデータの度数分布を求めたり、平均や標準偏差
を求めたり・・・
 手元にあるデータについて、そこだけを対象とした分析
手元のデータの中だけで完結した分析
推測統計は・・・
手元にあるデータの背後にある、さらに大きな
対象(母集団)について推測することを試みる
19
記述統計と推測統計(つづき)
知りたいこと
手元のデータ(標本)
一部をサンプリング
千葉の中学生
550人
母集団
(日本の全中学生)
真の平均 ?
(神のみぞ知る)
推測統計
550人の平均から母集団
の平均を推測する
Aさん
Bさん
Cさん
Dさん
Eさん
Fさん
Gくん
Hくん
Iくん
Jくん
x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12 x13 x14
2 2 2 2 2 1 1 1 2 2 2 2 2 2
1 3 1 4 1 1 1 1 2 1 2 1 1 1
1 1 1 1 1 1 1 1 1 1 1 1 1 1
1 2 1 2 1 1 1 3 4 2 4 2 1 4 ・・・・・
1 1 1 1 2 1 1 1 1 1 1 1 1 1
1 1 1 1 1 1 1 3 2 1 2 1 1 1
1 2 2 2 1 1 1 1 1 1 2 2 1 2
1 2 1 2 2 1 2 1 4 1 2 3 1 1
4 2 1 2 2 9 1 1 2 1 3 1 2 1
1 1 1 2 1 1 1 1 2 1 1 1 1 1
・
・
・
・
記述統計
手元のデータから計算される
平均・標準偏差・・・
20
標本調査の身近な例
(推測統計の考え方を使った調査)
 内閣支持率
「私、聞かれた覚えないけど?」
⇒有権者全員を調査対象として調査するのは時間的にもお金的にも無理
⇒統計の理論を用いて、サンプリング
⇒有権者の一部(サンプル)に調査して「支持率は○%でした」と報告
 テレビの視聴率
「うちのテレビに何の機械もついてないけど?」
⇒関東の場合、たった600世帯のデータから視聴率を出している
⇒600世帯は統計の理論を用いて、サンプリング
※例外
国勢調査(=全数調査)
21
サンプリングって大事
標本調査の結果から出来るだけ正確に母集
団の姿を推定するには・・・
いかに、母集団を代表するサンプリングが行
えるか・・・が大切
いかに、偏りのないミニチュアが作れるか?
そこで・・・
サンプリングの方法について見ていきましょう
22
サンプリングの方法
23
調査の手順
24
調査対象者を定義する
 調査目的や方法に応じて調査対象の範囲
を決める
例)子どものストレスを調査する
・子どもとは?小学生?中学生?高校生も含む?⇒
中学生
・学校に来ていない生徒は含めるのか?⇒通学して
いる生徒に限定
・中高一貫校や私立も含めるのか?⇒高校受験のあ
る公立校に限定…など
25
母集団を決める
母集団
調査で情報を得たいと考えている対象者全員
例)日本全国の中学生/東京の中学生/○○
中学校の生徒
26
調査対象者を決める
サンプリング方法を決める
1.全集調査か標本調査か?
全数調査
母集団の構成員全員から調査する方法
標本調査
母集団から一部の人々を取り出し、それらを対
象者として調査し、その結果から母集団の姿を
推定する方法
サンプル(標本):取り出された一部の対象
サンプリング(標本抽出):サンプルを取り出すこと
27
全数調査・標本調査の例
全数調査の例
 教師が自分の学級のストレスの実体を知りたい、管理
職が自分の職場のストレスの実態を知りたい
 国勢調査(母集団の規模が大きい全数調査。例外
的)
標本調査の例
 日本の公立中学に通う中学生のストレスを知りたい
⇒全国から1000名の中学生をサンプリングし
⇒1000名の結果から日本の全中学生の姿を推定
28
2.無作為抽出法か有意抽出法か?
*「母集団をできるだけ代表するようなサンプル」を抽出
するために…
無作為抽出法
調査者の主観が入らないようにランダムにサンプリング
⇒調査結果から母集団の姿を統計的に推定可能
有意抽出法
調査者が主観的に選び出す方法(数学的裏づけなし)
⇒調査結果から母集団の姿を統計的に推定不可能
(結果を過度に一般化することは避けなければならない)
29
無作為抽出の方法
30
無作為抽出のために必要なもの
母集団構成員のリスト(サンプリング台帳)
例)住民基本台帳・選挙人名簿
電話帳・同窓会名簿・企業などの名簿
31
無作為抽出の方法
 母集団から直接サンプルを抽出する方法
・単純無作為抽出法
・系統抽出法
 大規模な母集団からサンプリングする方法
・多段抽出法
・層化抽出法
 母集団がかなり大きい場合
・層化2段抽出法(層化抽出と2段抽出の組合せ)
32
具体例で考えてみましょう
長野県の○○市の中学1年生を対象に学校
ストレスの調査をしたい。
サンプリングしたい人数:約100名程度
学校の構成(架空)
中学校9校(1年生21学級・生徒数636名)
小規模校(1学年2学級以下):5校
中規模校(1学年3学級以上):4校
33
単純無作為抽出法
1.○○○○
2. ○○○○
636名全員分の名簿を用意
3. ○○○○
↓
4. ○○○○
・
・
・
・
・
・
・
100. ○○○○
・
・
・
・
636. ○○○○
1番から通し番号をつける
↓
乱数表などを用いて100人分抽出
34
系統抽出法
636名全員分の名簿を用意
1.○○○○
↓
2. ○○○○
3. ○○○○
4. ○○○○
・
・
・
・
・
・
・
100. ○○○○
・
・
・
・
636. ○○○○
6人
1番から通し番号をつける
↓
6人
1番目のサンプルをランダムに定める
↓
一定の周期で100人分抽出
35
多段抽出法
第1段階
9校から無作為
に3校選ぶ
第2段階
1学級ずつ無作
為に選ぶ
D組 B組 A組
(32名)(34名)(33名)
約100名
各学級全員を調査する
36
層化抽出法
学校規模が学校ストレスに影響する要因であった場合
中規模校
学校規模で層化
小規模校
2:1
5校・220名
4校・416名
名簿を用いて
それぞれ
1/6を系統抽出
70名
37名
約100名
37
層化2段抽出法
中規模校
学校規模で層化
小規模校
第1段階
各層から無作為に
2校抽出
第2段階
1学級ずつ無作為に選ぶ
D組
E組
A組
B組
(32名) (30名) (33名) (30名)
約120名
38
有意抽出の方法
39
有意抽出法
 割り当て法:考え方は層化抽出と同じだが、主観で
やる。
 典型法:主観で典型的なメンバーを選ぶ。
 縁故法:友だちにお願い。自分の生徒にお願い。
 募集法:新聞などを使って募集。
 便乗法:塾のセミナーに来た母親に、子どものソー
シャルスキルの調査を依頼。
 偶然法:駅で電車を待っている人、街を歩いている
人。
40
演習
大学生の調査(実習や卒論)では、「有意抽出
法」を用いることが多いです。
確かに、調査対象へのアクセスが容易で、費
用・労力・時間が少なく、台帳も必要ないので
便利ですが、注意点を十分に押さえておくこと
が重要です。
有意抽出法を用いる場合の注意点を話し合っ
てみましょう。
41
有意抽出法を用いる場合の注意
 本来は「統計的検定が適用できるのは無作為抽出さ
れたサンプルだけ」であることを忘れずに。
 なるべく母集団を代表するように抽出する
 結果を過度に一般化することは避ける。
以下の点に注意
 母集団と仮定しているものは何か?
 抽出されたサンプルはそれを代表しているか?
 得られた調査結果をどの範囲に適用したいのか?
 もちろん、無作為抽出が可能であればできるだけそ
れを用いた方がよい。
42
調査実習の希望アンケート
に記入して提出して下さい
43