Transcript ダウンロード
演習II(Rの勉強) 第5回
11月6日 木下直人
分散分析
t検定
2つの(標本)平均値の差を比較して、相違として認められる
のかについて推測する方法
3つ以上の(標本)平均値の差については、分散分析を用い
なければならない。
1要因の分散分析(対応なし・対応あり)について。
対応あり・なし
対応のない2群
標本を選んできた母集団が独立している
ex.) ある学校の3年1組と3年2組の化学のテストの成績
対応のある2群
標本を選んできた母集団が独立していない
1つの母集団から標本を選んでいる
ex.) ある学校の3年1組の、補習を受ける前と受けた後の
化学のテストの成績。
【前回】t検定(対応なし)
A市とB市から無作為にそれぞれ15人の住民を選び出
し睡眠時間を調べたところ、次に示した表のような結果
が得られた。2つの市の睡眠時間に違いがあるといえる
か(対応がない2群の平均値の差の検定)。
A市
B市
9 7 8 9 8 9
6 9 8 7 8 7
10 9 10
5 6 9 6 9 8
6 5 7 5 7 6
6 7 7
分散分析(対応なし)
A市とB市とC市から無作為にそれぞれ15人の住民を選
び出し睡眠時間を調べたところ、次に示した表のような
結果が得られた。2つの市の睡眠時間に違いがあるとい
えるか(対応がない3群の平均値の差の検定)。
A市
B市
C市
9 7 8 9 8 5 6 9 6 9
7 6 7 8 6
9 6 9 8 7
8 6 5 7
5 6 5 7 8
8 7 10 9 5 7 6 6 7
9 10 5 6
10
7
8
帰無仮説と対立仮説
帰無仮説
対立仮説
帰無仮説と対立仮説
帰無仮説
A市、B市、C市における睡眠時間の平均に差はない。
さらに言うと、
A市、B市、C市のうち任意の2市を選んだとき、その睡眠時
間の平均に差はない。
対立仮説
A市、B市、C市のいずれかの2市の間に、睡眠時間の平均
の差がある。
R Commanderでの操作
Excelでデータを作る
データをインポート
データ→アクティブデータセット内の変数の管理
→数値変数を因子に変換
市の変数を、「水準名を指定」で変換
1→A city
2→B city
3→C city など
分散の等質性について
ルビーンの検定を行う
統計量→分散→ルビーンの検定
中心的傾向は「平均」
正規分布から得た標本についての等分散の検定では、
バートレットの検定が最も良いが、バートレット検定は非
正規性に敏感なため、正規性を気にしないですむルビー
ンの検定を行うのが一般的らしい。
ここで分散が等質でないと判断された場合、クラスカル・
ウォリス検定が用いられる。
統計量→平均→1元配置分散分析
グループ:city
目的変数:hour
2組ずつの平均の比較(多重比較)
A市とB市、B市とC市、A市とC市の組み合わせについて分
析してくれる。
analysis of variance:分散分析
F値
P値
1%水準で有意
平均
標準偏差
多重比較
1要因の分散分析(対応あり)について
http://mizumot.com/handbook/?page_id=219
外国語教育研究ハンドブックによると…
Rcommanderを使う場合
Rcommander では,データ入力方法を変更しない限りで
きないため, ここでは説明を省略する。詳しくはHP参照。