ダウンロード

Download Report

Transcript ダウンロード

演習II(Rの勉強) 第5回
11月6日 木下直人
分散分析

t検定



2つの(標本)平均値の差を比較して、相違として認められる
のかについて推測する方法
3つ以上の(標本)平均値の差については、分散分析を用い
なければならない。
1要因の分散分析(対応なし・対応あり)について。
対応あり・なし

対応のない2群



標本を選んできた母集団が独立している
ex.) ある学校の3年1組と3年2組の化学のテストの成績
対応のある2群



標本を選んできた母集団が独立していない
1つの母集団から標本を選んでいる
ex.) ある学校の3年1組の、補習を受ける前と受けた後の
化学のテストの成績。
【前回】t検定(対応なし)

A市とB市から無作為にそれぞれ15人の住民を選び出
し睡眠時間を調べたところ、次に示した表のような結果
が得られた。2つの市の睡眠時間に違いがあるといえる
か(対応がない2群の平均値の差の検定)。
A市
B市
9 7 8 9 8 9
6 9 8 7 8 7
10 9 10
5 6 9 6 9 8
6 5 7 5 7 6
6 7 7
分散分析(対応なし)

A市とB市とC市から無作為にそれぞれ15人の住民を選
び出し睡眠時間を調べたところ、次に示した表のような
結果が得られた。2つの市の睡眠時間に違いがあるとい
えるか(対応がない3群の平均値の差の検定)。
A市
B市
C市
9 7 8 9 8 5 6 9 6 9
7 6 7 8 6
9 6 9 8 7
8 6 5 7
5 6 5 7 8
8 7 10 9 5 7 6 6 7
9 10 5 6
10
7
8
帰無仮説と対立仮説

帰無仮説

対立仮説
帰無仮説と対立仮説

帰無仮説




A市、B市、C市における睡眠時間の平均に差はない。
さらに言うと、
A市、B市、C市のうち任意の2市を選んだとき、その睡眠時
間の平均に差はない。
対立仮説

A市、B市、C市のいずれかの2市の間に、睡眠時間の平均
の差がある。
R Commanderでの操作


Excelでデータを作る
データをインポート

データ→アクティブデータセット内の変数の管理
→数値変数を因子に変換

市の変数を、「水準名を指定」で変換




1→A city
2→B city
3→C city など
分散の等質性について

ルビーンの検定を行う


統計量→分散→ルビーンの検定
中心的傾向は「平均」

正規分布から得た標本についての等分散の検定では、
バートレットの検定が最も良いが、バートレット検定は非
正規性に敏感なため、正規性を気にしないですむルビー
ンの検定を行うのが一般的らしい。

ここで分散が等質でないと判断された場合、クラスカル・
ウォリス検定が用いられる。

統計量→平均→1元配置分散分析


グループ:city
目的変数:hour

2組ずつの平均の比較(多重比較)

A市とB市、B市とC市、A市とC市の組み合わせについて分
析してくれる。
analysis of variance:分散分析
F値
P値
1%水準で有意
平均
標準偏差
多重比較
1要因の分散分析(対応あり)について




http://mizumot.com/handbook/?page_id=219
外国語教育研究ハンドブックによると…
Rcommanderを使う場合
Rcommander では,データ入力方法を変更しない限りで
きないため, ここでは説明を省略する。詳しくはHP参照。