9月3日第1時限

Download Report

Transcript 9月3日第1時限

第4日目第1時限の学習目標
 3つ以上の平均値の差の検定(分散分析)の
概要を知る。
(1)分散分析の例を知る。
(2)分散分析の広がりと基本的デザインに
つい
て学ぶ。
(3)要因の効果の検定方法を学ぶ。
(4)分散分析の基本用語を学ぶ。
3つ以上の平均値の差の検定(1)
分散分析例(1)
 睡眠遮断実験データ






(Kirk, 1985)
要因ー睡眠遮断
要因数ー1
要因の水準ー4
12h, 24h, 36h, 48h
の睡眠遮断条件
サンプル数ー各水準に8
名づつ無作為割付
従属変数ー手先の鈍感さ
完全無作為化 ANOVA
(完全無作為化法)
1
2
3
4
5
6
7
8
12h 24h 36h 48h
3
4
7
7
6
5
8
8
7
9
3
4
3
3
6
8
1
2
5 10
2
3
6 10
2
4
5
9
2
3
6 11
3つ以上の平均値の差の検定(2-1)
分散分析例(2-1)
 ミュラー・リヤー錯視実験データ
第2日目第4時限で学習した、ミュラーリ
ヤー錯視
図形を用いた実験で、錯視量に影響を及ぼす
要因
の1つである斜線分の角度と、実験参加者側
の要因
の1つと考えられる参加者の態度要因(全体
視か主
線分注視か)の効果の有無を検討するための
実験
 要因ー角度要因と態度要因
 要因数ー2
 要因の水準ー角度要因3、態度要因2
3つ以上の平均値の差の検定(2-2)
分散分析例(2-2)
A/B
A1
A2
全体
視
主線
分注視
B1
30度
B2
45度
B3
60度
23、24、2
24、14、
26
3
26、23、3 19、26、2
2
4
26、27、1
8
20、23、1
3
23、18、
17
28、16、
21
24、13、1
7
17、19、1
7
25、16、
20
18、26、1
8
3つ以上の平均値の差の検定(3)
分散分析例(3)
 ミラーリエル錯視実験






(18年度計量心理学演習
受講者データ)
要因ー斜線分の長さ
要因数ー1
要因の水準ー3
サンプル数ー12名
従属変数ー錯視量
(単位mm)
1要因反復測定 (デザイ
ン) ANOVA
15mm
条件
1
2
.
.
.
12
30mm
条件
45mm
条件
17.8 18.5 19.5
25.8 30.5 28.8
.
.
.
.
.
.
.
.
.
21.0 29.0 31.5
3つ以上の平均値の差の検定(4)
分散分析例(4)
 反応時間実験データ
(18年度修士2年
金田君デー






1
タ)
要因ー反応形態と刺激の
中立性
2
要因数ー2
要因の水準ー反応形態3、
刺激の中立性2
…
サンプル数ー25名
従属変数ー反応時間
25
2要因反復測定 (デザイ
ン) ANOVA
A1
B1
A1
B2
A2
B1
A2
B2
A3
B1
A3
B2
240 218 437 439 485 567
197 195 267 382 366 363
…
…
…
…
…
…
256 301 411 416 407 480
3つ以上の平均値の差の検定(5)
分散分析の広がり(1)
 3つ以上の平均値の差の検定の方法である分散分
析には、いろいろなものが知られている。
 一般には、この種の方法は、研究者が関心を持つ
従属変数に対して影響を持つと考えられる多くの
独立変数、すなわち要因のうち、少数の要因に絞
り他はできる限り統制し、少数要因の効果の有無
を統計的に検討する方法の全体を実験計画法
(design of ex- periment 又は experimental design)
と呼ぶが、狭義にはそれによる分析手続きを分散
分析 (analysis of variance, 略して ANOVA) と呼ぶ。
3つ以上の平均値の差の検定(6)
分散分析の広がり(2)
 分散分析は、狭義には1変量分散分析を指すが、
広義にはそれのみでなく、共分散分析 (analysis of
co- variance, 略して ANCOVA)、多変量分散分析
(multivariate analysis of variance, 略して
MANOVA)、及び一般多変量分散分析 (general
multivariate analysis of variance, 略して
GMANOVA) が含まれる。
 また、複数の条件(分散分析では、これを処理と
か水準とかいうことがある)に対して、同一被験
者が反応させられるデザインとして、反復測定
(測度)分散分析(repeated measures ANOVA) が
3つ以上の平均値の差の検定(6)
分散分析の広がり(3)
 この授業では、それらのうち、要因数が2つま
での基本的な4つの方法について、まず簡単に
紹介する。
 それらは、完全無作為化デザイン (completely
ran-domized design)、完全無作為化要因デザイ
ン (completely randomized factorial design)、乱
塊法 (randomized block design)、分割区画デザ
イン (split-plot design) である。
 分散分析では、つぎに示すように、データを収
集する前に、研究目的に照らして、適切な要因
及び被験者を計画的に集める必要がある。
3つ以上の平均値の差の検定(7)
完全無作為化デザイン(CR-p)
 当該実験での主要な1つの因子の各水準に対して、各被
験者を無作為に割り付ける方法。
 CR-p デザインでは、Fisher の実験計画法の3原則のうち
どれとどれを使うか?
水準
観測値
A1
・・・
Ap
均質な被験者集団
3つ以上の平均値の差の検定(8)
完全無作為化2要因デザイン(CRF-pq)
 当該実験での主要な2つの因子の各水準に対して、各被験
者を無作為に割り付ける方法。
 CR-p デザインとどこが異なる?
B1
…
Bq
A1
‫׃‬
Ap
均質な被験者集団
3つ以上の平均値の差の検定(9)
乱塊法デザイン(RB-p)
 当該実験での主要な1つの因子の各水準に対して、均質
でない被験者を1つの局外因子によりブロック化し、ブ
ロックごと無作為に割り付ける方法。
 RB-p デザインでは、Fisher の実験計画法の3原則のうち
どれとどれを使うか?
均質でない被験者を
1つの局外因子で分ける
BL1
・・・
BLk
A1
・・・
・・・
Ap
BL1
BLK
BL2
3つ以上の平均値の差の検定(10)
分割区画デザイン(SPF-p.q)
 当該実験で重要度の異なる2つの因子の水準に対して、各被験者を2
つの局外因子によりブロック化し2段階の無作為割り付けにより被
験者を割り付ける方法。
 RB-p デザインとどこが異なる?
B1
…
Bq
均質でない被験者を2つの
局外因子によりブロック化
A1
BL(1)1
…
BL(1)2
‫׃‬
‫׃‬
Ap
BL(2)1
‫׃‬
‫׃‬
BL(1)p
…
BL(2)
2
…
BL(2)r
3つ以上の平均値の差の検定(11)
条件間での平均値の差の持つ意味
 睡眠遮断データでは、12時間、24時間、36時
間、48時間の睡眠遮断を課す4グループ各8名の
手先の敏捷性(鈍感度)のデータの平均値は、睡眠
遮断時間が増すにつれて、増大している。
 水準間での平均値の違いは、手先の敏捷性に対する
睡眠遮断という要因の効果の有無を表している、と
考えられる。
 まず、睡眠遮断要因の効果の検定結果が分散分析で
はどのように示されるのかを、統計ソフト SAS を用
いてみてみよう。
3つ以上の平均値の差の検定(12)
SAS による分散分析の出力例
変動因 自由度 平方和
Model
3
194.5
Error
28
41.0
Correct
31
235.5
ed total
変動因 自由度 Anova
平方和
平均平方 F 値 Pr>F
63.83
44.28 .0001
1.46
level
63.83
3
194.5
平均
平方
F値
Pr>F
44.28 .0001
3つ以上の平均値の差の検定(13)
SAS による分散分析の出力例
変動因
平方和 自由度 平均平方
要因名
SS_A
I-1
SS_A
/ (I-1)
誤差
SS_E
N-I
SS_E
/(N-I)
計
SS_T
N-1
F値
p値
U_A
/ U_E
p
3つ以上の平均値の差の検定(14)
SAS による分散分析の出力例
 構造模型ー分散分析では、どのデザインでも、
それにより得られるデータ y を実現値とする確
率変数 Y に対するモデル(構造模型)を仮定す
る。例えば、CR-p デザインでは、
Yik     i  E ik ,
ここで、μは一般平均、αi は因子 A の第 i 水準の
主効果、Eik は誤差項である。
3つ以上の平均値の差の検定(15)
分散分析での3つの仮定
 (1)正規性
(構造模型の)誤差項は正規分布に従う
 (2)等分散性
各セルの(母集団での)分散はすべて
等しい
 (3)独立性
従属変数の値は互いに独立である
3つ以上の平均値の差の検定(16)
基本用語1-平方和(1)
 例えば、分散分析表の中の平方和の1つである
SSAは、第 i 水準の Ni 人のサンプルの従属変数の
値の平均を実現値とする確率変数から全サンプ
ルの平均を引いたものの二乗和(平方和)であ
N
I
る:
2
i
SS
A


i 1
(Y i  Y   ) , k 1
は、第 i 水準の主効果 αi と、誤差に関わる項であ
ることが、うえの構造模型を用いると証明できる。
3つ以上の平均値の差の検定(17)
基本用語1-平方和(2)
 同じく分散分析表の中の平方和の1つである SS
E は、第
i 水準の k 番目のサンプルの値 yik を実現
値とする確率変数 Yik から第 i 水準の Ni 人のサン
プルの平均を引いたものの二乗和(平方和)であ
N
る:
I
i
SS
E


(Y ik Y i  ) , 2
i 1 k 1
は、誤差に関わる項のみから成ることが、先ほどと同
様、構造模型から証明できる。
3つ以上の平均値の差の検定(18)
平均平方
 つぎに、分散分析表の中の平均平方の1つであ
る UEは、誤差平方和 SSE を N – I で割ったもの
である:
U E  SS E /( N  I )
Ni
I


(Y ik Y i  ) /( N  I )
2
i 1 k 1
同様に、UA は、要因平方和を I -1 で割ったもので、
U A  SS A /( I  1)

I

Ni
 (Y i   Y   ) /( I  1)
i 1 k 1
2
3つ以上の平均値の差の検定(19)
CR-p デザインにおける F 値の意味(1)
 結局、CR-p デザインにおける要因の効
果検定のための統計量 F は、要因の効
果と 誤差に関わる項の、誤差に関わる
項に対する比
F U
A
/U
E
として定義されることがわかる。
3つ以上の平均値の差の検定(20)
CR-p デザインにおける F 値の意味(2)
 結局、CR-p デザインに限らず、一般に
分散分析では、テキスト p.8 上方の枠内
にまとめたように、
分散分析ではデータの全変動を、組み込
んだ因子の変動と誤差変動に分解し、誤差
変動に比べて当該因子の変動がどれ程大
きいのかを検討する。