実験計画法

Download Report

Transcript 実験計画法

社会統計
第9回:実験計画法
寺尾 敦
青山学院大学社会情報学部
[email protected]
実験計画法
• 分散分析は実験を行った後の統計的手法.
• 分散分析はどのような実験を行ったのかとい
う実験デザインと切り離せない.
• 実験の方法をよく吟味する必要がある.
フィッシャーの3原則
• 反復(replication):誤差分散を評価するため
に,同じ条件下で測定を繰り返す.
• 無作為化(randomization):系統誤差
(systematic error)を偶然誤差(random error)
に転化するために,処理(条件)の割り付けを
無作為化する
• 局所管理(local control):系統誤差を除去す
るために,ブロックを構成して,各ブロック内
では条件が均一になるよう管理する.
反復
• 農場で3つの品種を育てて収穫量を比較する
実験を行うとする.
• 3種類を1株ずつ育てても,その差は偶然に
すぎないのか,品種の違いなのかわからな
い.
– 偶然変動(誤差分散)がわからなければ,差を評
価できない.
• よって,3つの品種を,それぞれ何株か育て
る必要がある.
反復だけでよいか?
3区画に土地を分け,それぞれの土地で1種類ずつ育てる.
AAA
AAA
AAA
BBB
BBB
BBB
CCC
CCC
CCC
反復だけでよいか?
• 測定を繰り返すだけでは,影響に一定の方向
のある系統誤差(systematic error)が混入す
るかもしれない.
– 3区画に土地を分け,それぞれの土地で1種類
ずつ育てる.収穫量が違っても,種の差なのか,
土地の差なのかが区別できない.これを,要因が
交絡している(confound)と言う.
無作為化
• 特定の土地区画は,収穫量に対して,一定の
方向のある誤差(系統誤差)をもたらす.
• ひとつの対策として,農場全体で,3つの品
種をランダムに植えればよい.
• どの品種においても,よい土壌条件に植えら
れる株もあれば,そうでない条件に植えられ
るものもある.無作為化により,系統誤差が
偶然誤差に転化される.
反復+無作為化
実験場全体に,3種類の株をランダムに植えて育てる.
BCA
CBA
ACA
ABC
AAB
CBB
CCA
BCB
CBA
反復と無作為化の原則を満たす実験デザインを
完全無作為法(completely randomized design)と呼ぶ.
局所管理
• 土地の違いは,同一品種での収穫量の違い
(誤差分散)に入り込む.
• 特定の株をどこに植えるかはランダムに決め
るので,土地条件は品種間で完全に公平で
はない.
– 良い土地条件にたまたま多く植えられた品種.
• 土地の違いによる収穫量の変動を,誤差変
動から切り離せないか? → 局所管理
• 農場全体を,土地条件が同一であると考えら
れるブロック(block)に分ける.
– ブロック:もともとは,農場の区画を意味する.一
般には,興味の対象となっている要因以外の条
件に関して均一であるような実験単位.
• 各ブロックで,3つの品種をランダムに植える.
– 無作為化を行うのは,土地条件以外の要因(日
光の当たる角度など,直接に考慮されていない)
の影響が系統誤差を生じさせないようにするため.
反復+無作為化+局所管理
BCA
CAB
ACB
CBA
BAC
BCA
Fisherの3原則すべてを満たす実験デザインを
乱塊法(randomized block design)と呼ぶ.
乱塊法
• 実験を行う「場」をいくつかのブロックに分け,そ
の中では系統誤差の影響を一定にする.系統誤
差はブロック間の差となる.
– ブロックが実験要因のひとつとなる.ブロック因子
• ブロック内で条件の割り当てをランダムにする.
• ブロックの例:農場の区画,装置,実験日,実験
者,実験順序,参加者
– 被験者内デザインは参加者をブロックにした乱塊法.
実験への参加者それぞれを,農場実験での土地の小区
画(すなわち,ブロック)と考えてみる.
BCA
CAB
ACB
参加者それぞれが,条件すべて(たとえば,A, B, C の3条件
すべて)をこなす.
条件の実施順序はランダムにする.
乱塊法の応用
• ラテン方格(latin square):複数のブロック因
子があるとき,それらを組み合わせる.
– 興味ある要因およびブロック因子の水準数が同
じでなければならない.下の表の各行・各列に,
要因を表す記号が1回ずつ表れている.
区画1
区画2
区画3
実験者1
B
C
A
実験者2
C
A
B
実験者3
A
B
C
完全無作為化法・乱塊法・
ラテン方格法の比較
• A, B, C という3種類の処理を比較する.
– それぞれ3回の反復
– 1日あたり3回,3日間にわたって実験.
• 完全無作為化法
第1日
第2日
第3日
1回目
B
C
A
2回目
C
B
C
3回目
A
B
A
完全無作為化法・乱塊法・
ラテン方格法の比較
• 乱塊法(実施日がブロック)
第1日
第2日
第3日
1回目
B
2回目
C
3回目
A
C
A
A
C
B
B
– A, B, C はどの日でも同じ回数だけ実施されてい
る.日という系統誤差は問題でなくなる.
– しかし,実験順序もブロックとすべきかもしれない.
完全無作為化法・乱塊法・
ラテン方格法の比較
• ラテン方格法(完備型計画)
第1日
第2日
第3日
1回目
B
2回目
C
3回目
A
C
A
A
B
B
C
– A, B, C は,どの日でも同じ回数だけ実施されてい
る.
– さらに,何回目に実施されたかについても公平.
順序効果と対処
• 順序効果(order effect):実験水準の実施順
序,あるいは,要因としていない実験要素の
出現順序の効果.
• 順序効果への対処:
– カウンターバランス:可能な順序が少数の場合,
それらをすべて実施して効果を相殺する.順序を
ブロック因子としてもよい.
– 無作為化:心理学実験で数多く呈示する刺激な
ど,可能な順序が多い場合には,無作為化を行
う(例:呈示順序をランダムにする)
2要因実験(被験者間デザイン)
• 興味ある要因が2つある実験例
訓練時間
各セルには2つ
以上の測定値
課題
難
易
平均
短
中
長
平均
y111
y211
y121
y221
y112
y212
y122
y222
y113
y213
y123
y223
y1
y3
y 
y  1 y  2
y2
• 参考:1要因被験者内デザイン
各セルには測定
値がひとつ
人
平均
要因A
短
中
長
平均
人1
y11
y12
y13
人2
y21
y22
y23
・・・
・・・
・・・
・・・
y1
y 2
y 3
y1
y 2
y
2要因実験の構造モデル
• 各セルにおいて測定が繰り返されている場合
には,交互作用(interaction)がモデルに入る.
yijk    a j  bk  (ab) jk  eijk
aˆ j  y j   y
bˆk  y k  y
yijk    a j  bk  (ab) jk  eijk
 jk    a j  bk  (ab) jk
(ab) jk  y jk  y j   y k  y
eˆijk  yijk  y jk
各セルでの標本平均
交互作用とは
• 交互作用は,要因の組み合わせの効果.
– 2つの要因効果の足し算では説明できない効果
• 一方の要因の効果が,もう一方の要因の水
準によって異なるとき,これは交互作用となる.
交互作用と誤差
• 各セルでの繰り返しがあるため,誤差と交互
作用を分離できる.
• 1要因被験者内デザインでの誤差(推定値)
eij  yij  y..  ( y. j  y.. )  ( yi.  y.. )
 yij  y. j  yi.  y..
• 2要因デザインでの交互作用(推定値)
(ab) jk  y jk  y j  yk  y
グラフでの主効果
易
成
績
難
短
中
長
訓練時間
グラフでの主効果
易
成
績
難
短
中
長
訓練時間
グラフでの交互作用
易
成
績
難
短
中
長
訓練時間
グラフでの交互作用
易
成
績
難
短
中
長
訓練時間
分散分析に続く分析
• 要因の効果(主効果 main effect)が有意に
なった場合:その要因が3水準以上あるなら
ば,どの水準間に差があるのかを調べる多
重比較を行う.
• 交互作用が有意となった場合:一方の要因の
効果が,もう一方の要因の水準ごとに異なる
のだから,その水準ごとに要因効果を分析す
る.これは単純効果(simple effect)の分析と
呼ばれる.
さらに学習すること
• この講義では扱わなかったが,さらに学習す
べきこととして,
– 被験者内要因のある2要因計画(金曜日の演習
で扱う)
– 固定効果と変量効果
– 枝分かれ配置
– 直交表
理解確認のポイント
• フィッシャーの3原則を説明できますか?
• 系統誤差と偶然誤差の違いを説明できます
か?
• 要因の交絡とは何か,説明できますか?
• 完全無作為法とはどのような実験計画か,説
明できますか?
• 乱塊法とはどのような実験計画か,説明でき
ますか?
• ラテン方格法とはどのような実験計画か,説
明できますか?
• 順序効果とは何か,説明できますか? これ
に対してどのような対処を行うことができるか,
説明できますか?
• 2要因実験での構造モデルを数式で書き,式
の要素を説明できますか?
• 2要因実験での交互作用とは何か,説明でき
ますか?
• 2要因実験での主効果および交互作用は,
グラフではどのように表れるかわかります
か?
• 交互作用を想定しない3要因実験には,ラテ
ン方格のデザインを利用できる.
– 水準数はすべての要因で等しいとする.
– A1 水準の効果の推定に,B および C の各水準が
1回ずつ用いられている.他の水準も同様.
A1
A2
A3
B1
C1
B2
C2
B3
C3
C3
C2
C1
C3
C2
C1