第4日目第1時限の学習目標

Download Report

Transcript 第4日目第1時限の学習目標

第4日目第1時限の学習目標
 3つ以上の平均値の差の検定(分散分析)の
概要を知る。
(1)分散分析の例を知る。
(2)分散分析の広がりと基本的デザインに
つい
て学ぶ。
(3)要因の効果の検定方法を学ぶ。
(4)分散分析の基本用語を学ぶ。
3つ以上の平均値の差の検定(1)
分散分析例(1)
 睡眠遮断実験データ






(Kirk, 1985)
要因ー睡眠遮断
要因数ー1
要因の水準ー4
12h, 24h, 36h, 48h
の睡眠遮断条件
サンプル数ー各水準に8
名づつ無作為割付
従属変数ー手先の鈍感さ
完全無作為化デザイン
ANOVA
1
2
3
4
5
6
7
8
12h 24h 36h 48h
3
4
7
7
6
5
8
8
7
9
3
4
3
3
6
8
1
2
5 10
2
3
6 10
2
4
5
9
2
3
6 11
3つ以上の平均値の差の検定(2)
分散分析例(2)
 社会的スキルと父母への






甘えの関連データ(18
年度卒業生稲垣さんデー
タ)
要因ー父・母への甘え
要因数ー2
要因の水準-各2
(甘えの有無)
サンプル数ー男65名
従属変数ー社会的スキル
の6因子のそれぞれ
完全無作為化2要因デザ
イン ANOVA
母
父 父親へ 父親へ
の甘え の甘え
有り
無し
母親へ
の甘え
有り
母親へ
の甘え
無し
3つ以上の平均値の差の検定(3)
分散分析例(3)
 ミラーリエル錯視実験






(18年度計量心理学演習
受講者データ)
要因ー斜線分の長さ
要因数ー1
要因の水準ー3
サンプル数ー12名
従属変数ー錯視量
(単位mm)
1要因反復測定デザイン
ANOVA
15mm
条件
1
2
.
.
.
12
30mm
条件
45mm
条件
17.8 18.5 19.5
25.8 30.5 28.8
.
.
.
.
.
.
.
.
.
21.0 29.0 31.5
3つ以上の平均値の差の検定(4)
分散分析例(4)
 反応時間実験データ
(18年度修士2年
金田君デー






1
タ)
要因ー反応形態と刺激の
中立性
2
要因数ー2
要因の水準ー反応形態3、
刺激の中立性2
…
サンプル数ー25名
従属変数ー反応時間
25
2要因反復測定デザイン
ANOVA
A1
B1
A1
B2
A2
B1
A2
B2
A3
B1
A3
B2
240 218 437 439 485 567
197 195 267 382 366 363
…
…
…
…
…
…
256 301 411 416 407 480
3つ以上の平均値の差の検定(5)
分散分析の広がり(1)
 3つ以上の平均値の差の検定の方法である分散分
析には、いろいろなものが知られている。
 一般には、この種の方法は、研究者が関心を持つ
従属変数に対して影響を持つと考えられる多くの
独立変数、すなわち要因のうち、少数の要因に絞
り他はできる限り統制し、少数要因の効果の有無
を統計的に検討する方法の全体を実験計画法
(design of ex- periment 又は experimental design)
と呼ぶが、狭義にはそれによる分析手続きを分散
分析 (analysis of variance, 略して ANOVA) と呼ぶ。
3つ以上の平均値の差の検定(6)
分散分析の広がり(2)
 分散分析は、狭義には1変量分散分析を指すが、
広義にはそれのみでなく、共分散分析 (analysis of
co- variance, 略して ANCOVA)、多変量分散分析
(multivariate analysis of variance, 略して
MANOVA)、及び一般多変量分散分析 (general
multivariate analysis of variance, 略して
GMANOVA) が含まれる。
 また、複数の条件(分散分析では、これを処理と
か水準とかいうことがある)に対して、同一被験
者が反応させられるデザインとして、反復測定
(測度)分散分析(repeated measures ANOVA) が
3つ以上の平均値の差の検定(6)
分散分析の広がり(3)
 この授業では、それらのうち、要因数が2つま
での基本的な4つの方法について、まず簡単に
紹介する。
 それらは、完全無作為化デザイン (completely
ran-domized design)、完全無作為化要因デザイ
ン (completely randomized factorial design)、乱
塊法 (randomized block design)、分割区画デザ
イン (split-plot design) である。
 分散分析では、つぎに示すように、データを収
集する前に、研究目的に照らして、適切な要因
及び被験者を計画的に集める必要がある。
3つ以上の平均値の差の検定(7)
完全無作為化デザイン(CR-p)
 当該実験での主要な1つの因子の各水準に対して、各被
験者を無作為に割り付ける方法。
 CR-p デザインでは、Fisher の実験計画法の3原則のうち
どれとどれを使うか?
水準
観測値
A1
・・・
Ap
均質な被験者集団
3つ以上の平均値の差の検定(8)
完全無作為化2要因デザイン(CRF-pq)
 当該実験での主要な2つの因子の各水準に対して、各被験
者を無作為に割り付ける方法。
 CR-p デザインとどこが異なる?
B1
…
Bq
A1
‫׃‬
Ap
均質な被験者集団
3つ以上の平均値の差の検定(9)
乱塊法デザイン(RB-p)
 当該実験での主要な1つの因子の各水準に対して、均質
でない被験者を1つの局外因子によりブロック化し、ブ
ロックごと無作為に割り付ける方法。
 RB-p デザインでは、Fisher の実験計画法の3原則のうち
どれとどれを使うか?
均質でない被験者を
1つの局外因子で分ける
BL1
・・・
BLk
A1
・・・
・・・
Ap
BL1
BLK
BL2
3つ以上の平均値の差の検定(10)
分割区画デザイン(SPF-p.q)
 当該実験で重要度の異なる2つの因子の水準に対して、各被験者を2
つの局外因子によりブロック化し2段階の無作為割り付けにより被
験者を割り付ける方法。
 RB-p デザインとどこが異なる?
B1
…
Bq
均質でない被験者を2つの
局外因子によりブロック化
A1
BL(1)1
…
BL(1)2
‫׃‬
‫׃‬
Ap
BL(2)1
‫׃‬
‫׃‬
BL(1)p
…
BL(2)
2
…
BL(2)r
3つ以上の平均値の差の検定(11)
条件間での平均値の差の持つ意味
 睡眠遮断データでは、12時間、24時間、36時
間、48時間の睡眠遮断を課す4グループ各8名の
手先の敏捷性(鈍感度)のデータの平均値は、睡眠
遮断時間が増すにつれて、増大している。
 水準間での平均値の違いは、手先の敏捷性に対する
睡眠遮断という要因の効果の有無を表している、と
考えられる。
 まず、睡眠遮断要因の効果の検定結果が分散分析で
はどのように示されるのかを、統計ソフト SAS を用
いてみてみよう。
3つ以上の平均値の差の検定(12)
SAS による分散分析の出力例
変動因 自由度 平方和
Model
3
194.5
Error
28
41.0
Correct
31
235.5
ed total
変動因 自由度 Anova
平方和
平均平方 F 値 Pr>F
63.83
44.28 .0001
1.46
level
63.83
3
194.5
平均
平方
F値
Pr>F
44.28 .0001
3つ以上の平均値の差の検定(13)
SAS による分散分析の出力例
変動因
平方和 自由度 平均平方
要因名
SS_A
I-1
SS_A
/ (I-1)
誤差
SS_E
N-I
SS_E
/(N-I)
計
SS_T
N-1
F値
p値
U_A
/ U_E
p
3つ以上の平均値の差の検定(14)
SAS による分散分析の出力例
 構造模型ー分散分析では、どのデザインでも、
それにより得られるデータ y を実現値とする確
率変数 Y に対するモデル(構造模型)を仮定す
る。例えば、CR-p デザインでは、
Yik    i  Eik ,
ここで、μは一般平均、αi は因子 A の第 i 水準の
主効果、Eik は誤差項である。
3つ以上の平均値の差の検定(15)
分散分析での3つの仮定
 (1)正規性
(構造模型の)誤差項は正規分布に従う
 (2)等分散性
各セルの(母集団での)分散はすべて
等しい
 (3)独立性
従属変数の値は互いに独立である
3つ以上の平均値の差の検定(16)
基本用語1-平方和(1)
 例えば、分散分析表の中の平方和の1つである
SSAは、第 i 水準の Ni 人のサンプルの従属変数の
値の平均を実現値とする確率変数から全サンプ
ルの平均を引いたものの二乗和(平方和)であ
Ni
I
る:
SSA  (Yi Y )2 , i 1 k 1
は、第 i 水準の主効果 αi と、誤差に関わる項であ
ることが、うえの構造模型を用いると証明できる。
3つ以上の平均値の差の検定(17)
基本用語1-平方和(2)
 同じく分散分析表の中の平方和の1つである SS
E は、第
i 水準の k 番目のサンプルの値 yik を実現
値とする確率変数 Yik から第 i 水準の Ni 人のサン
プルの平均を引いたものの二乗和(平方和)であ
る:
I Ni
SSE  (Yik Yi )2 , i 1 k 1
は、誤差に関わる項のみから成ることが、先ほどと同
様、構造模型から証明できる。
3つ以上の平均値の差の検定(18)
平均平方
 つぎに、分散分析表の中の平均平方の1つであ
る UEは、誤差平方和 SSE を N – I で割ったもの
である:
U E  SSE /( N  I )
I
Ni
  (Yik Yi )2 /( N  I )
i 1 k 1
同様に、UA は、要因平方和を I -1 で割ったもので、
U A  SSA /(I  1)
I
Ni
 (Y i Y  )2 /(I  1)
i 1 k 1
3つ以上の平均値の差の検定(19)
CR-p デザインにおける F 値の意味(1)
 結局、CR-p デザインにおける要因の効
果検定のための統計量 F は、要因の効
果と 誤差に関わる項の、誤差に関わる
項に対する比
F  U A / UE
として定義されることがわかる。
3つ以上の平均値の差の検定(20)
CR-p デザインにおける F 値の意味(2)
 結局、CR-p デザインに限らず、一般に
分散分析では、テキスト p.8 上方の枠内
にまとめたように、
分散分析ではデータの全変動を、組み込
んだ因子の変動と誤差変動に分解し、誤差
変動に比べて当該因子の変動がどれ程大
きいのかを検討する。