判別分析

Download Report

Transcript 判別分析

分散分析、判別分析、因子分析
分散分析
分散分析とは
分散分析とは、複数のグループについてグ
ループ間の差異を判定し、検定する統計学の
手法である。
マーケティング・リサーチへの応用
• 製品コンセプトテスト
• 広告コピーテスト
• マーケティング・ミックスの効果に関するリ
サーチ
標本平均の差異
標本2
標本1


X1 = X2
or


X1 ≠ X2
母集団と標本
母集団
標本1
標本2


X1 = X2
母集団1
母集団2
標本1
標本2


X1 ≠ X2
分散分析のデータ
標本1
標本2
変数1
X11
X21
変数2
X12
X22
…
…
…
変数n
X1n
X2n


平均
分散
X1
s21
X2
s22
グループ内とグループ間の分散
グループ内の分散 s2w =
s21 + s22
2
グループ間の分散 s2b = ns2X


s2X =




(X 1 - X)2 - ( X 2 - X)
2
F比とその分布
F=
s2b
s2w
μ1 = μ2 → s2w = s2b → F = 1
F検定
データ例
店舗条件
月間販売台数
平均販売台数
チラシAを配った店舗
25,27,28,29,26,24,25
26.3
チラシBを配った店舗
26,28,25,29,28,27,32
27.9
何も配らなかった店舗
18,20,25,24,25,23,24
22.7
全体平均販売台数
25.6
分散分析の結果
平方和
自由度
平均平方
F値
有意確率
グループ間
97.238
2
48.619
9.339
.002
グループ内
93.714
18
5.206
合計
190.952
分散分析の結果
F(2,18)
0
3.55
6.01
9.339
判別分析
判別分析とは
判別分析は、事前に与えられているデータが
異なるグループに分かれることが明らかな場
合、新しいデータが得られた際に、どちらのグ
ループに入るのかを判別するための基準(判
別関数)を得るための手法である。
判別分析の概念
100
数
学
合格
不合格
0
国語
100
判別分析の概念
判別分析のデータ
グループ
1
2
2
1
X1
X2
…
Xk
判別関数
Z = b1X1 + b2X2 + b3X3 + … + bkXk
Z = 判別得点
b = 判別係数
X = 説明変数
カットオフ得点
カットオフ得点
カットオフ得点と標本数
各グループの標本数が同じ場合

C=

ZA + ZB
2
各グループの標本数が異なる場合

C=

nB ZA + nA ZB
nA + nB
相関比による推定
グループ1
1
X1
X2
X1ij
X2ij
・・・
グループ2
Xk
X1
X2
・・・
2
3
4
5
Zij = b1X1ij + b2X2ij + b3X3ij + … + bkXkij
Xk
相関比による推定

2

2
グループ内の平方和 sw = ΣjΣi Zij - Z
グループ間の平方和 sb = Σj n j Zj - Z
θ=
sb
sw
→ 最大化
データ例
ID
グループ
性別
年齢
入院
糖尿病 高血圧
喫煙
行動
1
1
1
67
18
0
0
0
1
2
1
1
75
17
1
1
0
2
3
1
1
66
17
0
0
0
2
4
1
1
67
15
0
0
0
3
5
0
1
75
21
0
0
1
3
6
1
1
74
17
0
0
0
3
7
1
1
69
18
0
0
0
4
8
0
1
74
18
1
1
0
2
9
1
1
66
18
0
0
0
2
10
1
1
68
16
0
0
0
2
11
...
…
…
…
…
…
…
…
分析結果
投入済み/除去済みの変数
a, b, c, d
Wilks のラムダ
正確な F 値
ステップ
1
投入済み
入院日数
2
行動範囲
ADL
統計量
.958
自由度1
.915
自由度2
1
1
自由度3
98.000
2
1
98.000
各ステップで全体の Wilks のラムダを最小化する変数が投入されます。
a. 最大ステップ数は 14 です。
b. 投入するための偏 F 値の最小値は 3.84 です。
c. 削除するための偏 F 値の最大値は 2.71 です。
d. 計算を続行するには F 水準、許容度、または VIN が不十分です。
統計量
4.339
4.520
自由度1
1
自由度2
98.000
有意確率
.040
2
97.000
.013
因子分析
因子分析とは
因子分析とは、いくつかの変量間に潜む、共
通の要因―共通因子―を探り出す手法のこ
とである。
因子分析の概念
ブランド力の評価
因子負荷量と因子得点
因子負荷量
因子得点
X 1  a11 f 1  a12 f 2   1
X 2  a 21 f 1  a 22 f 2   2
X 3  a 31 f 1  a 32 f 2   3
X 4  a 41 f 1  a 42 f 2   4
C ov ( f i , f j )  0 for i  j
C ov ( k ,  h )  0 for k  h ,
E ( k )  0,
Cov ( f i ,  k )  0
Var ( k )  1,
i  1,
,4
因子負荷量と因子得点の推定
  12


V ar ( X )  



 12  13
 14 
2
 23
 24
3
 34
2
2
4
2
 a112  a122  1 a11 a 21  a12 a 22 a11 a 31  a12 a 32 a11 a 41  a12 a 42
 
2
2
a 21  a 22  1 a 21 a 31  a 22 a 32 a 21 a 41  a 22 a 42
 

2
2
a 31  a 32  1 a 31 a 41  a 32 a 42
 
2
2
 
a 41  a 42  1
 







因子負荷量の推定値 a ij を最初の式に代入する。
X i  aˆ i1 f1  aˆ i 2 f 2   i
i  1,
,4
最小二乗法を用いて回帰分析を行えば因子得点の推定値 f1 , f2 を求めることができる。
1.3 海外ブランド品に対するイメージのデータ
ブランド名
人気度
認知度 所有率 高級感
誇らし
さ
品質
センス 親しみ
広告
シャネル
159
377
209
318
136
150
123
36
86
エルメス
145
327
136
245
104
154
127
27
41
ティファニー
145
327
136
182
86
136
136
77
59
ルイ・ヴィトン
136
359
186
177
77
186
82
109
18
グッチ
123
350
154
163
73
141
114
68
32
ラルフローレン
114
295
200
54
27
114
91
154
36
カルティエ
109
291
109
232
95
150
95
14
23
フェラガモ
109
286
68
159
64
109
77
32
18
プラダ
104
245
45
104
50
77
82
59
18
100
263
123
32
23
64
118
132
54
86
327
241
18
5
54
59
227
95
K・クライン
ベネトン
因子負荷量
因子行列
因子
人気度
1
.812
2
.360
認知度
.466
.801
所有率
-.170
.955
高級感
.990
.102
誇らしさ
.994
.095
品質
.774
.242
センスの良さ
.556
.062
親しみ
-.86 6
.488
広告
-.133
.691
因子抽出法: 最尤法
知覚マップ
2.0
1.5 ベネトン
シャネル
ルイ・ヴィトン
1.0
.5
普
及
率
ラルフローレン
ティファニー
グッチ
エルメス
0.0
-.5
K・クライン
カルティエ
-1.0
フェラガモ
プラダ
-1.5
-2.0
-2.0
-1.5
-1.0
-.5
0.0
ブランド力
.5
1.0
1.5
2.0