Transcript 判別分析
分散分析、判別分析、因子分析 分散分析 分散分析とは 分散分析とは、複数のグループについてグ ループ間の差異を判定し、検定する統計学の 手法である。 マーケティング・リサーチへの応用 • 製品コンセプトテスト • 広告コピーテスト • マーケティング・ミックスの効果に関するリ サーチ 標本平均の差異 標本2 標本1 X1 = X2 or X1 ≠ X2 母集団と標本 母集団 標本1 標本2 X1 = X2 母集団1 母集団2 標本1 標本2 X1 ≠ X2 分散分析のデータ 標本1 標本2 変数1 X11 X21 変数2 X12 X22 … … … 変数n X1n X2n 平均 分散 X1 s21 X2 s22 グループ内とグループ間の分散 グループ内の分散 s2w = s21 + s22 2 グループ間の分散 s2b = ns2X s2X = (X 1 - X)2 - ( X 2 - X) 2 F比とその分布 F= s2b s2w μ1 = μ2 → s2w = s2b → F = 1 F検定 データ例 店舗条件 月間販売台数 平均販売台数 チラシAを配った店舗 25,27,28,29,26,24,25 26.3 チラシBを配った店舗 26,28,25,29,28,27,32 27.9 何も配らなかった店舗 18,20,25,24,25,23,24 22.7 全体平均販売台数 25.6 分散分析の結果 平方和 自由度 平均平方 F値 有意確率 グループ間 97.238 2 48.619 9.339 .002 グループ内 93.714 18 5.206 合計 190.952 分散分析の結果 F(2,18) 0 3.55 6.01 9.339 判別分析 判別分析とは 判別分析は、事前に与えられているデータが 異なるグループに分かれることが明らかな場 合、新しいデータが得られた際に、どちらのグ ループに入るのかを判別するための基準(判 別関数)を得るための手法である。 判別分析の概念 100 数 学 合格 不合格 0 国語 100 判別分析の概念 判別分析のデータ グループ 1 2 2 1 X1 X2 … Xk 判別関数 Z = b1X1 + b2X2 + b3X3 + … + bkXk Z = 判別得点 b = 判別係数 X = 説明変数 カットオフ得点 カットオフ得点 カットオフ得点と標本数 各グループの標本数が同じ場合 C= ZA + ZB 2 各グループの標本数が異なる場合 C= nB ZA + nA ZB nA + nB 相関比による推定 グループ1 1 X1 X2 X1ij X2ij ・・・ グループ2 Xk X1 X2 ・・・ 2 3 4 5 Zij = b1X1ij + b2X2ij + b3X3ij + … + bkXkij Xk 相関比による推定 2 2 グループ内の平方和 sw = ΣjΣi Zij - Z グループ間の平方和 sb = Σj n j Zj - Z θ= sb sw → 最大化 データ例 ID グループ 性別 年齢 入院 糖尿病 高血圧 喫煙 行動 1 1 1 67 18 0 0 0 1 2 1 1 75 17 1 1 0 2 3 1 1 66 17 0 0 0 2 4 1 1 67 15 0 0 0 3 5 0 1 75 21 0 0 1 3 6 1 1 74 17 0 0 0 3 7 1 1 69 18 0 0 0 4 8 0 1 74 18 1 1 0 2 9 1 1 66 18 0 0 0 2 10 1 1 68 16 0 0 0 2 11 ... … … … … … … … 分析結果 投入済み/除去済みの変数 a, b, c, d Wilks のラムダ 正確な F 値 ステップ 1 投入済み 入院日数 2 行動範囲 ADL 統計量 .958 自由度1 .915 自由度2 1 1 自由度3 98.000 2 1 98.000 各ステップで全体の Wilks のラムダを最小化する変数が投入されます。 a. 最大ステップ数は 14 です。 b. 投入するための偏 F 値の最小値は 3.84 です。 c. 削除するための偏 F 値の最大値は 2.71 です。 d. 計算を続行するには F 水準、許容度、または VIN が不十分です。 統計量 4.339 4.520 自由度1 1 自由度2 98.000 有意確率 .040 2 97.000 .013 因子分析 因子分析とは 因子分析とは、いくつかの変量間に潜む、共 通の要因―共通因子―を探り出す手法のこ とである。 因子分析の概念 ブランド力の評価 因子負荷量と因子得点 因子負荷量 因子得点 X 1 a11 f 1 a12 f 2 1 X 2 a 21 f 1 a 22 f 2 2 X 3 a 31 f 1 a 32 f 2 3 X 4 a 41 f 1 a 42 f 2 4 C ov ( f i , f j ) 0 for i j C ov ( k , h ) 0 for k h , E ( k ) 0, Cov ( f i , k ) 0 Var ( k ) 1, i 1, ,4 因子負荷量と因子得点の推定 12 V ar ( X ) 12 13 14 2 23 24 3 34 2 2 4 2 a112 a122 1 a11 a 21 a12 a 22 a11 a 31 a12 a 32 a11 a 41 a12 a 42 2 2 a 21 a 22 1 a 21 a 31 a 22 a 32 a 21 a 41 a 22 a 42 2 2 a 31 a 32 1 a 31 a 41 a 32 a 42 2 2 a 41 a 42 1 因子負荷量の推定値 a ij を最初の式に代入する。 X i aˆ i1 f1 aˆ i 2 f 2 i i 1, ,4 最小二乗法を用いて回帰分析を行えば因子得点の推定値 f1 , f2 を求めることができる。 1.3 海外ブランド品に対するイメージのデータ ブランド名 人気度 認知度 所有率 高級感 誇らし さ 品質 センス 親しみ 広告 シャネル 159 377 209 318 136 150 123 36 86 エルメス 145 327 136 245 104 154 127 27 41 ティファニー 145 327 136 182 86 136 136 77 59 ルイ・ヴィトン 136 359 186 177 77 186 82 109 18 グッチ 123 350 154 163 73 141 114 68 32 ラルフローレン 114 295 200 54 27 114 91 154 36 カルティエ 109 291 109 232 95 150 95 14 23 フェラガモ 109 286 68 159 64 109 77 32 18 プラダ 104 245 45 104 50 77 82 59 18 100 263 123 32 23 64 118 132 54 86 327 241 18 5 54 59 227 95 K・クライン ベネトン 因子負荷量 因子行列 因子 人気度 1 .812 2 .360 認知度 .466 .801 所有率 -.170 .955 高級感 .990 .102 誇らしさ .994 .095 品質 .774 .242 センスの良さ .556 .062 親しみ -.86 6 .488 広告 -.133 .691 因子抽出法: 最尤法 知覚マップ 2.0 1.5 ベネトン シャネル ルイ・ヴィトン 1.0 .5 普 及 率 ラルフローレン ティファニー グッチ エルメス 0.0 -.5 K・クライン カルティエ -1.0 フェラガモ プラダ -1.5 -2.0 -2.0 -1.5 -1.0 -.5 0.0 ブランド力 .5 1.0 1.5 2.0