Transcript ppt

第6章 数量化I類
6.1 適用例と解析ストーリー
数量化I類とは
目的変数が量的変数,説明変数が質的変数
(1)適用例と解析の目的
サークル 総合成績
サンプルNo.線形代数
x1
x2
y
例:成績のデータ y(点)
1
優
所属
96
2
優
所属
88
3
優
無所属
77
線形代数の成績
4
優
無所属
89
:x1 {優,良,可,不可}
5
良
所属
80
6
良
無所属
71
サークルの所属
7
良
無所属
77
:x2 {所属,無所属}
8
可
所属
78
9
可
所属
70
10
可
無所属
62
解析の目的:総合成績と,線形代数の成績とサークルの所属
の有無の関係を明らかにする.
・総合成績は線形代数の成績やサークルの所属の有無より予測できるか.
・どちらの変数の方が説明力があるか.
・予測できるとすればその精度はどのくらいか.
・例えば,線形代数が優でサークルに所属していない学生の総合成績
(2)数量化I類の解析ストー
は?
リー
(1)質的変数をダミー変数に変換して,ダミー変数を量的変数と考えて
重回帰モデルを想定する.
(2)自由度調整済寄与率を求め,得られた回帰式の性能を評価する.
(3)変数選択を行い,有用な変数を選択する.
(4)残差とテコ比の検討を行い,得られた回帰式の妥当性を検討する.
(5)得られた回帰式を利用して,任意に指定した説明変数の値に対し,
将来得られるデータの値を予測する.
6.2 説明変数が1個の場合の解析方法
(1)ダミー変数の考え方と回帰式の推定
アイテム :質的な変数
( ex. 線形代数の成績x1 )
カテゴリー :アイテムの中身 ( ex. 優,良,可 )
ダミー変数:二つの値のうちのどちらかをとる変数
(特に 0 か 1 かいずれかの値をとる)
1 優
1 良
x1(1)=
x1(2)=
x1(13 )= 1 可
0 優でない
0 良でない
0 可でない
x1(1)+ x1(2) + x1(3) =1
x1(1), x1(2) , x1(3)のうち1つは不必要
は,多重共線性を持つ
多重共線性(multicollinearity): 説明変数に非常に強い相関や一
次従属な変数関係があり,解析が不可能になること.たとえ結果
が求まったとしてもその信頼性は低い。
(2) 寄与率と自由度調整済み寄与率
(3) 説明変数の選択(変数選択)
pp.92
説明変数の選択:
目的変数に有効な説明変数のみをモデルに採用すること
①変数減少法:すべての変数を取り込んだ段階から不要な
変数を削除していく方法
②変数増加法:定数項だけのモデルから有用な変数を追加
していく方法
②変数増減法:①と②を両方取り入れた方法
ここでは,変数増加法について説明する.
変数増加法
定数項だけのモデル Model0:
yi  0   i
変数増加法
①定数項だけのモデル Model0:
yi  0   i
② Model0にx1かx2のどちらの変数を取り込むのが良いか?
1つの変数xjだけを取り込んだ単回帰式 yˆi  ˆ0  ˆ j xij
6.3 説明変数が2個以上の場合の解析方法
(1)ダミー変数の考え方と回帰式の推定
(2) 寄与率と自由度調整済み寄与率
(3) 説明変数の選択(変数選択)
pp.96
説明変数の選択:
目的変数に有効な説明変数のみをモデルに採用すること
①変数減少法:すべての変数を取り込んだ段階から不要な
変数を削除していく方法
②変数増加法:定数項だけのモデルから有用な変数を追加
していく方法
②変数増減法:①と②を両方取り入れた方法
ここでは,変数増加法について説明する.
変数増加法
定数項だけのモデル Model0:
yi  0   i
6.4 説明変数に量的変数と質的変数が混在する場合
サークル 通学時間 総合成績
サンプルNo.線形代数
x1
x2
x3
y
1
優
所属
15
96
2
優
所属
85
88
3
優
無所属
78
77
4
優
無所属
15
89
5
良
所属
57
80
6
良
無所属
29
71
7
良
無所属
64
77
8
可
所属
22
78
9
可
所属
57
70
10
可
無所属
50
62
①質的変数をダミー変数で表現する.
②重回帰分析を行う.
yi  0  1(2) xi1(2)  1(3) xi1(3)  2 xi 2  3 xi3   i ,  i ~ N (0, 2 )
xi1(2)  1 良
xi1(3)  1 可
( xi1(2) , xi1(3) )  (0,0) 優
( xi1(2) , xi1(3) )  (1,0) 良
( xi1(2) , xi1(3) )  (0,1) 可
xi 2  0 無所属
xi 2  1 所属
推定結果
yi  89.0  9.75xi1(2) 19.7xi1(3)  9.2xi 2  0.126xi3
 0 (優)

 0 (無所属)
 89.0    9.75 (良)   
  0.126xi3
 19.7 (可)   9.2 (所属) 

