Transcript 相関分析
相関分析の応用 散布図 共分散 相関係数 順位相関係数 散布図(Scatter-gram,正の関 係) GDPとMS(兆円) MS 700 600 500 400 300 300 400 500 GDP 600 散布図(負の相関関係) 貯蓄と世帯数の関係 世帯数 1000 800 600 400 200 0 0 500 1000 1500 2000 2500 3000 貯蓄 無相関の例 統計学の前期と後期の試験点数(n=10) 後期 90 80 70 60 50 40 30 20 10 0 0 20 40 前期 60 80 Xの分散とYの分散 変数 x1 , x 2 , x n と変数 y1 , y 2 , y n の それぞれの分散が次のように定義される。 n S xx (x n i i 1 n x) 2 S yy (y i i 1 n y) 2 共分散(Covariance) x i と y i について n S xy (x i x )( y i y ) i 1 n で定義される S xy を x i と y i の共分散 といい、Cov(x, y)と書く。 Xとyの変動と共分散の符号 Xとyの増減変化の方向が一致であれば、 S xy の値がプラスになり、xとyが正の相関 関係が存在する。 Xとyの増減変化の方向が逆であれば、 S xy の値がマイナスになり、xとyが負の相 関関係をもつ。 相関係数 相関係数は次式で定義される。 xy S xy S xx S yy S xy Sx Sy n (x i x )( y i y ) / n i 1 (x x) / n 2 i (y y) / n 2 i 共分散と相関係数の関係 相関係数はxとyの共分散 S xy を標準偏差 Sで基準化したものである。 x , S y xy (x x )( y i y ) i nS x S y n i 1 ( xi x Sx )( yi y Sy n ) 相関係数の性質 相関係数 xy は共分散 S xy と同じ符号をもち、 常に 1 xy 1 の範囲にある。 xy xy xy =1ならば、すべての観測値が正の傾きを持つ 同一直線上に並ぶ。 =-1ならば、すべての観測値が負の傾きを持つ 同一直線上に並ぶ。 は0に近ければ、XとYの間に相関はない。 相関係数の計算式 xy n x n x i y i x iΣ y i 2 i ( xi ) 2 n y 2 i ( yi ) 2 順位相関係数 2つの変数を質的基準によって順位づけて、 2変数の質的基準による順位相関関係を 示す指標。 n 6 d s 1 i 1 2 n(n 2 1) は2変数の質的基準による順位にお ける差の平方和を意味する。 d 2