Transcript Document

第3章
2つの変数の記述統計
小川新太
太田智章
3.1 2つの変数の関係
相関
量的変数(前章参照)どうしの関係
連関
質的変数(前章参照)どうしの関係
3.2 散布図
2変数の関係
(1)正の相関
変数xが大きいほど変数yも大きい傾向がある。
(2)負の相関
変数xが大きいほど変数yも小さい傾向がある。
(3)無相関
変数xの大小の変化と変数yの大小との間に関係はない
Plot()
統計テスト1と統計テスト2の散布図
右上がりの傾向にあるので、
正の相関と言える。
心理テストと統計テスト1の散布図
どちらかといえば、
右上がりの傾向があ
るが、前の散布図に
比べ相関が弱いとい
うことを意味している。
心理学テストと散布図テスト2の散布図
全体的に円に近い
ので、ほぼ無相関と
言える。
3.3 共分散
共分散 cov()
偏差の積の平均
cov()ではn-1で割ります(これを不偏共分散ということもある)
3.4 相関係数
相関の強さを求める式
rxy 相関係数
sxy 共分散
sxsy それぞれの標準偏差
cor()
−1 から 1 の間の実数値をとり、1 に近いときは2 つの
確率変数には正の相関があるといい、−1 に近ければ
負の相関があるという。
0 に近いときはもとの確率変数の相関は弱く、無相関である
相関係数
大きさの評価
ほとんど相関なし
-0.2≦r≦0.2
-0.4≦r<-0.2
0.2<r≦0.4
弱い相関あり
-0.7≦r<-0.4
0.4<r≦0.7
中程度の相関あり
-1.0≦r<-0.7
0.7<r≦1.0
強い相関あり
3.5 クロス集計表
クロス集計表 質的変数どうし(連関)の関係の表
これを2×2クロス集計表と言う。
3.6 ファイ係数
ファイ係数
1と0の2つの値からなる変数に対して計算される
相関係数のこと
この場合は正の値なので、数学が好き(1)と回答した人ほど
統計が好き(1)と回答する傾向があるということがわかる。
まとめ
目的
関数名と書式
使い方
散布図を描く
plot(x,y)
plot(test1,test2)
共分散を求める
cov(x,y)
cov(test1,test2)
相関係数を求める
cor(x,y)
cor(test1,test2)
クロス集計表を描く
table(x,y)
table(math,sta)
場合分けをする
Ifelse(条件、真の場合、偽の場合)
Ifelse(sta==“like”,1,0)