Transcript 10/22実施

統計学
第3週(第4回)
10/15(月)
鈴木智也
1
今日の講義の位置づけ
• この講義全体の構成
①記述統計 ← データの規則性を記述
一変数の規則性の数値化
度数分布の利用
二変数の規則性の数値化 ← 今はここ
②確率論 ← 推測統計への橋渡し
③推測統計 ← データから全体像を推測
2
なぜ二変数の関係が重要か?
• 経営者の立場:自社製品の「価格」を上げ
れば、「収入」は増えるのか?
• 経済政策決定の立場:「公共投資」をすれ
ば、どのくらい「GDP」は増えるのか?
• 投資家の立場:どの株とどの株を組み合
わせれば、リスクを減らせるのか?
3
二変数分析の第一歩(散布図)
二つの変数(XとY)のデータを取る。
⇒Xの値とYの値の組合せをグラフ化する。
⇒これを「散布図」という。
例:(株)トヨタ自動車と(株)デンソーについ
て、株価の動きを月次データで調べてみる。
4
2005/1
2005/2
2005/3
2005/4
2005/5
2005/6
2005/7
2005/8
2005/9
トヨタ自動車
4030
4070
3990
3840
3860
3970
4250
4500
4500
デンソー
2690
2675
2670
2495
2470
2525
2715
2795
2860
5
散布図の例
株価の連動(2005年1月~9月)
2900
デンソー
2800
2700
2600
2500
2400
3800
3900
4000
4100 4200 4300
トヨタ自動車
4400
4500
4600
6
散布図から次のステップ
• トヨタ自動車の株価が上れば、デンソーの
株価も上る傾向にある。
⇒こういった二変数の連動傾向が散布図か
ら、一目瞭然である。
⇒次は、その連動傾向を数値化する。
7
重要語句:復習をかねて
• 平均:データの代表値
• 分散&標準偏差:データの散らばり具合
☆今日の重要語句:共分散&相関係数
⇒二変数の結びつきの強さを測る指標
注)共分散を出してから、相関係数を出す。
8
復習
☆分散(変数Xのデータについて)
2
2
(
X

X
)



(
X

X
)
1
2
1
m
sX 

m
m
1
where X 
m
m

( X i  X )2 ,
i 1
m
X .
i
i 1
各々の観測値が平均値からどのくらい離
れているかの平均(散らばり具合の指標)
9
復習(2)
☆標準偏差(変数Xのデータについて)
s X  s X2
これも散らばり具合を表す指標。
注:分散は二乗を取って計算しているので、
元の単位(例:兆円)とは異なる。
⇒分散の平方根を取って、標準化し、元の単
位に戻す。
10
共分散
二変数間の関係の強さを表す指標
2
s XY
1

m
m
(X
i
 X )(Yi  Y ),
i 1
1
where X 
m
m

i 1
1
X i and Y 
m
m
Y .
i
i 1
↑これを用いて、相関係数をはじき出す。
11
重要:相関係数
• 共分散を標準偏差で割って算出。
rXY
2
s XY

, where  1  rXY  1.
s X sY
• 相関係数の重要な性質
Xと Yが同方向に動く  rXY  1.
Xと Yが逆方向に動く  rXY  1.
Xと Yがばらばらに動く  rXY  0.
12
応用例:投資リスクと相関係数
• 株などへの投資にはリスクがつきもの。
• 株価は上ることも下がることもある。
• 複数銘柄に投資し、ある銘柄の株価が下
がっても、別の銘柄の株価が上れば、損
失は防げる。
⇒相関係数が-1に近い株同士を組み合わ
せれば、投資のリスクを回避できる。
13
注意点:相関係数
☆相関係数は因果関係(原因と結果)につい
て何も語らない。
• 二変数XとYに相関関係が見られたとして
も、どちらが原因でどちらが結果なのかに
ついては、相関係数だけでは判別不能。
14
例1:相関係数と因果関係
身長の高い人ほど体重が重い傾向にある
⇒身長と体重は正の相関関係
では、体重を増やせば、身長は伸びるか?
⇒No!
15
例2:相関係数と因果関係
暑い日ほどアイスクリームがよく売れる。
⇒日中最高気温とアイスクリーム売上は正
の相関関係
では、アイスクリーム売上を減らせば、日
中最高気温を低くできるのか?
⇒No!
16
例3:相関係数と因果関係
• 天気予報が雨ならば、実際に雨の降る日
が多い。
⇒天気予報の降水確率と実際の降雨量に
正の相関
では、天気予報士に「雨が降る」と言わせ
れば、雨で水不足を解消できるか?
⇒No!
17
例4:相関係数と因果関係
• 1990年代末、我が国では、不良債権が増
加し、同時に、景気が悪化していた。
⇒不良債権と景気指標は負の相関関係。
・「銀行の不良債権が増えたから、景気が悪
化した」ので、不良債権問題を解決すれば
景気は上向く?
・「景気が悪化したから、不良債権が増えた」
ので、景気が上向けば、自然に不良債権
問題は解決する?
18