Transcript Document

経済統計学 第2回 4/24
Business Statistics
鈴木智也
紫英館 304号室
Office Hour:月曜日 第2講時
1
前回のポイント
• 「記述統計」と「推測統計」。
• この講義で扱うのは、推測統計。
• 標本(サンプル)データから標本統計量を
計算し、母集団の持つ規則性(母集団パラ
メータ)を推測する。
⇒推測統計を学ぶ前に、記述統計の復習。
2
記述統計の復習(1)
☆(母集団)平均
m
X1  X 2    X m
1
X 
 { X i  }
m
m
i 1
X が m 通りの値を取りうる時、大体どれ位
の値になるかの指標。
3
記述統計の復習(2)
☆(母集団)分散
2
2
m
(
X


)



(
X


)
1
2
2
1
X
m
X
X 
 ( Xi  X ) 
m
m
i 1
X が概ね平均値からどのくらい離れている
かを表す指標。(散らばり具合を記述)
Q:なぜ二乗しているのかを考えてみよう。
4
記述統計の復習(3)
☆(母集団)標準偏差
 X   X2
これも散らばり具合を表す指標。
注:分散は二乗を取って計算しているので、
元々の単位(例:兆円)とは異なる。
⇒分散の平方根を取って、標準化し、元の単
位に戻す。
5
記述統計と推測統計の対応
n個の標本データから母集団特性値を推測
☆標本平均
n
☆標本分散
X1  X 2    X n
X

n
( X1  X )    ( X n  X )
s 

n 1
2
2
2
X
☆標本標準偏差

i 1
Xi
n
2
(
X

X
)
i1 i
n
n 1
s X  s X2
6
注:一般的な表記方法
• 母集団特性値はギリシア文字で表すのが
通例。
平均:μ(ミュー) 標準偏差:σ(シグマ)
• 標本統計量は通常、アルファベットで表す。
小文字のσは小文字のs に相当。
母集団標準偏差 σ ⇔ 標本標準偏差 s
7
ここから前回の続き
• 推測統計では、サンプルを取って、母集団
の規則性(特性値)を推測する。
• サンプルをどう取るかで、標本統計量の値
は変わってくる。
• 標本統計量には、取り得る値が複数あり、
事前にはどの値を取るのか分からない。
⇒標本統計量は「確率変数」である。
8
そもそも確率とは?
• ある事象が起こるか否か分らない時、その
結果が起こる可能性を示す測度のこと。
事象 A の確率を P(A) と表すとすると、
①確率 P(A) は必ず非負である: P(A)≥0
②必ず起こる事象の確率は1である。
③事象 A と B が同時には起こり得ない場合、
A または B が起こる確率は、P(A)+P(B) 。
9
確率の具体例
• サイコロを振って、3の目が出る確率は?
⇒目の出方は、全部で6通り。3の目が出る
のは、そのうちの一つ。⇒1/6の確率。
• じゃんけんでグーを出して勝つ確率は?
⇒相手がチョキなら勝ち、グーならあいこ、
パーなら負け、の三通り。⇒1/3の確率。
10
確率変数とは
• 取り得る値(実現値)が複数あり、それぞ
れの値を取る確率が決まっている変数。
例:サイコロを振って出る目の数値(X)
実現値(xi):1,2,3,4,5,6
どの値を取る確率も1/6。
☆確率変数 X が xi という値を取る確率を
P(X=xi) または、単に P(xi) と表記する。
11
確率分布とは
• 確率変数 X が取り得る全ての実現値につ
いて、対応する確率の散らばりのこと。
• それを表すものが、確率分布表。
(例)サイコロで出る目の値の確率分布表
xi
P(xi)
1
2
3
4
5
6
1/6 1/6 1/6 1/6 1/6 1/6
12
確率変数を「記述」しよう ①
☆平均値(「期待値」と呼ぶ)
確率変数 X が、平均して、どの位の値を
取るものと期待できるだろうか?
m
  E ( X )  x1  P( x1 )    xm  P( xm )   {xi  P( xi )}
i 1
↑確率で加重して平均を取っている。
注: E は期待(Expectation)を意味する。
13
確率変数を「記述」しよう ②
☆分散
確率変数 X の実現値の散らばり具合を表す。
2
2
2
 X  V ( X )  {x1   X }  P( x1 )    {xm   X }  P( xm )
m
 {xi   X }  P( xi )
2
i 1
↑ここでも、確率で加重している。
注: V は分散(Variance)を表す。
14
確率変数を「記述」しよう ③
☆標準偏差
X  
2
X
理解の為の重要ポイント
母集団の平均、分散、標準偏差と、確率変
数の平均、分散、標準偏差のそれぞれの
相似性に注目せよ。
15
経済分析での確率変数の例
• 株式投資の収益率
株価は変動する⇒投資収益率は確率変数
Q:もし投資収益率の確率分布が次のよう
ならば、収益率の期待値はいくつ?
収益率
確率(%)
0.1 0.2 0.4 0.5 0.8
10 20 30 30 10
16
確率分布が分らない場合は?
• 過去のデータから「相対頻度」を調べて、代用。
例えば、過去12ヶ月間の収益率が
0.2, 0.4, 0.1, 0.3, 0.1, 0.3, 0.5, 0.2, 0.1, 0.2, 0.3, 0.2
だったとする。その場合、相対頻度は、
0.1 0.2 0.3 0.4 0.5
収益率
相対頻度 3/12 4/12 3/12 1/12 1/12
17
連続型確率変数
• ここまでの確率変数 X はとびとびの値だけ
を取り得ると仮定した。←離散型確率変数
• しかし、ある範囲内でどんな値でも取り得
る確率変数もある。←連続型確率変数
例:ある時点で、時計の秒針が、中心から十
二時の部分を結ぶ線と、成す角度は0度か
ら360度まであり得る。(分布を図示せよ)
18
連続型確率変数(続)
☆離散型の場合
・X の取る値自体に確率が対応。
・確率関数 P(X=xi) を定義できる。
☆連続型の場合
・X の取り得る値は無限にあり、一点の値
について確率が0ではないとすると、確率
の総和が1であるという公理(P.9)に矛盾。
⇒「範囲」について、確率を考える。
19
連続型確率変数(続々)
• 連続型確率変数の場合、確率密度関数を
導入する: f(x)
• X が a から b までの値を取る確率は、

b
a
f ( x)dx
• 注:積分(∫)は総和(∑)に対応している。
Q:図示して考えてみよ。
20
連続型確率変数を「記述」する
X が -∞ から ∞ までの値を取るならば、
☆平均(「期待値」と呼ぶ)

 X  E ( X )   x  f ( x)dx

☆分散

  V ( X )   {x   X } f ( x)dx
2
X
2

☆標準偏差
2
X  X
21
代表的な確率分布
☆正規分布 (Normal Distribution)
・正規分布は、平均値μと分散σ2によって
完全に決定される:N(μ, σ2)と表記する。
・確率密度関数は(覚えなくてもよいが)
f ( x) 
1
2 2
e
( x )2

2 2
・図示すると、釣鐘型をしていて、平均値に
関して左右対称である。
22
代表的な確率分布(続)
・N(μ, σ2) に従う変数 X は、N(0, 1)に従う
標準化変量 Z=(X-μ)/σに変換できる。
・N(0, 1)の分布を「標準正規分布」と呼ぶ。
重要:標本平均は正規分布に従うことが知
られている(次々回に詳説)。
*今週で準備は終り、来週から本題入り。
23