Transcript Document

統計学入門2
第3回
理論分布:
2項分布、正規分布
今日のはなし

確率変数と期待値

2項分布

正規分布



平均、分散
シグマの法則
正規分布の確率
確率変数


標本空間から、実数への写像
標本空間の標本点に対し、
数字を割り振る関数
コインの例(表の数)
表・表
X
裏・表
表・裏
裏・裏
確率
変数
コインの例(表の数)
表・表
X
裏・表
表・裏
裏・裏
確率
変数
2
1
1
0
確率変数と確率
P(X=0) = P(「裏・裏」)
 P(X=1)
= P(「表・裏」または「裏・表」)
= P(「表・裏」)+P(「裏・表」)
 P(X=2) = P(「表・表」)

確率変数と確率
確率変数に対する確率は、
その値になる基本事象の
確率の和
確率変数の期待値
値 と 確率 の積 の 和
E(X) =
S x P(x)
コインの例(表の数)
表・表
X
裏・表
表・裏
裏・裏
確率
変数
2
1
1
0
コインの例(表の数)
P( X=0 ) = 1/4
P( X=1 ) = 2/4
P( X=2 ) = 1/4
E(X) = 0 ・ 1/4 + 1 ・ 2/4 + 2 ・ 1/4
= 1
ベルヌーイ実験


2種類の結果を持つ実験
例:コイン投げ 裏・表
成功・失敗
生存・死亡
2項確率変数


複数のベルヌイ実験(n 回)を行っ
たときの、成功の回数を示す確率
変数
この確率変数の分布を2項分布
という
2項分布
成功の確率 p
 実験の回数 N


成功の回数を表す変数 X
2項分布

X = k の確率
P( X  k ) N Ck p (1  p)
k
N k
2項分布の計算

X = k の確率
P( X  k ) N Ck p (1  p)
k

Excelの関数
= BINOMDIST(
N k
)
BINOMDIST の使用方法

Excelの関数
= BINOMDIST(k, N, p, FALSE)
P( X  k ) N Ck p (1  p)
k
N k
= BINOMDIST(k, N, p, TRUE)
累積確率: k 以下になる確率
2項分布の期待値
P( X  k ) N Ck p (1  p)
k
N k
N
E ( X )   k P( X  k )
k 0
N
  k N Ck p (1  p )
k
k 0
N k
2項分布の期待値
N
E ( X )   k P( X  k )
k 0
N p
期待値が N p


成功の確率と実験回数の積
例: p = 1/6, N = 3
E(X) = 0.5
期待値が N p


成功の確率と実験回数の積
例: p = 1/6, N = 6
E(X) = 1
2項分布の計算

X = k の確率
P( X  k ) N Ck p (1  p)
k

Excelの関数
= BINOMDIST(
N k
)
BINOMDIST の使用方法

Excelの関数
= BINOMDIST(k, N, p, FALSE)
P( X  k ) N Ck p (1  p)
k
N k
= BINOMDIST(k, N, p, TRUE)
累積確率: k 以下になる確率
2項分布の期待値
P( X  k ) N Ck p (1  p)
k
N k
N
E ( X )   k P( X  k )
k 0
N
  k N Ck p (1  p )
k
k 0
N k
2項分布の期待値
N
E ( X )   k P( X  k )
k 0
N p
2項分布の確率関数
p=0.1
N=10
0.50
0.50
0.50
0.40
0.40
0.40
0.30
0.30
0.30
0.30
0.20
0.20
0.20
0.20
0.10
0.10
0.10
0.10
0.00
0.00
0.00
1
2
3
4
5
X
6
7
8
9
10
0
1
2
3
4
5
X
6
7
8
9
10
0.00
0
1
2
3
4
5
X
6
7
8
9
0
10
0.30
0.30
0.30
0.25
0.25
0.25
0.25
0.20
0.20
0.20
0.20
0.15
0.15
0.15
0.15
0.10
0.10
0.10
0.10
0.05
0.05
0.05
0.05
0.00
0.00
0.00
0.25
0.25
0.25
0.20
0.20
0.20
0.20
0.15
0.15
0.15
0.15
0.10
0.10
0.10
0.10
0.05
0.05
0.05
0.05
0.00
0.00
0.00
8
12
16
20
24
28
0
4
8
12
X
16
20
24
4
8
12
16
20
24
28
0
0.20
0.20
0.20
0.15
0.15
0.15
0.15
0.10
0.10
0.10
0.10
0.05
0.05
0.05
0.05
0.00
0.00
4
8
12
16
20
24 28
X
32
36
40
44
48
0
4
8
12
16
20
24 28
X
32
36
40
44
48
5
6
7
8
9
8
12
16
20
24
28
X
0.20
0
4
X
X
0.00
4
0.00
0
28
3
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
X
0.25
4
2
0.00
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
X
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
X
1
X
0.30
0
N=50
p=0.7
0.40
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
X
N=30
p=0.5
0.50
0
N=20
p=0.3
0.00
0
4
8
12
16
20
24 28
X
32
36
40
44
48
0
4
8
12
16
20
24 28
X
32
36
平均 : Np
分散 : Np(1-p) , 標準偏差 : √ Np(1-p)
40
44
48
10
N が大きいときの…
•2項分布を正規分布で近似
•平均 N p
•分散 N p (1 - p)
正規分布(Normal Distribution)
確率密度
N ( , )
2
σ
標準偏差
μ
f ( x) 

1
2
e
2
( x )
2
2
平均
データの値
2
パラメータ
正規分布

平均

平均を中心として左右対称
と
分散で分布が決まる
正規分布
Normal Distribution

平均
と
分散で分布が決まる
平均 、分散
2の正規分布
N( , 
2)
2
N(0,0.5 )
N(0,1)
2
N(0,2 )
-5
-3
-1
1
3
5
1シグマ2シグマ3シグマの法則
この区間の確率
68.3%
この区間の確率
95.4%
この区間の確率
99.7%
P (     x     )  P (  1  z  1)  2 * P ( 0  z  1)  2 * 0 . 3413 ( 数値表)  0 . 683
 P (  1  z  1)  NORMSDIST
(1)  NORMSDIST
( 0 )  0 . 8423  0 . 1587  0 . 683
正規分布の場合のシグマの法則
シグマの法則
正規分布の場合,
 平均±(1×標準偏差)に約68%


平均±(2×標準偏差)に約95%


大半が…
ほとんどが…
平均±(3×標準偏差)に約99.7%

ほぼ全部が…
EXCELの関数(正規分布関連)
NORMDIST
NORMINV
NORMSDIST
NORMSINV
: 累積確率
: 分布点
:
:
平均の標本分布
(1) x の平均は、母集団の平均
2
(2) x の分散は、  / n
(3a) n が大きいとき、 x の分布は正規分布
(3b) 母集団分布が正規分布であれば、x の
分布は正規分布
比率の標本分布
(1) p の平均は、母集団での比率P
(2) p の分散は、 P(1-P)/n
(3) n が大きいとき、p の分布は正規分布
1
x  
0
if Q = YES
if Q = NO
とおいて考えてみよう…
標本分布と統計的推測

正規分布の性質を利用して、誤差の大きさ
を推測する
標本
母集団
固定された値
x1
x2

xn
標
本
の
母
集
団
の
特
性
値
特
性
値
標本分布する
統計的推測
練習問題
159 167

次のような条件に当てはまる人の割合はいくらであるか





175 183 191
(a) 175cm以上
(b) 183 cm以上
(c) 167cm以上
(d) 159cm以下
:
:
:
:
50%
16%
84%
2.5%
次の文章について正しいかどうかを答えなさい。正しくな
い場合はその理由を述べよ。

(a) 180cm以上の人の割合は、15%以下である


183cm以上の割合が16%であるので、正しくない
(b) 160 cmから190cmの人の割合は、95%を越している。

159cmから191cmの割合がほぼ95%なので、160cmから190cm
の割合が95%を越しているとは考えにくい