Transcript URL

富山大学知能情報工学科
「統計学」第4回
ホーエル『初等統計学』
第3章 確率(前半)
高 尚策 (コウ ショウサク) 准教授
Email: [email protected]
前回演習問題の答え
• 課題1
(1)標本分散の変形:
1

n 1
(2行目)

(3行目)

(4行目)

(5行目) 
(6行目)


1
n 1
1
n 1
1
n 1
1
n 1
1
n 1
1
n 1
1

n 1
2
(X i  X ) 
( X i 
2

2X iX 
( X i  2 X
2

( X i  2 nX
2
2
2
(X i  2X iX  X )

2
 nX )
2
2
{ X i  n (
2
{ X i 
2
1
n
1
2
X )
X i  nX )
( X i  nX )
2
2

n
2
Xi) }
( X i ) }
2
前回演習問題の答え
(2)偏差平方和をnで割る場合の,分散の定義式の変形:
1
n
(2行目)


1
n
(3行目) 
1
n
(4行目) 
1
n
(5行目)

1
n

1
1
2
(X i  X ) 
( X i 
2

( X i  2 X
2
n

2X iX 

( X i  2 nX
2
2
2
(X i  2X iX  X )

2
2
X )
2
X i  nX )
 nX )
2
( X i  nX )
2

2
X i X
2
2
n
この式は,偏差平方和をn - 1で割る不偏分散を求めるときにも使うことができる.データ
からこの式で分散を計算した後,その値をn倍して(これで,nで割る前に戻る),あらため
てn - 1で割ればよい.「2乗の平均-平均の2乗」という式は覚えやすいので,これは有
用な計算方法である.
前回演習問題の答え
課題2 章末問題29のデータを用いて,度数分布表に
分類されたデータから分散の計算を行おう。
元の観測値
階級境界値と
階級の幅を設定する
度数分布表
最大値:31.6
最小値:7.6
階級境界値を設定する際の工夫:
• 測定単位よりもひとつ下の桁で境界値を設定するのは、ちょうど境界値をとったデータ
をどちらの階級に入れるか迷わないようにするための工夫である。
• 測定単位の桁で境界値を設定してもよい。
前回演習問題の答え
課題2 章末問題29のデータを用いて,度数分布表に
分類されたデータから分散の計算を行おう。
度数分布表
分類されたデータに対する分散の計算公式
x
1
n
k

i 1
xi f i
s 
2
1
n 1
k

i 1
( xi  x ) f i
2
1.序節
統計の授業なのに確率?
• 統計的な問題に対する解は確率的な表現に
よって与えられる.
• 母集団から標本を無作為抽出すれば,標本
においてどのような統計量(平均,分散など)
が得られるかは,確率的に決まる.
– 第4章以降での基本的考え方
• 近年注目されているベイズ統計学は,第3章
で学習するベイズの定理が基本.
確率 P
ある結果が必ず起きる … 確率 P = 1
決して起きない … 確率 P = 0
起きるか起きないか不確実 … 0 < 確率 P < 1
例:天気予報「明日雨が降る確率 30%」 P=0.3
意味:「明日雨が降る」という予想
それが当たる確率 P = 0.3
客観的側面 (頻度論)
同条件で何度も繰り返した時、その予想が当たって
いる割合。(実際には同一条件の繰り返しは困難)
主観的側面
その予報の信頼度
学習目標
• 確率に関する概念を理解する.
–
–
–
–
–
–
•
•
•
•
試行 (trial)
標本空間 Ω (sample space)
事象 E (event)
単一事象 (simple event)
複合事象 (composite even)
事象演算
確率の公理
排反の概念と,加法定理を理解する.
条件つき確率と,乗法定理を理解する.
独立事象の概念を理解する.
2.標本空間
• 同一の条件のもとで繰り返し行うことのできる「実
験」を考える.
– 例:コインを2回投げて,表および裏の系列を観察する.
– 同一の条件のもとで繰り返されることが前提とされてい
る実験や観察において,1つの事象を生起させる過程
を試行(trial)という.芝・渡部・石塚『統計用語辞典』(新曜社)
– つまり、ある 1 回または 1 組の実験や現象。
– コインを2回投げる実験での,1回のコイン投げ.
• 標本空間( sample space):実験における可能
な結果を表す点(「標本点」と呼ぶ)全体の集
合のこと. 「Ω」で表す.
• 個々の可能な結果を単一事象(simple event)
あるいは根元事象(original event)と呼ぶ.
「ei」で表す
– 例:2回のコイン投げでの,表と裏の系列.
– ややこしいことに,1回の試行の結果も事象と呼
ばれる.何を観察するかである.
• Ω = { e1 , e2, … }
• 例:1枚の硬貨を2回投げる実験において,可能な結
果は,HH, HT, TH, TT の4通り.これらの結果をそれぞ
れひとつの点で表す.
HH
HT
TH
TT
e1
e2
e3
e4
𝜴={HH, HT, TH, TT}
={e1, e2, e3, e4}
2つのサイコロの目の標本空間
• 例:2つのサイコロ …
6×6 = 36個の根元事象
( 1, 6 ) ( 2, 6 ) ( 3, 6 ) ( 4, 6 ) ( 5, 6 ) ( 6, 6 )
( 1, 5 ) ( 2, 5 ) ( 3, 5 ) ( 4, 5 ) ( 5, 5 ) ( 6, 5 )
( 1, 4 ) ( 2, 4 ) ( 3, 4 ) ( 4, 4 ) ( 5, 4 ) ( 6, 4 )
( 1, 3 ) ( 2, 3 ) ( 3, 3 ) ( 4, 3 ) ( 5, 3 ) ( 6, 3 )
( 1, 2 ) ( 2, 2 ) ( 3, 2 ) ( 4, 2 ) ( 5, 2 ) ( 6, 2 )
( 1, 1 ) ( 2, 1 ) ( 3, 1 ) ( 4, 1 ) ( 5, 1 ) ( 6, 1 )
• 確率の問題では,適切な標本空間を構成す
ることが基本.
– 可能な結果一覧を表現する.
– 1回の実験(試行)で,いずれかひとつの単一事
象だけが生じる.
• 少し複雑な問題では,標本点を図示するのに,
樹形図(テキスト p.58,確率の木)を用いると
よい.あとで具体例を示す.
• 2回の試行の標本空間は,2次元で表現する
こともできる.
– 例:章末問題2
赤(R),黒(B),緑(G)球が
1個ずつ入った箱から,2個
の球を取り出すときの標本空
間.
(1度取り出した球は箱に戻さ
ない)
G
B
R
R
B
G
• 練習問題
黒球が2個、白球が1個入った箱がある。この箱か
ら同時に2個の球を取り出す実験で、
(a)6個の標本点を用いる標本空間、
(b)3個の標本点を用いる標本空間、をつくれ
(答え)
W
B2
W
B1
B
B1
B2
(a)
W
B
W
(b)
3.(単一)事象の確率
• 標本空間を構成したら,各点に確率(probability)を付与する.
• 実験を繰り返したとき,全実験回数に対する,特定の単一事象
が生起した割合を考えることができる.これをその単一事象の相
対度数(relative frequency)と呼ぶ.すべての単一事象にわたっ
て相対度数を合計すると1になる.
• ある単一事象が生起する,経験的あるいは理論的な相対度数を,
その単一事象の確率とする.標本点 e1 に付与された確率を P(e1)
で表す.
• 標本空間を構成する n 個の単一事象の生起頻度(相対度数)が
すべて同じ(「同様に確からしい」)と考えられるならば,
P ( ei ) 
1
n
( i  1, 2 ,  , n )
• 例:1枚の硬貨を2回投げる実験において,
起こりうる結果は,HH, HT, TH, TT の4通り.こ
の実験を何度も繰り返し行えば,それぞれの
結果が生じる相対度数は ¼ となるだろう.そ
こで,それぞれの事象に確率 ¼ を付与する.
HH
HT
TH
TT
e1
e2
e3
e4
𝑃 𝑒1 =
1
4
𝑃 𝑒2
1
=
4
𝑃 𝑒3 =
1
4
𝑃 𝑒4 =
1
4
4.複合事象の確率
• 単一事象の集まりを複合事象(composite event)と呼ぶ.
• 複合事象 A がおこる確率は,A を構成している単一事象の確率
の和である.(テキストp.42)
 例:硬貨を3枚投げた時,表が2回出る確率 P(A) を考える.
標本空間を構成する8つの単一事象のうち,これに該当する
のは,HHT, HTH, THHの3つ.それぞれの単一事象の確率は
1/8 だから,
HHH HHT HTH THH HTT THT TTH TTT
e1
e2
P ( A) 
e5
e4
e3
1
8

1
8

1
8
e6

3
8
e7
e8
• 事象(event) : 標本空間Ωの部分集合
例:サイコロ投げを考えよう.ただし, Ω ={1, 2, 3, 4, 5, 6}とする.
このとき,サイコロを投げたときに偶数の目が出る事象Eとは,サ
イコロ投げによって得られた結果(サイコロの目)(ei ) が,
ei ∈ E={2, 4, 6}を満たすことをいう
Ω
• 事象の演算
E
Ω
Ω
Ω E
Ω E
E
E
𝐸∪𝐹
F𝐹
𝐸∩
𝐸−𝐹
F
F
F
(事象)例:「統計学」でどのような成績(評点)が得ら
れるか,その確率的な情報も含めて議論をしたい.
情報科学類では「履修放棄(X)は評点には用いてはならな
い」とされていることを反映させると,
標本空間Ω ={A+,A,B,C,D}となる.
このとき,「統計学の単位が取れる」という事象Eは,
E ={A+,A,B,C}と表すことができる.
「評点B以下は良い成績とはみなさない」という人で
あれば,「良い成績で単位が取れる」という事象Fは,
F = {A+, A}と表すことになる.
• 2つの事象 E と Fが,一方が起これば他方は決して起こらないとい
う性質をもつとき,これらの事象は互いに排反(mutually exclusive)
であるという.
つまり、E∩ 𝐹=∅
事象E = { e1 (E) , e2 (E), … } ⊂ Ω
• 標本空間 Ω の任意の部分集合。
例:目の和が奇数 E = { (1, 2), (2,1), …, (5, 6) }
目の和が偶数 F={ (1, 1), (3,1), …, (6, 6) }
EとFは互いに排反
2つのサイコロの目の標本空間
( 1, 6 ) ( 2, 6 ) ( 3, 6 ) ( 4, 6 ) ( 5, 6 ) ( 6, 6 )
事象 E の起きる
確率 P(E) =
事象 E を構成する各根元事象の確率の和
P(E) = P(e1 (E)) + P(e2 (E)) + …
例: 1/36 + … + 1/36
= 18/36 = 1/2
( 1, 5 ) ( 2, 5 ) ( 3, 5 ) ( 4, 5 ) ( 5, 5 ) ( 6, 5 )
( 1, 4 ) ( 2, 4 ) ( 3, 4 ) ( 4, 4 ) ( 5, 4 ) ( 6, 4 )
( 1, 3 ) ( 2, 3 ) ( 3, 3 ) ( 4, 3 ) ( 5, 3 ) ( 6, 3 )
( 1, 2 ) ( 2, 2 ) ( 3, 2 ) ( 4, 2 ) ( 5, 2 ) ( 6, 2 )
( 1, 1 ) ( 2, 1 ) ( 3, 1 ) ( 4, 1 ) ( 5, 1 ) ( 6, 1 )
確率の定義について
(1) 数学的確率
ある試行において,同程度の確からしさで起こることが期待される
場合の数をN,そのうち,あることがらAが起こる場合の数をrとする
とき, r/Nを「Aが起こる確率」という.
【前提】1.Nは有限確定
2.試行の結果として起こり得る各場合は,「同程度の確から
しさ」を持つ
例1)「正しく作られたサイコロ」を振ったときに「1の目が出る確率
は1/6」である.
例2)成田からフランクフルトへ向かう直行便に乗ることになった.航空
機がハイジャックされることを恐れる人にとっては,自分が乗る便がハ
イジャック「される」,「されない」の2通りの場合がある.だからとい
って,「これから乗るフランクフルト行き直行便がハイジャックされる
確率は1/2である」といってよいだろうか?
確率の定義について
(2)統計的確率
n回の試行に対してAの起こる相対度数r/nを考える.nを
十分大きくしていくとき, r/nがほぼ一定値pに近づくな
らば,pを「Aが起こる確率」という.
【前提】同一条件の下で,何度でも反復して「Aが起こる
か否か」を試すことが許される
(問題)1.どれくらいのnであれば「十分大きい」とい
えるのだろうか?
2.n → ∞ のとき,r/n → p となる保証はあるのだろうか?
(これについては,「大数の法則」で詳述する)
確率の公理(コルモゴロフ)
[公理1] 任意の事象 E⊂Ω について
0 ≦ P(E) ≦ 1
(万が一、百万人に1人 → 値の標準化)
[公理2] P(Ω) = 1 (必ず一つの根元事象が起きること =
書き忘れている根元事象が無いこと)
[公理3]
5.加法定理
• 加法定理(addition rule):2つの事象 Aと B が
互いに排反ならば,
𝑃 𝐴 ∪ 𝐵 = 𝑃 𝐴 + 𝑃(𝐵)
条件つき確率
• ある特定の事象 A1 が起きた時に,事象 A2 が
起こる条件つき確率(conditional probability )
を P(A2|A1) と表わす.
• 標本空間を構成する単一事象の確率がすべ
て等しいとき,事象 A1 に該当する単一事象
の数を n(A1) ,事象 A1 と A2 の両方に該当す
る単一事象の数を n(A1 and A2) とすると,
P ( A 2 | A1 ) 
n ( A1 and A 2 )
n ( A1 )
積事象の確率と乗法定理
• 確率 P(A1) と,条件つき確率 P(A2|A1)がわ
かっているとき,積事象の確率 P(A1 ∩A2)を求
めることができる.
• 乗法定理(multiplication rule):
𝑃 𝐴1 ∩ 𝐴2 = 𝑃(𝐴1 ) × 𝑃(𝐴2 |𝐴1 )
A1 を時間的あるいは概念的に先行する事象にす
ると考えやすい.
条件つき確率:例
箱の中から球を
ひとつ取り出す
P (1番 | 白玉 ) 
1
1
1
2
2
2
2
2
P (1番 | 青玉 ) 
3
もとの標本空間とは分母が異なる!
1
4
例題
• 10本のくじのうち,3本があたりである.Aさ
んが最初にくじをひき,つぎにBさんがくじを
引く.Bさんがあたりくじを引く確率はいくつか.
引いたくじは元には戻さないものとする.
例題の標本空間
10本のくじのうち,3本があたりである.Aさんが最初にくじをひき,
つぎにBさんがくじを引く. 引いたくじは元には戻さないものとする
Bの結果
あたり
4つの事象は
互いに排反
はずれ
Aの結果
あたり
はずれ
• この例題で,10本のくじすべてを区別した場
合は,90個の標本点を含む標本空間が構成
される.
– 各標本点に付与される確率は 1/90
• ここで提示した標本空間は,90個の点を含む
標本空間において,区別しない点をまとめた
ものと考えられる.(章末問題7参照)
– それぞれの標本点に付与される確率は,まとめ
られた点の数に対応する.
加法定理
P 
3
10

2
9
「Aあたり,Bあたり」

7

10
3
9

3
10
「Aはずれ,Bあたり」
互いに排反
P(Bあたり|Aあたり)=2/9
P(Bあたり|Aはずれ)=3/9
条件つき確率
「Aあたり,Bあたり」
P 
3
10
加法定理

「Aはずれ,Bあたり」
2
9

7

10
3
9

3
10
乗法定理
P(Bあたり)
=P(Aあたり ∩ Bあたり) + P(Aはずれ ∩ Bあたり) =
P(Aあたり)P(Bあたり|Aあたり)+P(Aはずれ)P(Bあたり|Aはずれ)
樹形図(確率の木)での標本空間
3/10
7/10
2/9
Bあたり
7/9
Bはずれ
3/9
Bあたり
6/9
Bはずれ
Aあたり
Aはずれ
「合計が1」になっているのはどこ?
樹形図
乗法定理
条件つき確率
2/9
3/10
7/10
Aあたり
3/10 * 2/9
Bはずれ
3/10 * 7/9
3/9
Bあたり
7/10 * 3/9
6/9
Bはずれ 7/10 * 6/9
7/9
Aはずれ
Bあたり
「合計が1」になっているのはどこ?
3 2 3 7 7 3 7 6 6 + 21 + 21 + 42
× +
× +
× +
× =
=1
10 9 10 9 10 9 10 9
90
樹形図の描き方
• 特定の場面で生じるすべての事象の枝を描く.
– 枝分かれの繰り返しは時間順.あるいは考えや
すさの順.
– 次回学習するベイズの定理では,最初に「仮説」
で分岐させ,次に「データ」で分岐させる.
• 記入するもの
– 事象のラベル
– その事象が生じる条件つき確率
独立な事象
• 2つの事象 A1,A2について,一方の事象の生
起が,もう一方の事象の生起に影響しないと
き,これら2つの事象は独立(independent)で
あるという.
– 模擬試験の判定と,入試結果は独立ではない.
– 入試の朝にコインを投げる.コインの裏表と,入
試結果は独立である.
 「確率論」と「力学」は一般には異なる学問体系に属する科目
である.両科目に対する学生の嗜好や興味を持つ(持たない)
理由も同一ではないのがふつうであろう.したがって,「確率論」
の試験で優秀な成績をおさめることが,「力学」の試験で優秀
な成績をおさめることを意味することはない.すなわち,「確率
論」でよい成績を修めることと,「力学」でよい成績を修めること
は,独立事象であると考えてもよい.
 「確率論」を担当しているI教授が茶目っ気を起こして,今年の
「確率論」の試験問題は,今年度の「力学」の講義内容に即した
応用問題の文脈で作成してみようと考えたなら,話は別である.
そのような「確率論」の試験問題は,「力学」が得意な学生にとっ
ては願ってもないものであろう.試験後に成績を調べたとき,ま
だ「確率論」の成績が入力されていないものの「力学」の評点が
「A」となっていることが確認できれば,やがて「確率論」の評点欄
に「A」が記載される可能性は高いと期待できよう.すなわち,「確
率論」で好成績を修めることと,「力学」で好成績を修めることが
独立事象であるとは考えにくい.
独立な事象の乗法定理
• 2つの事象が独立ならば,条件つき確率を考
えるときでも,条件を考慮する必要がない.
𝑃 𝐴2 𝐴1 = 𝑃(𝐴2 )
• 独立な事象の乗法定理
𝑃 𝐴1 ∩ 𝐴2 = 𝑃 𝐴1 𝑃(𝐴2 )
排反と独立
• 事象の排反と独立を混同しないように!
– 排反:2つの事象が同時には生じないこと
– 独立:一方の事象の生起が,もう一方の事象の
生起に影響しない(情報を与えない)こと.
• 2つの事象 A,B が排反ならば,これら2つの
事象は独立ではない.
– A が生じたという情報が,B の生起に関する情報
を与えている.A と B が排反ならば,P(B|A)= 0 で
ある.P(B)≠ 0 ならば,P(B|A) ≠ P(B).
補足:確率の性質
確率の性質: 証明(1)
確率の性質: 証明(2)
演習課題
課題1:
(事象の演算に関する)
A,B,Cを三つの事象とする.次の各場合を表す式を書け.
例)Aだけが起こる.
答え)A ∩ 𝐵c ∩ 𝐶 c
説明)Aは起きるが、B,Cは起きないから
1 )A,Bが起きるがCは起こらない.
2 )少なくとも一つが起こる.
3 )少なくとも二つが起こる.
4 )一つだけが起こる.
5 )二つ起こるが三つともは起こらない.
演習課題
課題2:
(条件つき確率に関する)
A君は一目惚れの彼女に熱烈な手紙を出したが遂に返事は
こなかった.ただし出した先は,私信を検閲することで悪
名高い女子寮である。このとき,検閲に引っかかって彼女
の手に渡らない確率は30%,彼女がそれを見て好意を抱
いてくれても羞恥心から返事を書かない確率は70%,見
ても一笑してくずかごに投げ込む確率は50%だとする.
A君には何%の割合で望みが残されているだろうか.
名前と学籍番号をご記入のうえ、解答用紙(A4)を提出する。
提出先:工学部大学院棟7階
締め切り時間:
NO.7708室のドアのポストに入れてください
来週月曜日(5月18日) 午後5時まで