Transcript 第2回

土木計画学
第2回:10月5日
計画における調査法
担当:榊原 弘之
本日の内容
1.計画における調査法について説明する.
2.土木計画と不確実性,確率理論の基礎
について説明する.
土木計画における循環的なプロセス
問題の明確化
YES!
意思決定
Decision Making
調査
NO!
OK?
予測
解釈と評価
代替案の設計
1.計画における調査法
全数調査と標本調査(P50)
全数調査(complete survey,悉皆調査)
・調査対象者全員(母集団, population)を回答者とする
・国勢調査が代表例
・無意味な場合もある(品質試験など)
“The entire set of individuals or objects of interest”
標本調査(sample survey)
・調査対象者の一部を一定の手順で選び出し,回答者とする
・選び出した調査対象のことを標本(sample)と呼ぶ.
・時間や費用が節約できる
・通常の世論調査などが代表例
・ほとんどの調査は標本調査
“A portion, or part of the population of interest”
国勢調査データの例
2000年国勢調査
メッシュ人口データ
宇部新川 工学部
フジグラン
標本抽出の方法(P51)
Sample
抽出(Sampling)
Population
•どの程度の精度が必要か?
•費用や労力の制約は?
(a)無作為抽出法(random sampling)
単純無作為抽出法
集落抽出法
層化抽出法
単純無作為抽出法
母集団の個体に番号をつけ,乱数に基づいて抽出
1.○ ○ ○ ○
2. ○ ○ ○ ○
3. ○ ○ ○ ○
.......
母集団の表
(住民基本台帳,電話帳,...)
系統抽出法
最初の一個体を乱数で選び,そこから一定間隔で標本を
抽出する.
すべての個体に番号を付ける労力
母集団表を得ることの難しさ
(b)集落抽出法
(c)層化抽出法
母集団をいくつかの集団に分割し,まずその集団を
抽出する.
(b)集落抽出法
集団間の違いを極小に,集団内の違いを極大に
(c)層化抽出法
集団間の違いを極大に,集団内の違いを極小に
抽出
母集団
抽出
抽出
回答のとり方による調査方法の分類(p66)
個人面接法(Interview survey)
調査員が回答者を訪問して一定の書式に従って質問し,
回答を記録する.
長所
きめ細かな情報収集が可能,高い有効回答率
短所
経費がかかる,調査員の能力に依存しやすい
プライバシーに関わることはききにくい
配布回収法(留め置き法)
調査員が訪問の上調査票を届け,回答者自身に記入させる.
一定の期間をおいた後に調査員が再び訪問して回収する.
長所
調査員が多くの対象を担当することができる.経費が安く済む.
相手が不在でも調査票を留め置くことができる.
回収率を高くすることができる.
プライバシーに関わる質問に答えやすい.
短所
回答者が記入するので,不正確になりがちである.
郵送法(mail survey)
調査票を郵送し,回答者自身に記入してもらった上で返送して
もらう.
長所
遠隔地の回答者に対しても調査ができる.
経費が安く済む.
プライバシーに関わる質問に答えやすい.
短所
回答率が低い(半分以下)
回答者が記入するので,不正確になりがちである.
電話法
調査員が一定の書式に従って電話で質問する.
長所
迅速に調査ができる.
短所
電話を有する世帯にしか調査ができない
(携帯電話普及後の問題)
調査対象の協力が得にくい
質問数が限定される
その他,インターネット調査など
Sample
Population

2

母集団の平均値(母平均)
母集団の分散(母分散)
母集団中のある値の比率(母比率) p
標本平均 X
標本分散(不偏分散) U 2
標本中の比率 P
? わからない!
標本調査において,母集団の平均や分散などを直接知ることは
できない.
標本から母集団のパラメータを推定するための手法
統計的推定手法
(Statistical estimation)
標本調査における利用法
・必要な標本数の算出
・推定値の信頼区間の算定
統計的手法を用いれば,標本調査でも十分実用に耐える
結果を出すことができる.
統計理論の復習
収集されたデータから特性を明らかにする.
度数分布表(Frequency table)
データが取り得る値をいくつかの区間に分けておき(カテゴライズ),
各カテゴリーに該当するデータの個数(度数)を表にまとめる.
ヒストグラム:度数分布を度数を高さとする長方形で表したグラフ
(Histogram)
15
身長
140cm~150cm
150cm~160cm
160cm~170cm
170cm~180cm
180cm~190cm
度数
2
8
18
10
3
度
数
10
5
0
150.00
160.00
170.00
var00001
180.00
代表値の例
標本平均(sample
mean)
n
X

f i xi
xi (i  1,2,...,n) i 番目の観測値
n
fi
i 1
i 番目の観測値の度数
パーセンタイル(percentile)
P( X  Qp )  p
メディアン(中央値)(median)m
P( X  m)  0.5
50パーセンタイル値
モード(mode)(最頻値)
度数が最大となる観測値
Q0.5
散布度(dispersion)の指標
分散
(variance)
2
f
{
x

x
}
 i i
2
sx 
n
2
f
x
 i i
 fi xi
 fi 2

2
x
x
n
n
n
2乗の平均-平均の2乗
標準偏差
(standard deviation)
sx  sx2
変動係数
(coefficient of variation)
sx
CV 
x
複数の調査項目間の相関の有無の検討
クロス集計表(p80)
共分散
(covariance)
sxy 
 fij {xi  x}{y j  y}
i
相関係数
(correlation coefficient)
j
n
sxy
r
sx s y
リスク=確率×被害額
土木技術者の身近なリスク
1.自然災害(地震,洪水,渇水,土砂災害..)
人間の活動によってリスクの大きさは変化する.
2. 経済・社会状況に関するリスク
需要予測のリスク
3. 設計上のリスク
部材強度,自然条件など
4.メインテナンス上のリスク
劣化スピードの不確実性
5. 経営上のリスク
入札,資金調達
どう対応するか?=リスクマネジメント
リスクコントロール:リスクの基となる要因を制御すること
リスク分散:事象が発生したときの被害を広く薄く分散すること
確率理論
統計理論
そのための基本情報を与える
・期待値
・信頼区間
結果の予測
確率モデル
・パラメータ推定
・妥当性検証(検定)
確率理論
観測データ
統計理論
確率の基本概念
標本空間(sample space):
観測される可能性のあるすべてのデータの集合

標本点(sample points):
標本空間中の個々の状態,標本空間の要素
事象(event):標本空間の部分集合,標本点の集合

A
A
事象の種類
全事象,空事象(impossible event),
余事象(complementary event),
和事象(union),積事象(intersection)
相互に排反
(mutually exclusive)
分割
(partition)
公理論的確率論
確率の公理
1.標本空間に含まれる任意の事象Aに対して次の確率が
存在する.
0  P( A)  1
2.全事象の確率は1である.
3.事象AとBが相互に排反であるとき次式が成立する.
P( A  B)  P( A)  P(B)
A
B
加法定理(addition law)
事象AとBが相互に排反でないとき
P( A  B)  P( A)  P(B)  P( A  B)
A
B
独立(independent)
次式が成立するとき,事象AとBは独立であるという.
P( A  B)  P( A)  P(B)
条件付確率 (conditional probability)
P( A | B)
Bが生起したことがわかっているとき,
Aが生起する確率
P( A  B)
P( A | B) 
P(B)
事象AとBが独立な場合,
P( A | B)  P( A)
全確率の定理(total probability formula)
B1 , B2 ,..., Bn
が標本空間の分割であるとき,
事象Aの生起確率は,
P( A) 
n
 P( A | Bi )P(Bi )
i 1
A
B1
B2
Bn
ベイズの定理(Bayes’ Theorem)
B1 , B2 ,..., Bn
が標本空間の分割であるとき,
事象Aが起きた場合の事象Biの確率は,
P(Bi  A)
P(Bi )P( A | Bi )
P(Bi | A) 

n
P( A)
P(Bi )P( A | Bi )
i 1

A
B1
B2
Bn