統計のばらつき(sb08)

Download Report

Transcript 統計のばらつき(sb08)

統計の基礎
第8回
ばらつきの指標
6月10日
母集団の推測
•
•
•
•
•
•
第8講 ばらつきの指標 ⑧6月10日
第9講 確率の基礎 ⑨6月17日
第10講 各種分布⑩6月24日
第11講 中心極限定理 ⑪7月1日
第12講 推定 ⑫7月8日
第13講 検定 ⑬7月15日
• 内容を積み上げて理解するので、
しっかりと復習するとともに、
入手した教科書を参考に多面的に理解するよ
うに努めること。
• 多様な視点から検討するので、自分でしっかり
と理解するように努めること。
例; 母集団の平均
標本の平均、
母集団から出現が予想される標本の平均
標本から予想される母集団の平均
ばらつきの指標
【目標】
• 統計データの分布状況を説明するため、ばら
つきの指標(標準偏差)について理解する。
【構成】
1.ばらつきの図表現
2.ばらつきの統計量
3.変動係数
4.標準化
5.チェビシェフの不等式
1.ばらつきの図表現
①ヒストグラム
Excel
分析ツール
パレート図は累積図
COUNTIFS
再計算が可能
②箱ヒゲ図
• 四分位値により作成
QUARTILE
Excelには直接図化する機能はない
③スカイライングラフ
• PERCENTILEを活用して図化
横軸 10%の境界
縦軸 10%の大きさ/横軸の幅
密度での表現
散布図による描写
VLOOKUPの活用
面積が10%
2.ばらつきの統計量
• 中心との偏差 和が最小になる指標
①中央値との偏差 絶対値の和が最小となる
②平均との偏差
和は0 ⇒ 平方の平均 (平方和/個数)
標準偏差の算出
• 偏差平方=偏差×偏差
• 偏差平方和=偏差平方の合計
・・・「変動」と言うことがある。
• 分散=偏差平方和/個数 (偏差平方の平均)
• 標準偏差=分散の平方根
標準偏差の活用
• 分布型で標準偏差を尺度として割合が決まる
(今後説明していく)
• s、d、σ
加重平均→期待値
• 平均、分散はそれぞれ
変数、偏差平方を加重平均したもの
加重平均は、期待値の概念と共通
(期待値は今後説明)
※Excel基本統計量の確認
平均
標準誤差 =σ/√(n)
中央値 (メジアン) =MEDIAN( )
最頻値 (モード) =MODE( )
標準偏差 =STDEV()母集団値の推計
=STDEVP( )データが母集団そのものの場合
分散 =VAR( )母集団値の推計
=VARP( )データが母集団そのものの場合
尖度 =SKEW( )
歪度 =KURT( )
範囲
最小 =MIX( )
最大 =MAN( )
合計 =SUM( )
標本数
3.変動係数
• 尺度の違いを超えて、ちらばり度合を見る
• 平均で割る ν(ヌー)=s/m
4.標準化
• ①平均の移動 平均=0
• ②標準偏差の調整 標準偏差=1
Z=(x-m)/s
標準化の目的
• 分布型の基本表と照合する
• 異なる尺度の指標を合成する
例 銀行の規模比較
預金残高?、行員数?、・・・
どの程度の位置にいるか
豊かさ指標
• 偏差値(学力評価) さらに10倍して50を加える
5.チェビシェフの不等式
X;確率変数
m;平均値
s;標準偏差
• 平均値から標準偏差のk倍乖離した範囲の
相対度数(確率)の下限が分かる。
例;k=2 ⇒ 3/4 以上
k=3 ⇒ 8/9 以上
k=4 ⇒ 15/16 以上
(確率については来週検討)
【時間末レポート】 6月10日
標準偏差を求めよ
所持金(万円)
1
2
3
4
5
6
7
8
9
10
5
3
7
5
6
8
4
2
6
4