Transcript 基準化変量と歪度、尖度
データ分布の特徴
基準化変量
歪度
尖度
基準化変量(Standardization)
与えられたデータ x1 , x2 , , xn に対して.
xi x
Zi
Sx
で定義される変量を基準化変量という。
基準化変量の性質
Zはn個あるが、Zの平均値と標準偏差を求めると
z 0
Sz 1
この基準化の意味はデータの平均値を0にし、そこ
からの散らばりを1にして、データの持っている他の
特徴を調べる基礎を作ることが狙いである。
基準化の効果
データのバラツキ状況を絶対値1の中にある程度
集中される。
異なる単位のデータに対して比較可能性を与える。
基準化変量Zに対して
Z Z Z n
2
1
2
2
2
n
したがって、ΣZ=0より、|Z|が取りうる値の最大値が
たかだか
n/ 2
歪度(Skewness)
データの分布が左右対称かどうかを示す歪
度は次の式で定義される。
n
n
1
3
3 Zi
n i1
( x x)
i 1
i
nS
3
x
3
左右対称分布の判断基準
歪度=0のとき、データが左右対称分布
Mo Me X
歪度>0のとき、データが右に歪んだ分布
Mo Me X
歪度<0のとき、データが左に歪んだ分布
Mo Me X
尖度(Kurtosis)
基準化変量に基づいたデータ分布の峰が一
つの場合、その分布の尖りを測る統計量が
以下のように定義される。
n
n
1
4
4 Zi
n i 1
( x x)
i 1
i
nS
4
x
4
データ分布の尖りの判断基準
尖度>3 鋭峰分布
尖度=3 正規分布
尖度<3 鈍峰分布
度数系列の歪度と尖度
歪度
3
n
f
尖度
4
fZ
1
i 1
n
i 1
i
n
fZ
1
n
f
i 1
i
3
i
i 1
i
i
4
i