第3四分位数

Download Report

Transcript 第3四分位数

第8回授業(5/29日)の学習目標





検定と推定は、1つの関係式の見方の違いであることを学ぶ。
第3章のWEB宿題の説明
-宿題の実行期限 平成21年6月12日(金)
第3章 四分位数、中央値、四分領域の概念とその意味を
学ぶ。
第4章 中央値、四分領域の求め方、の概要を知る(ここま
で、終了)。
第3章の再演習(データを一部変えて)を通じて、平均、分散、
標準偏差の計算に習熟し、平均値の区間推定の方法にも慣
れる。
標本平均等からの母平均の区間推定
の方法の基本的枠組みの復習ー1

先週から今週のここまでの授業では、ある母集
団から N 個の標本を手にしたとき、標本平均及
び標本標準偏差からつぎの量 t 、すなわち
 sx 
t  ( x  0 ) /

 N 1 
を計算すると、この量 t の値が、つぎの区間に
入る確率が、
標本平均等からの母平均の区間推定
の方法の基本的枠組みの復習ー2

 
  
prob t N 1   t  t N 1   1  .
2
 2 

となることを用いてこの式を変形し、μ0 につい
て解くと、テキスト p.13 の (3.18) 式となること
を利用して、当該標本が得られたもとの母集
団の母平均の区間推定の公式が導けることを
学んだ。
標本平均等から母平均についての
ある種の仮説を検討する方法の概要ー1

これに対して、ある母集団から N 個の標本を手
にしたとき、標本平均及び標本標準偏差からつ
ぎの量
 sx 
t  ( x  0 ) /

 N 1 

 
   に入る確率を
t  t N 1  
が  t N 1    t , 2
 2 

考えてみよう。つまり、
自由度 v = N-1 の t-分布で、
横軸の値 t がこの図の斜線部に入る確率
裾野の両側
の斜線部の
合計が α
確
率
t- 分布
t
- t N-1(α/2)
1-α
t N-1(α/2)
検定の考え方の概要-1(参考)

上の分布の特徴からは、次式が成り立つ:

 sx 
 
prob t N 1    ( x  0 ) /
,
2
 N 1 

 sx 
  
( x  0 ) /
  t N 1    .
 2 
 N 1 
この式を変形し
x について解くと、つぎのよう
になる。すなわち、
検定の考え方の概要-2(参考)

    sx 
prob0  t N 1    
  x,
 2   N 1 


    sx 
x  0  t N 1    
   .
 2   N 1 
上式は、データが母平均μ0 なる母集団からの標
本ならば、標本平均が上記の範囲に入る確率
は α % である、ことを意味している。
検定の考え方の概要-3(参考)



ここでの αは、検定の文脈では危険率あるいは
有意水準と呼ばれる。
αは、通常、5% か1% が選ばれる。
また、「データが母平均μ0 なる母集団からの標
本である」という言明は、統計的検定の文脈で
は、帰無仮説と呼ばれ、つぎのように表記され
る:
H0 :   0
検定の考え方の概要-4(参考)


ところで、危険率 α が5% の場合、データが母平
均μ0 なる母集団からの標本ならば、標本平均が
上記の範囲のような極端な値を取る可能性は、
100回のサンプリングでも5回ぐらいしかないこ
とになる。
万が一、うえの帰無仮説のもとで、このような起
こり得そうもないことが起きた場合、我々はその
帰無仮説を捨てる。これを、統計学では、帰無
仮説を棄却する、という。さもなければ、我々は、
帰無仮説を採択する。これが、検定である。
第3章の WEB 宿題のやり方

つぎに、第3
章の WEB 宿
題のやり方を
、千野のホー
ムページを開
いて説明する
。
第4章 中央値、四分領域の求め方
の授業での学習内容の目標


この章は、データを用いた演習は行わず、四分
位数(第1四分位数、第3四分位数)、中央値、
四分領域の概念の理解のみを目標にする。
これらの概念の基本となるものは、つぎの図の
ように、まず数値を小さいものから大きい物へと
並び替え、小さい方から順に、全体を25パーセ
ントづつで区切るという点である。
四分位数と四分領域 Q の関係
Q = (Q3-Q1)/2
25%
25%
Q1
25%
Mdn
25%
Q3
中央値 (Median) の求め方

中央値の求め方は、「心理統計学 a」のテキストの p.17
の (4.1) 式の通りである。すなわち、
 N


Mdn  lm  h  cum(lm )  / f m , (4.1)

 2

• ここで、lm は、中央値のある階級の下限点、
• h は、階級の幅、
• cum (lm) は、中央値のある階級より1つ手前までの
累積度数、
• fm は、中央値のある階級の度数
第1四分位数 の求め方

第1四分位数の求め方は、「心理統計学 a」のテキスト
の p.17 の (4.2) 式の通りである。すなわち、
 N


Q1  lQ1  h  cum(lQ1 )  / fQ1 , (4.2)

 4

• ここで、lQ1 は、第1四分位数のある階級の下限点、
• h は、階級の幅、
• cum (lQ1) は、第1四分位数のある階級より1つ手前
までの累積度数、
• fQ1 は、第1四分位数のある階級の度数
第3四分位数 の求め方

第3四分位数の求め方は、「心理統計学 a」のテキスト
の p.17 の (4.3) 式の通りである。すなわち、
Q3  lQ3
  3N


 h
 cum(lQ3 )  / fQ3 , (4.3)

  4

• ここで、lQ3 は、第3四分位数のある階級の下限点、
• h は、階級の幅、
• cum (lQ3) は、第3四分位数のある階級より1つ手前
までの累積度数、
• fQ3 は、第3四分位数のある階級の度数
四分領域の求め方

これらにより、中央値 (Mdn)、第1四分位数
(Q1)、第3四分位数 (Q3) が求まったならば、テ
キスト p.16 の下方の公式により、
Q3  Q1
Q
2
として、四分領域 (Q) を求めればよい。