Transcript 第5回(5月14日)
統計学 第4回 西山 平均と分散の性質 ゲタの公式 EaX b aE X b V aX b a 2V X SDaX b a SDX 合計の公式 E X Y E X E Y XとYが独立なら、 V X Y V X V Y 分散の求め方 2 2 V X EX EX 【例題】サイコロの目の数をXとして EX 3.5 V X 2.92 SDX 1.71 Y=2X+1とします。 (1) E[Y]を求めなさい。 (2) V[Y]を求めなさい。 (3) SD[Y]を求めなさい。 69‐70ページ 【解答】 EY E2 X 1 2EX 1 2 3.5 1 V Y V 2 X 1 V 2 X 2 V X 2 2.92 2 2 (続き)練習問題【4】 1. E[X]=3、V[X]=2のとき、Y=3X+1とYを定義する。E[Y]とV[Y]を求 めなさい. 2.E[X]=-2、V[X]=4のとき を求めなさい. E X2 3.互いに独立な確率変数XとYについて、E[X]=1、V[X]=9、 およびE[Y]=-1、V[Y]=16がわかっている.このとき、 E X Y 25 の値を求めなさい. 2 (続き)分散=二乗の平均-平均の二乗 V X E X E X 2 2 問題: 1. 「分散=二乗偏差の期待(平均)値」を式で表現し なさい. 2. 上の公式(水色部分)を証明しなさい. たとえば確率変数X=サイコロの目 として、具体例で確認しましょう 常に平均を議論します サイコロの目の数をXとすれば(69‐70ページ) EX 3.5 V X 2.92 SDX 2.92 1.71 E X 3.5 2 EX EX EX EX 2 2 2 2 2 3.5 X 3.5 2 3.5 EX 3.5 2 3.5 3.5 3.5 2 2 2 2 2 第4回目のポイント 1. 2. 3. 4. これまでの変数は離散型 連続型の変数が大半を占める 連続型の分布のポイントは「面 積で確率を表す」 特に正規(ノーマル)分布 身長、体重、血圧、高さ、強さ、速さ、etc すべて連続型です 教科書: 2.3節(63頁) 正規分布の形 本当の分布として 当てはめて考えます Xがとる値の数が増えると・・ 確率分布図は、最後には、作れなくなります!! 0から1まで任意の値となると ・・・・ 連続型の確率分布 確率密度 1 0.2から0.9まで どんぴしゃり、X=0.5 に入る確率は0.7 となる確率はゼロ! です。これを式で書 これをうまく説明して くと・・ 面積で確率を示す 平均と分散の計算 期待値=値×確率の合計、に違いはなし Xの値を0から1までベターっと、値×確率を合計すると・・・ 1 x2 1 EX x 1dx 0 2 0 2 1 EX 2 1 x3 1 x 1dx 0 3 0 3 1 2 V X E X E X 2 SDX 1 0.29 12 2 2 1 1 1 3 2 12 正規分布の利用法①―標準値 1. 標準値にする. 2. 数値表を使う. 標準値をZとか、S.S.といいますが・・・ Xの値- Xの平均値 X E X 標準値= = Xの標準偏差 SDX 標準値は統計分析の定番ツール ある試験の得点分布をみると、平均値が300、標準偏 差が30だった。 A君は得点350だった 平均値を引いてから、標準偏差で割った値にしなさい。 標準値は1.7 別の試験では平均が500点、標準偏差が40点だった。 B君は得点555点だった A君とB君はどちらが好成績だったか? (参考)偏差値とは 平均値 標準偏差 350 30 -350 0 30 ÷30 0 1 0 1 ×10 0 10 +50 50 10 50 10 元の値 標準値 偏差値 血圧分布を例にとると N(130、400) 平均と同じなら (130-130)÷20 だから標準値は0 血圧150の標準値 標準軸から分布を 標準値が1を超え は みると平均0、標準 る人は全体の何% (150-130)÷2 偏差1になります いるだろうか? 0だから1となる X 正規分布の利用法②―数値表 N(0,1) 教科書の258頁 を見なさい S.Sが1.0以上にな る確率です! 例題 0.日本人の成人男性の身長はN(168,100)に従っ て分布しているとします。168センチ以上の割合 P(168 ≦ X)を求めなさい。 1. 平均値±標準偏差以内の範囲に含まれる割合 P(158 ≦ X ≦ 178)を求めなさい。この範囲 を1シグマ区間といいます. 例題(1)の解答 標準値にしてから数値表 身長の分布は平均 168、分散 100、標準偏差 10.だから 158 168 1 10 178 168 178 の標準値は Z 1 10 158 の標準値は Z よって P158 X 178 P1 Z 1 1 2 0.15866 0.68 1シグマ区間に全体の68%が含まれます 練習問題【1】 身長分布はN(168,100)の正規分布が当てはまって います。 身長の2シグマ区間はどんな範囲ですか?2シグマ 区間に全体の何%程度が含まれますか。2シグマ区 間とは標準値が-2から+2までの区間のこと。 練習問題【2】 身長分布はN(168,100)の正規分布が当てはまって います。 身長の3シグマ区間はどんな範囲ですか?3シグマ 区間に全体の何%程度が含まれますか。3シグマ区 間とは標準値が-3から+3までの区間のこと。 正規分布の確率法則 1シグマの法則 ◦ 標準値で-1から+1までの範囲 ◦ 「平均圏」、「普通の範囲」と呼んでいます ◦ 概ね3分の2、68%が含まれます 2シグマの法則 ◦ 標準値で-2から+2まで ◦ 95%圏のことです 3シグマの法則 ◦ 最大限、最小限を見込むときに使います