강의자료 7장

Download Report

Transcript 강의자료 7장

7
표본분포
1
모집단분포와 표본분포
2
표본평균의 분포
3
정규모집단에 관련된 분포의 응용
4
표본비율의 분포
1
1
모집단분포와 표본분포
모집단 분포와 확률표본의 의미, 표본분포와 통계량에 대하
여 알아본다.
2
▶
모집단 분포(population distribution) : 어떤 통계적 실험의
대상이 되는 모든 대상물인 모집단의 정보로부터 얻어지는 확률
분포
▶
모수(parameter) : 모집단의 특성을 나타내는 수치
모평균, 모분산, 모표준편차, 모비율, 모상관관계
• 대부분의 모집단 분포는 완전하게 알려진 것이 없으며, 따라서 모집단 분포의
정확한 중심의 위치나 산포도 등을 알 수 없다.
• 모집단의 확률분포를 비롯한 특성을 알기 위하여 전수조사를 한다는 것은
경제적, 공간적 또는 시간적인 제약에 의하여 거의 불가능
표본을 선정
3
어느 배터리 제조회사에서 특별
한 모델의 cell phone에 사용될
새로운 배터리를 생산하고자 한
다면,
?
추
론
이 회사에서 생산될 배터리의 수
명이 어떠한 확률분포에 따르는
지 알 수 없다.
따라서 몇 개의 배터리를 표본으
로 추출하여 실제로 cell phone에
사용하여 얻은 배터리 수명에 대
한 측정값을 구한다.
임의 추출
정보수집
그러면 이러한 측정값들(표본)은
이 회사에서 생산될 배터리들의
확률분포(모집단 분포)로부터 추
출된 표본을 구성하게 된다.
이때 앞으로 생산될 배터리의 수
명은 갖는 알려지지 않은 확률분
포 f(x)에 따른다.
4
▶ 확률표본(random sample) : 모집단을 형성하고 있는 모든
대상들이 선정될 가능성을 동등하게 부여하고, 객관적이고
임의적으로 각 대상을 선정한 표본
▶ 통계량(statistics) : 표본으로 산출된 통계적인 양
표본평균, 표본분산, 표본표준편차, 표본비율, 표본상관관계
통계량은 표본을 어떻게 선정하느냐에 따라서 그 값이 다르게 나타난다. 즉,
동일한 모집단에서 동일한 크기의 표본을 선정하더라도 각 표본의 평균은
서로 다르게 나타남.
•통계량은 확률변수
•통계량의 확률분포를 표본분포라 한다.
5
표본
모집단
x1
f(x) : 미지의 모집단 분포
x2
x3
x7
m : 모평균
x8
x9
s2 : 모분산
xn
x10
x1 : 첫 번째 추출된 관찰값
X1 ∼ f(x)
x2 : 두 번째 추출된 관찰값
X2 ∼ f(x)
E(Xi) = m
…
Var(Xi) = s2
xn : n 번째 추출된 관찰값
1
표본평균 : X =
n
x5
x6
Xn ∼ f(x)
n
S Xi
i=1
1 n
표본분산 : S =
S (Xi – X )2
n-1 i = 1
2
x4
1 n
관찰된 표본평균 : x =
S x
n i=1 i
1 n
관찰된 표본분산 : s =
S (xi – x )2
n-1 i = 1
2
6
생산된 10개의 배터리를 표본으로 추출하여 얻은 측정값
예
835 637 764 830 768 840 790 835 840 910
표본평균과 표본분산의 관찰값 = ?
1 10
관찰된 표본평균 : x =
S x = 804.9
10 i = 1 i
1
관찰된 표본분산 : s =
9
2
전체 배터리 수명
f(x) : 미지의 모집단 분포
10
S (xi – 804.9 )2 = 5488.77
i=1
표본
835
764
m : 모평균
840
s : 모분산
910
2
637
768
835
830
790
840
7
2
표본평균의 분포
표본평균의 평균과 모평균, 표본평균의 분산과 모분산의 관계
그리고 중심극한정리에 의한 표본평균의 분포의 변화, 두 독
립인 표본평균의 차에 대한 분포 등에 대하여 알아본다.
8
☞ 1) 표본평균과 모평균(비복원 추출)
x1과 x2 그리고 x가 취할 수 있는 모든 경우
63 76
80
84
77
63
79
91
84
80
2개
x1
x2
표본평균 : X =
x1 + x2
x1
x2
x
x1
x2
x
x1
x2
x
80
63
71.5
63
84
73.5
77
84
80.5
80
76
78.0
63
91
77.0
77
79
78.0
80
63
71.5
76
63
69.5
77
80
78.5
80
77
78.5
76
77
76.5
77
84
80.5
80
84
82.0
76
84
80.0
77
91
84.0
80
79
79.5
76
79
77.5
84
79
81.5
80
80
80.0
76
80
78.0
84
80
82.0
80
84
82.0
76
84
80.0
84
84
84.0
80
91
85.5
76
91
83.5
84
91
87.5
63
76
69.5
63
77
70.0
79
80
79.5
63
63
63.0
63
84
73.5
79
84
81.5
63
77
70.0
63
79
71.0
79
91
85.0
63
84
73.5
63
80
71.5
80
84
82.0
63
79
71.0
63
84
73.5
80
91
85.5
63
80
71.5
63
91
77.0
84
91
87.5
2
9
X 의 확률분포와 확률히스토그램
x
63.0
69.5
70.0
71.0
71.5
73.5
76.5
77.0
77.5
78.0
78.5
확률
0.0222
0.0444
0.0444
0.0444
0.0889
0.0889
0.0222
0.0444
0.0222
0.0667
0.0444
x
79.5
80.0
80.5
81.5
82.0
83.5
84.0
85.0
85.5
87.5
계
확률
0.0444
0.0667
0.0444
0.0444
0.0889
0.0222
0.0444
0.0222
0.0444
0.0444
1.00
X의 평균 : E(X) = 77.7
X의 분산 : Var(X) = 31.3
10
모집단의 확률분포
x
63
76
77
79
80
84
91
확률
0.2
0.1
0.1
0.1
0.2
0.2
0.1
모평균 : m = E(X) = 77.7
모분산 : s2 = Var (X) = 70.41
70.41 10 - 2
s2 N - n
•
•
=
= 31.3 = Var(X)
n N-1
2
10 - 1
• 표본평균의 평균과 모평균은 동일하다.
s2 N - n
•
• 표본평균의 분산 =
n N-1
11
☞ 2) 표본평균과 모평균(복원 추출)
x1과 x2 그리고 x가 취할 수 있는 모든 경우
84
77
x1
63 76
80
63
79
91
84
63
76
77
2개
79
80
x2
84
표본평균 : X =
76
77
79
80
84
91
63.0
69.5
70.0
71.0
71.5
73.5
77.0
0.04
0.02
0.02
0.02
0.04
0.04
0.02
69.5
76.0
76.5
77.5
78.0
80.0
83.5
0.02
0.01
0.01
0.01
0.02
0.02
0.01
70.0
76.5
77.0
78.0
78.5
80.5
84.0
0.02
0.01
0.01
0.01
0.02
0.02
0.01
71.0
77.5
78.0
79.0
79.5
81.5
85.0
0.02
0.01
0.01
0.01
0.02
0.02
0.01
71.5
78.0
78.5
79.5
80.0
82.0
85.5
0.04
0.02
0.02
0.02
0.04
0.04
0.02
73.5
80.0
80.5
81.5
82.0
84.0
87.5
0.04
0.02
0.02
0.02
0.04
0.04
0.02
77.0
83.5
84.0
85.0
85.5
87.5
91.0
0.02
0.01
0.01
0.01
0.02
0.02
0.01
x2
80
x1
63
x1 + x2
2
91
x
x 의 확률
12
X 의 확률분포와 확률히스토그램
x
63.0
69.5
70.0
71.0
71.5
73.5
76.0
76.5
77.0
77.5
78.0
78.5
확률
0.04
0.04
0.04
0.04
0.08
0.08
0.01
0.02
0.05
0.02
0.06
0.04
x
79.0
79.5
80.0
80.5
81.5
82.0
83.5
84.0
85.0
85.5
87.5
91.0
확률
0.01
0.04
0.08
0.04
0.04
0.08
0.02
0.06
0.02
0.04
0.04
0.01
X의 평균 : E(X) = 77.7
X의 분산 : Var(X) = 35.21
2
모분산 : s = Var (X) = 70.41
s2 70.41
=
= 35.21
2
2
• 표본평균의 평균과 모평균은 동일하다.
s2
• 표본평균의 분산 = n
13
☞ 3) 표본평균과 모평균의 비교
⊙ 모평균 m와 모분산 s2을 갖는 크기 N인 모집단으로부터 크기 n인
확률표본을 추출할 경우
구 분
평 균
분 산
모집단
m
s2
m = E(X)
s2 N - n
•
n N-1
m = E(X)
s2
n
비복원추출인 경우
X
복원추출인 경우
X
※ N이 충분히 크면 비복원 추출과 복원 추출이 동일한 결과를 나타낸다.
특별한 언급이 없는 한 복원 추출인 경우를 다룬다.
14
☞ 4) 중심극한정리에 의한 표본평균의 변화
주사위 2번 던지기 게임 (n=2인 경우)
표본평균 : X =
x 1 + x2
2
의 확률분포 ?
X1과 X2의 결합분포
X1과 X2가 취하는 값 : 1, 2, 3, 4, 5, 6
P(X1 = x, X2 = y) = P(X1 = x)• P(X2 = y)
(x1, x2)의 취하는 값 : (1, 1), (1, 2), …, (6, 6)
x=
x1 + x2
2
가 취하는 값 : 1, 1.5, 2, 2.5
3, 3.5 4, 4.5 5, 5.5, 6
x1
1
2
3
4
5
6
fX2(x)
1
1/36
1/36
1/36
1/36
1/36
1/36
1/6
2
1/36
1/36
1/36
1/36
1/36
1/36
1/6
3
1/36
1/36
1/36
1/36
1/36
1/36
1/6
4
1/36
1/36
1/36
1/36
1/36
1/36
1/6
5
1/36
1/36
1/36
1/36
1/36
1/36
1/6
6
1/36
1/36
1/36
1/36
1/36
1/36
1/6
fX (x)
1/6
1/6
1/6
1/6
1/6
1/6
1
x2
1
15
표본평균 X 의 확률분포 :
X
1
1.5
2
2.5
3
3.5
4
4.5
5
5.5
6
확률
0.028
0.056
0.083
0.111
0.139
0.166
0.139
0.111
0.083
0.056
0.028
표본 평균
E(X) = SxP(X=x) = 3.5
2
2
E(X ) = Sx P(X=x) = 13.7083
Var(X) = E(X2) – E(X)2 = 1.4583
모집단
모평균 : m = (1+6)/2 = 3.5
모분산 : s2 = (62 -1)/12 = 2.9167
m = E(X) = 3.5, s2 = 2Var(X) = 2.9167
16
주사위 3번 던지기 게임 (n=3인 경우)
표본평균 : X =
x1 + x2+ x3
3
의 확률분포 ?
표본평균 X 의 확률분포 :
X
1.00
1.33
1.67
2.00
2.33
2.67
3.00
3.33
확률
0.005
0.014
0.028
0.046
0.069
0.097
0.116
0.125
X
3.67
4.00
4.33
4.67
5.00
5.33
5.67
6.00
확률
0.125
0.116
0.097
0.069
0.046
0.028
0.014
0.005
m = E(X) = 3.5,
s2 = 3Var(X) = 2.9167
17
주사위 4번 던지기 게임 (n=4인 경우)
x1 + x2+ x3+ x4
표본평균 : X =
4
의 확률분포 ?
X
1.00
1.25
1.50
1.75
2.00
2.25
2.50
2.75
3.00
3.25
3.50
확률
0.001
0.003
0.008
0.015
0.027
0.043
0.062
0.080
0.097
0.108
0.113
X
3.75
4.00
4.25
4.50
4.75
5.00
5.25
5.50
5.75
6.00
확률
0.108
0.097
0.080
0.062
0.043
0.027
0.015
0.008
0.003
0.001
주사위 5번 던지기 게임 (n=5인 경우)
표본평균 : X =
x1 + x2+ x3+ x4 + x5
5
의 확률분포 ?
X
1.0
1.2
1.4
1.6
1.8
2.0
2.2
2.4
2.6
2.8
3.0
3.2
3.4
확률
0.0001
0.0006
0.0019
0.0045
0.0090
0.0162
0.0264
0.0398
0.0541
0.0693
0.0838
0.0945
0.1002
X
3.6
3.8
4.0
4.2
4.4
4.6
4.8
5.0
5.2
5.4
5.6
5.8
6.0
확률
0.1002
0.0945
0.0838
0.0693
0.0541
0.039
0.0264
0.0162
0.0090
0.0045
0.0019
0.0006
0.0001
18
● 모집단분포와 크기에 따른 표본평균의 분포 비교
n이 커질수록 표본평균의
분포는 종모양에 가까워
진다.
19
f(x) : 미지의 모집단 분포
Xi ~ i.i.d. f(x) ,
크기 n인 표본
2
m : 모평균, s : 모분산
E(Xi) = m,
i = 1, 2, 3, …, n
복원추출
E(Xi) = m, Var(Xi) = s2
Var(Xi) = s2 , i = 1, 2, 3, …, N
X=
1 n
S Xi의 평균과 분산 :
n i=1
E(X) = E
(n
S Xi =
i=1
Var(X) = Var
S.D(X) =
)
1 n
1 n
(n
S Xi
i=1
Var(X) =
1 n
1 n
1
n i=1
n i=1
n
S E(Xi) =
)
=
1
n
S m=
S Var(Xi) =
n2 i=1
1
(nm) = m
n
S s2 =
n2 i=1
1
(ns2) =
2
n
s2
n
s
n
s2
.
※중심극한정리에 의하여 미지의 모집단 분포 f(x)에 대하여 X ~
. N m, n
(
)
20
모집단 분포가 다음과 같은 모집단으로부터 비복원추출에 의하여 크기 2인
확률표본 X1, X2에 대한 표본평균의 확률분포와 평균 그리고 분산
x
1
2
3
4
f(x)
0.25
0.25
0.25
0.25
모집단 {1,2,3,4}에서 비복원추출에 의하여 크기 2인 확률표본을 뽑을 수 있는
모든 경우 :
{1, 2}, {1, 3}, {1, 4}, {2, 1}, {2, 3}, {2, 4},
{3, 1}, {3, 2}, {3, 4}, {4, 1}, {4, 2}, {4, 3}
X가 취할 수 있는 값들의 집합 : {1.5, 2, 2.5, 3, 3.5}
X = 1.5
{X1 = 1, X2 = 2}, {X1 = 2, X2 = 1}
X=2
{X1 = 1, X2 = 3}, {X1 = 3, X2 = 1},
X = 2.5
{X1 = 1, X2 = 4}, {X1 = 2, X2 = 3}, {X1 = 3, X2 = 2}, {X1 = 4, X2 = 1}
X=3
{X1 = 2, X2 = 4}, {X1 = 4, X2 = 2}
X = 3.5
{X1 = 3, X2 = 4}, {X1 = 4, X2 = 3}
21
비복원추출에 의하여 표본을 선정
P(X1 = i, X2 = j) = P(X1 = i)• P(X2 = j|X1 = i)
1 1
1
•
=
=
, i, j = 1, 2, 3, 4, i ≠ j
4 3
12
X의 확률분포 :
x
1.5
2
2.5
3
3.5
확률
1/6
1/6
2/6
1/6
1/6
E(X) =
1.5 + 2 + (2.5)•2 + 3 + 3.5
6
E(X2 ) =
= 2.5
2.25 + 4 + (6.25)•2 + 9 + 12.25
= 6.67
6
Var(X) = E(X2) – E(X)2 = 0.417
22
예제1의 모집단분포로부터 크기 10인 표본을 임의 추출하였을 때,
(1) X의 평균과 분산
(2) X가 2.75이상 3.5이하일 근사확률
모집단 분포 :
x
1
2
3
4
f(x)
0.25
0.25
0.25
0.25
(1) m = 2.5, s2 = 1.25, n = 10
m = 2.5,
X
s2X =
s2
= 0.125
10
.
(2) 표본평균의 근사분포 : X ~. N(2.5, 0.125)
P(2.75 ≤ X ≤ 3.5) = P
(
2.75 – 2.5
3.5 – 2.5
≤ X≤
0.354
0.354
)
.
=. P(0.71 ≤ Z ≤ 2.82) = F(2.82) – F(0.71)
= 0.9976 – 0.7611 = 0.2365
23
확률분포가 N(60, 4)인 모집단에서 크기 10인 표본을 임의 추출하였을 때,
(1) X 의 확률분포, 평균과 분산
(2) X 가 58.5 이상 61.5 이하일 확률
(1) X1, X2, …, X10 ~ i.i.d. N(60, 4)
E(X) = m = 60, Var(X) = s2/10 = 0.4
X=
1
SXi ~ N(60, 0.4)
10
58.5 – 60
61.5 – 60
P(58.5
≤
X
≤
61.5)
=
P
≤
X
≤
(2)
0.4
0.4
.
=. P(-2.37 ≤ Z ≤ 2.37) = 2[F(2.37) – 0.5]
(
)
= 2(0.9911 – 0.5) = 0.9822
24
고교 3학년 학생 1,000명을 대상으로 수학 모의시험을 실시한 결과
평균 68.3이고 분산 1.5인 정규분포
(1) 임의로 한 명을 선정하였을 때, 이 학생이 69점 이상일 확률
(2) 10명을 임의로 선정하였을 때, 이 학생들의 평균 점수가 69점 이상일 확률
(3) 10명의 평균 점수가 상위 5% 안에 들어가기 위한 최하 점수
(1) 임의로 선정한 학생의 점수 : X ∼ N(68.3, 1.5)
P(X ≥ 69) = P
( X –1.568.3
≥
69 – 68.3
1.5
)
= P(Z ≥ 0.57) = 1 - F(0.57) = 1 – 0.7157 = 0.2843
(2) 10명의 평균점수 : X ~ N(68.3, 0.15)
P(X ≥ 69) = P
(
X – 68.3
0.15
≥
69 – 68.3
0.15
)
= P(Z ≥ 1.81) = 1 - F(1.81) = 1 – 0.9649 = 0.0351
(3) z0.05 = 1.645이므로
P(X ≥ x0) =
P
(
(
X – 68.3
=P Z≥
≥
0.15
x0 – 68.3
0.15
x0 – 68.3
0.15
x0 – 68.3
)
)= P(Z ≥ z
0.05)
0.15
= 0.05
= z0.05 = 1.645 ;
x0 = 68.937 ; 69점이상
25
☞ 5) 두 표본평균의 차에 대한 확률분포
Xi ~ N(m1, s12 ), i = 1, 2, …, n ;
Yj ~ N(m2, s22 ), j = 1, 2, …, m ;
1 n
X=
S Xi ~ N(m1, s12 /n)
i
=
n 1
1 m
Y=
S Yj ~ N(m2, s22 /m)
m j=1
X와 Y가 독립이므로
s12 s22
X – Y ~ N m1 - m2, n + m
(
s12 = s22 = s2 이면,
(
X – Y ~ N m1 - m2,
(
1
1
s2
+
n m
)
) )26
임의의 확률분포인 경우
Xi ~ f1(x) ; 평균 m1, 분산 s12, i = 1, 2, …, n ;
Yj ~ f2(x) ; 평균 m2, 분산 s22, j = 1, 2, …, m ;
1 n
.
X=
S Xi ~. N(m1, s12 /n)
n i=1
1 m
.
Y=
S Yj ~
N(m2, s22 /m)
.
m j=1
X와 Y가 독립이므로
s12 s22
.
X – Y ~. N m1 - m2,
n +m
(
s12 = s22 = s2 이면,
(
)
.
X – Y ~. N m1 - m2,
( n1
+
) )
1
s2
m
27
남학생 200명과 여학생 150명을 임의로 선정한 결과 남학생의 평균 몸무게가
여학생의 평균 몸무게보다 22 kg이상 더 많을 근사확률
몸무게
평균
분산
남학생
69.75
12.25
여학생
47.25
15.15
남학생의 평균 몸무게 : X
여학생의 평균 몸무게 : Y
12.25
.
X ~
N
69.75,
.
200
(
) = N(69.75, (0.25) )
(
) = N(47.25, (0.318) )
15.15
.
Y ~. N 47.25,
150
2
.
2
X–Y ~
. N(22.5, (0.405) )
2
P(X ≥ Y +22) = P(X - Y ≥ 22) =
P
22 - 22.5
Y -22.5
≥ 0.4056 )
( X –0.4056
.
=. P(Z ≥ -1.23) = P(Z ≤ 1.23) = 0.8907
28
3
정규모집단에 관련된 분포의 응용
표본분산과 합동표본분산에 관련된 분포, 표본표준편차에 관
련된 분포 그리고 두 표본분산의 비(ratio)에 관한 분포 등에
대하여 알아본다.
29
☞ 1) 표본분산에 대한 확률분포
X ~ N( m, s2/n)
Z=
X-m
s
n
~ N(0, 1)
Z2 ~ c2(1)
n
S
Zi2 ~ c2(n) , i = 1, 2, …, n
i=1
, Zi ~ i.i.d N(0, 1), i = 1, 2, …, n
n
S
Zi2
i=1
1 n
S
(Xi – m) = 2 S [(Xi – X) + (X – m)]2
s i=1
i=1
n
S
(Xi – X)2 + n2 (X – m)2
i=1
s
X–m 2
n-1 • 1 n
2
= 2
S(X – X) +
n-1 i=1 i
s
s n
X–m 2
n-1 2
= 2 S +
s
s n
1
= 2
s
= 12
s
n
2
(
(
)
)
30
(
X–m
s
n
2
)
~ c (1)
n
2
n-1 2
2
S
~
c
(n-1)
s2
: 독립
S
Zi2 ~ c2(n)
i=1
n-1 2
E
S = n-1
카이제곱분포의 기대값 :
s2
모분산을 추정하기 위한 통계량 : V =
E(S2) = s2
n-1 2
S
s2
31
정규모집단 N(m, 25)에서 추출된 크기 5인 확률표본
[104, 110, 100, 98, 106]
(1) 카이제곱분포의 자유도를 구하고, 관찰된 통계량의 값
(2) S2이 (1)에서 구한 통계량의 값보다 클 근사확률
(1) 확률표본의 크기가 5이므로 카이제곱분포의 자유도는 4
104 + 110 + 100 + 98 + 106
표본평균 :
x=
표본분산 :
91.2
1 5
2
s =
S(x – 103.6) =
=22.8
4 i=1 i
4
5
= 103.6
2
모분산이 25이므로
관찰된 통계량의 값 : V =
4•(22.8)
n-1 2
=
= 3.648
S
25
s2
(2) ==> 문제 이상!!
32
정규모집단 N(m, 25)에서 크기 5인 확률표본을 추출할 경우,
(1) 표본분산 S2 이 37.44 보다 클 확률은?
(2) 표본분산 S2 이 12보다 작을 확률은
33
☞ 2) 동일한 모분산을 갖는 두 모집단에 대한 합동표본분산
Xi ~ N(m1, s2) , i = 1, 2, …, n
Yj ~ N(m2, s2) , j =1, 2, …, m
S21 =
1 n
S (Xi – X )2
n-1 i = 1
S22 =
1
S (Yj – Y )2
m-1 j = 1
n-1 2
2
2 S1 ~ c (n-1) ,
s
합동표본분산(pooled sample variance) :
S2p =
1
n+m-2
독립
m
[
n
m-1 2
2
2 S2 ~ c (m-1)
s
m
S (Xi – X ) + S (Yj – Y )2
i=1
2
j=1
]
34
합동표본분산의 확률분포
m
n
n+m-2 2
1
1
2
S p = 2 S (Xi – X ) + 2 S (Yj – Y )2
2
s
s i=1
s j=1
m
n
= n-1 • 1 S (Xi – X)2 + m-1• 1 S (Yj – Y)2
s2 n-1 i=1
s2 m-1 j=1
=
n-1 2 m-1 2
2 S2
2 S1 +
s
s
~ c2(n+m-2)
⊙ 합동표본분산의 다른 표현 방법 :
2
Sp =
1
2
2
[(n-1)S1 + (m-1)S2]
n+m-2
35
독립인 두 정규모집단 N(2, 25)와 N(5, 25)에서 각각 크기 5인 확률표본을 추출
2
P(Sp > 62.78) = ?
V = 8Sp2 / 25 ~ c2(8)이므로
P(Sp2 > 62.78) = P
8Sp2
( 25
>
8•(62.78)
25
) = P(V > 20.09) = 0.01
36
☞ 3) 표본표준편차에 관련된 확률분포
Xi ~ N(m, s2) , i = 1, 2, …, n
X-m
s
t- 분포의 정의 ( T =
X-m
s
n
n -1 2
S n -1
2
s
Z
V/r
=
n-1 2
2
2 S ~ c (n-1)
s
) 에 의하여
X-m
s
n
~ N(0, 1) ,
n
~ t(n-1)
37
예제 1에서 표본표준편차를 구하고, P(|X – m| < t0) = 0.99인 t0을 구하고,
표본평균의 관찰값 x를 이용하여 모평균 m의 범위를 구하여라.
예제 1에서
x = 103.6
s2 = 22.8, s =
X-m
이고
22.8 = 4.775 ,
X-m
s
n
=
한편, P(|T| < t0.005) = 0.99 ;
X-m
4.775
5
~ t(4)이므로
s
n
=
X-m
1.135
t0.005 = 4.604
구하고자 하는 t0 와 m의 범위 :
t0 = t0.005 • (1.135) = 4.604 • (1.135) = 5.226
|x – m| < 5.226 ;
|103.6 – m| < 5.226 ;
98.374 < m < 108.828
38
☞ 4) 합동표본표준편차에 관련된 확률분포
1 n
X = S Xi ~ N(m1, s12 /n)
n i=1
1 m
Y=
S Yj ~ N(m2, s22 /m)
m j=1
(
X – Y ~ N m 1 - m 2,
X - Y - (m1 – m2)
s
(1/n) + (1/m)
(
1
1
s2
+
n m
) )
n +m -2 S2 n + m -2 = X - Y - (m1 – m2)
p
Sp (1/n) + (1/m)
2
s
~ t(n + m – 2)
39
타이어 공정 방법
예전 방식과 새로운 방법에 의한 수명에 대한 예비실험 : 평균수명이 동일하다
새로운 방법에 의하여 생산된 타이어가 예전 방식에 의하여 생산된 타이어에
비하여 평균수명이 1,518㎞이상 더 클 확률
(단위 : 1,000㎞)
새로운 방법에 의한 평균 수명 : X
예전 방식에 의한 평균 수명 : Y
x = 62.58 ,
s21 =
s22
=
y = 58.84
1
S
(xi – 62.58)2 = 2.30
8
1
2
S
(y
–
58.84)
= 3.76
j
6
합동표본분산 : sp2 =
1
9+7-2
1
1
+
n m
sp•
=
새로운 방법
65.4
60.4
예전 방법
59.2
57.7
63.6
62.5
60.6
61.5
62.4
56.2
62.6
63.7
62.0
61.1
58.1
(8• s12 + 6•s22) = 2.926 , sp =
1
1
+
9
7
=
58.1
2.926 = 1.71
0.254 = 0.504
1
1
= (1.71)•(0.504) = 0.862
n +m
40
예비실험으로부터 두 모평균이 동일하다는 결론을 얻었으므로
mX – mY = 0
X - Y - (m1 – m2)
X- Y
=
~ t(14)
Sp (1/n) + (1/m)
0.862
구하고자 하는 확률 :
P(X - Y ≥ 1.518) = P
(X- Y
0.862
≥
1.518
0.862
)
= P(T ≥ 1.761) = 0.05
41
☞ 5) 두 표본분산의 비(ratio)에 관련된 확률분포
S21 =
1 n
S (Xi – X )2
n-1 i = 1
S22 =
1
S (Yj – Y )2
m-1 j = 1
m
n-1 2
2
2 S1 ~ c (n-1) ,
s
독립
m-1 2
2
2 S2 ~ c (m-1)
s
2
(n-1) S1 / s12
(n-1)
(m-1)
2
S2 /
(m-1)
s22
2
=
S1 / s12
2
S2 /
s22
~ F(n-1, m-1)
42
2
2
남학생의 폐활량 ~ N(m1, 1.2)
여학생의 폐활량 ~ N(m2, 1.0)
남•여학생 각각 16명과 20명씩 임의로 추출할 경우,
추출된 남학생과 여학생의 폐활량의 분산의 비가 x0이상일 확률이 0.05일 때,
x0 = ?
추출된 남학생의 표본분산 : S1
추출된 남학생의 표본분산 : S2
2
S1 / 1.2
2
S2 /
1.0
~ F(15, 19)
2
0.05 = P
S1 / 1.2
2
S2 /
1.0
2
=P
S1 / S22
1.2
> 2.23
= P(S1 / S2 > 2.676)
x0 = 2.676
43
4
표본비율의 분포
▶ 모비율(population proportion) : 모집단을 형성하고 있는
모든 원소 수에 대한 특정한 성질을 갖고 있는 원소 수의 비율 (p)
▶ 표본비율(sample proportion) : 확률표본을 이루는 원소 수에
∧
대한 특정한 성질을 갖는 원소 수의 비율 (p)
모집단의 원소의 수 : N
표본의 원소 수 : n
모집단이나 표본 안에 어느 특정한 성질을 갖는 원소의 수 : x
모비율 : p =
x
N
표본비율 : p∧ =
x
n
44
☞ 1) 표본비율에 관련된 확률분포
Xi =
1 , 표본의 i번째 성분이 특정 성질을 갖는 경우
0 , 그렇지 않은 경우
표본에서 성공의 횟수 : X = X1 + X2 + … + Xn
X
표본비율 : p = n =
∧
1 n
SX
n i=1 i
45
4•3절로부터
Xi ~ B(1, p), i = 1, 2, …, n
X ~ B (n, p)
E(Xi) = p, Var(Xi) = p(1-p)
E(X) = np, Var(X) = np(1-p)
∧
표본비율의 평균 : E(p)
= E(X/n) = p
∧
표본비율의 분산 : Var(p) = Var(X/n) =
p(1-p)
n
표본의 크기 n이 충분히 크다면,
np > 5, n(1-p) > 5이면
중심극한정리에 의하여
.
X
~
. N(np, np(1-p))
특정한 성질을 갖는 성분의 수의 확률분포 :
∧ .
표본비율의 확률분포 : p ~. N p, p(1-p)
n
(
)
46
지난 선거에서 A 후보자에 대한 지지도는 45.5%이었다. 이번에 보궐선거 실시
(1) 유권자 200명을 임의로 선정하여 조사한 결과 적어도 100명이 A 후보자를
지지할 확률
(2) A 후보자에 대한 보궐선거 지지율이 45%와 46% 사이일 확률
(1) A 후보자를 지지하는 유권자의 수 : X
n = 200, p = 0.455
np = 91, np(1-p) = 49.595
연속성수정에 의한
정규근사를 위하여
X ≈ N(91, 49.595)
P(X ≥ 100) = P
X - 91
49.595
≥
99.5 - 91
49.595
.
=. P(Z ≥ 1.21) = 1 – 0.8869 = 0.1131
47
(2) 200명의 유권자에 대한 A 후보자의 지지율 : ∧p
.
(0.455)•(0.545)
p∧ ~. N 0.455,
200
∧
P(0.45 ≤ p ≤ 0.46) = P
0.45 – 0.455
0.035
= N(0.455, (0.035)2)
∧
≤
p – 0.455
0.035
≤
0.46 – 0.455
0.035
.
=. P(-0.14 ≤ Z ≤ 0.14) = 2(F(0.14) – 0.5)
= 2(0.5557 -0.5) = 0.1114
48
☞ 2) 두 표본비율의 편차에 관련된 확률분포
p (1-p1)
.
p∧ 1 ~. N p1, 1
n
)
p (1-p2)
.
p∧ 2 ~. N p2, 2
m
)
(
(
.
p1 – p∧ 2 ~. N p1 – p2 ,
∧
∧
∧
(p
–
p2) – (p1 – p2)
1
p1(1-p1)
p (1-p2)
+ 2
n
m
.
~. N(0, 1)
p1(1-p1)
p2(1-p2)
+
n
m
표준화
49
대한가족계획협회에서 1998년 7월 미혼인 남자 470명과 여자 619명을 조사결과 :
남자 254명과 여자 223명이 성인전용 극장의 허용을 지지
이 사실을 기초로, 올해 남자와 여자 각각 1,000명씩 조사할 경우,
지지율의 차가 15%이하로 줄어들 확률
남자의 지지율 : p1 =254/470=0.54
여자의 지지율 : p2 =223/619=0.36
지지율의 편차 : p1 – p2 = 0.54 – 0.36 = 0.18
남자와 여자 각각 1,000명씩 조사하므로
p1(1-p1)
p (1-p2)
+ 2
n
m
=
(0.54)•(0.46)
1000
+
(0.36)•(0.64)
1000
= 0.022
∧
∧
(p
1 – p2) – 0.18 .
~. N(0, 1)
지지율의 차의 확률분포 :
0.022
∧
∧
P(p1 – p2 ≤ 0.15) = P
(p∧ 1 – p∧ 2) – 0.18
0.022
≤
0.15 – 0.18
0.022
.
=. P(Z ≤ -1.36) = 1 - F(1.36) = 1 – 0.9131 = 0.0869
50
제7장
51