강의노트

Download Report

Transcript 강의노트

확 률 변 수
2
1
이산확률변수
2
연속확률변수
3
기대값
1
이산확률변수
이산확률변수, 확률질량함수와 분포함수의 의미를 알아본다.
▶
확률변수(random variable) : 표본공간을 이루는 실험 결과를
실수로 대응시키는 함수 X
R
S
w
X
X(w)
▶ 상태공간(state space) : 확률변수 X가 취하는 모든 실수들의
집합
X : 주사위를 두 번 반복하여 던지는 게임에서 두 눈의 합
예
주사위를 두 번 반복하여 던질 때, 상태공간
표본공간 S
X의 상태공간 :
SX = {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}
예
X : 동전을 두 번 반복하여 던지는 게임에서 그림이 나온 횟수
동전을 두 번 반복하여 던질 때, 상태공간
표본공간
S = {(그림, 그림), (그림, 숫자), (숫자, 그림), (숫자, 숫자)}
X의 상태공간 :
SX = {0, 1, 2}
예
X : “1”의 눈이 나올 때까지 주사위를 던진 횟수
“1”의 눈이 나올 때까지 주사위를 던진 횟수에 대한 상태공간
표본공간
X의 상태공간 :
SX = {1, 2, 3, 4, 5, … }
▶
이산확률변수(discrete random variable) : 상태공간이
유한집합이거나 셈할 수 있는 무한집합인 확률변수 X
X : 동전을 두 번 반복하여 던지는 게임에서 그림이 나온 횟수
SX = {0, 1, 2}
X : 주사위를 두 번 반복하여 던지는 게임에서 두 눈의 합
SX = {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}
X : “1”의 눈이 나올 때까지 주사위를 던진 횟수
SX = {1, 2, 3, 4, 5, … }
X : 주사위를 두 번 반복하여 던지는 게임에서 두 눈의 합
X=2
A1 ={(1,1)}
P(X=2)=P(A1)=1/36
X=3
A2 ={(1,2), (2,1)}
P(X=3)=P(A2)=2/36
X=4
A3 ={(1,3), (2,2), (3,1)}
P(X=4)=P(A3)=3/36
X=5
A4 ={(1,4), (2,3), (3,2), (4,1)}
P(X=5)=P(A4)=4/36
X=6
A5 ={(1,5), (2,4), (3,3), (4,2), (5,1)}
P(X=6)=P(A5)=5/36
X=7
A6 ={(1,6), (2,5), (3,4), (4,3), (5,2), (6,1)}
P(X=7)=P(A6)=6/36
X=8
A7 ={(2,6), (3,5), (4,4), (5,3), (6,2)}
P(X=8)=P(A7)=5/36
X=9
A8 ={(3,6), (4,5), (5,4), (6,3)}
P(X=9)=P(A8)=4/36
X=10
A9 ={(4,6), (5,5), (6,4)}
P(X=10)=P(A9)=3/36
X=11
A10 ={(5,6), (6,5)}
P(X=11)=P(A10)=2/36
X=12
A11 ={(6,6)}
P(X=12)=P(A11)=1/36
▶ 확률질량함수(probability mass function) : 상태공간 안에
있는 xi에 대하여 확률 pi를 대응시키고, 상태공간 안에 있지 않는
x에 대하여 0으로 대응시키는 함수
f(xi) =
P(X = xi) , xi  SX
0
, xi  SX
=
pi , xi  SX
0 , xi  SX
f(x) =
X : 주사위를 두 번 반복하여 던지는
게임에서 두 눈의 합에 대한
확률질량함수
1
36
2
36
3
36
4
36
5
36
6
36
0
, x = 2, 12
, x = 3, 11
, x = 4, 10
, x = 5, 9
, x = 6, 8
,x=7
, 다른 곳에서
▶
확률분포(probability distribution) : 확률변수 X에 대응
하는 확률들의 집합
{pi : pi = P(X = xi), xi  SX }
☞
확률질량함수의 성질
f(x) ≥ 0
 f(x) = 1
확률변수 X가 취할 수 있는 값 1, 2, 3에 대하여, P(X = 1) = 0.3, P(X = 2) = 0.35
P(X = 3) = ?
확률질량함수를 f(x)라 하고, P(X = 3) = k라 하면
0.3 , x = 1
f(x) =
0.35, x = 2
k , x=3
확률질량함수의 성질 (2)에 의하여
f(1) + f(2) + f(3) = 1
P(X = 3) = f(3) = 1- f(1) - f(2) = 1 - 0.3 - 0.35 = 0.35
☞
확률을 구하는 방법
P(XB) =  f(x)
xB
주사위를 두 번 반복하여 던질 때,
두 눈의 합이 5이상 8이하일 확률 ?
X : 주사위를 두 번 반복하여 던지는
게임에서 두 눈의 합
5≤X≤8
구하고자 하는 확률
P(5 ≤ X ≤ 8) = f(5) + f(6) + f(7) + f(8)
4
5
6
5
5
= 36 + 36 + 36 + 36 = 6
X : 동전을 두 번 던지는 실험에서 앞면이 나온 횟수
X의 확률질량함수 ?
X를 앞면이 나온 횟수라 하면, X가 취하는 값 : 0, 1, 2
X=0
A = {TT}
X=1
B = {HT, TH}
X=2
C = {HH}
확률질량함수
1
확률 표
X
0
1
2
P(X=x)
1/4
1/2
1/4
f(x) =
4
1
2
0
, x = 0, 2
,x=1
, 다른 곳에서
▶
확률히스토그램(probability histogram) : 확률변수 X가
취하는 값 x를 중심으로 밑면의 길이가 1이고 높이가 확률 f(x)인
사각형으로 이루어진 그림
동전을 두 번 던지는 실험에서 앞면이 나온 횟수에 대한 확률히스토그램
남자아이와 여자아이가 태어날 확률이 동일하다 할 때, 세 명의 자녀를 둔
가족에 대하여 여자아이의 수를 X라 한다.
(1) X의 확률질량함수 f(x) = ?
(2) 여자아이가 적어도 두 명 이상일 확률.
(3) X의 확률 히스토그램.
(1)
b : 남자 아이, g : 여자 아이
표본공간 :
S = {(b,b,b), (b,b,g), (b,g,b), (g,b,b), (b,g,g), (g,b,g), (g,g,b), (g,g,g)}
각 표본점에 대한 확률은 동등하게 1/8
X : 여자 아이 수
1
X=0
{(b,b,b)}
X=1
{(b,b,g), (b,g,b), (g,b,b)}
X=2
{(b,g,g), (g,b,g), (g,g,b)}
8
X=3
{(g,g,g)}
0
f(x) =
8
3
, x = 0, 3
, x = 1, 2
, 다른 곳에서
(2) 여자아이가 적어도 두 명 이상일 사건 : {X ≥ 2} = {X = 2 or X = 3}
P(X ≥ 2) = P(X = 2) + P(X = 3)
=
(3) 확률히스토그램
3
8
+
1
8
=
1
2
주사위를 반복하여 두 번 던지는 게임에 대하여, 두 눈의 차 : X
(1) X의 확률 표와 확률질량함수 f(x) = ?
(2) 두 눈의 차이가 “1” 이하이면 이긴다고 할 때, 이 게임에서 이길 확률
(1) 주사위를 두 번 던져서 나온 눈의 수 : (i, j), i, j = 1,2,3,4,5,6
확률변수 : X = |i – j|, i, j = 1,2,3,4,5,6
상태공간 : SX = {0, 1, 2, 3, 4, 5}
X=0
A0 = { (1,1), (2,2), (3,3), (4,4), (5,5), (6,6)}
X=1
A1 = {(1,2), (2,1), (2,3), (3,2), (3,4), (4,3 ), (4,5), (5,4), (5,6), (6,5)}
X=2
A2 = {(1,3), (3,1), (2,4), (4,2), (5,3), (3,5), (6,4), (4,6)}
X=3
A3 = {(1,4), (4,1), (2,5), (5,2), (3,6), (6,3)}
X=4
A4 = {(1,5), (5,1), (2,6), (6,2)}
X=5
A5 = {(1,6), (6,1)}
각 사건에 대한 확률 :
P(A0) =
6
36
6
P(A3) =
36
10
36
P(A2) =
8
36
4
P(A4) =
36
P(A5) =
2
36
P(A1) =
확률 표 :
X
P(X = x)
0
1
2
3
1
6
5
18
2
9
1
6
4
1
9
5
1
18
(2) 두 눈의 차이가 “1” 이하인 사건:
{X ≤ 1} = {X = 0 or X = 1}
P(X ≤ 1) = f(0) + f(1) =
1
5
4
+
=
6
18
9
f(x) =
확률질량함수 :
1
, x = 0, 3
6
5
,x=1
18
2
,x=2
9
1
,x=4
9
1
,x=5
18
, 다른 곳에서
0
▶ 분포함수(distribution function) : x를 넘지 않는 모든 실수
u에 대하여 확률 f(u) = P(X = u)를 합한 누적확률
F(x) = P(X ≤ x) = u≤
 x f(u)
예
X : 동전을 두 번 반복하여 던지는 게임에서 앞면이 나온 횟수
X의 분포함수 F(x)
X < 0 에 대하여 u ≤ x 이면 f(u)=0
P(X ≤ x) = 
f(u) = 0
u≤ x
0≤ x< 1 에 대하여 u≤ x 이면
f(0)=1/4, f(u)=0
P(X ≤ x) =  f(u) = f(0) =
u≤ x
1
4
1≤ x< 2 에 대하여 u≤ x 이면
f(0)=1/4, f(1)= 1/2, f(u)=0
P(X ≤ x) =  f(u) = f(0) + f(1)
u≤ x
=
1
3
1
+
=
2
4
4
x ≥ 2 에 대하여 u≤ x 이면
f(0)=1/4, f(1)= 1/2, f(2)=1/4,
f(u)=0
P(X ≤ x) =  f(u) = f(0) + f(1) + f(2)
u≤ x
=
1
1
1
+
+
=1
2
4
4
X의 분포함수 :
0
1
4
3
4
F(x) = P(X≤ x) =
1
,x<0
,0≤x<1
,1≤x<2
,x≥2
불연속 점과 확률의 관계 : P(X = x) = F(x) – F(x-)
불연속 점
x=0
x=1
x=2
점프크기
1
4
2
4
1
4
확률변수 X = x
X=0
X=1
X=2
P(X = x)
1
4
2
4
1
4
예제 3에서, X의 분포함수 F(x)와 분포함수의 그림
X의 확률질량함수 :
f(x) =
1
8
3
8
0
x < 0 이면,
, x = 0, 3
, x = 1, 2
, 다른 곳에서
F(x) = P(X ≤ x) = 0
1
8
1 ≤ x < 2 이면, F(x) = P(X ≤ x) = f(0) + f(1)
0 ≤ x < 1 이면, F(x) = P(X ≤ x) = f(0) =
=
1
3
1
=
+
8
8
2
2 ≤ x < 3 이면, F(x) = P(X ≤ x) = f(0) + f(1) + f(2)
3
1
3
7
=
+
=
+
8
8
8
8
3 ≤ x 이면 , F(x) = P(X ≤ x) = f(0) + f(1) + f(2) + f(3) = 1
X의 분포함수
0
F(x) =
1
8
1
2
,x<0
,0≤x<1
,1≤x<2
7
8
,2≤x<3
1
,x≥3
X의 분포함수의 그림
X의 분포함수 :
0
F(x) =
, x < 10
0.30 , 10 ≤ x < 20
0.75 , 20 ≤ x <30
X의 확률질량함수 f(x) = ?
1.00 , 30 ≤ x
X의 분포함수는 x = 10, 20, 30에서 점프불연속이고, 각 점프크기 :
p1 = F(10) – F(10-) = 0.3 – 0 = 0.3
p2 = F(20) – F(20-) = 0.75 – 0.3 = 0.45
p3 = F(30) – F(30-) = 1 – 0.75 = 0.25
0.3, x = 10
0.45, x = 20
f(x) =
0.25, x = 30
0 , 다른 곳에서
☞
분포함수를 이용한 확률을 구하는 방법
(1) P(a < X ≤ b) = P(X ≤ b) – P(X ≤ a) = F(b) - F(a)
(2) P(a ≤ X ≤ b) = F(b) - F(a) + P(X = a)
(3) P(a ≤ X < b) = F(b) - F(a) - P(X = b) + P(X=a)
(4) P(a < X < b) = F(b) - F(a) – P(X = b)
예제 6에서,
P( 5 < X ≤ 15) = ?
P(15 ≤ X ≤ 25) = ?
분포함수와 질량함수가
0
F(x) =
, x < 10
0.30 , 10 ≤ x < 20
0.75 , 20 ≤ x <30
1.00 , 30 ≤ x
0.3, x = 10
0.45, x = 20
f(x) =
0.25, x = 30
0 , 다른 곳에서
이므로
P( 5 < X ≤ 15) = F(15) – F(5) = 0.3 – 0 = 0.3
P(15 ≤ X ≤ 25) = F(25) – F(15) + P(X=15) = 0.75 - 0.3 + 0 = 0.45
2
연속확률변수
연속확률변수, 확률밀도함수에 관한 개념, 연속확률변수의
분포함수와 확률의 기하학적 의미, 확률밀도함수와 분포함
수 사이의 관계 등에 대하여 알아본다.
▶ 연속확률변수(continuous random variable) : 확률변수
X가 취하는 값이 구간으로 나타나는 확률변수
새로 교체된 전구의 수명 : 상태공간 SX = { x : x ≥ 0 }
하루 동안의 온도 변화 : 상태공간 SX = { x : -20 ≤ x ≤ 40 }
▶ 확률밀도함수(probability density function) : 연속확률변수
X에 대하여 다음 조건을 만족하는 함수 f(x)
f(x) ≥ 0, for all x
S f(x)dx = 1
X
☞ 확률을 구하는 방법
P(a < X ≤ b) =
b
f(x) : p.d.f.
 f(x)dx
a
P(a≤ X ≤ b)
=
b
a f(x)dx
a
참 고
P(X=a) = P(a ≤ X ≤ a) =
a
=0
f(x)dx
a
P(a ≤ X ≤ b) = P(a < X ≤ b) = P(a ≤ X < b) = P(a < X < b)
b
반도체 칩의 수명에 대한 확률밀도함수
1
f(x) =
(x+1) 2
0
, x≥0
, x<0
(1) 칩의 수명이 6년 이하일 확률(수명의 기본 단위는 1년)
(2) 수명이 5년에서 8년 사이일 확률
(3) 최소한 4년 이상 사용할 확률
P(X≤ 6) =
6
0
1
dx
(x+1)2
6
1
1
= =7
x+1 0
+ 1=
6
7
P(5 ≤ X≤ 8) =
8
5
1 dx
(x+1)2
8
= - 1
x+1 5
1
1
1
+
=
6
9
18
=-
P(X ≥ 4) = 1 – P(X < 4)
=1-
4
0
1
dx
(x+1)2
4
=1- - 1
x+1 0
(
=1- -
1
1
+1 =
5
5
)
▶ 분포함수(distribution function) : 임의의 실수 x에 대하여
확률 P(X ≤ x)를 연속확률변수의 분포함수라 한다.
F(x) = P(X ≤ x) =
☞ 분포함수의 기하학적 의미
x
-∞ f(u)du
☞ 분포함수의 성질
(1) F(∞) = P ( X ≤ ∞) = 1 ,
lim F(x) = 1
(2) F(-∞) = P ( X ≤ -∞) = 0 ,
lim F(x) = 0
x→∞
x → -∞
(3) 모든 실수 x에 대하여 0 ≤ F(x) ≤ 1
(4) F(x)는 단조증가한다.
(5) F(x)는 우측 연속이다.
연속확률변수의 경우,
d
(6)
F(x) = f(x)
dx
(7) P(a < X ≤ b) = P(a ≤ X ≤ b)
=P(a ≤ X < b) = P(a < X < b)
= F(b) – F(a)
예제 1에 주어진 확률변수 X에 대한 분포함수 F(x) = ?
x < 0 이면,
F(x) = P( X ≤ x) = 0
x ≥ 0이면,
F(x) = P( X ≤ x)
=
0
x
x
1 du
1
1
=
=
1
2
(u+1)
u+1 0
x+1
확률밀도함수 : 0 ≤ x ≤ 6에서 2등변 삼각형
(1) 확률밀도함수 : f(x)
(2) 분포함수 : F(x)
(3) 확률 P(2 < X ≤ 5)
(1) 삼각형의 넓이가 1이므로
6• k• (1/2) = 1 ; k= 1/3
확률밀도함수 : f(x) =
x
9
- x + 2
9
3
0
, 0≤x<3
, 3≤x<6
, 다른 곳에서
(2) x < 0 이면, f(x) = 0이므로 F(x) = 0
0 ≤ x < 3 이면, f(x) = x/ 9이므로
F(x) =
x
0
x2
u du
=
9
18
x
2 이므로
+
3 ≤ x < 6 이면, f(x) = 9
3
F(x) =
x
0
f(u) du =
2
u du + x - u
+
3 9 3 du
9
3
0
x2
2
x-1
=+
18
3
6 ≤ x 이면, F(x) =
x
0
f(u) du =
0
3
0
u du +
9
6
3
- u + 2 du = 1
9
3
, x<0
x2
, 0≤x<3
18
분포함수 : F(x) =
x2
2
x-1 , 3≤x<6
+
18
3
1
(3) P(2 < X ≤ 5) = F(5) – F(2) =
, x≥6
4
17
13
=
18
18
18
3
기대값
기대값과 평균의 의미, 분포의 중심위치 척도, 확률분포의
분산과 표준편차, Chebyshev 부등식의 의미 등에 대하여
알아본다.
예
[1, 2, 3, 4, 5, 6]의 평균 :
1+2+3+4+5+6
x1 =
6
1
1
1
1
1
1
= 1 • + 2 • + 3 • + 4• + 5 • + 6 •
6
6
6
6
6
6
= 3.5
X
1
2
3
4
5
6
P(X=x)
1
6
1
6
1
6
1
6
1
6
1
6
[1, 2, 2, 4, 4, 6]의 평균 :
1+2+2+4+3+6
x2 =
6
1
2
2
1
= 1• + 2• + 4• + 6•
6
6
6
6
= 3.167
X
1
2
4
6
P(X=x)
1
6
2
6
2
6
1
6
▶ 가중평균(weighted mean) : 상대적인 중요성에 대한 적당
한 허용치를 주기 위하여 일련의 가중치를 부여한 양들의 평균
☞ 가중평균의 의미
중심의 위치 > 가중평균
중심의 위치 = 가중평균
중심의 위치 < 가중평균
왼쪽으로 기울어짐
수평
오른쪽으로 기울어짐
▶ 기대값(expected value) : 이산확률변수 X가 취할 수 있는 값
xi에 대하여 pi = P(X=xi )일 때, X의 가중평균
m = E(X) =  xi pi = i xi P(X=xi )
i
예
동전 두 번 던지는 실험에서 앞면이 나온 횟수 X의 기대값
확률질량함수 : f(x) =
1
4
1
2
, x = 0, 2
,x=1
0 , 다른 곳에서
기대값 : E(X) = 0•
1
1
1
+ 1• + 2• = 1
4
2
4
컴퓨터의 고장에 대하여 서비스를 받을 때, 소요되는 비용과 그에 대한 확률
(1) 고장으로 인하여 소요되는 평균비용
(2) 확률 히스토그램에 위치를 표시
비용
1
2
3
4
5
확률
0.35
0.21
0.23
0.15
0.06
E(X) = 1•(0.35) + 2•(0.21) + 3•(0.23) + 4•(0.15) + 5•(0.06)
= 2.36
☞ 연속확률변수의 기대값
E(X) =
∞
-∞ x f(x)dx
확률밀도함수 : f(x) = e-x , 0 ≤ x < ∞
X의 기대값 = ?
E(X) =
∞
-∞
x f(x)dx =
= -(x+1)e
-x
∞
0
∞
0 xe-xdx
=1
, f(x) : X의 확률밀도함수
참 고
모든 확률분포에 대하여 기대값이 존재하는 것은 아니다.
확률밀도함수 : f(x) =
1
p(1+x2)
, -∞ < x < ∞
x = 0 을 중심으로 좌우대칭
x = 0 이 중심의 위치
그러나 이 분포는 기대값을
갖지 않는다
▶ 중앙값(median) : 확률변수 X의 분포함수 F(x)에 대하여
F(x0) =0.5를 만족하는 x0을 X의 중앙값이라 하고,
Me로 나타낸다. 즉, 중앙값은 다음과 같다.
P(X≤ Me) = P(X≥ Me) = 0.5
▶ 최빈값(mode) : 확률변수 X의 확률함수 f(x)에 대하여
f(x0) =max { f(x) : x ∈ SX }
를 만족하는 x0을 X의 최빈값이라 하고, Mo로 나타낸다.
▶ 사분위수(quartiles) : 확률분포를 4등분하는 상태공간 안의
점 Q1, Q2, Q3
100p-백분위수(percentiles) : 확률변수 X의 분포함수
F(x)에 대하여 F(xp) =p, 0 < p < 1을 만족하는 xp
중앙값이 하나인 경우
중앙값이 무수히 많은 경우
최빈값이 없는 경우
중앙값이 없는 경우
최빈값이 2개인 경우
사분위수와 백분위수의 관계 : Q1 = x0.25 , Q2 = Me = x0.5 , Q3= x0.75
예제 2에 대하여
(1) 중앙값, 최빈값을 구하고, 평균과 비교
(2) 제1사분위수와 제3사분위수
확률밀도함수 : f(x) = e-x , 0 < x < ∞
분포함수 :
F(x) =
x
0 e
-u
-u
du = - e
F(x0) = 1-e-x 0= 0.5 ;
x
-x
=
1
–
e
0
,0<x<∞
e-x 0= 0.5 ;
x0 = Me = ln 2 = 0.693
x = 0 에서 f(0) = 1이 최대이므로 최빈값 : Mo = 1
F(q1) = 1-e-q 1= 0.25 ;
1 0.75 ;
e-q =
Q1 = ln (0.75) = 0.2876
F(q3) = 1-e-q 3= 0.75 ;
3 0.25 ;
e-q =
Q3 = ln (0.25) = 1.3863
왼쪽으로 치우치고
오른쪽으로 긴 꼬리
모양을 갖는 경우
Mo < Me < m
오른쪽으로 치우치고
왼쪽으로 긴 꼬리
모양을 갖는 경우
m < Me < Mo
대칭형인 경우
m = Me = Mo
☞ 확률변수의 함수에 대한 기대값
예
이산확률변수 X에 대하여
확률질량함수 : f(x) =
1
4
1
2
, x = -1, 1
Y = X2의 기대값 ?
, x=0
0 , 다른 곳에서
상태공간 : SX = { -1, 0, 1 }
Y = X2
Y=0
SY = { 0, 1 }
X=0
동치관계
Y=1
X = -1, 1
P(Y = 0) = P(X = 0) =
1
2
Y의 확률질량함수 :
P(Y = 1) = P(X = -1 또는 X = 1)
h(y) =
= P(X = -1) + P(X = 1)
1
2
, y = 0, 1
0 , 다른 곳에서
1
=
2
1
1
1
Y = X2의 기대값 : E(Y) = 0• 2 + 1• 2 = 2
X
-1
0
1
Y=X2
1
0
1
f(x)
1/4
1/2
1/4
x2f(x)
1/4
0
1/4
 x2f(x) =
x
1
1
1
+ 0 + 2 = 2 = E(Y)
2
확률변수의 함수 Y = g(X)의 기대값 :
E(Y) = E[g(X)] =
x g(x)f(x)
∞
-∞ g(x)f(x)dx
X :이산확률변수인 경우
X : 연속확률변수인 경우
☞ 기대값의 성질
(1) E(a) = a ,
a : 상수
(2) E(aX) = aE(X) , a≠0 : 상수
(3) E(aX + b) = aE(X) + b, a≠0, a, b : 상수
(4) E[au(X) + bv(X)]= aE[u(X)] + bE[v(X)]
동전 두 번 던지기 게임
E(X) = ?
X : 앞면이 나온 횟수
X의 확률질량함수 :
f(x) =
1
4
1
2
, x = 0, 2
, x=1
0 , 다른 곳에서
1
1
1
E(X) = 0• 4 + 1• 2 + 2• 4 = 1
2
E(X ) = 0
2
•
1
2 1
2 1
+1 •
+2 •
= 1.5
4
2
4
E(X2) = ?
확률밀도함수 :
1 , 0≤x<4
4
f (x) =
0 , 다른 곳에서
4
1
E(X) =
x 4
0
 ( )
2
E(X ) =
4
1
4
1 2
dx = 8 x
0 x ( )
2
E(X) = ?
4
0
1 3
dx =
x
12
=2
4
0
16
64
=
= 3
12
E(X2) = ?
▶ 분산(variance) : 확률변수 X의 평균을 중심으로 분포의
밀집정도를 나타내는 척도.
Var(X) 또는 s2
표준편차(standard deviation) : 분산의 양의 제곱근
S.D(X) 또는 s
Var(X) = E[(X-m)2] =
x
∞
-∞
(x-m)2 f(x)
(x-m)2 f(x)dx , X :이산확률변수인 경우
☞ 분산의 간편 계산 방법
s2 = E[(X-m)2] = E(X2 -2mX + m2 )
= E(X2 ) -2 m E(X) + m2
= E(X2 ) - m2
, X :이산확률변수인 경우
, m = E(X)
※ 분산(표준편차)이 작을수록 평균에 집중하여 분포한다.
예제 4에서 주어진 이산확률변수 X의 분산과 표준편차
m = E(X) = 1
s2 = E(X2 ) - m2 = 1.5 – 1 = 0.5
E(X2 ) = 1.5
s=
0.5 = 0.7071
예제 5에서 주어진 이산확률변수 X의 분산과 표준편차
m = E(X) = 2
E(X2 ) =
16
3
s2 = E(X2 ) - m2 =
s =
2
4
=
3
3
3
16
4
– 22 =
3
3
☞ 분산의 성질
(1) Var(a) = 0 ,
a : 상수
(2) Var(aX) = a2Var(X) , a≠0 : 상수
(3) Var(aX + b) = a2Var(X), a≠0, a, b : 상수
☞ 표준편차의 성질
(1) S.D(a) = 0 ,
a : 상수
(2) S.D(aX) = |a|S.D(X) , a≠0 : 상수
(3) S.D(aX+b) = |a|S.D(X), a≠0, a, b : 상수
확률밀도함수 : f(x) = 2x , 0 < x < 1
X와 Y = 3X + 1의 평균과 분산
X의 평균과 분산 :
m = E(X) =
1
1
0
2x2 dx =
1
E(X ) =
2x dx = 2
0
1
s2 = E(X2) - m2 =
2
2

2
3
3
2
( )
2
3
=
1
18
Y = 3X + 1의 평균과 분산 :
2
E(Y) = 3E(X) + 1 = 3• 3 + 1 = 3
Var(Y) = 9Var(X) = 9•
1
1
=
18
2
☞ 표준화 확률변수
평균 m, 표준편차 s인 임의의 확률변수 X에 대하여
Z=
X-m
s
mZ = 0, sZ = 1
예제 1의 서비스 비용 X에 대하여
확률히스토그램에 m - s와 m + s를 표시하고, 히스토그램을 이용한 확률
P(m - s ≤ X ≤ m + s) = ?
예제 1에서,
비용
1
2
3
4
5
확률
0.35
0.21
0.23
0.15
0.06
E(X) = 1•(0.35) + 2•(0.21) + 3•(0.23) + 4•(0.15) + 5•(0.06) = 2.36
E(X2) = 12•(0.35) + 22•(0.21) + 32•(0.23) + 42•(0.15) + 52•(0.06) = 7.16
s2 = E(X2) - m2 = 7.16 – (2.36)2 = 1.5904
s=
1.5904 = 1.261
m – s = 2.36 – 1.261 = 1.099, m + s
= 2.36 + 1.261 = 3.621
히스토그램을 이용한 확률 :
P(m – s ≤ X ≤ m + s )
= (1.5 – 1.099)•(0.35) + 1•(0.21) + 1•(0.23) + (3.621 – 3.5)•(0.15) = 0.5985
☞ Chebyshev 부등식
P(m – ks ≤ X ≤ m + ks) ≥ 1 -
1
k2
, k>1
※ 평균으로부터 동등한 간격으로 떨어져 있는 거리 사이에 놓일 확률의 하한값
과거 경험에 따르면, 어느 편의점을 찾는 고객의 수 X는 평균 40명이고 표준편차
4명이라고 한다. 어느 날 이 편의점을 찾을 고객의 수가 35명 이상 45명 이하일
확률의 하한값 ?
m = 40, s = 4 이므로 Chebyshev 부등식에 의하여
(
P(35 ≤ X ≤ 45) = P(40 - 5 ≤ X ≤ 40 + 5) = P 40 -
(
=P m≥1-
5
•s ≤ X ≤ m +
4
1 = 9
25
(5/4)2
5
•s
4
)
5
≤ X ≤ 40 +
4
•4
•4
5
4
)
제2장