Transcript Document

목차
EXCEL활용
현대통계학
제 4 장 확률이론
■ 사상과 표본공간
■ 복합사상
■ 확률의 개념
■ 확률의 공리
■ 확률법칙
■ 베이즈 정리
■ Excel 활용
EXCEL활용 현대통계학
1
사상과 표본공간
EXCEL활용
현대통계학
■ 사상과 표본공간
통계적 추측
모집단
표본
확률
확률과 추리통계학은 역의 관계를 가진다.확률은 모집단으로부
터 표본으로 판단(추론)하지만 추리통계학은 표본으로부터 모집
단에 대해 추론한다.
EXCEL활용 현대통계학
2
사상과 표본공간
EXCEL활용
현대통계학
■ 사상과 표본공간
실험
실험이란 관찰이나 측정을 유발하는 과정을 말한다.
표본공간
표본공간이란 실험의 실시로 관찰할 수 있는 모든 가능한 단일사상의
집합을 말한다.
사상
사상이란 확률실험의 실시로 얻는 하나 또는 많은 결과들의 집합을
말한다
EXCEL활용 현대통계학
3
사상과 표본공간
EXCEL활용
현대통계학
EXCEL활용 현대통계학
■ 사상과 표본공간
4
사상과 표본공간
EXCEL활용
현대통계학
EXCEL활용 현대통계학
■ 사상과 표본공간
5
복합사상
EXCEL활용
현대통계학
■ 복합사상
실제로 우리가 관심을 갖는 사상은 수많은 단일사상을 동시에 고려해야
하는 복합사상(compound event)이다.
합사상
합사상이란 표본공간을 이루는 모든 사상 중 적어도 하나의 사상에
속하는 모든 단일사상들의 집합을 말한다.
EXCEL활용 현대통계학
6
복합사상
EXCEL활용
현대통계학
■ 복합사상
교사상
교사상이란 표본공간을 이루는 모든 사상에 공통적으로 속하는 단일
사상의 집합을 말한다.
EXCEL활용 현대통계학
7
복합사상
EXCEL활용
현대통계학
■ 복합사상
여사상
여사상이란 표본공간에 속하는 모든 단일사상 중에서 특정 사상에
속하지 않는 단일사상의 집합을 말한다.
EXCEL활용 현대통계학
8
확률의 개념
EXCEL활용
■ 확률의 개념
현대통계학
우리는 불확실한 어떤 사상이 미래에 발생할 가능성 또는 확
실성을 측정하기 위하여 확률(probabiltity)을 사용한다.
예
•
오늘 비가 올 확률은 얼마인가?
•
강 씨가 이번 대통령선거에서 당선될 확률은 얼마인가?
•
김 군이 엑셀대학교에 합격할 확률은 얼마인가?
확률은 0부터 1까지의 값을 갖는다.
EXCEL활용 현대통계학
9
확률의 개념
EXCEL활용
현대통계학
■ 확률의 개념
확률의 측정
주관적 확률개념
→ 단 한번만 발생하는 확률실험의 경우 사용
객관적 확률개념
→ 동일한 조건에서 반복해서 실시할 수 있을 경우 사용
고전적 방법 : 이론적으로 생각하는 실험을 반복할 때 측정
경험적 방법 : 실제 실험을 반복하여 측정
EXCEL활용 현대통계학
10
확률의 개념
EXCEL활용
현대통계학
■ 확률의 개념
고전적 방법(객관적 확률개념)
어떤 실험이나 관찰의 결과로 나타날 수 있는 사상들이 동일한 발생
가능성과 상호배타적이라는 전제가 성립하면 어떤 특정 사상이 발생
할 확률은 다음과 같은 공식을 이용하여 구한다.
EXCEL활용 현대통계학
11
확률의 개념
EXCEL활용
현대통계학
■ 확률의 개념
고전적 방법(객관적 확률개념)
EXCEL활용 현대통계학
12
확률의 개념
EXCEL활용
현대통계학
■ 확률의 개념
경험적 방법(객관적 확률개념)
사상에 확률을 부여하는 경험적 법칙은 어떤 법칙에 의존하는 것이
아니라 과거에 실제로 관찰한 수많은 횟수의 확률실험의 경험에 바탕
을 두고 있다. 경험적 방법은 상대도수개념(relative frequency
concept)를 이용한다.
EXCEL활용 현대통계학
13
확률의 개념
EXCEL활용
현대통계학
■ 확률의 개념
고전적 방법과 경험적 방법의 비교
EXCEL활용 현대통계학
14
확률의 개념
EXCEL활용
현대통계학
■ 확률의 개념
주관적 방법
실험의 반복에 의해서가 아니라 어떤 사상이 발생할 가능성에 대한
개인적 믿음의 정도(degree of belief)에 따라 순전히 주관적으로 확
률을 결정하는 방법
EXCEL활용 현대통계학
15
확률의 개념
EXCEL활용
현대통계학
■ 확률의 몇 가지 예
- 붉은 카드와 푸른 카드가 들어 있는 상자에
서 한 장의 카드를 무작위로 추출할 때, 붉
은 색이면 천원을 얻고 푸른색이면 아무 것
도 얻지 못한다고 할 때, 다음 두 상자에서
상금을 탈 확률은?
상자 A (붉은 카드 3개, 푸른 카드 2개)
상자 B (붉은 카드 30개, 푸른 카드 20개)
붉은 카드의 수 3
 으로
두 상자 모두 확률은
전체 카드의 수 5
동일하다.
EXCEL활용 현대통계학
16
확률의 개념
EXCEL활용
현대통계학
■ 확률의 몇 가지 예
-예: 한 벌의 카드를 잘 섞어서 위에서부터 두
장의 카드를 뽑는다. 만약 두 번째 카드가
하트 Q라면 천원을 받는다고 하자.
(a) 상금을 받을 확률은?
(b) 첫번째 카드가 클럽 7이었다면 상금을
받을 확률은?
a) 비조건부 확률  Pr(두 번째 카드가 하트 Q)=1/52
b) 조건부 확률  Pr(두번째 카드가 하트 Q | 첫번째 카드가 클럽 7)
=1/51
EXCEL활용 현대통계학
17
확률의 개념
EXCEL활용
현대통계학
■ 확률의 몇 가지 예
-복원추출과 비복원추출• 복원추출(sampling with replacement):
상자로부터 반복해서 카드를 꺼낼 때, 꺼낸
카드를 매번 상자에 다시 집어 넣는 경우
•비복원 추출(sampling without replacement):
꺼낸 카드를 다시 집어 넣지 않는 경우
 복원추출이든 비복원 추출이든 상자로부터
한 장의 카드를 무작위로 뽑으면 상자 안
각각의 카드가 뽑힐 가능성은 같다.
EXCEL활용 현대통계학
18
확률의 공리
EXCEL활용
현대통계학
■ 확률의 공리
확률의 공리
앞 절에서 살펴본 3가지 방법 중 어떤 방법으로 사상에 확률을 부여
하더라도 다음과 같은 확률의 공리는 만족되어야 한다. A와 B는 표본
공간 S를 이루는 사상이라고 하자.
공리
0  P( A)  1
공준 2 : P(S )  1
공준 1 :
공준 3 :
EXCEL활용 현대통계학
P( A 또는 B)  P( A)  P( B)
19
확률의 공리
EXCEL활용
현대통계학
■ 확률의 공리
• 공리 1은 표본공간을 이루는 한 사상이 발생할 확률은 0부터 1까지의
값을 갖는다는 법칙이다.
• 공리 2는 확률실험이 실시될 때 표본공간을 이루는 단일사상 중 하나
는 꼭 발생한다는 법칙이다.
• 공리 3은 상호배타적 사상들이 발생할 확률은 그들 개개의 확률을 합
한 것과 같다는 법칙이다.
• 공리 2와 3은 확률실험의 결과 발생하는 단일사상들의 확률은 모두
합치면 1과 같다는 것을 의미한다.
• 공리 3은 사상 A와 그의 여사상은 상호배타적이기 때문에 다름 식이
성립한다는 것을 알 수 있다. 이는 여사상의 확률법칙이라고 한다.
P( A또는AC )  P( A)  P( AC )  1
P( AC )  1  P( A)
EXCEL활용 현대통계학
20
확률 법칙
EXCEL활용
현대통계학
■ 확률법칙
일반법칙(두 사상이 상호 배타적이 아닌 경우)
• 덧셈법칙
특별법칙(두 사상이 상호 배타적인 경우)
일반법칙(두 사상이 종속적인 경우)
• 곱셈법칙
특별법칙(두 사상이 독립적인 경우)
EXCEL활용 현대통계학
21
확률 법칙
EXCEL활용
현대통계학
■ 확률법칙
덧셈법칙
두 사상 A와 B가 있을 때 두 사상 가운데 적어도 한 사상이 발생할 합
확률(union probability), 즉 P(AUB)를 구하는 법칙이다.
덧셈의 일반법칙 : 배타적이 아닌 경우
P ( A  B )  P ( A)  P ( B )  P ( A  B )
EXCEL활용 현대통계학
22
확률 법칙
EXCEL활용
현대통계학
■ 확률법칙
덧셈의 특별법칙 : 배타적인 경우
P (A  B )  P (A)  P (B )
EXCEL활용 현대통계학
23
확률 법칙
EXCEL활용
현대통계학
조건확률
종속사상의 경우
어떤 사상의 발생확률이 다른 사상의 발생여부에 의존한다면 두
사상은 통계적 종속성의 관계에 있다고 한다.
조건확률 (종속사상)
조건확률이란 어떤 사상 B가 이미 발생하였다는 조건하에
다른 사상 A가 발생할 확률을 말한다.
P (A | B ) 
또는
P (B | A) 
EXCEL활용 현대통계학
P (A  B )
P (B )
P (A  B )
P (A)
24
확률 법칙
EXCEL활용
현대통계학
조건확률
조건확률(종속사상)
분할표
분할표란 모집단에서 추출된 표본자료를 두 가지 기준에 따라 행과
열로 분류하여 작성한 통계표를 말한다. 두 변수 간의 관계를 나타
내는 자료를 정리하여 행과 열에 각각 한 변수의 구간을 정하고 행
과 열이 교차하는 칸에 해당하는 값을 기록한다. 이때 수치로 나타
내면 분할표이고 상대도수로 나타내면 결합확률표가 된다.
EXCEL활용 현대통계학
25
확률 법칙
EXCEL활용
현대통계학
조건확률
조건확률(종속사상)
EXCEL활용 현대통계학
26
확률 법칙
EXCEL활용
현대통계학
조건확률
조건확률(종속사상)
EXCEL활용 현대통계학
27
확률 법칙
EXCEL활용
현대통계학
조건확률
조건확률(종속사상)
EXCEL활용 현대통계학
28
확률 법칙
EXCEL활용
현대통계학
조건확률
독립사상의 경우
한 사상이 이미 발생하였다는 사실을 알더라도 다른 사상이 발
생할 확률에 아무런 영향을 미칠 수 없을 때 통계적 독립성의 관
계에 있다고 말할 수 있다.
조건확률 (독립사상)
P (B | A)  P (B )
또는
P (A | B )  P (A)
P(A) 또는 P(B)는 무조건 확률, 주변확률 또는 단일확률이라고
한다.
EXCEL활용 현대통계학
29
확률 법칙
EXCEL활용
현대통계학
조건확률
조건확률(독립사상)
EXCEL활용 현대통계학
30
확률 법칙
EXCEL활용
현대통계학
조건확률
조건확률(독립사상)
EXCEL활용 현대통계학
31
확률 법칙
EXCEL활용
현대통계학
주변확률과 결합확률
주변확률
어떤 단일사상(A)이 일어날 확률 즉, P(A)를 말한다.
결합확률
두 사상이 동시에 발생할 확률, 즉 두 사상 A와 B의 교사상의
확률 P(A∩B)를 말한다.
EXCEL활용 현대통계학
32
확률 법칙
EXCEL활용
현대통계학
주변확률과 결합확률
네 개의 결합확률
네 개의 주변확률
EXCEL활용 현대통계학
33
확률 법칙
EXCEL활용
현대통계학
주변확률과 결합확률
결합확률분포
EXCEL활용 현대통계학
34
확률 법칙
EXCEL활용
현대통계학
주변확률과 결합확률
여덟 개의 조건확률
EXCEL활용 현대통계학
35
확률 법칙
EXCEL활용
현대통계학
곱셈법칙
확률의 덧셈법칙은 두 사상의 합사상의 확률을 계산하는 데 이
용되지만 곱셈법칙은 두 사상의 결합확률을 구하는 데 이용된다.
곱셈의 일반법칙 (종속사상)
P( A  B)  P( B) P( A | B)
EXCEL활용 현대통계학
또는 P( A  B)  P( A) P( B | A)
36
확률 법칙
EXCEL활용
현대통계학
곱셈법칙
곱셈의 특별법칙 (독립사상)
P( A  B)  P( A) P( B)
EXCEL활용 현대통계학
37
확률 법칙
EXCEL활용
현대통계학
곱셈법칙
곱셈의 특별법칙 (독립사상)
EXCEL활용 현대통계학
38
베이즈정리
EXCEL활용
현대통계학
■ 베이즈 정리
• 예: 사지선다 문제를 맞추었을 때(B), 알고 풀었을(A) 확률은?
사전확률 (prior probability) : P (A)=1/2 (사전 정보)
사후확률 (posterior probability) : P (A|B)=4/5
• 그러면 모르고도 맞을 확률은 얼마인가?
EXCEL활용 현대통계학
39
베이즈정리
EXCEL활용
현대통계학
■ 베이즈 정리
의사결정자가 특정 사상에 대해 최초로 부여한 확률을 사전확률
이라고 한다. 추가적인 새로운 정보가 주어지면 사전확률을 수
정 하 여 사 후 확 률 을 계 산 할 수 있 다 . Bayes 정 리 (Bayes’
theorem)는 이러한 확률계산에 사용되는 수단이다.
Bayes 정리
P ( L1 ) P ( D | L1 )
P ( L1 | D ) 
P ( L1 ) P ( D | L1 )  P ( L2 ) P ( D | L2 )
P( L2 | D) 
EXCEL활용 현대통계학
P( L2 ) P( D | L2 )
P( L1 ) P( D | L1 )  P( L2 ) P( D | L2 )
40
베이즈정리
EXCEL활용
현대통계학
EXCEL활용 현대통계학
■ 베이즈 정리
41
베이즈정리
EXCEL활용
현대통계학
EXCEL활용 현대통계학
■ 베이즈 정리
42
Excel의 활용
EXCEL활용
현대통계학
EXCEL활용 현대통계학
Excel 활용
43
Excel의 활용
EXCEL활용
현대통계학
EXCEL활용 현대통계학
Excel 활용
44