통계교육원2005년12월8-9일 - X

Download Report

Transcript 통계교육원2005년12월8-9일 - X

엑셀을 이용한 통계 자료 분석
2005. 12. 8 – 9
통계 교육원
MoDo Statistical Institute
강의 목적
 엑셀의 이용하여 수집된 자료를 표나 그래프로 요약하는 방법
 여러 가지 기술 통계치를 계산하고 해석하는 방법
수집된 자료를 정리.요약하여 의미 있는 정보를
얻어 내어 양질의 의사결정을 할 수 있다
 현실의 자료에 적용 할 수 있다.
MoDo Statistical Institute
강의 일정
 12월8일(목) 6-8교시
통계학의 기본개념,
질적 자료의 정리 및 요약
 12월9일(금) 1-3교시
양적 자료의 정리 및 요약
5-6교시
수치로서의 요약
MoDo Statistical Institute
목 차
제1장 통계학의 기본개념
제2장 자료의 정리 및 요약
 표와 그래프-질적자료,양적자료
 수치로서의 요약
MoDo Statistical Institute
제1장 통계학의 기본개념
1. 통계학이란 무엇인가?
2. 기술통계학과 추론통계학
MoDo Statistical Institute
제1장 통계학의 기본 개념
 모집단과 표본
(예) 20대 남성의 평균 신장을 알아보기 위해
각 시도에서 500명의 20대 남성을 선발
한국의 20대
남성 전체
키
각 시도에
서 500명
의 20대 남
성의 키
모집단
표 본
 모집단(population) :
관심의 대상이 되는 모든 개체의 관측값이나 측정값
 표본(sample) :
통계적 처리를 위하여 모집단에서 실제로 추출한
관측값이나 측정값, 모집단의 일부분
MoDo Statistical Institute
제1장 통계학의 기본 개념
 통계학이란 무엇인가?
확실히 예측할 수 없는 현상에 대해서
1. 자료를 수집하고(experimental design, survey 등으로),
2. 자료의 구조를 파악하고(표, 그림, 수치요약 등으로),
3. 현재의 상태를 설명하고 불확실한 미래를 과학적으로 예측
할 수 있도록 도와주는 학문
기술통계학(descriptive statistics) : 2번
추측통계학(inferential statistics) : 3번
MoDo Statistical Institute
제1장 통계학의 기본 개념
기술통계학과 추측 통계학
모집단
정리 및 요약
표본추출
모집단
결론
모집단추출
설계단계
모집단
특성에
대한 추론
탐색단계
기술통계학
추측단계
가설검정
추측통계학
MoDo Statistical Institute
제2장 자료의 정리 및 요약
1. 자료의 종류
2. 도표나 그래프를 이용한 자료의 정리
3. 수치(기술 통계치)로서의 요약
MoDo Statistical Institute
실습예제자료
1. 설문자료.xls
2. 아이스크림자료.xls
3. 인력개발부설문자료.xls
4. 질적자료.xls
5. 종합실습자료.xls
MoDo Statistical Institute
제2장 자료의 정리 및 요약
[표 2-1]신상품 통신기기에 대한 소비자들의 만족도 및 구매의향 조사를 위한
설문지
1. 귀하의 성별은? ① 남자
② 여자
2. 귀하의 연령을 기입해 주세요.
만(
)세
3. 귀하의 직업은 ?
①전문직 ② 경영·관리직 ③ 사무직 ④ 판매·서비스직 ⑤ 노무직 ⑥ 학
⑦ 전업주부 ⑧ 기 타
생
4. 귀하(전업주부의 경우는 남편기준)의 월수입은 얼마나 됩니까? ( )만원
5. A라는 신상품 통신기기에 대한 귀하의 만족도는?
① 매우 불만족 ② 불만족 ③ 보통 ④ 만족
⑤매우 만족
6. A라는 통신기기를 10만원에 판매한다고 할 때, 귀하께서는 구매하시겠습니까?
① 예
② 아니오
③ 아직은 결정못하겠다
7. 다음의 회사들이 A라는 신상품 통신기기를 동시에 판매한다고 할 때,
귀하께서 어느 회사 제품을 구입하시겠습니까?
① ‘가’회사
② ’나’회사
③ ‘다’회사
MoDo Statistical Institute
제2장 자료의 정리 및 요약
설문 조사 시 자료 정리 방법
• 각 문항이 변수가 됨
만족도 및 구매의향에 대한 설문 조사 응답자료
번호
문항 1
(성별)
문항 2
(연령)
문항 3
(직업)
1
1
33
2
200
3
2
1
2
2
33
7
120
2
1
2
3
1
31
3
210
4
2
3
4
2
21
6
80
5
1
3
5
1
35
3
170
1
3
2
6
1
21
6
100
3
1
1
50
1
38
8
60
5
3
1
문항 4
문항 5
문항 6
(월수입) (만족도) (구매의향)
문항 7
(구입희망회사)
MoDo Statistical Institute
제2장 자료의 정리 및 요약
 자료의 종류
Data
Categorical
(Qualitative)
질적
Numerical
(Quantitative)
양적
Discrete
이산형
Continuous
연속형
MoDo Statistical Institute
제2장 자료의 정리 및 요약
자료의 종류
질적자료
• 관측된 값이 몇 개의 범주(category)를 나타내는 문자나 숫자
로 표시된 자료
• 범주형 자료라고도 함
• 문항1(성별), 문항3(직업), 문항5(만족도), 문항6(구매의향), 문
항7(구입희망회사)
양적자료
• 크기, 무게, 개수 등과 같이 양을 나타내는 숫자로 표현되
어 있음
• 문항2(연령), 문항4(월수입)
양적자료의 질적변환
• 연령을 20-29(20대), 30-39(30대), 40-49(40대), 50-59(50
대)로 바꾸면 질적자료로 변환됨
• 변환과정을 집단화(grouping)라고 함
MoDo Statistical Institute
질적 자료의 요약
Categorical Data
그래프
도수분포표
분할표(질적변수 2개)
Pie Charts
CD
Pareto Diagram
S a vi n g s
Bar Charts
B onds
S to c k s
0
10
20
30
40
50
45
120
40
100
35
30
80
25
60
20
15
40
10
20
5
0
0
S to c k s
B onds
S a vi n g s
CD
MoDo Statistical Institute
제2장 자료의 정리 및 요약
 실습예제
인터넷에서 내려받기
http://statedu.x-y.net
<자료실>에서 자료 다운로드
MoDo Statistical Institute
제2장 자료의 정리 및 요약
 도수분포표
 도수란?
각 자료값이 반복되어 나타난 횟수
 도수분포표란?
각 자료값에 대하여 도수를 나열해 놓은 도표
 도수분포의 예
성별
남자
여자
합계
도수
31(62%)
19(38%)
50
MoDo Statistical Institute
제2장 자료의 정리 및 요약
 표와 그래프를 이용한 자료의 정리
자료의 종류
질적자료
양적자료
표
그래프
도수분포표
막대그래프, 원
그래프 등
히스토그램
질적자료인 경우 - 도수분포표(피벗 테이블)
 문항1(성별), 문항3(직업)에 대한 도수분포표를 작성
 메뉴<데이터> - <피벗 테이블/챠트>
MoDo Statistical Institute
제2장 자료의 정리 및 요약
 질적자료인 경우 - 분할표
 분할표란? 두 변수 혹은 그 이상의 변수에 대해 결합된 형태의 빈
도표
성별
교육수준
남
여
중졸
21
23
고졸
33
35
대졸
24
40
 설문자료예제 ‘문항1(성별)’과 ‘문항3(직업)’에 대한 2차원 분할
표를 만드시오.
 성별과 직업에 대한 분할표를 수정하여 성별(문항1)과 구입희망회
사(문항7)에 대한 분할표를 만드시오.
MoDo Statistical Institute
제2장 자료의 정리 및 요약
 양적자료를 질적자료로 변환시킨 후 도수분포표 만들기
 문항2(연령)을 20대,30대,40대,50대이후로 집단화
(grouping)한 후 도수분포표를 만드시오.
함수마법사의 IF문을 사용한 후 채우기핸들 이용함.
IF(연령<30,”20대”,IF(연령<40,”30대”,
IF(연령<50,”40대”,”50대이후”)))
MoDo Statistical Institute
제2장 자료의 정리 및 요약
 그래프를 이용한 자료의 정리 - 질적자료
 막대 그래프(bar chart)
 원 그래프(pie chart)
 문항1(성별)에 대한 막대그래프와 원 그래프 그리
시오.
 성별과 만족도에 대한 분할표를 이용하여 막대그
래프를 그리시오.
MoDo Statistical Institute
실습예제- 질적자료
1.
성별은 남,여 순으로, 교육수준은 대졸,고졸,중졸의 순으로, 임금수준
은 상, 중상, 중하, 하 순으로 도수분포표를 만드시오.
2.
교육수준에 따른 빈도표를 작성하시오.
3.
2번을 수정하여 교육수준과 임금수준의 분할표를 만드시오.
4.
3번에서 만든 분할표에서 임금수준 상과 중상은 A로, 중하와 하는 B로
새롭게 범주를 나누어 분할표를 만드시오.
5.
교육수준에 대한 막대그래프를 그리시오.
MoDo Statistical Institute
양적자료의 요약
Numerical Data
Ordered Array
21, 24, 24, 26, 27, 27, 30, 32, 38, 41
41, 24, 32, 26, 27, 27, 30, 24, 38, 21
Frequency Distributions
Cumulative Distributions
Ogive
120
100
80
60
40
20
0
10
Stem and Leaf
Display
줄기-잎 그림
2 144677
3 028
4 1
Histograms
20
30
40
오자이브
Ogive
7
6
5
도수분포표
4
Polygons
3
2
1
0
10
20
30
40
50
60
MoDo Statistical Institute
50
60
제2장 자료의 정리 및 요약
 양적자료의 경우 - 도수분포표
도수분포표란? 자료의 범위를 몇 개의 구간으로 나누고, 그
구간 내에 존재하는 자료의 수, 도수를 세어 표로 작성한 것
계 급 (주가)
도수
누적도수
상대도수
누적
상대도수
300이상
400미만
1
1
3%
3%
400이상
500미만
1
2
3%
6%
500이상
600미만
1
3
3%
9%
600이상
700미만
6
9
17%
26%
700이상
800미만
6
15
17%
43%
800이상
900미만
9
24
25%
68%
900이상 1000미만
12
36
33%
100%
계
36
100
100%
100%
MoDo Statistical Institute
제2장 자료의 정리 및 요약
 양적자료의 경우 - 도수분포표
 도수분포표를 작성하는 절차
1. 범위(=최대값- 최소값)를 구함.
2. 구간의 수를 정함. 일반적으로는 구간의 개수로는 자료의 크기에
따라 5-20개 .
3. 구간의 폭 (=범위/계급의 수)을 정함.
4. 첫 번째 구간의 하한값 = 최소값 – 최소 단위 * 1/2
5. 도수 산정
MoDo Statistical Institute
제2장 자료의 정리 및 요약

표와 그래프를 이용한 자료의 정리
1. 함수 Frequency 이용
(배열복사:ctrl+shift+enter)
2. 메뉴 <도구> - <데이터 분석> - <히스토그램> 이용

<실습>
문항2(연령)에 대한 도수분포표와 히스토그램 작성
MoDo Statistical Institute
제2장 자료의 정리 및 요약

양적자료의 경우 - 도수분포표
= MAX(C2:C51)
= MIN(C2:C51)
= K2 - K3
= K4/K5
MoDo Statistical Institute
 실습예제

인력개발부설문자료에서 문항5번, 기업근무년수에 대한 도수분포표와
히스토그램을 그려보시오.
MoDo Statistical Institute
제2장 자료의 정리 및 요약
 산점도
 두 변수사이의 관계를 시각적으로 파악하기 위한 그래프
 두 변수 중 한 변수를 가로축으로 하고 다른 변수를 세로 축으로
하여 대응하는 데이터를 1점식 타점(Plot)함으로써 작성
 산점도 작성을 위한 자료는 양적 자료이어야 함
 실습- 나이와 월수입은 어떤 관계가 있을까?
나이가 많을수록 월수입도 많을까?
‘문항2(연령)’와 ‘문항4(월수입)’간의 산점도 작성
MoDo Statistical Institute
탐색적 자료분석
(EDA: Exploratory Data Analysis)

Stem and Leaf plot (줄기 잎 그림)





적은 양의 자료에 적합.
간단하게 자료의 구조 및 형태를 파악
히스토그램에서 알 수 없었던 원 자료값
(raw data) 하나 하나를 알 수 있음.
정보의 보존성이 우수.
정보의 손실이 전혀 없음.
John Wilder Tukey
(1915-2000)
MoDo Statistical Institute
줄기 잎 그림

설문자료에서 나이에 대한 줄기 잎 그림
2
3
4
5
0111122223346667789
1122223334455789
112346789
235669
2
2
3
3
4
4
5
5
011112222334
6667789
11222233344
55789
11234
6789
23
5669
MoDo Statistical Institute
수치로서의 요약
Summary Measures
Central Tendency
집중화 경향
Mean
Quartile
Mode
Median
Range
Variation
Coefficient of
Variation
Variance
Standard Deviation
MoDo Statistical Institute
중심위치의 측도-대표값
Central Tendency
Median
Average
Mode
n
X 
X
i 1
i
n
N

X
i 1
i
N
MoDo Statistical Institute
제2장 자료의 정리 및 요약
평균(Mean)
 전체를 공평하게 만들었을 때의 양
 < >보다 큰 수까지의 거리 합 = < >보다 작은 수까지의 거리 합
 평균(mean) = 관측된 숫자들의 총합 /관측된 숫자들의 총개수
 극단적인 값에 민감
0 1 2 3 4 5 6 7 8 9 10
0 1 2 3 4 5 6 7 8 9 10 12 14
Mean = 5
Mean = 6
예제
경상대학을 졸업한 학생들의 월 소득(단위:만원)
180, 110, 100, 150, 120, 50000, 110
평균 = (180+110+…+110)/7=7252.86
MoDo Statistical Institute
제2장 자료의 정리 및 요약
 중앙값(Median, 중위수)
중앙값 : 자료를 크기 순으로 나열하였을 때 한 가운데 위치한 값
자료의 개수가 홀수인 경우
100 110 110 120 150 280 50,000
자료의 개수가 짝수인 경우
100 110 110 120 140 150 180 50,000
중앙값은 (120+140)/2 = 130
극단적인 값에 민감하지 않은 척도는 중앙값이다.
0 1 2 3 4 5 6 7 8 9 10
Median = 5
0 1 2 3 4 5 6 7 8 9 10 12 14
Median = 5
MoDo Statistical Institute
최빈값(Mode)
 최빈값은 관측 횟수가 가장 많은 값
 평균이나 중앙값은 양적 자료일 경우에만 집중화경향을 측정
 양적 자료와 질적 자료에 모두 적용가능
 평균값처럼 소수의 극단적인 값에 의해 영향을 받지 않음
 평균과 중앙값은 단 하나만 존재
 최빈값은 하나 이상 가능
 최빈값이 유용한 경우
 옷, 신발, 모자 등을 생산하는 공장에서는 가장 많이 소비되는 표준
치수를 기준으로 생산.
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Mode = 9
0 1 2 3 4 5 6
No Mode
MoDo Statistical Institute
제2장 자료의 정리 및 요약
 집중화 경향만으로는 부족하다…그러면….
 맹구의 경험 어느 강의 평균 수심이 1m라는 면사무소의 정보만 믿고
맹구는 물놀이를 하기 위하여 강에 들어갔다. 그러나 강의 실제 수심
은 20Cm인 곳도 있고 어떤 곳은 3m인 곳도 있었다. 수영에 익숙하지
못한 맹구는 그만 수심이 3m되는 지점에서 익사할 뻔 하였다. 그 후로
맹구는 목욕탕에서만 수영을 하였다.
 맹구의 잘못은 무엇인가? 맹구는 무엇을 고려하지 않아서 익사할 뻔
하였나?
MoDo Statistical Institute
제2장 자료의 정리 및 요약
 산포의 측도
집중화 경향만으로는 부족하다…그러면…
자료 1
60
10 20 30 40 50 60 70 80 90 100 110
자료 2
60
50 60 70
50 60 70
40 50 60 70 80
자료 1의 관측값들이 자료 2의 관측값보다 평균값을 중심으로
더 넓게 흩어져 있다.
MoDo Statistical Institute
산포의 측도
Variation
분산
표준편차
변동계수
Variance
Standard Deviation
Coefficient
of Variation
범위Range
사분위 범위
Interquartile Range
MoDo Statistical Institute
산포의 측도
 범위(Range)
•
•
•
•
범위=최대값-최소값
데이터의 개수에 관계없이 최대값과 최소값만 이용
정보의 손실 발생
양 극단값에 민감
Range = 12 - 7 = 5
Range = 12 - 7 = 5
7
8
9
10
11
12
7
8
9
10
11
12
MoDo Statistical Institute
사분위수(Quartiles)
25%
25%
 Q1 
25%
 Q2 
25%
Q3 
i  n  1
 Qi  
4
Data in Ordered Array: 11 12 13 16 16 17 18 21 22

Position of i-th Quartile
1 9  1
Position of Q1 
 2.5
4

Q1
12  13


 12.5
2
Q2 = 중위수(Median)
MoDo Statistical Institute
산포의 측도

사분위 범위(Interquartile Range)



제3사분위수-제1사분위수
자료의 중간 50%에 대한 범위
범위보다 극단값에 덜 민감
Data in Ordered Array: 11 12 13 16 16 17
17 18 21
Interquartile Range  Q3  Q1  17.5  12.5  5
MoDo Statistical Institute
산포의 측도
 분산과 표준편차
편차 = (관찰값 - 평균값)
분산(Variance) = 편차를 제곱하여 합한 값 / 관측값의 총수
표준편차 = 분산의 제곱근
자료가 평균을 중심으로 많이 흩어져 있으면 분산(또는 표준편차)
은 커지고, 평균 주위에 몰려 있으면 분산(또는 표준편차)는 작아진
다.
N
모분산
2 
 X
i 1
i

N
2
n
표본분산
S2 
 X
i 1
i
X
n 1
2
MoDo Statistical Institute
산포의 측도
Data A
11 12 13 14 15 16 17 18 19 20 21
Mean = 15.5
s = 3.338
Data B
11 12 13 14 15 16 17 18 19 20 21
Mean = 15.5
s = .9258
Data C
11 12 13 14 15 16 17 18 19 20 21
Mean = 15.5
s = 4.57
MoDo Statistical Institute
산포의 측도

변동계수(변이계수,Coefficient of Variation)

평균에 대한 상대적 산포도

Always in percentage (%)


측정 단위가 다른 2개 이상의 data set들의 변동
비교
평균이 크게 다른 두 집단의 변동 비교
S
CV  
X

100%

MoDo Statistical Institute
변동계수의 비교
성인여자의
몸무게
평균
표준편차
51.1Kg
5.0Kg
10세 소녀의
26.49Kg
3.66Kg
몸무게
• 성인여자 몸무게의 변동계수=9.78%
• 10세 소녀 몸무게의 변동계수=13.82%
MoDo Statistical Institute
분포의 형태를 나타내는 측도
 Skewness 왜도




평균에 대한 분포의 비대칭도를 나타내는 지표
분포가 좌우대칭인 경우 왜도는 0이다
왜도가 양수이면 분포는 오른쪽으로 긴 꼬리를 갖는다.
왜도가 음수이면 분포는 왼쪽으로 긴 꼬리를 갖는다.
 Kurtosis 첨도
 분포의 뾰족한 정도를 정규분포와 비교해서 나타내는 것
 첨도가 양이면 더 뾰족하고 첨도가 음이면 덜 뾰족함
MoDo Statistical Institute
제2장 자료의 정리 및 요약
 분포의 특성비교
B
A
B
A
집중화경향
산포도
높은 첨도
오른쪽꼬리분포
B
왼쪽꼬리분포
A
A
보통 첨도
낮은 첨도
왜도
첨도
MoDo Statistical Institute
분포의 모양 Shape of a Distribution
Left-Skewed
Mean < Median < Mode
Symmetric
Mean = Median =Mode
Right-Skewed
Mode < Median < Mean
좌비대칭
대칭
우대칭
왜도<0
왜도=0
왜도>0
MoDo Statistical Institute
탐색적 자료분석
(EDA:Exploratory Data Analysis)

상자수염그림(Box-and-whisker plot)

5개의 수치요약값을 그림으로 표시
X smallest Q
1
Median( Q2)
Q3
Xlargest
MoDo Statistical Institute
분포의 모양과 상자그림
Left-Skewed
Q1
Q2 Q3
Symmetric
Q1Q2Q3
Right-Skewed
Q1 Q2 Q3
MoDo Statistical Institute
연령에 대한 상자 그림(설문자료.xls)
Q1 Q2 Q3
MoDo Statistical Institute
상관계수
(Coefficient of Correlation)




IQ가 높으면 성적도 높을까?
키가 크면 몸무게도 많이 나갈까?
사교육비가 많으면 성적도 높을까?
두 양적 변수 사이의 직선적인 경향


산점도(scatter plot): 시각적 표현
상관계수 : 수치로 계산
n
r
 X
i 1
n
 X
i 1
i
i
 X Yi  Y 
X
2
n
 Y  Y 
i 1
2
i
MoDo Statistical Institute
산점도와 상관계수
Y
Y
Y
X
r = -1
X
r = -.6
Y
X
r=0
Y
r = .6
X
r=1
X
MoDo Statistical Institute
산점도와 상관계수
예제
아이스크림 체인점 관리자는
여름철에 하루 최고기온과 매
출액 사이에 어떤 관계가 있
는지 살펴보고자 한다. 무작
위로 20일을 선택한 자료가
다음과 같다.
산점도
4
3.5
3
2.5
매출액

상관계수=0.9696
2
1.5
1
0.5
0
0
10
20
최고기온
30
40
MoDo Statistical Institute
수치에 의한 자료의 요약
 엑셀을 이용하여 기술통계치 구하기


각각의 엑셀함수를 이용
메뉴<도구> - < 데이터분석> -<기술통계법> 이
용
 실습하기(실습예제.xls)
1. 문항2(연령)에 대한 기술통계치를 구하시오.
2. 남.녀별 연령에 대한 기술통계치를 비교하시오.
MoDo Statistical Institute
종합실습문제 (교재 p.179)
1. 남.녀별 신장, 몸무게, 나이에 대해 기술통계치를
각각 비교 하시오.
2. 키와 몸무게 사이에 어떤 관계가 있는 지 적당한
그래프와 수치로 알아보시오.
3. 성별에 따라 즐기는 음식이 어떤 지 적당한 표나
그래프로 설명 해 보시오.
4. 연령에 대해 적당한 표나 그래프로 요약 한 후 자
료의 특성을 설명하시오.
MoDo Statistical Institute
실습예제

직원들의 기업에 대한 만족도 조사
1.
당신의 나이는 몇 세 입니까? (
2.
당신의 성별은?  남자  여자
3.
전반적으로 당신은 직무에 대해 만족하십니까?
세)
 매우만족  약간만족  약간 불만  매우 불만족
4.
직장에서 당신에게 가장 중요한 요소는 무엇입니까?
 높은 임금  고용 안정  시간 여유  진급의 기회
 작업 환경
5.
기업 근무 년수는? (
년)
6.
향후 5년간 당신의 진급 가능성을 어떻게 평가합니까?
 매우 높음  높음  확실치 않음  낮음
 매우 낮음
MoDo Statistical Institute
실습예제(인력개발부설문자료.xls)
1.
직무 만족도(문항3)에 대한 도수분포표와 그래프를 그리시오.
2.
근무년수와 연령 사이에 어떤 관계가 있는지 산점도와 상관계수
를 구해보고 설명하시오.
3.
성별과 가장 중요한 요소에 대한 분할표를 작성하시오.
4.
가장 중요한 요소에 대한 막대그래프와 원형그래프를 그려보시
오.
5.
남,여별 기업 근무년수에 대한 기술통계치를 구해 보시오.
6.
나이에 대한 도수분포표와 히스토그램을 그리시오.
MoDo Statistical Institute
여론조사에서의 신뢰도와 표집오차
 A 후보의 지지율은 88%로 나타났습니다.
이 조사는 성인 남녀 1000명
을 대상으로 조사했으며 신뢰도는 95%이고 오차범위는 ±3.1%P입니다.
 95%의 신뢰도의 의미
p 지지율, 알려져 있지 않음
표본 1
표본 2
표본 3
표본 4
표본 5
표본 6
표본 7
표본 8
표본 9
표본 10
MoDo Statistical Institute
여론조사에서의 신뢰도와 표집오차
 A후보의 지지율에 대한 95% 신뢰구간
88%3.1% = (84.9%, 91.1%)
 최대 표집오차(오차범위)
 1.96
0.5(1  0.5)
0.5  0.5
 1.96
 0.0309(3.1%)
n
1000
 표본크기의 결정
 1.96  0.5 
n

 오차범위
2
MoDo Statistical Institute
여론조사에서 오차범위에 따른 표본의 크기
오차범위
표본의 크기
9.8%
4.4%
3.1%
2.5%
1.0%
100
500
1,000
1,500
9,604
MoDo Statistical Institute