Transcript ch04

데이터의 요약과 시각화
HCI Lab. @ Cheonan University, Korea
http://hci.cheonan.ac.kr
통계량에 의한 데이터의 요약
 기본 통계량에 의한 요약
예제5-1
예제 3-1에 있어서의 설문 4에 대한 회답 결과인 연령의 데이터에
대해서 평균과 표준편차를 구하라.
 사고방식과
적용수법
 통계량




데이터를 기초로 계산된 평균 등의 수치로서
분포의 중심위치를 나타내는 통계량,
산포도(dispersion)을 나타내는 통계량,
형태를 나타내는 통계량 등이 있다.
HCI Lab. @ Cheonan University, Korea
http://hci.cheonan.ac.kr
 기본
통계량
 분포의 중심위치를 나타내는 지표
 평균
 중앙값: 데이터를 수치의 작은 순위(혹은 큰 순위)로 늘어 놓았을 때, 한가운데의
순위에 놓이는 데이터의 값
예제1) 14,12,10,19,16 등 5개의 데이터가 있을 때 작은 순서로 바꾸어 늘어 놓으면
10, 12, 14, 16, 19로 되기 때문에 중앙값은 14가 된다. 이때 평균은 14.2이다.
예제2) 14, 12, 10, 19, 16, 18 등 6개의 데이터가 있을 때는 작은 순서로 바꾸어
늘어놓으면 10, 12, 14, 16, 18, 19로 되기 때문에 중앙에 위치하는 2개의 값(14,
16)의 평균인 15를 중앙값으로 한다. 한편 평균은 14.8이 된다.
HCI Lab. @ Cheonan University, Korea
http://hci.cheonan.ac.kr
 분산의 산포도를 나타내는 지표
 범위: 데이터 중의 최대값과 최소값의 차
 분산
 표준편차
 분포의 형태를 나타내는 통계량
 왜도: 평균에 대한 분포의 비대칭 정도를 나타내는 지표
•
•
왜도가 양수: 분포의 비대칭 꼬리가 양의 값 쪽으로 치우쳐 있음
왜도가 음수: 분포의 비대칭 꼬리가 음의 값 쪽으로 치우쳐 있음.
 첨도: 분포의 뾰족한 정도를 정규분포와 비교하여 나타내는 것
•
•
양의 첨도: 상대적으로 더 뾰족함
음의 첨도: 상대적으로 덜 뾰족함
HCI Lab. @ Cheonan University, Korea
http://hci.cheonan.ac.kr

기술통계의 선택
 메뉴에서 [분석(A)]-[기술통계량(E)]-[기술통계(D)]를 선택
HCI Lab. @ Cheonan University, Korea
http://hci.cheonan.ac.kr

변수의 선택 및 통계량의 선택
 요약하고 싶은 변수 선택
 [옵션(O)] 버튼을 클릭하면 다음과 같은 [기술통계:옵션] 대화상자가 나타난다.
HCI Lab. @ Cheonan University, Korea
http://hci.cheonan.ac.kr
기술통계량
연령
유효수 (목록별)
N
통계량
20
20
범위
통계량
27.00
최소값
통계량
18.00
최대값
통계량
45.00
합계
통계량
655.00
평균
표준편차
통계량 표준오차 통계량
32.7500
1.8692 8.35952
HCI Lab. @ Cheonan University, Korea
http://hci.cheonan.ac.kr
분산
통계량
69.882
왜도
통계량 표준오차
-.562
.512
첨도
통계량 표준오차
-1.061
.992

도수분포표에 의한 요약
 도수분포표의 작성
 도수분포표란 데이터의 범위를
몇 개의 구간으로 나누어서 그
구간 내에 존재하는 데이터의
수(빈도수)를 표로 만드는 것
 빈도분석의 선택
 메뉴에서 [분석]-[기술통계량][빈도분석]을 선택한다.
HCI Lab. @ Cheonan University, Korea
http://hci.cheonan.ac.kr

변수의 선택
 도수분포표를 작성하고 싶은
변수를 선택

통계량 구하기
 도수분포표에서 필요한
통계량을 구하기 위해
[통계량]을 클릭하면,
[빈도분석:통계량] 대화
상자가 나타난다.
 [빈도분석:통계량]
대화상자에서 다음 사항을
지정하고, [계속] 버튼을 클릭
HCI Lab. @ Cheonan University, Korea
http://hci.cheonan.ac.kr

출력결과 형식 정하기
 도수분포표의 결과를 원하는
대로 출력하기 위해서는
[형식] 버튼을 클릭하면 된다.
 [빈도분석:형식] 대회
상자에서 [변수값
오름차순]을 선택한 후, [계속]
버튼을 클릭
 원래 창으로 돌아오면
[확인]을 눌려 결과 출력
HCI Lab. @ Cheonan University, Korea
http://hci.cheonan.ac.kr
통계량
연령
N
유효
결측
연령
20
0
32.7500
35.0000
35.00a
8.35952
69.88158
-.562
.512
-1.061
.992
27.00
18.00
45.00
655.00
평균
중위수
최빈값
표준편차
분산
왜도
왜도의 표준오차
첨도
첨도의 표준오차
범위
최소값
최대값
합계
a. 여러 최빈값이 있습니다. 가장 작은 값이 나타납니다.
HCI Lab. @ Cheonan University, Korea
http://hci.cheonan.ac.kr
빈도
유효
18.00
20.00
22.00
23.00
25.00
32.00
35.00
36.00
38.00
39.00
40.00
42.00
45.00
합계
1
2
1
1
1
2
3
1
2
1
3
1
1
20
퍼센트 유효 퍼센트 누적퍼센트
5.0
5.0
5.0
10.0
10.0
15.0
5.0
5.0
20.0
5.0
5.0
25.0
5.0
5.0
30.0
10.0
10.0
40.0
15.0
15.0
55.0
5.0
5.0
60.0
10.0
10.0
70.0
5.0
5.0
75.0
15.0
15.0
90.0
5.0
5.0
95.0
5.0
5.0
100.0
100.0
100.0
그래프에 의한 데이터의 시각화
 히스토그램
 히스토그램
 데이터의 범위를 몇 개의 구간으로 나누고, 그 구간 내에 존재하는
데이터의 수(도수 혹은 빈도)를 막대그래프로 도시한 것





중심의 위치
산포도
분포의 형태
크게 차이가 나는 값의 유무
등을 시각적으로 파악할 수 있다
HCI Lab. @ Cheonan University, Korea
http://hci.cheonan.ac.kr

데이터의 입력
HCI Lab. @ Cheonan University, Korea
http://hci.cheonan.ac.kr

빈도분석의 선택
 메뉴에서 [분석][기술통계량]-[빈도분석]을
선택

변수의 선택
HCI Lab. @ Cheonan University, Korea
http://hci.cheonan.ac.kr

통계량 구하기
 필요한 통계량을 구하기 위해
[통계량]을 클릭하면,
[분도분석:통계량]
대화상자가 나타난다.
[빈도분석:통계량] 대화
상자에서 다음과 같이
설정하고 [계속]버튼을
누른다.

도표 그리기
 [빈도분석] 대화상자로
되돌아 오면 [도표] 버튼을
클릭한다. [빈도분석:도표]
대화상자에서 [히스토그램],
[정규곡선 표시]를 선택한다.
HCI Lab. @ Cheonan University, Korea
http://hci.cheonan.ac.kr

출력결과 형식 정하기
 도수분포표의 결과를
원하는대로 출력하기
위해서는 [형식] 버튼을 클릭
 [빈도분석:형식]
대화상자에서 [변수값
오름차순]을 클릭
 [계속] 버튼을 클릭
 원래 화면에서 [확인] 버튼을
클릭
HCI Lab. @ Cheonan University, Korea
http://hci.cheonan.ac.kr
운행거리
20
10
표준편차 = 7.03
빈
도
평균= 20.5
0
N = 110.00
4
4
4
3
3
3
3
2
2
2
2
1
1
1
1
2. 5. 7. 0 2 5 7 0 2 5 7 0 2 5 7 0 2 5
5 0 5 .0 .5 .0 .5 .0 .5 .0 .5 .0 .5 .0 .5 .0 .5 .0
운행거리
HCI Lab. @ Cheonan University, Korea
http://hci.cheonan.ac.kr
히스토그램의 수정

Output1-SPSS뷰어 화면에서 2.5 5.0 45.0(운행거리 부분)을 더블클릭
HCI Lab. @ Cheonan University, Korea
http://hci.cheonan.ac.kr

Chart 2-SPSS도표 편집창에서
다시 2.5 5.0 … 45.0 (운행거리
부분)을 더블클릭

[구간축] 대화상자의 [제목 맞춤]
난에서 “가운데” 선택

[구간] 난에서는 [사용자 정의]를
선택하면 [정의] 부분이
반전된다.

[정의]버튼을 클릭

[구간축: 사용자 구간 정의]
대화상자에서 다음과 같이 입력

[계속] 버튼을 클릭하면 앞의
[구간축] 대화상자로 돌아가는데,
여기서 [확인] 버튼을 클릭하면
수정된 히스토그램을 얻을 수
있다.
HCI Lab. @ Cheonan University, Korea
http://hci.cheonan.ac.kr
운행거리
40
30
20
10
빈
도
표준편차 = 7.03
평균= 20.5
N = 110.00
0
7.5
17.5
42.5
32.5
22.5
12.5
2.5
27.5
운행거리
HCI Lab. @ Cheonan University, Korea
http://hci.cheonan.ac.kr
37.5
분석 도구를 이용한 히스토그램
 데이터 입력
HCI Lab. @ Cheonan University, Korea
http://hci.cheonan.ac.kr
 히스토그램 선택

메뉴에서 [그래프][히스토그램]을 선택
 변수의 선택

[히스토그램 대화상자가
나타나면 “운행거리”를
변수로 선택

[정규곡선 출력]을 체크
HCI Lab. @ Cheonan University, Korea
http://hci.cheonan.ac.kr
 제목 기입

[제목] 버튼을 클릭하면
[제목] 대화상자가 나타남

[첫째줄] 난에 “운행거리
히스토그램”이라고 입력

[계속] 버튼을 클릭하면
[히스토그램] 대화상자로
되돌아간다. 여기서 [확인]
버튼을 클릭하면 다음과
같은 히스토그램을 얻을 수
있다.
운행거리 히스토그램
20
10
표준편차 = 7.03
평균= 20.5
N = 110.00
0
.0
45.5
42.0
40.5
37.0
35.5
32.0
30.5
27.0
25.5
22.0
20.5
17.0
15.5
12.0
10
5
7.
0
5.
5
2.
운행거리
HCI Lab. @ Cheonan University, Korea
http://hci.cheonan.ac.kr