Transcript SPSS 소개

SPSS 소개
서울대학교
보건대학원
김호
SPSS 분석의 기본과정
1) SPSS 로 데이터를 불러들인다
(혹은 입력한다)
2) 메뉴에서 프로시저를 선택한다
3) 분석하고자 하는 변수를 선택한다
4) 프로시저를 수행하고 결과를 검토한다
SPSS에서 사용하는 주요 화일
• .sav : 데이터
• .spo : 결과
• .sps : syntax 화일
SPSS 의 초기화면(데이터편집기)
데이터 파일= 변수(열)+케이스(행)
•
•
•
•
•
•
•
•
•
•
파일 : 새 파일 만들고, 열고, 저장
편집 : 자료 편집
보기 : 상태표시줄, 도구모음, 글꼴
데이터 : 데이터 파일의 전체적인 수정
변환 : 데이터 파일의 변수나 값 변형
분석 : 통계분석
그래프
유틸리티 : 데이터 파일과 변수내용에 관한 정보
창 : 창 통제
도움말
사용할 데이터
• 3개 데이터 파일
1) 예제 1 : 9개 변수 (id,…,식후혈당), 10개 관측치
2) 예제 2 : 7개 변수 (id, 콜레스테롤, … 식후요당),
10 개 관측치
3) 예제 3 : 15개 변수(id, …, 식후요당), 20개 관측치
파일
• 엑셀화일 불러오기: 파일 > 열기 > 데이터 (파
일형식, xls)
보기
<데이터 보
기>
<변수 보기>
데이터
• 파일 합치기
1) 변수추가 : 두 개 이상의 데이터 파일을
옆으로 붙이기
‘예제 1’ 파일과 ‘예제 2’ 파일을 합치기
2) 케이스 추가 : 두 개 이상의 데이터 파일을
밑으로 붙이기
‘예제 1+예제 2’ 파일과 ‘예제 3’ 파일
합치기
1) 변수추가
데이터 ->
파일합치기
->
2) 케이스 추가
데이터 ->
파일합치기
->
변환
• 변수 계산 : 있는 변수의 값들을 이용해서
계산된 값을 가진 새로운 변수 만들기
데이터 파일 안에 ‘체중’과 ‘신장’ 변수를
이용해 새로운 변수인 ‘비만도’를 만든다
체중-(신장-100) 0.9
비만도=
(신장-100) 0.9
• 코딩변경 : 있는 변수의 값들에 따라서
변형한 값을 가진 새로운 변수 만들기
연속변수인 ‘연령’에서,
29세 이하 사람들은 ‘1’, 30-49세는 ‘2’,
50세 이상 사람들은 ‘3’의 값을 갖는,
‘연령_1’이란 변수를 만든다
• 변수 계산
변환->변수계산
• 코딩 변경
변환->
코딩변경
-> 새로운
변수로
그래프
• 막대그래프
그래프 ->
막대도표
(1) 케이스 집단들의 요약값
1) 단순 막대그래프
‘성별’(남녀)에 따른 ‘체중’의 평균값
80
70
60
평
균
체
중 50
1.00
성별
2.00
2) 수평누적 막대그래프
‘성별’에 따라, ‘간염항체’ 유무인 사람의 수
그래프 ->막대도표 -> 수평누적
8
7
6
5
4
간염항체
3
1.00
빈
도 2
2.00
1.00
성별
2.00
3) 수직누적 막대그래프
14
12
10
8
6
4
간염항체
2
빈
도
2.00
0
1.00
1.00
성별
2.00
(2) 개별변수의 요약값
2) 수평누적 막대그래프
‘성별’에 따른 ‘신장’과 ‘체중’의 평균값
180
160
140
120
100
80
60
평
균
신장
40
체중
1.00
성별
2.00
(3) 각 케이스의 값
각 케이스(예제 1+2의 총 10명)의 ‘혈압수축’,
‘혈압이완’, ‘공복혈당’ 값
400
300
200
100
공복혈당
혈압이완
값
0
혈압수축
1
2
3
케이스 번호
4
5
6
7
8
9
10
• 산점도
‘신장’에 따른 ‘체중’
분석
• 기술통계량
(1) 빈도분석
‘성별’의 빈도분석
분석->기술통계량->빈도분석
(2) 기술통계
‘신장’의 기술통계
분석->기술통계량->기술통계
기술통계량
N
신장
유효수 (목록별)
20
20
최소값
154.30
최대값
183.80
평균
168.1750
표준편차
7.4287
기술통계
신장
성별
1.00
평균
평균의 95%
신뢰구간
3) 데이터탐색
‘성별’에 따른 ‘신장’의
기술통계량과 상자도표
하한
상한
5% 절삭평균
중위수
분산
표준편차
최소값
최대값
범위
사분위수 범위
왜도
첨도
평균
평균의 95%
신뢰구간
분석->기술통계량->데이터탐색
2.00
하한
상한
5% 절삭평균
중위수
분산
표준편차
최소값
최대값
범위
사분위수 범위
왜도
첨도
통계량
172.4500
169.0193
175.8807
172.3111
172.4500
29.155
5.3996
163.60
183.80
20.20
5.7750
.269
1.005
161.7625
157.5285
161.6861
162.5000
25.648
5.0644
154.30
170.60
16.30
6.7500
.228
.314
11
180
170
160
신
장 150
성별
.637
1.232
1.7905
165.9965
190
N=
표준오차
1.5587
12
8
1.00
2.00
.752
1.481
(4) 교차분석
‘성별’에 따른
‘간염항원’과
‘간염항체’의
교차표와 카이제곱검정
분석->기술통계량->교차분석
간염항원 * 간염항체 * 성별 교차표
빈도
성별
1.00
2.00
간염
항원
1.00
2.00
전체
간염
항원
1.00
2.00
전체
간염항체
1.00
2.00
3
2
5
1
2
3
전체
7
7
5
5
10
2
12
6
2
8
카이제곱 검정
성별
1.00
2.00
Pearson 카이제곱
연속수정a
우도비
Fisher의 정확한 검정
선형 대 선형결합
유효 케이스 수
Pearson 카이제곱
연속수정a
우도비
Fisher의 정확한 검정
선형 대 선형결합
유효 케이스 수
값
3.360b
1.097
4.083
3.080
12
4.444c
1.600
5.178
3.889
8
자유도
1
1
1
점근 유의확률
(양쪽검정)
.067
.295
.043
1
.079
1
1
1
.035
.206
.023
1
정확한 유
의확률 (양
쪽검정)
정확한 유
의확률 (한
쪽검정)
.152
.152
.107
.107
.049
a. 2x2 표에 대해서만 계산됨
b. 3 셀 (75.0%)은(는) 5보다 작은 기대 빈도를 가지는 셀입니다. 최소 기대빈도는 .83입니다.
c. 4 셀 (100.0%)은(는) 5보다 작은 기대 빈도를 가지는 셀입니다. 최소 기대빈도는 .75입니다.
• 통계표 작성 분석->표 ->기초적통계표
(1) 기초적 통계표
‘성별’로, ‘간염항원’과 ‘간염항체’에 따른
‘콜레스테롤’의 평균
• 분석->평균비교
(3) 독립표본 T검정
‘성별’에 따라서
‘콜레스테롤’ 의
차이가 있는가?
독 립표 본 검 정
Levene의 등분산 검정
콜레스테
등분산 가정
등분산 가정되지 않음
F
.147
유의확률
.706
평균의 동일성에 대한 t-검정
t
.017
.018
자유도
18
16.696
유의확률
(양쪽)
.987
.986
평균차
.2167
.2167
차이의
표준오차
12.6482
12.2513
차이의 95% 신뢰
구간
하한
상한
-26.4 26.7895
-25.7 26.1005
(4) 일원배치 분산분석
‘연령_1’에 따라서 ‘콜레스테롤’의 평균의
차이가 있는가?
분 산분 석
콜레스테
제곱합
집단-간 3487.758
집단-내 10334.434
합계
13822.192
자유도
2
17
19
평균제곱
1743.879
607.908
F
2.869
유의확률
.084
다운받기
• http://plaza.snu.ac.kr/hokim
• 열린강의실 세미나 자료
• SPSS 소개 (2008/12/18),
spss data