Transcript SPSS 소개
SPSS 소개 서울대학교 보건대학원 김호 SPSS 분석의 기본과정 1) SPSS 로 데이터를 불러들인다 (혹은 입력한다) 2) 메뉴에서 프로시저를 선택한다 3) 분석하고자 하는 변수를 선택한다 4) 프로시저를 수행하고 결과를 검토한다 SPSS에서 사용하는 주요 화일 • .sav : 데이터 • .spo : 결과 • .sps : syntax 화일 SPSS 의 초기화면(데이터편집기) 데이터 파일= 변수(열)+케이스(행) • • • • • • • • • • 파일 : 새 파일 만들고, 열고, 저장 편집 : 자료 편집 보기 : 상태표시줄, 도구모음, 글꼴 데이터 : 데이터 파일의 전체적인 수정 변환 : 데이터 파일의 변수나 값 변형 분석 : 통계분석 그래프 유틸리티 : 데이터 파일과 변수내용에 관한 정보 창 : 창 통제 도움말 사용할 데이터 • 3개 데이터 파일 1) 예제 1 : 9개 변수 (id,…,식후혈당), 10개 관측치 2) 예제 2 : 7개 변수 (id, 콜레스테롤, … 식후요당), 10 개 관측치 3) 예제 3 : 15개 변수(id, …, 식후요당), 20개 관측치 파일 • 엑셀화일 불러오기: 파일 > 열기 > 데이터 (파 일형식, xls) 보기 <데이터 보 기> <변수 보기> 데이터 • 파일 합치기 1) 변수추가 : 두 개 이상의 데이터 파일을 옆으로 붙이기 ‘예제 1’ 파일과 ‘예제 2’ 파일을 합치기 2) 케이스 추가 : 두 개 이상의 데이터 파일을 밑으로 붙이기 ‘예제 1+예제 2’ 파일과 ‘예제 3’ 파일 합치기 1) 변수추가 데이터 -> 파일합치기 -> 2) 케이스 추가 데이터 -> 파일합치기 -> 변환 • 변수 계산 : 있는 변수의 값들을 이용해서 계산된 값을 가진 새로운 변수 만들기 데이터 파일 안에 ‘체중’과 ‘신장’ 변수를 이용해 새로운 변수인 ‘비만도’를 만든다 체중-(신장-100) 0.9 비만도= (신장-100) 0.9 • 코딩변경 : 있는 변수의 값들에 따라서 변형한 값을 가진 새로운 변수 만들기 연속변수인 ‘연령’에서, 29세 이하 사람들은 ‘1’, 30-49세는 ‘2’, 50세 이상 사람들은 ‘3’의 값을 갖는, ‘연령_1’이란 변수를 만든다 • 변수 계산 변환->변수계산 • 코딩 변경 변환-> 코딩변경 -> 새로운 변수로 그래프 • 막대그래프 그래프 -> 막대도표 (1) 케이스 집단들의 요약값 1) 단순 막대그래프 ‘성별’(남녀)에 따른 ‘체중’의 평균값 80 70 60 평 균 체 중 50 1.00 성별 2.00 2) 수평누적 막대그래프 ‘성별’에 따라, ‘간염항체’ 유무인 사람의 수 그래프 ->막대도표 -> 수평누적 8 7 6 5 4 간염항체 3 1.00 빈 도 2 2.00 1.00 성별 2.00 3) 수직누적 막대그래프 14 12 10 8 6 4 간염항체 2 빈 도 2.00 0 1.00 1.00 성별 2.00 (2) 개별변수의 요약값 2) 수평누적 막대그래프 ‘성별’에 따른 ‘신장’과 ‘체중’의 평균값 180 160 140 120 100 80 60 평 균 신장 40 체중 1.00 성별 2.00 (3) 각 케이스의 값 각 케이스(예제 1+2의 총 10명)의 ‘혈압수축’, ‘혈압이완’, ‘공복혈당’ 값 400 300 200 100 공복혈당 혈압이완 값 0 혈압수축 1 2 3 케이스 번호 4 5 6 7 8 9 10 • 산점도 ‘신장’에 따른 ‘체중’ 분석 • 기술통계량 (1) 빈도분석 ‘성별’의 빈도분석 분석->기술통계량->빈도분석 (2) 기술통계 ‘신장’의 기술통계 분석->기술통계량->기술통계 기술통계량 N 신장 유효수 (목록별) 20 20 최소값 154.30 최대값 183.80 평균 168.1750 표준편차 7.4287 기술통계 신장 성별 1.00 평균 평균의 95% 신뢰구간 3) 데이터탐색 ‘성별’에 따른 ‘신장’의 기술통계량과 상자도표 하한 상한 5% 절삭평균 중위수 분산 표준편차 최소값 최대값 범위 사분위수 범위 왜도 첨도 평균 평균의 95% 신뢰구간 분석->기술통계량->데이터탐색 2.00 하한 상한 5% 절삭평균 중위수 분산 표준편차 최소값 최대값 범위 사분위수 범위 왜도 첨도 통계량 172.4500 169.0193 175.8807 172.3111 172.4500 29.155 5.3996 163.60 183.80 20.20 5.7750 .269 1.005 161.7625 157.5285 161.6861 162.5000 25.648 5.0644 154.30 170.60 16.30 6.7500 .228 .314 11 180 170 160 신 장 150 성별 .637 1.232 1.7905 165.9965 190 N= 표준오차 1.5587 12 8 1.00 2.00 .752 1.481 (4) 교차분석 ‘성별’에 따른 ‘간염항원’과 ‘간염항체’의 교차표와 카이제곱검정 분석->기술통계량->교차분석 간염항원 * 간염항체 * 성별 교차표 빈도 성별 1.00 2.00 간염 항원 1.00 2.00 전체 간염 항원 1.00 2.00 전체 간염항체 1.00 2.00 3 2 5 1 2 3 전체 7 7 5 5 10 2 12 6 2 8 카이제곱 검정 성별 1.00 2.00 Pearson 카이제곱 연속수정a 우도비 Fisher의 정확한 검정 선형 대 선형결합 유효 케이스 수 Pearson 카이제곱 연속수정a 우도비 Fisher의 정확한 검정 선형 대 선형결합 유효 케이스 수 값 3.360b 1.097 4.083 3.080 12 4.444c 1.600 5.178 3.889 8 자유도 1 1 1 점근 유의확률 (양쪽검정) .067 .295 .043 1 .079 1 1 1 .035 .206 .023 1 정확한 유 의확률 (양 쪽검정) 정확한 유 의확률 (한 쪽검정) .152 .152 .107 .107 .049 a. 2x2 표에 대해서만 계산됨 b. 3 셀 (75.0%)은(는) 5보다 작은 기대 빈도를 가지는 셀입니다. 최소 기대빈도는 .83입니다. c. 4 셀 (100.0%)은(는) 5보다 작은 기대 빈도를 가지는 셀입니다. 최소 기대빈도는 .75입니다. • 통계표 작성 분석->표 ->기초적통계표 (1) 기초적 통계표 ‘성별’로, ‘간염항원’과 ‘간염항체’에 따른 ‘콜레스테롤’의 평균 • 분석->평균비교 (3) 독립표본 T검정 ‘성별’에 따라서 ‘콜레스테롤’ 의 차이가 있는가? 독 립표 본 검 정 Levene의 등분산 검정 콜레스테 등분산 가정 등분산 가정되지 않음 F .147 유의확률 .706 평균의 동일성에 대한 t-검정 t .017 .018 자유도 18 16.696 유의확률 (양쪽) .987 .986 평균차 .2167 .2167 차이의 표준오차 12.6482 12.2513 차이의 95% 신뢰 구간 하한 상한 -26.4 26.7895 -25.7 26.1005 (4) 일원배치 분산분석 ‘연령_1’에 따라서 ‘콜레스테롤’의 평균의 차이가 있는가? 분 산분 석 콜레스테 제곱합 집단-간 3487.758 집단-내 10334.434 합계 13822.192 자유도 2 17 19 평균제곱 1743.879 607.908 F 2.869 유의확률 .084 다운받기 • http://plaza.snu.ac.kr/hokim • 열린강의실 세미나 자료 • SPSS 소개 (2008/12/18), spss data