PASW17.0

Transcript PASW17.0

PASW 17.0 활용하기
일시 : 2009.07.15, (PM) 6:30-10:30
장소 : 삼성암센터 (지하1층 세미나실2)
내용
 자료 입력하기, 저장하기
 엑셀로 입력된 자료 불러오기
 실제 분석 절차 및 결과 제시
 S/W : PASW (Predictive Analytics Software) 17.0
초기 화면
자료 입력 및 저장하기
 PASW에서 Data 직접 입력하기
 입력한 변수 정보 확인하기
 Data 저장하기
자료 입력 하기
 PASW에서 Data 직접 입력하기
Step1
Step2
Step2
Step2
클릭 !!!
Step2
Step2
Step2
Tip. 문자형 자료 입력하기
클릭 !!!
Tip. 문자형 자료 입력하기
Tip. 문자형 자료 입력하기
Tip. 문자형 자료 입력하기
입력한 변수 정보 확인하기
파일 > 데이터 파일 정보 표시 > 작업 파일
Data 저장하기
-> ***.sav
Step1
파일 > 저장
Step2: 경로 지정
Step3 : 파일 이름 입력
Tip. Excel로 저장하기
 저장 유형을 (*.xls)로 바꿔 준다
자료 불러오기
 엑셀로 입력된 자료 불러오기
엑셀 자료
Step1
파일 > 열기 > 데이터
Step2 : 파일 유형 지정
Step3 : 불러올 파일 이름 지정 -> 열기
Step4 : 워크시트 지정 -> 확인
연관성 분석
Example 1-1
Ex) 흡연상태(C, P, N)와 폐암 발생간 연관성
환자군
정상군
total
C
28
(80%)
(53%)
7
(20%)
(22%)
35
P
20
(67%)
(38%)
10
(33%)
(31%)
30
N
5
(25%)
(9%)
15
(75%)
(47%)
20
total
53
32
85
가설 : 흡연 상태간 폐암 발생 비율이 차이가 있다.
가설 : 폐암군과 정상군간 흡연상태 비율이 차이가
있다.
-> Chi-square test, Fisher’s exact test 수행
분석할 자료 불러오기
분석 절차
1. 가중치 부여하기
2. Chi-Square test or Fisher’s Exact test 수행
가중치 부여: Step1
데이터 > 가중 케이스
가중치 부여: Step2
가중치 부여: Step2
Output
Chi-square test, Fisher’s exact test
:Step1
분석 > 기술통계량 > 교차분석
Chi-square test, Fisher’s exact test
:Step2
Chi-square test, Fisher’s exact test
:Step2
클릭 !!!
Chi-square test, Fisher’s exact test
:Step3
Chi-square test, Fisher’s exact test
:Step4
클릭 !!!
Chi-square test, Fisher’s exact test
:Step4
Output : 빈도분포표
Output : 카이제곱 검정 결과
Example 1-2
Ex) 하루 흡연량(0, <=10/day, >10/day)과 폐암 발생 여부간
연관성
Example 1-2
가설 : 세 군(흡연량)간 폐암 발생 비율이 다르다.
가설 : 폐암군과 정상군간 흡연량 비율이 다르다.
가설 : 하루 흡연량이 많을수록 폐암 발생 비율이 높다.
가설 : 폐암군은 정상군보다 흡연량이 많다.
 가설 : 세 군(흡연량)간 폐암 발생 비율이 다르다.
 가설 : 폐암군과 정상군간 흡연량 비율이 다르다.
Chi-square test, Fisher’s exact test
 가설 : 하루 흡연량이 많을수록 폐암 발생 비율이 높다.
Cochran-Armitage test
분석 절차
1. 문자형 변수 Group(정상군, 환자군)을 숫자형 변수
로 바꾸기
2. 가중치 부여하기
3. Cochran-Armitage test 수행
데이터 변환 - 문자 -> 숫자: Step1
변환 > 다른 변수로 코딩변경
데이터 변환 - 문자 -> 숫자 : Step2
데이터 변환 - 문자 -> 숫자 : Step2
데이터 변환 - 문자 -> 숫자 : Step3
데이터 변환 - 문자 -> 숫자 : Step3
Data 변환 결과
가중치 부여:Step1
데이터 > 가중 케이스
가중치 부여:Step2
가중치 부여:Step2
Output
Cochran-Armitage test: Step1
분석 > 기술통계량 > 교차분석
Cochran-Armitage test: Step2
Cochran-Armitage test: Step2
클릭 !!!
Cochran-Armitage test: Step3
Cochran-Armitage test: Step4
클릭 !!!
Cochran-Armitage test: Step5
Output : 빈도분포표
Output : 분석결과
카이제곱 검정
Pearson 카이제곱
값
16.769a
점근 유의확률
(양측검정)
자유도
2
.000
우도비
16.880
2
.000
선형 대 선형결합
14.976
1
.000
유효 케이스 수
85
a. 0 셀 (.0%)은(는) 5보다 작은 기대 빈도를 가지는 셀입니다. 최소
기대빈도는 7.53입니다.
 가설 : 폐암군은 정상군보다 흡연량이 많다.
Mann-Whitney test
분석 절차
1. 가중치 부여하기
2. Mann-Whitney test 수행
Mann-Whitney test: Step1
분석 > 분산분석 > 비모수적 검정 > 독립 2 표본
Mann-Whitney test: Step2
Mann-Whitney test: Step2
Mann-Whitney test: Step3
클릭 !!!
Output
Example 1-3
Ex) 하루 흡연량(0, <=10/day, >10/day)과 BP level (SBP;
<130, 130<= < 150, >=150)간 연관성
가설 : 세 군(흡연량)간 BP level 비율이 다르다
가설 : 흡연량이 많을수록 BP level이 높은가
 가설 : 세 군(흡연량)간 BP level 비율이 다르다.
Chi-square test, Fisher’s Exact test
-> 기대돗수 check
If expected count less than 5, Fisher’s Exact test
분석 절차
1. 가중치 부여하기
2. Fisher’s Exact test 수행
Fisher’s exact test: Step1
분석 > 기술통계량 > 교차분석
Fisher’s exact test: Step2
클릭 !!!
Fisher’s exact test: Step3
Fisher’s exact test: Step4
클릭 !!!
Fisher’s exact test: Step5
Fisher’s exact test: Step6
클릭 !!!
Fisher’s exact test: Step7
Output
Output
 가설 : 흡연량이 많을수록 BP level이 높은가
Spearman’s correlation analysis
분석 절차
1. 가중치 부여하기
2. Spearman’s correlation analysis 수행
Spearman’s correlation analysis: Step1
분석 > 상관분석 > 이변량 상관계수
Spearman’s correlation analysis: Step2
클릭 !!!
Spearman’s correlation analysis: 결과
Example 1-4
Ex) Venography와 Thermography간 진단결과 비교
(Paired design)
가설 :Venography의 양성 비율과 Thermography의
양성비율이 다르다.
……………………
-> McNemar’s test 적용
McNemar’s Test: Step1
분석 > 기술통계량 > 교차분석
McNemar’s Test: Step2
클릭 !!!
McNemar’s Test: Step3
클릭 !!!
McNemar’s Test: 분석결과
Example 2-1(1)
Ex) 폐암 발생 여부와 하루 흡연량(개피/day)간 연관성
가설 : 폐암 환자군과 정상군간 하루 흡연량이 다른가
 Two sample t-test, Mann-Whitney test
 정규성 체크!
- If yes, Two-sample t-test 적용
- If no, Mann-Whitney test 적용
정규성 check/ 기술통계: Step1
분석 > 기술통계량 > 데이터 탐색
정규성 check / 기술통계: Step2
클릭 !!!
정규성 check / 기술통계: Step3
정규성 check / 기술통계: Step4
클릭 !!!
정규성 check / 기술통계: Step5
정규성 check / 기술통계: 분석결과
정규성 check / 기술통계: 분석결과
 각 군에서 자료값들이 정규 분포를 따르는가
-> yes
 모수적 방법인 Two Sample t-test 적용
T-test: Step1
분석 > 평균 비교 > 독립 표본 T 검정
T-test: Step2
T-test: Step3
T-test: 분석결과
Example 2-1(2)
Ex) 폐암 발생 여부와 하루 흡연량(개피/day)간 연관성
가설 : 폐암 환자군과 정상군간 하루 흡연량이 다른가
 Two sample t-test, Mann-Whitney test
 정규성 체크!
-> If no, Mann-Whitney test 적용
Mann-Whitney test: Step1
분석 > 분산분석 > 비모수적 검정 > 독립 2 표본
Mann-Whitney test: Step2
Error !!!
문자 속성을 가진 Group변수는
활성화 되지 않음 -> 숫자로 변환
Data 변환: Step1
변환 > 다른 변수로 코딩변경
Data 변환: Step2
클릭 !!!
Data 변환: Step3
클릭 !!!
Mann-Whitney test: Step2
Mann-Whitney test: Step3
Mann-Whitney test: 분석 결과
Example 2-2
Ex) 해열제 투여 여부(투여전, 투여후)와 체온간 연관성
(Paired design)
가설 : 투여 전후 간 체온이 다르다.
 투여전후간 차이값들이 정규분포를 따르는지 check
-> If yes, Paired t-test
-> If no, Wilcoxon’s signed rank test
Diff(=before-after)계산: Step1
변환 > 변수 계산
Diff(=before-after)계산: Step2
정규성 check/ 기술통계: Step1
분석 > 기술통계량 > 데이터 탐색
정규성 check / 기술통계: Step2
클릭 !!!
Diff에 대한 정규성 check/기술통계:
Step3
Diff에 대한 정규성 check/기술통계:
분석결과
Diff에 대한 정규성 check/기술통계:
분석결과
 각 쌍의 차이값들이 정규 분포를 따르는가
-> yes
 Paired t-test 적용
Paired t-test: Step1
분석 > 평균 비교 > 대응 표본 T 검정
Paired t-test: Step2
Paired t-test: Step3
Paired t-test: 분석결과
Example 2-3(1)
Ex) BP level(<130, 130<= <150, >=150)과 하루 흡연량
(개피/day)간 연관성
가설 : 세 군(BP level)간 하루 흡연량이 다르다
-> One-way ANOVA or Kruskal-Wallis test
->
정규성 check
등분산성 check
정규성 및 등분산성 check / 기술통계
: Step1
분석 > 기술통계량 > 데이터 탐색
정규성 및 등분산성 check / 기술통계
: Step2
클릭 !!!
정규성 및 등분산성 check / 기술통계
: Step3
정규성 및 등분산성 check / 기술통계
: 분석 결과
정규성 및 등분산성 check / 기술통계
: 분석 결과
정규성 및 등분산성 check / 기술통계
: 분석 결과
 각 군에서 자료값들이 정규 분포를 따르는가 : Yes
 네 군의 분산들이 모두 같은가 : No
Kruskal-Wallis test
Kruskal –Wallis Test: Step1
분석 > 비모수 검정 > 독립 K - 표본
Kruskal –Wallis Test: Step2
Kruskal –Wallis Test: Step3
클릭 !!!
Kruskal –Wallis Test: 분석결과
비모수적 다중비교: Step1
(Tukey test using ranks)
변환 > 순위변수 생성
비모수적 다중비교: Step2
(Tukey test using ranks)
…………
비모수적 다중비교: Step3
(Tukey test using ranks)
분석 > 평균 비교 > 일원배치 분산분석
비모수적 다중비교: Step4
(Tukey test using ranks)
비모수적 다중비교: Step5
(Tukey test using ranks)
클릭 !!!
비모수적 다중비교: Step6
(Tukey test using ranks)
Tukey의 방법
비모수적 다중비교: 결과
(Tukey test using ranks)
1 vs 2 : P-value = 0.024
1 vs 3 : P-value = <0.001
2 vs 3 : P-value = 0.072
Example 2-3(2)
Ex) BP level(<130, 130<= <150, >=150)과 하루 흡연량
(개피/day)간 연관성
가설 : 하루 흡연량이 많을수록 BP level이 높다.
 순서형 변수와 연속형 변수간 상관성 분석
Spearman’s correlation analysis
Spearman’s correlation analysis: Step1
분석 > 상관분석 > 이변량 상관계수
Spearman’s correlation analysis: Step2
Spearman’s correlation analysis: Step3
Spearman’s correlation analysis:
분석결과
Example 2-4
Ex) 다이어트제 종류와 체중간 연관성; 세군간 체중 비교
(Matched design)
- Control (No diet)
- Diet제 A
- Diet제 B
가설 : 그룹 간에 6개월 후 체중이 다르다.
 정규성 check
-> If yes, Two-way ANOVA
Two way ANOVA: Step1
분석 > 일반선형모형 > 일변량
Two way ANOVA: Step2
Two way ANOVA: Step2
클릭 !!!
Two way ANOVA: Step3
Two way ANOVA: Step3
Two way ANOVA: Step4
클릭 !!!
Two way ANOVA: Step5
Two way ANOVA: Step9
Two way ANOVA: 분석결과
Two way ANOVA: 분석결과
 다중비교 결과
Example 3-1
Ex) 하루 흡연량과 SBP간 상관성이 있다.
가설 : 하루 흡연량과 SBP간 상관성이 있다.
 자료 탐색 - 산점도
 정규성 가정 check
-> If yes, Pearson’s correlation analysis
-> If no, Spearman’s correlation analysis
산점도: Step1
그래프 > 레거시 대화 상자 > 산점도/점도표
산점도: Step2
산점도: Step3
산점도: 분석결과
정규성 check: Step1
분석 > 기술통계량 > 데이터 탐색
정규성 check: Step2
클릭 !!!
정규성 check: Step3
정규성 check: 분석결과
Spearman correlation analysis:Step1
분석 > 상관분석 > 이변량 상관계수
Spearman correlation analysis:Step2
Spearman correlation analysis:
분석결과
Example 4-1
Ex) 종속변수(y) : SBP of infants
독립변수(x) : birthweight of infants, age in days of
infants, sex
Multiple linear regression (다중선형회귀) analysis
Multiple linear regression: Step1
분석 > 일반선형모형 > 일변량
Multiple linear regression: Step2
Multiple linear regression: Step2
클릭 !!!
Multiple linear regression: Step3
Multiple linear regression: 분석결과
Example 5-1
Ex) 종속변수(y) : CHD (1, 0)
독립변수(x) : 연령, 흡연유무
Logistic regression model
Logistic regression model: Step1
분석 > 회귀분석 > 이분형 로지스틱
Logistic regression model : Step2
Logistic regression model : Step2
Logistic regression model : Step3
클릭 !!!
Logistic regression model : Step4
Logistic regression model : Step5
클릭 !!!
Logistic regression model : Step6
Logistic regression model : 분석결과
Example 6-1
Ex) 우울증 환자들을 대상
으로 특정 치료제의 효
과를 알아보기 위해 동
일한 환자들을 대상으
로 투약전과 투약후 2
주, 4주 등의 간격으로
HAMD를 측정
id age
HAMD
(baselin
e)
HAMD HAMD
(week2 (week
)
4)
1
39
16
13
12
2
72
18
12
10
3
56
21
13
12
4
52
20
20
14
5
58
17
8
5
6
41
16
14
13
…
…
…
…
…
가설1: HAMD 점수가 시간에 따라 변화가 있다.
가설2: 50세 미만과 50세 이상 군간에 HAMD 점수 변화
양상이 다르다
가설3: 각 시점에서 50세 미만 군과 50세 이상 군간
HAMD 점수가 다르다.
가설1: HAMD 점수가 시간에 따라 변화가 있다.
Repeated Measures ANOVA(반복측정자료의 분산분석법)
에서 HAMD에 대한 time effect 검정
Repeated measures ANOVA: Step1
분석 > 일반선형 모형 > 반복측정
Repeated measures ANOVA: Step2
Repeated measures ANOVA: Step2
Repeated measures ANOVA: Step2
클릭 !!!
Repeated measures ANOVA: Step2
Repeated measures ANOVA: Step3
클릭 !!!
Repeated measures ANOVA: Step4
클릭 !!!
Repeated measures ANOVA: Step5
Repeated measures ANOVA: Step6
Repeated measures ANOVA: Step7
Repeated measures ANOVA: Step8
클릭 !!!
Repeated measures ANOVA: Step9
Repeated measures ANOVA: 분석결과
Repeated measures ANOVA: 분석결과
(time_1 =1 -> baseline, time_1 =2 -> Week2, time_1 =3 ->Week4)
Bonferroni’s correction
 Week2 vs baseline : P = < 0.0001 *2 = < 0.0001
 Week4 vs baseline : P = < 0.0001 *2 = < 0.0001
Tip. 구형성 가정
가설2: 50세 미만과 50세 이상군간에 HAMD 점수 변화
양상이 다르다
Repeated Measures ANOVA(반복측정자료의 분산분석
법)에서 HAMD에 대한 age 군과 time간 교호작용 효과
- (Interaction effect) 검정
Data 변환: Step1
변환 > 다른 변수로 코딩변겅
Data 변환: Step2
Data 변환: Step3
Data 변환: Output
Data 변환: Output
Repeated measures ANOVA Interaction effect: Step1
분석 > 일반선형 모형 > 반복측정
Repeated measures ANOVA Interaction effect: Step2
Repeated measures ANOVA Interaction effect: Step2
Repeated measures ANOVA Interaction effect: Step3
클릭 !!!
Repeated measures ANOVA Interaction effect: Step4
Repeated measures ANOVA Interaction effect: Step5
Repeated measures ANOVA Interaction effect: 분석결과
가설3: 각 시점에서 50세 미만 군과 50세 이상 군간 HAMD
점수가 다르다.
각 시점에서 두 군간 연속형 변수 비교 검정
 At baseline:
각 연령군에서 HAMD가 정규분포를 따르는지 check
> yes, Two-sample t-test
 At week2, Week4에서도 동일한 절차 적용
T-test: Step1
분석 > 평균 비교 > 독립 표본 T-검정
T-test: Step2
분석결과
분석결과
Bonferroni’s correction
 At baseline : P = 0.481 *3 = 1.000
 At week2
: P = 0.324 *3 = 0.972
 At week4 : P = 1.000 *3 = 1.000
Example 6-2
Ex) Outcome (normal, abnormal) repeated outcome;
범주형
가설 : 농도간에 abnormal 비율이 다르다
Data transpose: Step1
데이터 > 구조변환
Data transpose: Step2
Data transpose: Step3
Data transpose: Step4
Data transpose: Step5
Data transpose: Step6
Data transpose: Step7
Data transpose: Step8
Data transpose: Step9
Data transpose: 분석결과
………
GEE (Generalized Estimating Equation):
Step1
분석 > 일반화 선형 모형 > 일반화 추정 방정식
GEE: Step2
GEE: Step3
GEE: Step4
GEE: Step5
클릭 !!!
GEE: Step6
GEE: Step7
클릭 !!!
GEE: Step8
GEE: Step9
GEE: 분석결과
Bonferroni’s correction
 농도(5) – 농도(10) ; p = 0.056 *2 = 0.1114
 농도(5) – 농도(15) ; p = 0.003 *2 = 0.006
Example 7-1
Ex) 만성 간염환자 44명을 확률화에 의해 프레드니솔론
투여군과 비투여군으로 할당
가설 : 두 군간 생존곡선이 다르다
-> 생존율 및 생존곡선 추정
: Kaplan-Meier estimation 방법 이용
-> 두 생존곡선 비교
: 로그순위 검정법
생존율 추정/생존곡선 비교: Step1
분석 > 생존분석 > 생명표 분석
생존율 추정/생존곡선 비교: Step2
생존율 추정/생존곡선 비교: Step3
클릭 !!!
생존율 추정/생존곡선 비교: Step4
생존율 추정/생존곡선 비교: Step5
클릭 !!!
생존율 추정/생존곡선 비교: Step6
K-M 생존율 추정: 분석결과
………………………..
생존곡선: 분석결과
생존곡선 비교: 분석결과
Example 7-2
Ex) Data on 43 bone marrow transplants for
HD and NHL
Event = death or relapse
독립변수 : Graft type, Disease type
Karnofsky score,
Waiting time to transplat
-> Cox의 비례위험 모형
( Cox’s proportional hazards model)
Cox의 비례위험모형: Step1
분석 > 생존확률 > Cox 회귀모형
Cox의 비례위험모형: Step2
Cox의 비례위험모형: Step3
클릭 !!!
Cox의 비례위험모형: Step4
클릭 !!!
Cox의 비례위험모형: Step5
클릭 !!!
Cox의 비례위험모형: Step6
Cox의 비례위험모형: 분석결과
참고 문헌
 김선우 저(2004). 간호연구를 위한 기초통계 방법론,
자유아카데미
 김선우 저(2005). 의학연구를 위한 기초통계 방법론,
교우사

PASW17.0

Transcript PASW17.0

Directory