PowerPoint 프레젠테이션

Download Report

Transcript PowerPoint 프레젠테이션

Factor Analysis
Factor Analysis
Chapter1. Factor Analysis
http://ui.korea.ac.kr
http://ui.korea.ac.kr
Factor Analysis
Factor Analysis
Contents
 Research Methodology
 Multivariate Analysis
 Factor Analysis
 Concept – Correlation Analysis, Regression Analysis
 SAS Program
 PCA - Example, SAS Program (Code, Output)
 CFA - Example, SAS Program (Code, Output)
 Example
Questionnaire
http://ui.korea.ac.kr
http://ui.korea.ac.kr
Factor Analysis
1. Research
Research Methodology
Black-Box
Stimuli
HUMAN & OBJECT
Response
?
Response=(a)Stimuli+Error
Response=(a1)Stimuli1+(a2)Stimuli2+•••+ Error
3/49
http://ui.korea.ac.kr
http://ui.korea.ac.kr
Factor Analysis 2. Multivariate
Multivariate Analysis
 Multivariate Analysis
 단일변량 통계분석: 어떤 한 변수의 분포상의 특성을 파악하는 데 사용되는 분석방법
 다변량 통계분석: 2개 이상의 변수들간의 관계를 파악하는 데 사용되며 변수들간의 관계 파악
 다변량 분석 종류:
회귀분석
분산분석
요인분석
군집분석
•요인분석
•주성분 분석
판별분석
다차원척도 분석
컨조인트 분석
구조방정식
4/49
http://ui.korea.ac.kr
http://ui.korea.ac.kr
Factor Analysis
3. Motivation
Factor Analysis?
Object
Component A
d
a
Component B
c


d
a
b
c
b
자료의 양을 줄여 정보를 요약
변수내의 존재하는 구조를 밝힘
요인으로 묶여지지 않은 중요도가 낮은 변수 제거
동일개념을 측정하는 변수들이 동일한 요인으로 묶였는지를 확인(측정도구의 타당성 검증)

5/49
c
b

Component B
d
a
c
b

d
a
Component C
요인분석을 통하여 얻어진 요인들을 회귀분석이나 판별분석으로 활용하려는 경우
http://ui.korea.ac.kr
http://ui.korea.ac.kr
Factor Analysis
4. Concept
Factor Analysis?
 Factor Analysis
 수집된 다수 또는 대량의 자료처리를 통하여 내용적으로 의미 있는 소수의 변수를 추출하는
통계기법
 독립변수와 종속변수가 지정되어 있지 않은 변수들 간의 상호관계 분석
 관찰 변수간의 상관관계를 소수의 잠재변수에 의해 설명
 측정변수와 요인간의 관계는 선형적
 전제조건
 모든 변수는 등간 척도 이상의 연속형 데이터, 각 변수는 정규분포, 관찰치는 상호독립적, 각 변
수의 분산은 같아야 함, 표본 수의 타당성(변수의 4-5배> 2배>통계적 분석 결과 해석에 신중)
 요인분석의 3가지 중요 요소
 1.Data : Interval Scale (Continuous)
 2.Software: SAS, SPSS
 3.Factoring
6/49
http://ui.korea.ac.kr
http://ui.korea.ac.kr
Factor Analysis
4. Concept
Factor Analysis
 Measurement Variable
Z=a·F+U
Z: 측정변수
F: 공통요인 U: 고유요인
a: 요인부하
Z1 = a11F1 + A22F2 + · · · +a1mFm + U1
··
·
Zn = an1F1 +An2F2+ · · ·+anmFm+Un
Z1 = b11F1 + b22F2 + · · · +b1nFn
··
·
Zn = bn1F1 +bn2F2+ · · ·+bnnFn
P1 = c11Z1 + c22Z2 + · · · +c1nZn
··
·
Pn = cn1Z1 +cn2Z2+ · · ·+cnnZn
7/49
http://ui.korea.ac.kr
http://ui.korea.ac.kr
Factor Analysis
4. Concept
Factor Analysis Model
 Factor Analysis Model
Var(z)= Common Variance + Unique Variance
 Principle Comport Model
- Total Variance: 측정변수의 분산을 설명하기 위하여 측정
- 변수들의 선형결합으로써 주성분을 도출하는 모형 (회전 필요 없음)
 Common Factor Model
- Common Variance: 측정변수 간의 상관관계고려 하는 공통요인을 추출하는 모형
- 변수간의 내재하는 차원을 찾아 구조 파악
- CV/TV 비율이 크거나, 자료의 특성에 대하여 아는 바가 없을 때 사용
8/49
http://ui.korea.ac.kr
http://ui.korea.ac.kr
Factor Analysis
4. Concept
Correlation Analysis?
 Correlation
 Definition: A correlation exists between two variables when one of them is related to the other in
some way.
 When X and Y are statistically independent, it can be shown that the covariance is zero.
 However, the converse is not generally true.
 Correlation Coefficient: The value indicates how much of a change in one variable is explained by
a change in another.
1: a perfect positive correlation
•
1   XY  1
0: a lack of correlation
-1: a perfect negative correlation
9/49
http://ui.korea.ac.kr
http://ui.korea.ac.kr
Factor Analysis
4. Concept
Regression Analysis?
 Regression
 Definition: A statistical technique used to find relationships between variables for
the purpose of predicting future values.
Y   x 
10/49
http://ui.korea.ac.kr
http://ui.korea.ac.kr
Factor Analysis
4. Concept
Correlation & Regression Analysis
 Correlation Analysis
 Simple Correlation Coefficient, Multiple Correlation, Partial Correlation
 Regression Analysis
 Simple Regression Analysis, Multiple Regression Analysis
 Correlation & Regression Analysis
 Correlation Analysis: Variable X  Variable Y
 Regression Analysis: Variable X  Variable Y
11/49
http://ui.korea.ac.kr
http://ui.korea.ac.kr
Factor Analysis
4. Concept
Factor Analysis Process
1. 분석 목적의 확립/분석변인 선정/ Raw Data 수집
2. 측정변수의 검토 및 상관관계 계산 (R or Q-Type)
Multiclineariy (R Square). Chronbach’s
Alpha, Partial Correlation (-1 < r < 1)
KMO, Barttler’s Test
3. 요인분석 모형 결정
Principal Component Model, Common Factor
Model, Maximum Likelihood, Generalized
Least Square
4. 요인수 결정( Communality 추정에서 SMC의 경우)
EigenValue, Cumulative, Scree Test
5. 요인 회전 방식 결정
Orthogona Rotation (Varimax, Quartimax,
Eqimax), Oblique Rotation (Oblimin,
Covarimin, Quartimin)
6. 요인결과 해석
7. 추후 분석을 위한 요인의 산출
12/49
Regression & Discriminant Analysis
http://ui.korea.ac.kr
http://ui.korea.ac.kr
Factor Analysis
4. Concept
Factor Analysis
 용어정리
 Variable: 요인 분석에 적용하고자 하는 내용을 포함하고 있는 데이터
 Factor: DataEssence (Unobserved Variable)/ 이론변수=잠재변수=가설적개념.
 Factor Loading:
- 해당변수가 요인에 의해 설명되는 비율
- 각 변수와 요인사이의 상관관계(rR-Square)
- 일반적으로 Factor Loading의 절대값 0.4이상이면 유의한 변수, 0.5를 넘으면 아주 중요변수
 Communality:
- 여러 요인에 의하여 그 변수가 얼마나 설명되어질 수 있는 한 변수의 비율
 Eigenvalue: 변수 속에 담겨진 정보가 어떤 요인에 의하여 어느 정도 표현될 수 있는가를
말해주는 비율
13/49
http://ui.korea.ac.kr
http://ui.korea.ac.kr
Factor Analysis 6. SAS Program
SAS Program
 상관계수를 이용한 요인분석
DATA FACT (TYPE=CORR);
INPUT NAME $ X1….. X5;
_TYPE_= ‘CORR’;
CARDS;
.
;
PROC FACOR METHOD=PRIN ROTATE=VARIMAX SCORE;
VAR X1……X5;
RUN;
 주성분 분석에 의한 요인분석
DATA FACT;
INPUT X1….. X2;
CARDS;
.
;
PROC FACOR DATA=FACT CORR MINEIGEN=1 ROTATE=VARIMAX SCREE;
VAR X1……X2;
RUN;
 상관행렬은 주성분 분석과 요인분석에 공통으로 사용됨
14/49
http://ui.korea.ac.kr
http://ui.korea.ac.kr
Factor Analysis
7. PCA
PCA: Principal Component Analysis
 주성분
 무수히 많은 선형결합 가운데에서 그 중 가장 높은 설명력을 가지는 선형결합 형태
 측정변수는 줄지않고 설명요인으로 묶임
 회귀분석. 군집분석 등에서 변수를 제거하기 위한분석으로 사용
 PCA에서 의 고려사항
 상관 행렬과 공분산 행렬 중 어느것을 선택할 것인가?
 주성분의 개수를 몇 개로 할 것인가?
 주성분에 영향을 미치는 변수는 어떤 변수를 택할 것인가?
 주성분 개수 결정(주성분을 결정하는 기준)
 고유치가 1보다 클 것 (상관계수 이용의 경우)
 주성분의 설명력이 원자료 변량의 80-90%이상 설명할 수 있을 것
 고유치를 그래프로 그려 급격히 감소하기 전까지 선택(Scree Analysis)
 주성분에 대한 해석이 가능할 것
15/49
http://ui.korea.ac.kr
http://ui.korea.ac.kr
Factor Analysis
7. PCA
Principal Component Analysis
DATA BODY1(TYPE=CORR);
INPUT _NAME_ $ HIGHT AMSPAN FORARM LOWLEG WEIGHT BITROC CGIRTH
CWIDE;
CARDS;
HIGHT 1.0 . . . . . . .
AMSPAN .846 1.0 . . . . . .
FORARM .805 .881 1.0 . . . . .
LOWLEG .859 .826 .801 1.0 . . . .
WEIGHT .473 .376 .380 .436 1.0 . . .
BITROC .398 .326 .319 .329 .762 1.0 . .
CGIRTH .301 .277 .237 .327 .730 .583 1.0 .
CWIDE .382 .415 .345 .365 .629 .577 .539 1.0
DATA OBODY1;
SET BODY1;
_TYPE_='CORR';
PROC PRINCOMP DATA=OBODY1(TYPE=CORR);
RUN;
16/49
http://ui.korea.ac.kr
http://ui.korea.ac.kr
Factor Analysis
7. PCA
Principal Component Analysis
Principal Component Analysis
10000 Observations
Eigenvalue
:한 요인이 설명할
수 있는 변수의 수
8 Variables
Eigenvalues of the Correlation Matrix
Eigenvalue
PRIN1
PRIN2
PRIN3
PRIN4
PRIN5
PRIN6
PRIN7
PRIN8
Factor Loading
:변수와 요인의
상관관계
8.00000
PRIN1
HIGHT
AMSPAN
FORARM
LOWLEG
WEIGHT
BITROC
CGIRTH
CWIDE
17/49
4.67288
1.77098
0.48104
0.42144
0.23322
0.18667
0.13730
0.09646
Difference
Proportion
Cumulative
2.90190
1.28995
0.05959
0.18822
0.04655
0.04937
0.04084
.
0.584110
0.221373
0.060129
0.052680
0.029153
0.023334
0.017163
0.012058
0.58411
0.80548
0.86561
0.91829
0.94744
0.97078
0.98794
1.00000
Eigenvectors
PRIN2
PRIN3
0.397578 -.279741
0.389320 -.331420
0.376160 -.344604
0.388390 -.297067
0.350667 0.394242
0.311908 0.400718
0.285527 0.435919
0.310225 0.314449
-.101382
0.113145
0.015263
-.144975
-.213293
-.073234
-.420881
0.853036
PRIN4
-.107460
0.068099
-.046962
0.123812
-.114490
-.712800
0.629531
0.220862
PRIN5
-.408365
0.340923
0.541190
-.458635
-.295730
0.219483
0.257169
-.109598
PRIN6
PRIN7
0.151934 -.635983
0.072097 -.278488
-.392355 0.241883
0.250864 0.662345
-.720099
-.026307
0.409796 0.111977
0.258284 -.080244
0.040713 0.033036
PRIN8
0.384098
-.722613
0.481640
-.112146
-.237305
0.006900
0.125354
0.116923
http://ui.korea.ac.kr
http://ui.korea.ac.kr
Factor Analysis
8. FA
Factor Analysis
 가정:
 Y=a1F1+a2f2+……+aiFi + e (Y는 F: Factor와 e:Error에 만 영향을 받음)
 관찰된 변수간의 관계를 설명하는 소수의 공통요인 존재
공통요인과 고유요인은 상관관계 없고, 고유유인끼리도 상관관계 없음
 특성
 PCA와 비슷한 기법 (요인 분석 초기에 상관 행렬 이용)
 관찰되지 않은 잠재적 변수(= Factor)를 발견하는데 유용
 요인분석에서 초기인자를 유도하는 방법 중 PCA가 포함
 여러 변인들 관계를 고려하여 내면에 잠재되어 있는 공통요인(Common Factor)을
찾아내는 분석방법
 고유요인을 고려하지 않은 분석
 공통요인은 측정변수의 수보다 적게 만족하는 범위 산출
18/49
http://ui.korea.ac.kr
http://ui.korea.ac.kr
Factor Analysis
8. FA
Factor Analysis
기초구조 산출
OPTIONS LS=75;
DATA BODY(TYPE=CORR);_TYPE_='CORR';
INPUT _NAME_ $ HIGHT AMSPAN FORARM LOWLEG WEIGHT BITROC CGIRTH
CWIDE;
CARDS;
HIGHT 1.0 . . . . . . .
AMSPAN .846 1.0 . . . . . .
사전공통분 추정치(prior Communality Estimate)
FORARM .805 .881 1.0 . . . . .
•다중상관제곱치
•재분해를 통한 반복추정
LOWLEG .859 .826 .801 1.0 . . . .
•상관계수 절대치중 최대값
WEIGHT .473 .376 .380 .436 1.0 . . .
BITROC .398 .326 .319 .329 .762 1.0 . .
상관행렬 분해방법
CGIRTH .301 .277 .237 .327 .730 .583 1.0 .
단일분해: PRIN
CWIDE .382 .415 .345 .365 .629 .577 .539 1.0 반복분해: PRINIT
최대우도분해:ML
;
RUN;
요인은 뽑지 말고
PRIORS=SMC
PROC FACTOR
METHOD=PRIN NFACT=0 SCREE; 단지 계산되는
상관행렬의
RUN;
종속변수에 대한 R-square = Squared Multiple Correlation
고유치만 계산
예측변수로 회귀하는 것공통분으로 사용
19/49
http://ui.korea.ac.kr
http://ui.korea.ac.kr
Factor Analysis
8. FA
Factor Analysis
Prior Communality Estimates: SMC
HIGHT AMSPAN FORARM LOWLEG WEIGHT BITROC CGIRTH CWIDE
0.816201
0.849314
0.800578
0.788437
0.748831 0.604149
0.562191 0.477792
대체로 공통분이 높다.
Eigenvalues of the Reduced Correlation Matrix:
Total = 5.64749154 Average = 0.70593644
1
2
3
4
5
6
Eigenvalue
4.4098
1.4609
0.0702
0.0266
-0.0190
-0.0731
-0.0994
-
Difference
Proportion
2.9489
0.7809
1.3907
0.2587
0.0435
0.0124
0.0457
0.0047
0.0541
-0.0034
0.0263
-0.0129
0.0291
-0.0176
-
Cumulative
0.7809
1.0395
1.0520
1.0567
1.0533
1.0404
1.0228
8
5.65+U/5.87
=100%
0.1285
Factor 2개
0.0228
1.0000
1. Scree Test
20/49
7
요인수 결정방법
2. Cumulative:85-85% 3. 해석가능성:최종구조 “3개이상의 변수”
http://ui.korea.ac.kr
http://ui.korea.ac.kr
Factor Analysis
8. FA
Factor Analysis
I
G
E
V
A
L
U
E
S
5
4
1
3
2
Kaiser Rule Or EigenvaluesGreater-Than-One Rule
2
1
0
Scree Test
3
1
3
2
4
5
4
5
6
6
7
7
8
8
Number
21/49
http://ui.korea.ac.kr
http://ui.korea.ac.kr
Factor Analysis
8. FA
Factor Analysis
기초구조 산출
OPTIONS LS=75;
DATA BODY(TYPE=CORR);_TYPE_='CORR';
INPUT _NAME_ $ HIGHT AMSPAN FORARM LOWLEG WEIGHT BITROC CGIRTH
CWIDE;
CARDS;
HIGHT 1.0 . . . . . . .
AMSPAN .846 1.0 . . . . . .
FORARM .805 .881 1.0 . . . . .
LOWLEG .859 .826 .801 1.0 . . . .
WEIGHT .473 .376 .380 .436 1.0 . . .
BITROC .398 .326 .319 .329 .762 1.0 . .
CGIRTH .301 .277 .237 .327 .730 .583 1.0 .
CWIDE .382 .415 .345 .365 .629 .577 .539 1.0
;
RUN;
기초 주성분 분석
PROC FACTOR PRIORS=SMC M=PRIN N=0 SCREE;
PROC FACTOR PRIORS=SMC M=PRIN N=2 R=V PLOT;
PROC FACTOR PRIORS=SMC M=PRIN N=3 R=V PLOT;
RUN;
22/49
http://ui.korea.ac.kr
http://ui.korea.ac.kr
Factor Analysis
8. FA
Factor Analysis
Rotation Method: Varimax
Orthogonal Transformation Matrix
1
1
2
Rotation Method: Varimax
Orthogonal Transformation Matrix
2
1
1
2
3
0.78710 0.61682
-0.61682 0.78710
Rotated Factor Pattern
23/49
0.86957
0.91118
0.88504
0.86170
0.24228
0.18812
0.12759
0.25549
0.27919
0.20884
0.18305
0.24952
0.87166
0.77565
0.75583
0.65791
3
0.78683 0.61717 -0.00035
-0.61703 0.78663 -0.02220
-0.01343 0.01768 0.99975
Rotated Factor Pattern
FACTOR1 FACTOR2
HIGHT
AMSPAN
FORARM
LOWLEG
WEIGHT
BITROC
CGIRTH
CWIDE
2
FACTOR1 FACTOR2 FACTOR3
HIGHT
AMSPAN
FORARM
LOWLEG
WEIGHT
BITROC
CGIRTH
CWIDE
0.87085
0.90939
0.88375
0.86326
0.24268
0.18750
0.12790
0.25364
0.27772
0.21148
0.18505
0.24771
0.87072
0.77610
0.75505
0.66008
-0.10185
0.13056
0.09482
-0.12088
-0.06545
0.01505
-0.05363
0.11159
http://ui.korea.ac.kr
http://ui.korea.ac.kr
Factor Analysis
8. FA
Factor Analysis
기초구조 산출 요인 회전 결과 비교
OPTIONS LS=75;
DATA BODY(TYPE=CORR);_TYPE_='CORR';
INPUT _NAME_ $ HIGHT AMSPAN FORARM LOWLEG WEIGHT BITROC CGIRTH
CWIDE;
CARDS;
HIGHT 1.0 . . . . . . .
AMSPAN .846 1.0 . . . . . .
FORARM .805 .881 1.0 . . . . .
LOWLEG .859 .826 .801 1.0 . . . .
WEIGHT .473 .376 .380 .436 1.0 . . .
BITROC .398 .326 .319 .329 .762 1.0 . .
CGIRTH .301 .277 .237 .327 .730 .583 1.0 .
CWIDE .382 .415 .345 .365 .629 .577 .539 1.0
;
RUN;
PROC FACTOR PRIORS=SMC METHOD=PRIN NFACT=2 PREPLOT;
Initial Solution
PROC FACTOR PRIORS=SMC METHOD=PRIN NFACT=2 R=V PLOT;
Factor Rotation
RUN;
24/49
http://ui.korea.ac.kr
http://ui.korea.ac.kr
Factor Analysis
8. FA
Factor Analysis
 기초구조
2 factors will be retained by the NFACTOR criterion.
Factor Pattern
FACTOR1
주성분 전체에 대한
선형결합 형태
HIGHT
AMSPAN
FORARM
LOWLEG
WEIGHT
BITROC
CGIRTH
CWIDE
0.85665
0.84600
0.80953
0.83216
0.72836
0.62651
0.56664
0.60691
FACTOR2
-0.31662
-0.39766
-0.40184
-0.33512
0.53665
0.49448
0.51622
0.36025
Factor1=0.86hight+
0.85amspan+…+
0.60691cwide
Variance explained by each factor
FACTOR1 FACTOR2
4.409844
1.460918
Final Communality Estimates: Total = 5.870762
25/49
http://ui.korea.ac.kr
http://ui.korea.ac.kr
Factor Analysis
8. FA
Factor Analysis
FACTOR1
F1*
B DA
C
-1
-.9 -.8
-.7
-.6
-.5
각 축이 중앙이 되도록 유지
26/49
-.4
-.3
-.2
1
.9
.8
.7
.6
.5
.4
.3
.2
.1
0
-.1 0
-.1
-.2
-.3
-.4
-.5
-.6
-.7
-.8
-.9
-1
지표가 되는 정보가
정확하지 않음
F2*
H
E
F
G
HIGHT
=A
AMSPAN =B
.1 . 2
.3
.4
.5
.6
.7 .8
.9
F
A
C
.1 T
O
R
2
FORARM =C
LOWLEG =D
WEIGHT =E
BITROC =F
CGIRTH =G
CWIDE
=H
기초구조
http://ui.korea.ac.kr
http://ui.korea.ac.kr
Factor Analysis
8. FA
Factor Analysis
 요인회전
Rotation Method: Varimax, Orthogonal Transformation Matrix
Rotated Factor Pattern
FACTOR1 FACTOR2
HIGHT
MSPAN
FORARM
LOWLEG
WEIGHT
BITROC
CGIRTH
CWIDE
0.86957
0.91118
0.88504
0.86170
0.24228
0.18812
0.12759
0.25549
0.27919
0.20884
0.18305
0.24952
0.87166
0.77565
0.75583
0.65791
Variance explained by each factor
FACTOR1 FACTOR2
3.287865
2.582897
Final Communality Estimates:
Total = 5.870762
27/49
Initial Solution과 정보량이 동일함
http://ui.korea.ac.kr
http://ui.korea.ac.kr
Factor Analysis
8. FA
Factor Analysis
FACTOR1
-1
-.9 -.8
28/49
-.7
-.6
-.5
-.4
-.3
-.2
1
.9
.8
.7
.6
.5
.4
.3
.2
.1
0
-.1 0
-.1
-.2
-.3
-.4
-.5
-.6
-.7
-.8
-.9
-1
CB
DA
HIGHT
=A
AMSPAN =B
H
GF
.1 . 2
.3
.4
.5
.6
.7 .8
E
.9
F
A
C
.1 T
O
R
2
FORARM =C
LOWLEG =D
WEIGHT =E
BITROC =F
CGIRTH =G
CWIDE
=H
요인구조 회전
http://ui.korea.ac.kr
http://ui.korea.ac.kr
Factor Analysis
9. Example
EXAMPLE
Development and Evaluation of An Internet Literacy
Questionnaire (ILQ)
인터넷 경험 측정 질문지를 구성하려고 한다. 이를 위하여 인터넷 경험능력과 관련 있는 21항목(Item)을
추출하여 총 52명의 대학생 집단으로부터 데이터를 얻었다. 그리고 21항의 측정변수를 요약하여 간단명
료한 질문지를 구성하려고 한다. 이는 여러 질문 항목(Items)들의 상관관계를 기초로 하여 정보의 손실을
최소화하면서 항목의 수보다 적은 수의 잠재변수로 묶어서 인터넷 경험에 대하여 분석할 수 있을 것이
다. 질문항목에 대한 응답자의 데이터가 아래와 같이 주어졌을 때 요인분석(Factor Analysis)의 절차에 맞
게 분석을 실시하시오. (회전방식은 Varimax 방식을 이용하라.)
29/49
http://ui.korea.ac.kr
http://ui.korea.ac.kr
Factor Analysis
9. Example
Development and Evaluation of An Internet Literacy
Questionnaire (ILQ)
1단계
1차 질문지 구성
신뢰성 분석
(86 항목)
(문항 제거)
2단계
2차 질문지 구성
신뢰성 분석
(21 항목)
타당성 검증
Test-retest
요인분석
30/49
IEQ 질문지 작성
http://ui.korea.ac.kr
http://ui.korea.ac.kr
Factor Analysis
9. Example
※질문지 구성의 고려사항
 사용능력 평가 질문지
 제품자체의 특수성 이해
 수용성(Capacity)
 응용(Application)
 기술지식에 대한 이해
 사회의 개인적 규칙이 개인에게 적합하게 응용되는가의 여부
 인터페이스에 관한 질문지
 일부에 한정되지 않고 사용능력과 관련된 전반적 내용
 신뢰도(Validity)와 타당성(Reliability) 증명
 사용자 수준(Level)결정
 응답시간(Response Time)
 질문지의 구성(Subfactor)
31/49
http://ui.korea.ac.kr
http://ui.korea.ac.kr
Factor Analysis
9. Example
※질문지 구성의 고려사항
 질문지 신뢰도(Reliability)
 동일한 개념을 반복해서 측정할 때 측정 결과 값의 일관성, 정확성,
의존 가능성, 안전성, 예측 가능성
 내적합치도(Internal Consistency Reliability)
- Cronbach’s Alpha 이용
- Cronbach’s Alpha: 서로 다른 문항이 서로 보완하여 체계적으로 개면, 변수, 또는 속성
을 잘 측정하고 있는가를 보여줌
32/49
http://ui.korea.ac.kr
http://ui.korea.ac.kr
Factor Analysis
9. Example
※질문지의 타당성과 신뢰도 검증
 타당성 검증
 항목들 간의 상관관계(Correlation) 분석
210개의 상관관계: -0.14 – 0.77
Positive 206, Negative 4
결과적으로 전반적으로 상관관계가 있다고 볼 있음
 각 항목과 전체 항목에 대한 문항분석(Item-total Correlations)
 상관관계: 0.48 – 0.75(p-value<0.05), 평균(0.66)
결과적으로 개별항목에 대하여 동일한 측정값, 따라서 모든 척도 사용 가능
 신뢰도 검증: Cronbach’s Alpha=0.93 (P-value<0.001)
 Test-retest 결과
 1차와 2차 평균: 72.6 ±15.0, 72.5 ±13.5
 Cronbach’s Alpha=0.9254 (P-value<0.001)
 두 득점관 상관계수: r=0.90
33/49
http://ui.korea.ac.kr
http://ui.korea.ac.kr
Factor Analysis
9. Example
SAS CODE-PPOC FACTOR
DATA LEQ;
INPUT X1-X21;
CARDS;
---------RUN;
PROC PRINT;
TITLE '자료처리보기';
RUN;
PROC CORR DATA=LEQ ALPHA NOSIMPLE NOCORR;
VAR X1-X21;
TITLE '신뢰도 분석';
RUN;
PROC CORR DATA=LEQ NOSIMPLE;
VAR X1-X21;
TITLE '상관계수 보기';
RUN;
PROC REG DATA=LEQ;
MODEL X1=X2-X21/COLLIN VIF TOL;
TITLE '다중공선성 예 Dep Vari X1 나머지 InDep Vari X2-X21';
RUN;
PROC FACTOR ALPHA PRIORS=SMC M=PRIN N=0 SCREE;
TITLE '기조구조 산출';
RUN;
PROC FACTOR PRIORS=SMC M=PRIN N=4 R=V;
TITLE '회전 4요인결정 확인적 요인분석';
RUN;
34/49
LABEL X1 =‘키보드치기’
X2 =‘ . …. . … . .’
•
X21=‘인터넷 보안설정’
•/VIF (Variance Inflation Factor):
10보다 크면 다중공선성 의심
•/TOL (Tolerance): 모수 추정치 허용도
0.1 미만일 경우 의심
•COLLIN
http://ui.korea.ac.kr
http://ui.korea.ac.kr
Factor Analysis
9. Example
SAS OUTPUT-PROC PRINT
자료처리보기 15:46 Saturday, October 24, 1998
OXXXXXXXXXXXXXXXXXXX
BXXXXXXXXX11111111112
S123456789012345678901
1424455555355535555235
2334334344243233334343
3445555355445345545355
4135135255155132115125
5233444434355424344344
6455554354354454344354
7435454555255255445243
8445434445254344435345
9234321421211223311112
10 5 4 5 5 2 4 5 5 5 1 5 4 1 4 5 4 4 5 1 5 5
11 3 5 5 5 5 5 5 5 5 5 5 5 5 5 4 5 5 5 5 4 5
49 2 5 5 4 4 5 4 5 5 2 5 4 3 5 4 3 5 5 3 4 5
50 5 5 5 3 5 4 4 3 4 4 4 5 5 3 4 4 5 5 5 4 5
51 1 4 4 2 2 2 3 2 4 1 4 2 4 3 2 3 4 4 4 2 4
52 1 4 4 5 5 5 3 5 5 3 5 5 3 5 5 4 5 5 5 3 4
35/49
http://ui.korea.ac.kr
http://ui.korea.ac.kr
Factor Analysis
9. Example
SAS OUTPUT-Reliability
신뢰도 분석 15:46 Saturday, October 24, 1998
Correlation Analysis
Cronbach Coefficient Alpha
for RAW variables: 0.931865
for STANDARDIZED variables: 0.934740
Raw Variables
Std. Variables
Deleted Correlation
Correlation
Variable
with Total
Alpha with Total
Alpha
--------------------------------------------------------------------------------------X1
0.508533 0.930619 0.506120 0.933586
X2
0.638789 0.928233 0.621926 0.931573
X3
0.556119 0.929635 0.553552 0.932766
X4
0.637308 0.928142 0.628074 0.931465
X5
0.645271 0.927957 0.648538 0.931105
X6
0.703371 0.926951 0.716041 0.929911
X14
0.629791 0.928342 0.616731 0.931664
X15
0.635471 0.928141 0.635817 0.931329
X16
0.694436 0.927020 0.688710 0.930396
X17
0.656724 0.927757 0.657914 0.930940
X18
0.646372 0.928787 0.672721 0.930679
X19
0.522771 0.930326 0.501856 0.933660
X20
0.601832 0.928902 0.609660 0.931787
X21
0.622816 0.928386 0.623382 0.931547
36/49
3/49
http://ui.korea.ac.kr
http://ui.korea.ac.kr
Factor Analysis
9. Example
SAS OUTPUT-The Correlation Matrix
37/49
http://ui.korea.ac.kr
http://ui.korea.ac.kr
Factor Analysis
9. Example
SAS OUTPUT- Multiclineariy
다중공선성 예 Dep Vari X1 나머지 InDep Vari X2-X21
Model: MODEL1 Dependent Variable: X1
Analysis of Variance
Sum of
Mean
Source
DF Squares
Square F Value Prob>F
Model
20 43.44351 2.17218
2.384 0.0145
Erro r
31 28.24880 0.91125
C Total
51 71.69231
Root MSE
0.95460 R-square
0.6060
Dep Mean
2.92308 Adj R-sq
0.3518
C.V.
32.65720
Parameter Estimates
38/49
http://ui.korea.ac.kr
http://ui.korea.ac.kr
Factor Analysis
9. Example
SAS OUTPUT- Multiclineariy
Variable DF
INTERCEP 1
X2
1
X3
1
X4
1
X5
1
X6
1
X7
1
X8
1
X9
1
X10
1
X11
1
X12
1
X13
1
X14
1
X15
1
X16
1
X17
1
X18
1
X19
1
X20
1
X21
1
Parameter
Estimate
-1.107330
0.696737
0.055674
0.060190
0.255561
-0.229370
-0.017656
0.124136
0.026193
-0.086836
-0.543627
-0.189038
0.241314
-0.329355
0.395065
0.057565
-0.356856
0.718035
-0.312357
0.335715
0.107214
Standard T for H0:
Error Parameter=0
1.08531847
-1.020
0.21828246
3.192
0.25755908
0.216
0.17365680
0.347
0.19784737
1.292
0.24326835
-0.943
0.16605590
-0.106
0.25175654
0.493
0.41526062
0.063
0.22060957
-0.394
0.40938970
-1.328
0.24537333
-0.770
0.22392177
1.078
0.19110137
-1.723
0.19039114
2.075
0.20138624
0.286
0.18669754
-1.911
0.45774621
1.569
0.22748238
-1.373
0.20783402
1.615
0.18853351
0.569
Prob > |T|
0.3155
0.0032
0.8303
0.7312
0.2060
0.3530
0.9160
0.6254
0.9501
0.6966
0.1939
0.4469
0.2895
0.0948
0.0464
0.7769
0.0652
0.1269
0.1796
0.1164
0.5737
Variance
Tolerance
Inflation
.
0.00000000
0.21231814 4.70991317
0.33901850 2.94969152
0.38587826 2.59149093
0.31565724 3.16799325
0.26175258 3.82040167
0.50856308 1.96632441
0.31786507 3.14598893
0.14554530 6.87071331
0.26836489 3.72626992
0.17582548 5.68745796
0.24819367 4.02911155
0.27504002 3.63583456
0.30035185 3.32942844
0.38870606 2.57263804
0.34013814 2.93998201
0.32245109 3.10124553
0.15157352 6.59745861
0.24909822 4.01448074
0.48219976 2.07382931
0.36744918 2.72146478
10 이상이 없음
39/49
http://ui.korea.ac.kr
http://ui.korea.ac.kr
Factor Analysis
9. Example
SAS OUTPUT- Multiclineariy
Collinearity Diagnostics
Condition
Number Eigenvalue
Index
1
19.88792 1.00000
2
0.27421 8.51627
3
0.17160 10.76552
4
0.11732 13.02011
5
0.08590 15.21595
6
0.06906 16.97008
7
0.05817 18.48985
8
0.05010 19.92365
9
0.04737 20.49062
10
0.04197 21.76906
11
0.03736 23.07369
12
0.03201 24.92511
13
0.02682 27.23147
14
0.02515 28.12100
15
0.02125 30.59305
16
0.01794 33.29800
17
0.01287 39.31750
18
0.01015 44.27221
19
0.00633 56.03982
20
0.00396 70.89972
21
0.00256 88.18460
40/49
Var Prop Var Prop
INTERCEP
X2
0.0000
0.0001
0.0014
0.0017
0.0006
0.0607
0.0060
0.0120
0.0099
0.0003
0.0000
0.0086
0.0011
0.0026
0.0090
0.0025
0.0021
0.0009
0.0368
0.0056
0.0057
0.1900
0.0202
0.0191
0.0001
0.0392
0.0354
0.0062
0.0187
0.0702
0.0869
0.1281
0.1980
0.0000
0.0473
0.2156
0.4850
0.0934
0.0341
0.0611
0.0018
0.0816
Var Prop
X3
0.0000
0.0011
0.0000
0.0007
0.0077
0.0005
0.0002
0.0075
0.0001
0.0785
0.0053
0.0296
0.0002
0.0109
0.0037
0.0067
0.0679
0.3656
0.1121
0.0005
0.3013
- EX) 98%0.000066
-
Var Prop
X19
0.0001
0.0395
0.0018
0.0348
0.0193
0.0148
0.0847
0.0793
0.1227
0.0092
0.0077
0.0000
0.0897
0.0104
0.0167
0.1286
0.0189
0.0064
0.1847
0.0013
0.1294
Var Prop
X20
0.0001
0.0017
0.0017
0.0001
0.0036
0.0046
0.0101
0.0398
0.0007
0.0002
0.0009
0.4200
0.1065
0.1079
0.0974
0.0008
0.0005
0.0203
0.0001
0.0528
0.1303
Var Prop
X21
0.0001
0.0008
0.0185
0.0002
0.0089
0.0001
0.0582
0.0779
0.0861
0.0000
0.2118
0.0014
0.2253
0.0028
0.0087
0.0018
0.0196
0.0839
0.1312
0.0214
0.0412
http://ui.korea.ac.kr
http://ui.korea.ac.kr
Factor Analysis
9. Example
SAS OUTPUT-Prior Communality
기조구조 산출
20:40 Thursday, October 15, 1998
Initial Factor Method: Principal Factors
Prior Communality Estimates: SMC
X1
X2
X3
X4
X5
X6
X7
X8
X9
X10
X11
X12
X13
X14
0.605972 0.840201 0.661492 0.615611 0.700465 0.745545 0.491622 0.684608 0.854473 0.732970 0.833637 0.756469 0.734892 0.725910
X15
X16
X17
X18
X19
X20
X21
0.658699 0.660756 0.711545 0.859573 0.765183 0.555235 0.636344
Eigenvalues of the Reduced Correlation Matrix:
Total = 14.8312021 Average = 0.70624772
1
Eigenvalue 8.9455
Difference 6.8398
Proportion 0.6032
Cumulative 0.6032
2
2.1057
0.8917
0.1420
0.7451
3
1.2140
0.0609
0.0819
0.8270
11
0.0956
0.0366
0.0064
1.0439
12
0.0590
0.0336
0.0040
1.0478
13
0.0254
0.0101
0.0017
1.0496
Eigenvalue
Difference
Proportion
Cumulative
4
5
6
7
1.1531 0.5082 0.4323 0.3838
0.6449 0.0760 0.0485 0.1047
0.0777 0.0343 0.0291 0.0259
0.9047 0.9390 0.9681 0.9940
14
15
16
0.0153 0.0012 -0.0432
0.0141 0.0444 0.0354
0.0010 0.0001 -0.0029
1.0506 1.0507 1.0478
8
9
0.2791 0.2209
0.0582 0.0774
0.0188 0.0149
1.0128 1.0277
17
-0.0785
0.0503
-0.0053
1.0425
18
-0.1288
0.0044
-0.0087
1.0338
10
0.1435
0.0479
0.0097
1.0374
19
-0.1332
0.0472
-0.0090
1.0248
20
-0.1804
0.0070
-0.0122
1.0126
21
-0.1874
-0.0126
1.0000
0 factors will be retained by the NFACTOR criterion.
41/49
http://ui.korea.ac.kr
http://ui.korea.ac.kr
Factor Analysis
9. Example
Scree Plot for ILQ Factors
42/49
http://ui.korea.ac.kr
http://ui.korea.ac.kr
Factor Analysis
9. Example
SAS OUTPUT – Initial Factor Model
기초구조 확인 20:40 Thursday, October 15, 1998
Initial Factor Method: Principal Factors
Factor Pattern
FACTOR1 FACTOR2 FACTOR3 FACTOR4
X1
0.53072 0.11342
0.46589
0.09123
X2
0.65277
0.29584
0.20687 -0.53693
X3
0.58916 -0.01963
0.43974 -0.08143
X4
0.63968
0.27571
0.22214
0.07253
X5
0.68020
0.05997 -0.10465
0.34653
X6
0.75487 -0.16927 -0.01554
0.08714
X7
0.57287
0.12410
0.16888
0.27852
X8
0.68680 -0.34379
0.03959
0.00831
X9
0.71150 -0.50001 -0.23409
0.00169
X10
0.60023
0.52931 -0.11401
0.27482
X11
0.73582 -0.48831 -0.17121 -0.03645
X12
0.77591 -0.27344 -0.10752 -0.02895
X13
0.41595
0.55588 -0.45611
0.01026
X14
0.64736
0.17617
0.07765 -0.43863
X15
0.65806
0.10830
0.21068
0.33593
X16
0.70861
0.14712
0.01687
0.17263
X17
0.68802
0.07426 -0.29939 -0.18069
X18
0.73476 -0.49377 -0.21157 -0.02674
X19
0.52172
0.53914 -0.36908 -0.10333
X20
0.63482 -0.07898
0.11919 0.17128
X21
0.65067
0.00493
0.13384 -0.39119
Variance explained by each factor
FACTOR1 FACTOR2 FACTOR3 FACTOR4
8.945482 2.105701 1.213978 1.153085
43/49
http://ui.korea.ac.kr
http://ui.korea.ac.kr
Factor Analysis
9. Example
SAS OUTPUT – Rotation Factor Model
회전 4요인결정 확인 20:40 Thursday, October 15, 1998
Rotation Method: Varimax
Rotated Factor Pattern
FACTOR1 FACTOR2 FACTOR3 FACTOR4
X1
0.09602
0.63150 -0.03338 0.33283
X2
0.13742
0.22884
0.26919 0.83726
X3
0.23332
0.52008 -0.09260 0.46261
X4
0.13931
0.57732
0.27182 0.33647
X5
0.42894
0.52509
0.36977 -0.02938
X6
0.60193
0.41696
0.17280 0.20069
X7
0.22035
0.59636
0.19205 0.09269
X8
0.65902
0.32759 -0.00773 0.22322
X9
0.87824
0.14802
0.07538 0.11029
X10
0.05858
0.53696
0.65595 0.08332
X11
0.86345
0.17753
0.04895 0.17624
X12
0.71890
0.28667
0.16518 0.25087
X13
0.04259
0.09550
0.81737 0.10555
X14
0.26191
0.18320
0.27685 0.68537
X15
0.27084
0.69627
0.18774 0.09284
X16
0.34391
0.52826
0.34994 0.18457
X17
0.49099
0.11806
0.48259 0.33654
X18
0.88073
0.15847
0.07175 0.15232
X19
0.09043
0.13352
0.78168 0.26968
X20
0.41646
0.49597
0.10614 0.14861
X21
0.36212
0.20693
0.12980 0.63525
Variance explained by each factor
FACTOR1 FACTOR2 FACTOR3 FACTOR4
4.759762 3.543629 2.604822 2.510033
44/49
http://ui.korea.ac.kr
http://ui.korea.ac.kr
Factor Analysis
9. Example
SAS OUTPUT-Final Factor Analysis Statistics for the Components
45/49
http://ui.korea.ac.kr
http://ui.korea.ac.kr
Factor Analysis
9. Example
SAS OUTPUT-Factor Loading of the Rotated Factor Matrix
46/49
http://ui.korea.ac.kr
http://ui.korea.ac.kr
Factor Analysis
9. Example
Means, Stand Deviation, Component-Total Score Correlations and
Coefficient Alphas for the Components
LEQ Component
M
SD
r
Cronbach’s Alpha
General Experience
4.26
0.95
0.76
0.92
Advance Experience
3.65
1.20
0.93
0.86
Internet Program Language
2.86
1.28
0.78
0.82
Software Application
3.42
1.12
0.83
0.74
47/49
http://ui.korea.ac.kr
http://ui.korea.ac.kr
Factor Analysis
9. Example
Results
LEQ
General Experience
48/49
Advance Experience
Internet Program Language
Software Application
http://ui.korea.ac.kr
http://ui.korea.ac.kr
Factor Analysis
Factor Analysis
Thank you !!!
http://ui.korea.ac.kr
http://ui.korea.ac.kr