가설검정

Download Report

Transcript 가설검정

Six Sigma를 하려면
꼭 알아야만 하는 통계
1
목
차
1. 기본 통계량 : 평균과 편차
2. 정규분포
3. 통계적 의사결정
- 가설검정
4. 분포를 이용한 추정,검정
- 평균치 : z 분포/t 분포
- 산 포 : χ² 분포/F 분포
5. 회귀분석
6. 실험계획법
기타-공정능력 지수 / 장기,단기 Sigma
2
Six Sigma와 통계Tool
Define
Measure
Analyze
Improve
Control
*통 계 Tools and Techniques
• 친화도
• 벤치마킹
• 인과분석
• Challenge Assumptions
• FMEA
• 브레인스토밍
• 체크시트
• 상관
• CDAM
• 프로세스 관리시스템
• 고객조사
• 관리도
• 실험계획법
• 비용 효과분석
• Workplanning
• 전개도
• 데이터 차트
• Fault Tree
• 기준선정 메트릭스
• 간트차트
• Guage R&R
• FMEA
• Force Field Analysis
• 그래프
• 히스토그램
• 가설검증
• How-By Pursuits
• 카노분석
• 척도
• 파레토
• 수평적 사고
• 회합스킬
• Run Chart
• 프로세스 시뮬레이션
• Mind Mapping
• Mult-voting
• 샘플링
• 정량적 프로세스 분석
• Random Word
• 명목집단방법
• 시그마 계산
• 회귀
• Six Hat Thinking
• 팀 헌장
• 층별
• 계층화
• Storyboards
• 정성적 프로세스 분석
• 산포
• Structure Tree
• Solution Mapping
• Top Down Mapping
• 가치분석
• 고객의 소리 변환
• 품질기능전개
3
통계적 사고의 정의
1. 모든 일은 상호 연결된 프로세스의 연속이며,
2. 모든 프로세스는 변화하며,
3. 산포를 이해하고 줄이는 것이 성공의 열쇠이다.
4
확률과 통계
• 확률은 게임의 규칙을 알고 게임을 관전하는 것과
같음.
• 통계는 게임의 규칙을 알기 위해 게임을 관전하는
것과 같음.
• Six Sigma 경영에서는 프로세스를 관찰하고
(측정을 통해 게임을 관전함) 사실에 근거한
의사결정을 하며, 프로세스를 관리하기위해
규칙을 적용함.
5
1.기본 통계량
모집단과 표본
통계는 표본을 통해 모집단의 특성을 파악하는 것
모집단(Population)
정의 : 파악하고자 하는 대상
ex : 전 국민의 평균 수명
전 국민의 출신 지역
×
×
×
▲
×
▲
○
○ ▲▲
○
×
×
×
×
○ ▲○
× : 8개
▲ : 4개
○ : 4개
통계량
평균 : μ
산포 : σ
표본(Sample)
Sampling
정의 : 통계적 판단을 위
해
모집단에서 선택
된
표 본집단
작은
× ▲
× ○
× 2개에 ▲, ○가 각 1개씩 존재
평균 : χ
산포 : s
6
왜 통계가 필요?
통계를 통해 모집단의 특성을 알고 앞으로 일어날 사건도 예측
■ 표본을 통해 모집단의 대표 값이나 변동의 크기를 구하는 것
기술 통계(Descriptive Statistics)
ex) GNP의 추정, 평균수명
■ 표본을 통해 얻은 정보를 이용하여 불확실한 사실에 대해 추론하고
통계적 판단을 위한 Model을 설정하는 것,
미지의 특성에 대해 주어진 정보를 이용하여 결론을 내리고 미래에
일어날 특성치에 대한 예측을 하는 것
추측 통계(Inferential Statistics)
ex) 회귀분석 Model
7
Input,프로세스 및 Output 척도
Input
척도
프로세스
척도
효율성 척도
• 비용
• activity 당 시간
• 재작업 양
• 대응 시간
• activity의 변동성
Output
척도
효과성 척도
• 결점율
• 결점수
• 총 반응 시간
• 대금 청구 정확도
• 이익
8
그래프/도표의 필요성
자료가 갖는 의미를 쉽게 이해하고 의미를
찾아냄
돗수분포
(Frequency Distribution)
Delivery Time*
95, 120, 117, 99, 110, 107
125, 98, 85, 127, 105, 114
103, 112, 92, 101, 122, 120
Data 자체는 의미 없
는 숫자 덩어리
• 치우침, 대칭 등 Data이
구조를 이해
도표화
×
×
×
×
×
×
×
×
×
×
×
×
× ×
시간
80 90 100 110 120130
• 의문이 명확해짐
왜 치우침이 발생할까?
* 주문접수 후 고객에게 도착한 시간
9
데이터 수집 방법
지표 마련
Step 1
지표에 대한
운용정의 마련
Step 2
측정계획 수립
Step 3
데이터 수집
Step 4
데이터 표현
데이터 평가
10
데이터 표현 방법
11
산포란 무엇인가?
•
산포란 제품이나 서비스가 제공될 때 프로세스가 정확하게 동일한
결과를 가져오는 것은 아니라는 것을 의미함
•
산포는 모든 프로세스에 존재함
•
비즈니스 프로세스에서 산포를 측정하고 이해하는 것은 현재의
성과수준이 어느 정도 수준인지, 산포를 줄이는 한편 불량을 줄이기
위해 필요한 것이 무엇인지를 도출하는 데 도움을 줌
데이터 산포
12
2.정규분포
모집단과 표본
이항분포는 모집단의 불량율(P)를 알고 있을 때 표본집단에서 나
타난 불량율이 모집단과 얼마나 다른지를 알고 싶을 때 사용
모집단 정보
표본집단에서 나타날 수 있는 경우
4번 추출
흰 공 확율 : 3/4
검은 공 확률 : 1/4
○ : 흰 공(W)
● : 검은 공(B)
전제조건
• 각 실험은 Yes, No 같은 2가지 결과만
갖음(P, 1-P)
• 각 실험은 독립으로 서로 영향을 주지
않음(복원추출)
BBBB
WBBB
BWBB
BBWB
BBBW
WWBB
BWBW
BWWB
WBBW
WBWB
BBWW
WWWB
WWBW
WBWW
BWWW
WWWW
0
1
2
3
4
1
4C0
4
4C1
6
4C2
4
4C3
4
4C4
(1/4)²
(3/4)²
(3/4)³
(1/4)¹
(3/4)⁴
공 4개의
가능한 조합
추출된
흰 공의 개수
(W)
경우의 수
각 경우의
확율
확율
(1/4)⁴ (1/4)³
(3/4)
0×(1/4)⁴4×(1/4)³ 6×(1/4)² 4×(3/4)³ 1×(3/4)³
= 0.004 ×(3/4) ×(3/9)² ×(1/4)¹ = 0.316
= 0.007 = 0.211 = 0.422
13
이항분포(2)
주어진 n, p에 따라 확률분포를 그리고 모집단의 χ, S를 구할 수 있음
이항분포
χ
P(X = 흰 공 개수)
4-χ
= 4Cχ(3/4)χ (1/4)
4×0.75
= 2.25
4×1/4×3/4
= 0.87
S
0.422
0.316
n=4
p = 3/4
(흰 공 3개)
0.211
0.004
0
0.047
1
2
3
4
나타나는
검은 공
개수(X)
0.375
n=4
p = 2/4
(흰 공 2개)
0.25
0.25
χ
4-χ
4×0.5
=2
4×2/4×2/4
=1
χ
4-χ
4×0.25
=1
4×3/4×1/4
= 0.87
χ = np
S = np(1-8)
4Cχ(2/4) (2/4)
0.063
0.003
0
1
2
3
4
X
0.422
n=4
p = 1/4
(흰 공 1개)
0.316
0.211
4Cχ(1/4) (3/4)
0.047
0.004
0
1
2
3
4
X
χ
n-χ
일반식 : nCχP (1-P)
14
확률 밀도함수
연속형 Data는 계급의 폭을 작게 하여 분포를 함수형태로 나타낼 수 있음
계급의 폭이 10cm
계급의 폭이 3cm
계급의 폭이 아주 작음
키가 167.5cm부터
172.5cm까지의
학생은 전체의 28%
P(167.5< χ<172.5)
= 0.28
28%
0.28
0.25
0.16
0.12
0.08
0.04
0.01
0.04
0.02
155 160165170175 180185190195
155
170
195
155
170
195
15
정규 분포
정규 분포의 통계적 판단의 출발점
정규분포는 평균치에서 벗어난 정도에 따라 확률 값으로
주어짐
정규 분포의 특성
정규 분포란?
평균값
= 중앙값= 최고 값
• Gauss가 발견
• 계측 오차에 대한 분포
• 대부분의 자료에 적합
좌우대칭
면적 68%
평균 M, 표준편차 σ
f(χ) = 1 Exp - (χ-Μ)²
2σ²
2π
- ∞< χ< ∞
χ축에
닫지 않음
면적 95%
N(M, σ²)으로 표시
-2σ
☞ Data가 정규 분포에 따르지 않으면 고도의 Approach가 필요
-σ
Μ
+σ
2σ
16
정규 분포의 활용
Data가 정규 분포에 따르면 표본집단의 평균치가 정규 분포상에 어디에 위치하
는지에 따라 일어날 수 있는 확률을 구할 수 있음
A사직원의 신장은
χ = 170, σ = 10 이다.
180cm 이상은 몇 %일까?
은행에서 고객은 5분 이내 업무처리를
원한다. A은행의 업무처리는
χ = 4분 σ = 1분이다.
몇% 고객이 불편을 참고 있는가?
고객의
요구수준
알고 싶은
확율
150
-2σ
160 170
-1σ
π
180
1σ
190
2σ
고객 불만
영역
1
-3σ
2
-2σ
3
-1σ
4
π
5
1σ
50% - 68% = 16%
50% - 68% = 16%
2
2
6
2σ
7
3σ
17
정규확률분포의 표준화
 평균이 0 이고 표준편차가 1인 정규분포를
표준정규분포라고 부른다.
 z value: X라고 지정하는 어떤 값과 모집단의 평균
m 와의 거리를 모집단의 표준편차 s로 나눈 값을
말한다.
X


Z 
18
표준 정규분포
표준화를 통해 산포의 척도를 Z값으로 통일
• Data마다 1σ, 2σ, 3σ 위치를 따로 구
해야 해당면적을 구할 수 있음
• A 집단의 120과 B 집단의 120은 우
열을 비교하기 어려움
χ = 100, σ = 10
• Z = X-Μ로 표준화하면
σ
1σ, 2σ, 3σ 위치가 동일한 Z값으로 표시됨
• A 집단의 120은 Z값이 2, B 집단의 120은 Z
값이 1, A 집단의 120이 더 나타나기 어려운
사건
N(100, 10²)
A집단
Z = X-100
10
70 80
-3σ -2σ
90 100 110 120 130
-1σ π
1σ 2σ 3σ
70
Z값 -3
80
-2
90 100 110 120 130
-1 0
1
2
3
40
Z값 -3
60
-2
80 100 120 140 160
-1 0
1
2
3
χ = 100, σ = 20
B집단
N(100, 20²)
40 60
-3σ -2σ
80 100 120 140 160
-1σ π
1σ 2σ 3σ
N(Μ, σ²)
N(0, 1)로
표준화 됨
Z = X-100
20
19
정규 분포의 성질
정규 분포에 따르는 모집단에서 추출한 Data는 아래와 같은 성질을
갖음
성질 1
X = N(Μ, σ²)일 때
예) 어떤 온도 Data가 섭씨로 N(100, 10²)
일때
성질 2
성질 3
Y = a + bX의 관계가 성립하면 Y는
Y = N(a + bΜ, b²σ²)인 정규 분포를 따름
Y = 32 + 1.8χ 공식을 이용하여 화씨로
바꾸면 바뀐 Data는
N(32+180, 1.8²×10²)에 따른다
X = N(Μ₁,σ1²)이고
Y = N(Μ₂, σ2²)이라면
X + Y는 N(Μ₁+ Μ₂, σ1² + σ2²)에
따른다
예) 체중은 N(60, 6²)이고
키는 N(170, 10²)이라면
신체지수 체중 + 키는 N(230, 6²+10²)의
정규 분포에 따름
N(Μ, σ²)인 모집단에서 n개의
Sample을 취하면
n개의 표본집단은 N(Μ, σ²/n)의 정규 분
포에 따른다
예) N(100, 10²)인 모집단에서 10개의
Data를 취하면
표본집단의 분포는 평균 100, 분산 10인
정규 분포에 따름
20
이항 분포와 정규 분포
이항 분포는 정규 분포로 간주하여 계산할 수 있다.
B(n, p)
n : 반복수, p : 나타날 확율
χ = np
σ=
np(1-p)
B(15, 0.4)
이항 분포에서
7
8
10
5
P(7≤χ≤10) = 15C7(0.4)
(0.6)
+ · · · + 15C10(0.4)
(0.6)
= 0.381
0.2
정규 분포에서
P(6.5≤χ≤10.5)
= P(6.5 - 6 ≤ Z ≤ 10.5 - 6)
1.9
1.9
= P(0.263 < Z< 2.368
= 0.387
0.1
0 1 2 3 4 5 6 7 8 9 10 11 12 13
빗금부분의
확률은?
☞ np >15인 경우에는 거의 정규 분포에 가까움
21
모집단에 대한 가정
모집단이 정규 분포에 따른다는 가정은 통계처리의 출발점
모집단에 대한 의심
1. 모집단이 정규분포에 따르는지
어떻게 아나?
해
답
• Normality Test(정규성 검증)
누적
Minitab
확율
·
·
사용
·
·
· ·· · ·
·
· ·· · ·
-2-1 0 1 2
Z값
2. 모집단이 정규분포가 아니면
무엇이 잘못되나?
• 예를 들어 구간 추정을 할 때
신뢰도 95%면 t0.025 s
로
n
하는데 모집단이 정규분포가
아니면 구간이 90%인지 80%
인지 알 수 없게 됨
3. 모집단이 정규 분포가 아니면
어떻게 해야 하나?
• 정규성을 해치는 이상 Data를
제거
• 자료를 변환하여 정규화
Y = logχ
×
22
모든 Data는 정규분포에 따르는지를 확인후 통계적
의사결정에 사용
• 각 데이터에 대한 정규성 검정을 실시함.
• Graph > Probability Plot
• Variables: Data25
• OK.
• 샘플이 많은 경우 (100개 이상) Anderson-Darling 검정 실행
• Stat > Basic Statistics > Normality Test
• Variables: Data1000
• OK. (p value가 =.05 보다 크다면 정규 분포를 따름)
23
Data를 직선화된 정규분포 선상에 Plot하여 정규성을 검정
Normal Probability Plot for Data
99
ML Estimates
95
Mean:
9.73630
StDev:
1.72645
90
Percent
80
70
60
50
40
30
20
10
5
1
5
10
15
Data
정규성 검정: p값>0.05 이상이면 정규분포
24
정규분포에 따르지 않는 Data는 정규성을 같도록 변환
• 목적:
– 정규성 검정 연습
• Minitab 연습
– File: Case6Sigma.mpj
– c2 Cycle Time 에 대한 히스토그램 작성
– Y 변수(c2 Cycle Time)가 정규 분포를 하는지 검정
25
사례연구 : 은행의 예금처리 시간
정규성과 변환
– cycle time은 대략적으로 정규 분포를 하는가?
• Graph > Probability Plot
Normal Probability Plot for Cycle Time
ML Estimates
99
Cycle time 은 정규분포
를
따르지 않음.
Percent
•
Mean:
9.26931
StDev:
4.75454
95
90
80
70
60
50
40
30
20
10
5
1
0
15
30
Data
26
정규성을 갖는 Data로 변환
• 목적:
– 알맞은 변환 방법을 선택함.
• 테이블 연습
– File: Case6Sigma.mpj
– Box-Cox 변환을 이용하여 알맞은 변환 방법을 결정함
– Stat > Control Charts > Box-Cox Transformation
• Single column: Cycle Time Subgroup size: = 1
27
정규성 검정과 변환
• cycle time 은 대략적으로 정규분포를 하는가?
• Graph > Probability Plot
• Cycle time 은 정규분포를 하지 않음
• 어떤 변환을 이용해야 하는가?
• Stat > Control Charts
Box-Cox Plot for Cycle Time
> Box Cox
95% Confidence Interval
35
Last Iteration Info
30
= 0 이므로 log 변환이 적합
함
StDev
25
Lambda
StDev
Low
-0.169
3.730
Est
-0.112
3.727
Up
-0.055
3.727
20
15
10
5
0
-5
-4
-3
-2
-1
0
1
2
3
4
5
Lambda
28
Box-Cox 변환
Stat>Control Charts>Box-Cox
Lambda
( )
-2
-1
Transfromation
YT
1
Y2
1
Y
Common Names
Reciprocal (Inverse)
Squared
Reciprocal (Inverse)
Back
Transformation
1
YT
1
Y
T
-.5
1
Y
Reciprocal Square Root
(Inverse)
0
Log (Y)
Log
1
YT2
10Y T
.5
Y
Square Root
YT2
1
No
Transformation
-
-
Squared
YT
2
Y
2
29
MINITAB Calculator를 이용하여 데이터를 변환하기
Calc > Calculator
“store result in variable” Log10 Cycle Time
“Expression”내부를 클릭하고, functions 메뉴에서
Log 10을 선택함.
C2 Cycle Time 을 식에 대입하기 위해 두번
클릭하여 “number’가 보이도록 함.
그러면, 변환된 데이터가 Log 10 Cycle Time
컬럼에 나타남.
30
3.통계적 의사결정
• 가설검정은 “Group 1은 Group 2 와 비교할 때 유의하게 다른가”에
대한 답을 줌. Groups 1과 2 는 개선 전, 후 프로세스의 싸이클
타임 일수도 있고, 장소1과 장소2 에서
발생하는 결점 일수도
있음.
•
가설검정은 연속형 데이터와 이산형 데이터에 적용 할 수 있고,
두개 이상의 그룹에도 적용됨.
검정 방법:
– t-검정(t-Tests)
– 분산분석(ANOVA tests)
– 상관관계(Correlation)
– 회귀(Regression)
– 카이-제곱 검정(Chi-squared tests)
31
가설검정의 가정
• 모집단으로 부터 충분히 많은 시료가
랜덤하게 추출되었음.
• 통계적으로 서로 독립이다는 가정
• 데이터는 정규분포를 함.
32
검정은 표본집단이 모집단과 같은지 다른지를 판정
하는 것
검정의 판단 논리
Ho
올바른
선택
Ha가 사실이나
Ho를 선택
Type Ⅱ error
β
Ho가 사실이나
Ha를 선택
Type Ⅰ error
α
올바른
선택
Ho
Ha
선 택
Ha
Ho(귀무가설) : 표본에서 얻은 정보를
볼 때 표본은 모집단과
일치한다는 주장
Ha(대립가설) : 표본에서 얻은 정보를
볼 때 모집단과 같다고
할 수 없다는 주장
사 실
33
통계적 의사결정 사례
six sigma 팀은 두 부서간 평균 급여에 대해 차이가 있는지를
비교하려 함.
팀은 먼저 두 부서의 모집단으로 부터 무작위로 샘플을
채취한 다음 부서별로 히스토그램을 그린 결과 아래와 같음.
x cs =
xm =
34
가설검정의 해석
우리가 하려는 가설검정은 “귀무가설이 잘못 되었음을 증명하라” 임.
이것을 위해 앞에서 언급한 p-value의 개념을 상기 시켜 주고자 함.
P 에 대한 정의는 아래와 같음.
만일 p < 0.05 이면, 차이가 있다는 것을 의미함.
“ p-value는 xcs 와 xm 사이에서 관측된 차이는 샘플링 산포에 의해서만 발생할
확률이다”
p-value에 대한 또 다른 정의는:
“p-value는 두 샘플이 같은 모집단에서 추출될 확률이다.”
결론적으로 우리가 범할 오류가 5% 보다 작지 않다면 우리는 통계적으로 유의
하다고 주장할 수 없게 됨..
35
가설검정
이산형
연속형
이산형
Chi Square
t-Test
ANOVA
연속형
Y
Logistic
Regression
Regression
X
36
양쪽 검정
(1-α) 100% 신뢰
Ha 채택
Ha 기각
한쪽 검정
Ha 채택
1-α
α
2
Ha 기각
1-α
α
2
χ
χ - t α σ <μ <χ+ t α σ
2 n
2 n
Ha 채택
α
T
χ
χ > T + t α σ 이면(1- α ) 100%의
2 n
2
신뢰도를 갖고 Ha를 채택
37
중요한 통계적 의사결정 사항
모집단이 정규분포에 따르면서
모집단의평균,산포를 알고 표본집단과
모집단간의 평균의차가
있는 지를 알고 싶을 경우
모집단이 정규분포에 따르되 모집단의평균을
모르면서 표본집단과 모집단간의 평균의차가
있는 지를 알고 싶을 경우
표본의 분산이 정규분포에 따르는모분산과의
차이가 있는 지를 알고 싶을 경우
정규분포에 따르는 두집단간의
산포의차가 있는 지를 알고 싶을 경우
활용 분포
Z 분포
t분 포
카이자승(χ²)
분포
F 분포
38
통계적 판단을 위한 샘플의 크기
통계적 판단을 위한 샘플의 크기는 허용오차(d)와 신뢰수준에 따라 결정됨
모집단이 N(μ, σ²)에 따를 때
μ추정 값의 100(1-α)%의
오차 한계는
Z α2 σ 로 표시된다
n
100(1-α)%의 확신을 갖고
오차가 d 이내가 되려면
Z
α σ
=d
2 n
Case Study
철판 수축의 표준 편차는 4㎜로
알려져 있다
90% 신뢰수준을 갖고 추정오차가
0.8㎜ 이내로 되려면 몇 개를
Test하여야 하나?
n=
α
Z 2 ·σ ²
d
=
1.64· 4 ²
0.8
Z0.05 = 1.64
= 68
이를 만족시키는 n값은
n=
α
Z 2 ·σ ²
d
39
.분포를 이용한 가설검정 및 추정
Z 분포의 이용
중심극한의 정리
(정규분포의 성질)
모집단
평균:Μ
편차:σ
N(Μ, σ²)
모집단 평균의 추정
평균 값
n개 추출
n개 추출
n개 추출
•
•
•
n개 추출
X₁
X₂
X₃
•
•
•
평균 : Μ
편차 : σ/ n
Data 수가 n개인 표본집단의
평균치가 X, 편차가 σ
라면 모집단의 평균치가 존재할
수 있는 범위는 99.7% 확율에
서
N(Μ, σ/ n)
면적 99.7%
Xn
• N(Μ, σ²)인 모집단에서 n개
취한 표본 집단들의 평균값은
Μ이고 평균값의 편차는
σ/ n이다
-3σ
σ
3×
n
Μ
X
+3σ
σ
3×
n
• 샘플개수 n이 증가할 수록
표본집단의 평균 X는 Μ에 수렴
40
표본집단의 평균치, 편차에서 모집단의 평균치를 측정
할 수 있음
사출 부품의 중량
3.6
2.6
3.0
2.2
2.5
2.9
2.5
2.5
2.2
2.6
2.8
2.4
2.7
2.8
3.2
2.6
2.6
2.5
2.7
3.1
2.4
2.3
2.6
1.8
4.1
3.2
2.5
3.1
2.5
2.7
2.2
2.1
3.8
3.0
2.7
2.6
2.6
2.0
3.2
2.2
n = 40
χ = Σχi = 2.715
40
S = Σ(χi-χ)² = 0.475
39
모집단의 평균은?
모집단
표 본
N(Μ, σ²)
Μ가 존재하는
범위(95%)
40개
χ = 2.217
S = 0.475
X의 신뢰구간은
±2σ이나 σ가
미지의 양으로
표본집단의 편차
S값을 추정량으로 사용
Μ = 2.217이고 어떻게 표본을 골라도
95% 평균치가 검출되는 구간은
2.217 - 2× 0.475< Μ< 2.217 + 2× 0.475
40
40
2.067 < Μ< 2.367
41
t 분 포의 이용
모집단의 편차를 아는 경우
모집단의 편차를 모르는 경우
(정규분포의 성질)
표본의
평균 값
모집단
n개
N(Μ, σ²)
n개
X₁
X₂
•
•
•
•
•
•
n개 추출
Xn
표본 X의 표준 정규 분포는
Z=
X-Μ
σ/ n
모집단
N(Μ, σ²)
σ : DRI
N(Μ, σ²/ n)
n개
X
S
S는 알 수 있음
t
분
포
정
의
표본 X의 표준 정규 분포에서
σ를 표본으로 추정치 S로 대체하면
X-Μ
t=
S/ n
t는 자유 n-1의 t 분포에 따른다
n이 크면 정규 분포로 수렴
42
Z 분포/ t 분포의 차이
모집단의 정보에 따라 적용하는 분포가 틀려짐
Z 분포
t 분포
(모평균, 편차가 기지)
(모평균을 모를 때)
자유도 n-1인
t분포
신뢰구간
α
2
α
Z2
사 례
α
2
1-α
0
α
Z2
α
2
α
2
rd
α
t2
0
α
t2
χ - Z α σ <χ<χ+ Z α σ
2 n
2 n
χ - t α S <χ<χ+ t α S
2 n
2 n
ABS의 강도의 편차는 8로 알려져
있는데 모집단의 평균은 잘 모른다
100개를 Sampling하여 Test해보니
평균치가 42.7이었다
모평균의 90% 신뢰구간은?
새로운 ABS를 개발하여 충격강도를
15회 측정하여 보니 평균이 39.3,
표준편차가 2.6이었다
새로운 ABS의 충격강도 Μ에 대해
90%신뢰구간은?
α
Z 2 = Z0.05 = 1.64
Μ의 구간은 42.7± 1.64× 8/ 100
= 42.7 ± 1.31
n = 15 : 자유도 14
α = t0.05 = 1.7
t분포표에서 자유도가 14일 때 t 2
Μ의 구간은 39.3± 1.761× 2.6/ 15
= 39.3 + 1.18
43
평균치의 검정(1)
모집단의 편차(σ)를 알고 있으면 Z값을 이용하여 검정
평균치 검정(Z 검정)
Case
AL사 C/S팀은 A/S 접수 후 처리가
평균 15시간, 편차 3시간 내에
처리하고 있다
C/S팀에서는 새로운 업무 절차를
만들어 처리 70건의 A/S 요청에
적용해 본 결과 시간을 단축하였다고
한다(편차는 같음)
이런 주장을 97.5% 신뢰 수준에서
받아들이려면 처리 시간은 얼마가
되어야 하나?
Ho = Μ ≥ 15
Ha = Μ< 15
2.5%
Z0.025 = -1.96
15
검정 통계량 : Zα< χ - Μ
σ/ n
-1.96 < χ - 15
3/ 70
χ< 14.3
결론 : Test 평균이 14.3 시간 보다는
작아야 95%수준에서
단축되었다고 말할 수 있다
44
평균치의 검정(2)
모집단의 편차를 모를 때는 t값을 이용하여 검정
평균치 검정(t 검정)
Case
자동차 부품의 평탄도는 200㎛ 까지
허용된다
10개를 임의로 택해 Test하여
175, 190, 215, 198, 184
207, 210, 193, 196, 180
10개의 Data를 얻었다
이 부품 모집단의 평균치를 Μ,
편차를 σ로 할 때 가설은
Ho : Μ >200
Ha : Μ< 200이며
유의 수준 0.01에서 검정하면
검정 통계량 : t = χ - Μ
S/ n
표본집단 통계량 : χ = 194
S = 13.14
t = 194.8 - 200 = -1.25
13.14/ 10
자유도 9, α = 0.01일 때 t값은
표에서 -2.82< -1.25
t0.01
표본의
= -2.82 t값 = -1.25
결론 : 주어진 표본의 Data로는
200 이하로 개선되었다
할 수 없다
45
평균치 검정(3)
모편차(σ)를 알 때
한쪽 검정
Ho
Ha
기각역
Ho
Ha
기각역
Μ≤Μo
Μ >Μo
Z ≥ Za
Μ≤Μo
Μ >Μo
t ≥ ta
Μ≥Μo
Μ< Μo
Z ≤ Za
Μ≥Μo
Μ< Μo
t ≤ ta
Μ = Μo
Μ ≠ Μo
│t│≥ t
양쪽 검정 Μ = Μo
통계량
모편차(σ)를 모를 때
Z=
Μ ≠ Μo │Z│≥ Z α
2
χ-Μ
S/ n
t=
α
2
χ - Μo
S/ n
46
카이자승(χ²) 분포
정
의
특성/활용방법
확률 표본
n개
모집단
N(Μ, σ²)
확율
자유도 n-1인 함수
X₁
X₂
X₃
•
•
•
특성 : 긴 꼬리
비대칭
항상 양수
α
α
χ²
χ 1²
χα ²
Xn
산포의 크기
σ²
Σ(χi - χ)²
χ² = Σ(χi-χ)² = (n-1)S²
σ²
σ²
활용방법 : 표본의 산포(S²)를 알고
모집단의 산포(σ²)를
추정할 때
95%에서 모집단 σ²의 신뢰구간을
구하려면
P[χ²0.975< (n-1)S²< χ²0.025] = 0.95
σ²
(n-1)S²< σ²< (n-1)S²
= 0.95
P
χ² 0.025
χ² 0.975
47
카이자승(χ²) 분포의 이용(1)
n - 1 = 9, 1-α = 0.9
Case
전지는 전압이 균일하게 유지되어야 함
5%
5%
생산시 검사에 통과한 전지 10개를
10시간 사용 후 전압차이를 Test해보니
평균차이가 0.7V, 편차가 0.4V 였다
(편차가 큰 문제임)
χ²
χ²-α = χ²0.95
2
= 3.325
χ²-α = χ²0.05
2
= 16.919
이러한 차이가 정규 분포에 따른다고
가정할 때 모집단의 편차는 90% 신뢰
수준으로 얼마라고 말할 수 있는가?
(n-1)S²
(n-1)S²
< σ²<
χ²0.05
χ²0.95
9×(0.4)² < σ²<
16.919
9×(0.4)²
3.325
0.085< σ²< 0.433
0.29< σ²< 0.66
48
카이자승(χ²) 분포의 이용(2)
카이자승 분포를 이용하여 표본의 분산이 모분산과 같은지를 검정할 수 있음
해
Case
앞의 전지 예에서 전해질의
처방을 변경하여 전압차의
편차를 0.2로 줄였다고 한다
(n = 10)
답
Ho : σ = σ²
Ha : σ² >σ²
(n-1)s²
σ²
(10-1)(0.2)²
=
= 5.76
(0.25)²
검정 통계량 : χ² =
자유도 9, 95%에서 χ²0.95 = 3.325
95% 신뢰수준에서 산포가
개선되었다고 할 수 있는가
5.76 >3.325
(Ho를 기각 개선되었다고 할 수 있음)
전지 전압차의 편차는 0.25
이하로 관리되어야 한다
5%
기각역 표본의
χ²0.95 χ²=5.76
= 3.325
49
F 분포 개념
F 분포는 두 집단의 산포를 비교하는데 이용됨
모집단 X
표본집단
N(μ1, σ1²)
두 집단의
분산 검정
표본집단
N(μ1, σ2²)
X₁
Σ(χi-χ)²
S1² =
n1-1
모집단 Y
Y₁
X₂
Y₂
X₃
•
•
•
Y₃
•
•
•
Xn1
Yn2
두 집단간의
모분산 비교는 표
본의 분산을
이용
X, Y 두 집단의 분산이
동일한가 하는 가설은
Σ(Yi-Y)²
S2² =
n2-1
F 분포
F=
S1²/σ1²
은 자유도
S2²/σ2²
(n1-1, n2-1)인 F분포에
따른다 신뢰도 α에서
Fα (n1-1, n2-1) 값은
F표로 주어짐
Ho : σ1² = 1
σ2²
σ₁, σ₂는 모르므로 표본집단의 S₁, S₂를 이용하여
Fα(n1-1, n2-1) 값보다 크면 Ho를 기각
S1²
값이
S2²
50
F 분포의 이용
F 분포는 산포가 중요한 제품에서 두 집단의 산포를 평가할 수 있게 해줌
해
답
Case
A 기계 12번 측정 편차 : 2.3
B 기계 10번 측정 편차 : 1.5
A 기계의 생산품이 B 기계
생산품보다 산포가 크다고
할 수 있는가?
Ho : σA = σB²= 1
Ha :
σA²
σB²
>1
검정 통계량 :F = SA² = 5.29 = 2.35
SB²
2.25
표에서 F0.05(11, 9) = 3.10
기각역은 F>3.10(유의 수준 5%)
기각역에 속하지 않으므로 Ho를
기각할 수 없다
(σA, σB는 다르다고 할 수 없다)
51
5.회귀분석(Regression Analysis)
독립변수(X)가 종속변수(Y)에 어떻게 영향을 끼치는지를 정량화 한 것
B사 T제품 출시 후
광고투자와 매출액을 분석해
보니 아래의 결과를 얻었다.
이 Data에서 광고투자를
늘리면 매출액이 상승한다고
결론 내릴 수 있을까?
매출액과 광고비는
선형관계가 있음
매출액(Y)
6
·
30
월
1
2
3
4
5
6
7
8
9
10
3
광고료(억원) 매출액(십억원)
4
8
9
8
8
12
6
10
6
9
9
20
22
15
17
30
18
25
10
20
·
·
·10
5
2
20
7
·
1·
10
·
·
4
·
9
광고료(X)
2
4
6
8
10
12
52
최소 자승법
회귀 직선식은 오차항의 크기가 가장 작아지도록 설정함
최소자승법
회귀분석의 Model
χ, y간에 선형관계가 있다고 가정하면
y
y = a + bχ
·
e₂
e₁
y ·
χ₁
χ₂
y₁ = a + bχ₁+ e₁
y₂ = a + bχ₂+ e₂
•
•
•
•
•
•
•
•
•
•
•
•
yn = a + bχn + en
• 모든 점 y₁y₂··· yn의 오차의 합은
Σei = Σ(yi - a - bχi)
• 최소자승법(Σei)²이 최소가 되도록 a,
b값을 정하는 것
a+bχ₂
a+bχ₁
• 어떤 yi 값에서 오차항은
ei = yi - (a + bχi)
χ
^
^
Sχy
b=
, a = y - bχ
Sχ²
선형식으로 설명
안 되는 부분
오차항으로
N(0, σ²)에 따른
53
최소 자승법
회귀 직선식은 오차항의 크기가 가장 작아지도록 설정함
달
χ
y
(χ₁- χ)²
(χ₁- χ) (y₁- y)
1
2
3
4
5
6
7
8
9
10
4
8
9
8
8
12
6
10
6
9
9
20
22
15
17
30
18
25
10
20
16
0
1
0
0
16
4
4
4
1
(-4)× (-9.6)
0
3.4
0
0
4 × 11.4
(-2)× (-0.6)
2× 6.4
(-2)× (-8.6)
1.4
계
80
186
46
120
y
y = -2.27 + -2.609χ
(yi - y)
y = 18.6
(χi - χ)
χ₁
χ
χ
Σ(χi-χ)²
46
=
n-1
9
Σ(χi-χ)²(yi- y)
120 (χ가 변할 때
Sχy =
=
n-2
9 y가 변한 크기)
Sχy
120
b=
=
= 2.609
S²χ
46
S²χ =
9 = y - bχ = -2.270
54
회귀직선의 분산 분석
회귀직선을 구한 다음에는 그 회귀직선이 얼마나 문제를 설명하는지를 검증해야 함
회귀분석의 설명력
y
yi
·
회귀직선의 분산분석
y = a + bχ
yi - ^yi
^
yi - y
y
r² =
요 인 제곱합 자유도 제곱합 평균
회귀선
SSR
1
SSR
잔차
SSE
n-2
계
SSE
n-2
Sy²
n-1
Fo
SSR
SSE/n-2
Fo>Fα(1, n-2)이면 회귀직선은 유의
SSR
Sy²
χ
^
^
(yi - yi)² = (yi - y)² + (yi - yi)²
총변동 회귀선으로 설명 안 되는
설명되는 오차항(잔차)
변동
yi가 y에서 떨어진 크기를 SSR,
SSE로 구분하여 2집단으로 만든 후
2집단의 분산을 비교하는
F검정을 통해 판단
Sy² = SSR + SSE
55
분산분석의 예
B사 T제품 매출증가의 85%를 광고비가 설명해 줌
분산분석
달
χ
y
1
2
3
4
5
6
7
8
9
10
4
8
9
8
8
12
6
10
6
9
9
20
22
15
17
30
18
25
10
20
계
80
186
R² =
^yi = a+bχi 잔차 ^yi - y
8.17
18.60
21.21
18.60
18.60
29.04
13.38
23.81
13.38
21.21
0.83
1.43
0.79
-3.60
-1.60
0.96
4.62
1.19
-3.38
-1.21
0
313.04
= 85%
368.40
-8.63
0
2.61
0
0
1.04
-5.24
5.21
-5.22
2.61
Ho : b = 0(상관관계가 없다)
Ha : b ≠ 0(상관관계가 있다)
요 인
자유도 제곱합
회귀선
313.04
1
잔차
55.36
8
368.40
9
MS
Fo
313.04 45.24
6.92
Fo0.05(1, 8) = 5.31
Fo>5.31(Ho 기각)
회귀선은 95% 신뢰수준으로
믿을 수 있으며 Data 변화의
85%를 설명해 준다
광고비를 증가 시키면 매출액이 증가 ! ! !
56
다중회귀분석
B사 T제품의 매출이 광고비뿐 아니라 판촉에 투입된 영업사원 숫자에도
상관 관계가 있는 것 같다면 어떻게 해석될 수 있을까?
분산분석
χ1(광고)
4
8
9
8
8
12
6
10
6
9
χ(판촉인원)
4
10
8
5
10
15
8
13
5
12
y(매출)
9
20
22
15
13
30
18
25
10
20
회귀식 y = a+b1+χ1+b2χ2는
y = -0.651+1.551χ1+0.760χ2으로
표시됨
Ho : b₁ = b₂(상관관계가 없다)
Ha : b ≠ b₂ ≠ 0(상관관계가 있다)
요 인
자유도 제곱합
회귀선
332.12
2
잔차
36.28
7
367.40
9
MS
Fo
166.06 32.04
5.17
유의수준 α = 0.05에서
Fo0.05(2, 7) = 4.75
Fo>4.75(Ho 기각)
r² =
332.12
= 90.15%
368.40
더욱 설명력이 향상되었음
57
6.실험계획법(DOE)
실험계획법은 품질을 결정하는 인자를 찾고 최적화 시켜 나가는 방법
DOE 전개순서/Tool
왜 DOE가 필요?
• Screening
- 품질에 영향을 미치는
• 과거의 Data가
근본원인을 밝혀 주
지 못할 때
• 공정에 대한 지식이
부족할 때
• 최적 작업조건
설정이 필요할 때
반제품 수율
인자를 검출
- 교락법(Resolution Ⅲ)
• 공정정의
(Process
Characterization)
개시제 반응 반응 교반력 원료 작업
농도 온도 압력
투입비 방법
(○)
(×) (×)
(×)
(○)
(×)
L
H
-
-
-
L
-
-
유의
인자
개선
방향
- 공정의 개선방향을 제시
- 요인 배치법(Full Factorial)
수율 = f(개시제 - χ₁, 원료 투입비χ₂)
• 최적화(Optimization)
- 최적 조건을 선정
수율
최적점
- 반응표면 분석
최적점
(Response Surface)
χ₁
χ₂
58
DOE 사례
Scatter Daigram(산점도)
BS사 원사의 강도는 Nylon 함량에 따라
달라진다고 추정된다
Nylon 함량별로 5번씩 시험한 결과를 정리하면
인자
(Factor)
수준
(Level)
Nylon
Test Data(강도)
Total AVE.
함량 1회 2회 3회 4회 5회
15
20
25
30
35
7
12
14
19
7
7
17
18
25
10
15
12
18
22
11
11
18
19
19
15
9
18
19
23
11
× - × : 평균
강도
49
77
88
108
54
9.8
15.4
17.6
21.6
10.8
376
15.4
반복(Repetition)
·
·
·
·
×
··
20
··
·
×
10
·
·
×
·
··
15
처리(Treatment) : 인자가 2개 이상일 때
인자별 수준의 조합된 상태
ex) A₁수준(100℃)× B₂수준(5kg)
:측정치 분포
··
20
··
··
×
·
25
·
× ·· ·
·
30
35
Ave = 15.4
Nylon
함량
과연 Nylon 함량이 강도를
결정한다고 할 수 있을까?
59
분산 분석
인자의 유의 여부는 총변동을 수준의 변화로 인한 변동(SST)와 수준내 오차로
인한 변동(SSE)로 나누어 두 변동간의 차이를 F 분포를 이용하여 검정
× - × : 평균
반응
Ho : (y1 - y) = (y2 - y) = · · · = (y5 - y) = 0
Ho : 적어도 한 수준의 효과는 있다
×
y(총평균)
×
×
yi - y
yi - y
y1
×
·
yi
1수준
분산분석
×
yi - y1
요 인 제곱합 자유도 제곱평균
Nylon
475.76
함량
(SST)
오차
161.20
4
118
20
8.6
Fo
14.76
(SSE)
2수준 3수준 4수준 5수준
(yi - y)² = (y1 - y)² + (yi - y1)²
총변동 수준으로
수준 내
모집단 인한 변동 피할 수 없는
(SST) 오차 때문에
평균에서
떨어진 크기
생기는 변동
(TSS)
(SSE)
계
636.96
(TSS)
24
F0.05(4, 20) = 2.87< 14.76
Nlyon 함량은 유의하다
(y1-y)보다 (yi-y1)가 크면
수준의 변화가 오차에 묻혀버림
60
분산 분석 Data 구조
Test No.
Test 순서
Nylon 함량
반복
강도(yi)
yi - y
1수준
1
2
3
4
5
3
9
11
7
15
15
15
15
15
15
1
2
3
4
5
7
7
15
11
9
- 8.4
- 8.4
- 0.4
- 4.4
- 6.4
2수준
6
7
8
9
10
2
10
4
8
1
20
20
20
20
20
1
2
3
4
5
12
17
12
18
18
- 3.4
1.6
- 3.4
2.6
2.3
11
5
25
1
14
- 1.6
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
y-y
yi - y
- 5.6
- 2.8
- 2.8
5.2
1.2
- 0.8
0
- 3.4
1.6
- 3.4
2.6
2.6
•
•
•
20
y = 15.4
SST
ST²
=
= Fo
SSE
SE²
TSS
SST
= Σ(yi-y)² = Σ(y-y)²
SSE
= Σ(yi-y)²
61
인자가 2개인 경우
인자가 2개 이상일 때도 똑같은 원리로 결과치의 차이가 인자의 수준차인지
단순한 오차 범위에 해당되는 것인지를 판단
인자의 영향
Test Data표
전지의 전해질과 사용온도에 따른 수명
A 인자(온도, ℉)
B₁
B인자
(재질)
A1(15)
A1(15)
A1(15)
130, 155
34, 40
20, 70
74, 180
80, 75
82, 58
계
Ave.
수명
■
998
83.2
▲
■
·
B₂
B₁
150, 188 136, 122
25, 70
159, 126 106, 115
58, 45
138, 110 174, 120 96, 104
168, 160 150, 139
82, 60
1,300 108.3
■
재질3
▲
· 재질1
·
1,501 125.1
계
1738
1291
770
3,799
-
Ave.
148.6
107.6
64.2
-
105.5
▲
재질2
온도
1
2
3
온도변화와 재질변화가 모두
수명을 단축하는 방향
두 인자간 교호작용이 없다
62
2인자 분산 분석
요 인
제곱합
(TSS)
자유도
제곱평균
Fo
P값
F값
결론
재질
10,683
2
5,342
7.91
0.0020
F0.05, 2, 27 = 2.73
유의
온도
39,119
2
19,558
28.97
0.0001
상동
유의
교호
9,614
4
2,403
3.56
0.0186
F0.05, 4, 27 = 3.35
유의
오차
18,231
27
675
-
-
-
-
계
77,647
35
이 실험을 다중회귀 분석으로 표현하면
Y(수명) = a + bχ1(재질) + cχ2(온도) + dχ1χ2로 표시
이 Model의 설명력은 r² = 10,683(재질) + 39,119(온도) + 9,614(교호)
77,647
= 76%
63
공정능력지수 / 장기,단기 Sigma
• 공정능력지수는 설계능력(규격) 대비 공정이 나타내고 있는
6 sigma 범위(공정능력)의 비율임.
Cp = 설계능력(규격) / 공정능력
-3sst
m0
+3sst
공정능력
Process Width
Design Width
LSL
T
설계능력(규격)
USL
64
Cp(Process Capability) 프로세스 능력
사람
설비
재료
방법
환경
프로세스
INPUT
PROCESS
프로세스 능력 =
OUTPUT
INPUT
제품 또는
서비스
고객
OUTPUT
=
Process표준
Process산포
프로세스능력은 공정능력, 영업능력, 구매능력, 개발능력 등등
65
공정문제의 일반적 증상
산포의 문제
Cp < 1.0
불안정 문제
중심치 이탈
•
•
•
•
기형(freak)
경향(trend)
주기(cycle)
변화(shift)
Cp-Cpk > 0.33
정상 단계
66
공정문제는 공정에 영향을 주는 가피원인에
기인함.
가피 원인(special causes) 의 발견
관리 범위 내의 산포
관리 범위 밖의 산포
67
단기 Process Capability Ratios: Cp
•
•
설계 여유(Margin)가 클수록, 단위당 총 결함수(TDU; Total Defects Per Unit )는
작아진다.
설계 여유는 공정능력지수(Cp)에 의해 측정된다.
Cp =
-3sst
m0
(특성치의 최대 허용가능한 범위)
(공정의 자연적인 변동 -- Short Term)
Cp =
+3sst
Design Width
LSL
±3s
st
ZST = 3 Cp
Process Width
T
│USL-LSL│
USL
Note: Pp 는 한가지 예외를 제외하고는 Cp와 공식이 같
다. 즉, Pp는 long-term의 표준편차를 적용하고 Cp는
short-term의 표준편차를 적용한다.
68
단기 Process Capability Ratios: Cpk
Cpk = Cp (1 - k)
Note: PpK 는 한가지 예외를 제외하고는 CpK와 공식이 같다. 즉, PpK는
long-term의 표준편차를 적용하고 CpK는 short-term의 표준편차를 적용한다.
K는 공차범위에서 정적인(Static) 평균의 변화(Shift)가 차지하는 비율을 말한다.
k =
│T - │
(USL-LSL)/2
Example: Cp = 2, k = .25
Cpk = 2( 1 - .25 ) = 1.5
0
1
6 st
4.5 st
0 ppm
LSL
3.4 ppm
T
USL
69
장기 Process Capability Ratios: Pp
Note: Pp 는 한가지 예외를 제외하고는 Cp와 공식이 같다. 즉, Pp는 longterm의 표준편차를 적용하고 Cp는 short-term의 표준편차를 적용한다.
Pp =
│USL-LSL│
ZLT = 3 Pp
±3 lt
(특성치의 최대 허용가능한 범위)
Pp =
(공정의 정상적인 변동 -- Long Term)
Short-term 분포
오직 순수한 에러, 즉 White Noise만을 보
여준다. 평균은 인위적으로 목표값(target)
에 일치한다.(계산식을 통해)
Long-term 분포
white noise와 black noise를 보여준다.
이 경우에 black noise는 표준편차를 크게
하는 경향이 있는 공정의 non-random한 변
동을 말한다.
Pp의 경우에, 평균은 인위적으로 목표값
(target)에 일치한다.(계산식을 통해)
3lt
0
+3lt
Process Width
Design Width
LSL
T
USL
70
장기 Process Capability Ratios: Ppk
Ppk = Pp (1 - k)
Note: Ppk 는 한가지 예외를 제외하고는 Cpk와 공식이 같다. 즉, Ppk는 longterm의 표준편차를 적용하고 Cpk는 short-term의 표준편차를 적용한다.
K는 공차범위에서 정적인(Static) 평균의 변화(Shift)가 차지하는 비율을 말한다.
k =
Long
Term
│T - │
(USL-LSL)/2
0
1
정적인 변화가 있는
Long Term
Short
Term
LSL
T
USL
71
Pooled 표준편차와 Overall 표준편차
Overall 표준편차 : 총변동, 즉 우연요인과 이상요인이 모두 작용한 변동.
Pooled 표준편차 : 군내변동(Within Variation), 우연요인/ Noise만 작용한 변동.
시간에 지남에 따라 군간에 발생하는 차이는 고려하지 않는다.
Example
Group
1
1
1
2
2
3
3
n= 4, g= 5 : 4개의 연속 샘플을 5회에 걸쳐 수
집
n
SSW : Within Sum of Square(군내변동)
2
3
4
SSW (g)
g
n
5.0
2
3
4
2
SSW=
j
ij
3
4
5
5.0
j 1 i 1
4
5
6
5.0
4
4
5
6
7
5.0
5
5
6
7
8
5.0
( X
X )
Pooled 표준편차 = SSW / g(n-1) = 1.2909
Overall 표준편차 는 전체 20개의 데이터를 일반적인 샘플 표준편차(s)를 구하는
공식에 따라 구함. Overall 표준편차 = 1.8496
Minitab의 Stat>Quality Tools>Capability Analysis 에서 ‘Estimate’에서
지정할 수 있음. 단, Pooled Stdev는 n>1일 때만 구할 수 있음
72
Data 해석의 주요 Point
Six Sigma에서는 단기/장기간 1.5σ Shift를 인정
Su(10)
제 1기간
σst₁
(0.5)
단기
Data의 의미
• 주요 공정 조건이 일
정하다고 보고
공정
이 나타내는
변동
만 관찰
χ₁
• Z 분포에서 Spec-Out
부분의 확률로부터 직접 계산
Ex) Zst =
=
Data
Drift
제 2기간
σst₂
(0.5)
• 설비 노후, 종업원의
숙달 환경변화 등의
통제 불가능 요소
(Special Cause)의
영향으로 χ, σ값이 변
하게 됨
Χ₂(7)
장기
Su-χ
σst
10-7
0.5
=3
• Cpk 값에서 계산
Cpk = 1.0
Zst = Cpk×3=3.0
• 단기 6 Sigma가 품질 목표
Zlt = Zst-1.5
: 1.5σ Shift는
최대 인정 폭
• Data 누적에 따라
분포가 완만해짐
(산업마다 다름)
• Z 분포표에서 직접 계산
10-8.5
Zlt =
= 1.5
1.0
• 공정/품질의 장기적
변동이 반영됨
• Ppk 값에서 계산
Ppk = 0.5
Zlt = 3×Ppk=1.5
σlt(1.0)
χ 8.5
품질능력
• 장기 4.5 Sigma가 3.4ppm 수준
73
제품설계에서 1.5 Sigma Shift의 의미
Short-term Performance
Long-term Performance
74