02-MS-performance - 이상정

Download Report

Transcript 02-MS-performance - 이상정

컴퓨터 아키텍처의 성능
순천향대학교 정보기술공학부
이상정
2002-2 컴퓨터구조특론1
컴퓨터시스템의 발전
 반도체 집적기술의 발전(technology)
• 고집적,고성능 VLSI 설계 기술
• Moore’s Law : 1965년
=> 반도체집적도 2배/18-24개월
 프로세서 성능 발전
• RISC, ILP 프로세서(superscalar,VLIW)
• Single chip multiprocessor, SMT
 컴퓨터구조 설계기술의 발전
• cache, RAID, multiprocessors
 새로운 기능 대두
• networking, local interconnection technology
순천향대학교 정보기술공학부 이 상 정
2
2002-2 컴퓨터구조특론1
기술 발달 추세
순천향대학교 정보기술공학부 이 상 정
3
2002-2 컴퓨터구조특론1
마이크로프로세서 발달 추세
순천향대학교 정보기술공학부 이 상 정
4
2002-2 컴퓨터구조특론1
성능평가 및 보고
 response time, execution time, latency
• 한 작업의 시작에서 끝까지 걸리는 시간
• 컴퓨터 일반 사용자 관점
 throughput, bandwidth
• 단위 시간 당 처리되는 작업의 량
• 컴퓨터 관리자 관점
 latency, bandwidth는 메모리 시스템의 성능
측정 시 사용하는 용어
순천향대학교 정보기술공학부 이 상 정
5
2002-2 컴퓨터구조특론1
성능측정(시간)
 execution time : 프로그램이 수행되는 시간 (초)
 performance : 초당 event 수의 비율로 측정
 execution time과 performance는 반비례
 response time
• elapsed time, wall-clock time
• task를 완료하는 데 걸리는 시간
• disk access, memory access, I/O activities, OS overhead
포함
• multiprogramming 환경에서는 I/O 대기 중 CPU는 다른 프로
그램을 수행하므로 반드시 한 프로그램의 elapsed time을 최
소화할 필요는 없다.
순천향대학교 정보기술공학부 이 상 정
6
2002-2 컴퓨터구조특론1
성능측정(시간)
 CPU time
• user CPU time과 OS에 의해 수행되는 시간인 system
CPU time으로 구분
 UNIX time command : 90.7u 12.9s 2:29 65%
• 90.7 seconds : user CPU time
• 12.9 seconds : system CPU time
• 2:29(159 seconds) : elapsed time
• 65% : CPU time/elapsed time = (90.7+12.9)/159
순천향대학교 정보기술공학부 이 상 정
7
2002-2 컴퓨터구조특론1
벤치마크 프로그램
 real programs
• 프로그램을 실행할 때 사용자가 선택할 수 있는 input,output,
options을 갖는 프로그램
• compilers, text-processing S/W(Tex), CAD tools(Spice)
 kernels
• real programs의 중요 부분을 추출하여 머신 개개의 특징을
평가하기 위해 사용되는 프로그램
• Linpack, Livermore Loops
 toy benchmarks
• 10-100 줄의 프로그램으로 사용자가 이미 알고 있는 결과를
생성하는 프로그램
• Sieve of Erastosthenes, Puzzle, Quick Sort
순천향대학교 정보기술공학부 이 상 정
8
2002-2 컴퓨터구조특론1
벤치마크 프로그램
 synthetic benchmarks
• 프로그램 상의 오퍼레이션과 오퍼랜드의 평균 빈도 수를 조정
하여 임의로 작성된 프로그램
• Whetstone, Dhrystone
 SPEC benchmarks
• Standard Performance Evaluation Corporation
• 여러 컴퓨터 및 마이크로프로세서 공급자들이 벤치마크 테스
트의 표준을 만들기 위해 1988년에 설립한 비영리기관
• SPEC CPU95
• CINT95: 8개의 정수형 벤치마크 프로그램
• CFP95 : 10개의 실수형 벤치마크 프로그램
• SPEC CPU2000
• CINT2000: 12개의 정수형 벤치마크 프로그램
• CFP2000 : 14개의 실수형 벤치마크 프로그램
순천향대학교 정보기술공학부 이 상 정
9
2002-2 컴퓨터구조특론1
정량적인 컴퓨터 설계의 원칙
 Make the Common Case Fast
• 컴퓨터 설계 시 자주 사용하는 경우를 더 빨리 처리
될 수 있도록 설계하여 성능을 향상
 어떤 것이 자주 발생하는 경우이며, 이러한 것
들을 보다 빠르게 처리함으로써 얼마나 성능개
선을 얻을 것인가를 결정해야 함
 Amdahl의 법칙이 이와같은 원칙을 정량화하
기 위해 사용
순천향대학교 정보기술공학부 이 상 정
10
2002-2 컴퓨터구조특론1
Amdahl's Law
 Speedup due to enhancement E:
ExTime w/o E
Speedup(E) = ------------ExTime w/ E
=
Performance w/ E
------------------Performance w/o E
 성능개선(enhancement) E가 task의 fraction F를
factor S 만큼 개선시키고, task의 나머지는 영향을
받지 않는다고 가정
순천향대학교 정보기술공학부 이 상 정
11
2002-2 컴퓨터구조특론1
Amdahl's Law
ExTimenew = ExTimeold x (1 - Fractionenhanced) + Fractionenhanced
Speedupenhanced
Speedupoverall =
ExTimeold
ExTimenew
1
=
(1 - Fractionenhanced) + Fractionenhanced
Speedupenhanced
순천향대학교 정보기술공학부 이 상 정
12
2002-2 컴퓨터구조특론1
Amdahl’s Law 예 1
 Floating point instructions의 성능이 2배 개선
 10% of actual instructions 가 FP
ExTimenew = ExTimeold x (0.9 + 0.1/2) = 0.95 x ExTimeold
Speedupoverall =
순천향대학교 정보기술공학부 이 상 정
1
0.95
=
13
1.053
2002-2 컴퓨터구조특론1
Amdahl’s Law 예 2
 Floating point SQRT
• 20% of execution time
 Floating point instructions
• 50% of execution time
 Proposal A
• add hardware to make SQRT 10 times faster
 Proposal B
• add hardware to make all floating point 2 times as fast
 Comparison of speedups
• SpeedupSQRT = ((1 - 0.2) + 0.2/10)-1 = 1.22
• SpeedupFP = ((1 - 0.5) + 0.5/2)-1 = 1.33
 FP enhancement is more effective
• speedup value is larger
순천향대학교 정보기술공학부 이 상 정
14
2002-2 컴퓨터구조특론1
The CPU Performance Equation
CPU time
= Seconds
= Instructions x
Program
Program
Program
Inst Count CPI
X
X
(X)
Inst. Set.
X
X
X
X
15
Cycle
Clock Rate
X
Technology
순천향대학교 정보기술공학부 이 상 정
x Seconds
Instruction
Compiler
Organization
Cycles