Transcript File

2. Performansat dhe zhvillimi i
kompjuterëve
Një historik i shkurtër
Dizajnimi dhe performansat
Evolucioni i Pentiumit dhe PowerPC
ENIAC
• ENIAC (Electronic Numerical Integrator
And Computer)
• Eckert and Mauchly
• University of Pennsylvania
• Fillimi 1943
• Filloi te përdoret më 1946
• Përdorimi deri më 1955
ENIAC
•
•
•
•
•
•
•
•
Decimal (jo binar)
20 akumulator me nga 10 shifra
Programimi manual permes nderpreresve
18,000 gypa katodik
30 ton
15,000 square feet (rreth 1,400 m2)
140 kW
5,000 operacione te mbledhjes ne sekonde
Makina e von Neumann/Turing
• Koncepti i kompjuterit me program të
brendshëm (Stored Program).
• Programi dhe të dhënat ruhen në memorien
kryesore.
• Njësia aritmetiko-logjike (ALU) operon me
të dhëna binare.
• Njësia kontrolluese interpreton
instruksionet e vendosura ne memorie dhe i
ekzekuton
• Pajisjet hyrëse dhe dalëse udhëhiqen nga
njësia kontrolluese
• Princeton Institute for Advanced Studies
—IAS
• U kompletua me 1952
Struktura e makines se von Neumann-it
Modeli IAS (Institute of Advanced Studies)
• 1000 fjalë 40 bitëshe
• Numrat binarë
— 2 x 20 bit instruksione
• Regjistrat (memoria në CPU)
— Memory Buffer Register (bufer regjistri i memories)
— Memory Address Register (regjistri asdresor i
memories)
— Instruction Register (regjistri i instruksioneve)
— Instruction Buffer Register (bufer regjistri i
instruksioneve)
— Program Counter (numëruesi programor)
— Accumulator (akumulatori)
— Multiplier Quotient
Formatet e memories IAS
Struktura e
zgjeruar e
kompjuterit IAS
Kompjuterët komercial
• 1947 - Eckert-Mauchly Computer
Corporation
• UNIVAC I (Universal Automatic Computer)
• Kalkulimet për US Bureau of Census 1950
• Prone e Sperry-Rand Corporation
• Fundi i 1950ve - UNIVAC II
—Më i shpejtë
—Më shumë memorie
IBM
• Pajisjet për procesim të kartelave me
vrima 1953 - IBM 701
—Kompjuteri i parë i IBM-it me program të
brendshëm
—Për kalkulime shkencore
• 1955 – IBM 702
—Aplikacionet Biznes
• Pararendës i serisë IBM 700/7000
Tranzistorët
•
•
•
•
•
•
•
•
Zëvendsuan gypat katodikë
Më të vegjël
Më të lirë
Lirojnë më pak nxehtësi
Pajisje ‘solid state’
Prodhohen nga silikoni
1947 Bell Labs
William Shockley etj.
Kompjuterët e bazuar në tranzistorë
•
•
•
•
Gjenerata e dytë
NCR & RCA machines
IBM 7000
DEC – 1957
—PDP-1
Kompjuteri IBM 7094
Gjenerata e tretë – qarqet e integruara
• Një tranzistor i vetëm - komponentë diskrete (vitet 1950-1960).
• Problem në industrinë kompjuterike.
• Në fillim të gjeneratës së dytë, kompjuterët përmbanin rreth
100,000 tranzistorë.
• Në vitin 1958 - një arritje që revolucionarizoi elektronikën.
• Filloi era e mikroelektronikës: QARKU I INTEGRUAR. Qarku i
integruar shënon edhe lindjen e gjeneratës së tretë të
kompjuterëve.
• Katër funksionet bazë:
• Ruajtjen e të dhënave (data storage), që ofrojnë celulat
memorike,
• Procesimin e të dhënave (data processing), që ofrojnë portat,
• Bartjen e të dhënave (data movement), shfrytëzohen shtigjet
ndërmjet komponenteve për bartje të të dhënave prej memories
në memorie dhe prej memories nëpërmejt portave te memorit
tjera,
• Kontrolli (control): shtigjet ndërmjet komponenteve duhet
kontrolluar përmes sinjaleve.
Mikroelektronika
• Komponentet e kompjuterit: portet,
qelizat memorike, ndërlidhjet
• Prodhohen nga materiali gjysëmperçues
Gjeneratat e kompjuterëve
• Gypat katodikë - 1946-1957
• Tranzistorët - 1958-1964
• Small scale integration SSI – 1965+
—Deri 100 pajisje në çip
• Medium scale integration MSI - deri 1971
—100-3,000 pajisje në çip
• Large scale integration LSI - 1971-1977
—3,000 - 100,000 pajisje në çip
• Very large scale integration VLSI- 1978 1991
—100,000 - 100,000,000 pajisje në çip
• Ultra large scale integration ULSI – 1991 —Mbi 100,000,000 pajisje në çip
Ligji i Moore-it
•
•
•
•
Dendësia e rritur e komponenteve në çip
Gordon Moore – bashkëthemelues i Intelit
Numri i tranzistorëve në çip dyfishohet çdo vit
Prej 1970’s zhvillimi ngadalësohet pak
— Numri i tranzistorëve në çip dyfishohet çdo 18 muaj
• Çmimi i çipit i pandryshuar
• Paketimi më i dendur nënkupton rrugë më të
shkurta elektrike, që rezulton me performansa
më të mira
• Madhësia më e vogël jep më shumë fleksibilitet
• Nevoja më të vogla për energji dhe ftohje
• Më pak ndërlidhje mes çipave zvogëlojnë
problemet e mundshme
Rritja e numrit te tranzistoreve ne CPU
Sistemi i serisë IBM 360
• 1964
• Zëvendsoi serinë IBM 7000
• Familja e parë e kompjuterëve
—Bashkësia e ngjashme ose identike e
instruksioneve
—Sistemi operativ identik ose i ngjashëm
—Shpejtësia e rritur
—Numri më i madh i porteve hyrëse/dalëse
(p.sh terminaleve)
—Memoria më e madhe
—Çmimi më i lartë
Seritë IBM 360
DEC PDP-8
•
•
•
•
•
1964
Minikompjuteri i parë
Nuk i nevojitet klimatizimi
Mund të vendoset mbi tavolinë
$16,000
—$100k+ për IBM 360
• Aplikacionet e integruara dhe OEM
• Struktura e bus-ave
Struktura e Bus-it DEC PDP-8
Memoria gjysmëpërçuese
•
•
•
•
•
•
•
1970
Fairchild
Madhësia si e bërthamës magnetike
Përmban 256 bita
Non-destructive read
Më e shpejtë se bërthamat magnetike
Kapaciteti dyfishohet çdo vit
Intel
• 1971 - 4004
—Mikroprocesori i parë
—Të gjitha komponentete CPU ne një cip
—4 bit
• 1972 - 8008
—8 bit
• Të dizajnuar për aplikacione specifike
• 1974 - 8080
—Mikroprocesori i parë i Intelit për përdorim të
pergjithshëm
Rritja e shpejtësisë
•
•
•
•
•
•
Pipelining
Cache në pllakë
L1 & L2 cache në pllakë
Parashikimi i degëzimit
Analiza e rrjedhës së të dhënave
Ekzekutimi spekulativ
Procesorët
Procesorët
Procesorët
Procesorët
Performansat
• Rritja e shpejtësisë së procesorit
• Rritja e kapacitetit të memories
• Shpejtësia e procesorit më e madhe se e
memories
Login and Memory Performance Gap
Zgjidhja
• Rritja e numrit të bitave që merren në një
hap
• Ndryshimi i interfejsit të DRAM-it
—Cache
• Zvogëlimi i shpeshtësisë (frekunecës) së
qasjes memories
—Cache më kompleks dhe cache në çip
• Rritja e shpejtësisë së ndërlidhjeve
—Busa të shpejtë
—Hierarkia e busave
Pajisjet H/D
• Periferitë me kërkesa të mëdha për H/D
• Kërkesa për transfer të madh të të
dhënave në njësi kohore
• Problemi i bartjes së të dhënave
• Zgjidhjet:
—Keshimi
—Baferimi
—Busa interkonektivë me shpejtësi të lartë
—Struktura më komplekse e busave
—Konfigurimet multiprocesorike
Shpejtësitë tipike të të dhënave të paisjeve H/D
Balancimi
•
•
•
•
Procesorët
Memoria kryesore
Pajisjet H/D
Strukturat ndërlidhëse
Përmirësimet në organizimin dhe
arkitekturën e çipit
• Rritja e shpejtësisë së procesorit
—Për shkak të zvogëlimit të madhësisë së
porteve logjike
– Më shumë porte, të paketuara më shpesh, me
frekuencë më të lartë
– Koha e shkurtuar e përhapjes së sinjaleve elektrike
• Rritja e madhësisë dhe shpejtësisë së
cache-it
—Hapësira e dedikuar në çipin e procesorit
– Koha e qasjes cache-it bjen drastikisht
• Ndryshimi i organizimit dhe arkitekturës
së procesorit
— Rritja e shpejtësise se ekzekutimit
— Paralelizmi
Probleme me shpejtësinë e kllokut dhe
dhe dendësinë
• Fuqia
— Dendësia e fuqisë rritet me dendësinë e qarqeve logjike dhe
shpejtësinë e kllokut
— Disipacioni i nxehtësisë
• Vonesa RC
— Shpejtësia me të cilën lëvizin elektronet kufizohet me
rezistencën e përçuesve dhe kapacitetet
— Rritje e RC rrit vonesat
— Përçuesit më të hollë rrisin rezistencën
— Përçuesit e vendosur më afër njeri tjetrit rrisin kapacitetin
• Ngecja (latency) e memories
— Shpejtësia e memories ngec pas shpejtësise së procesorit
• Zgjidhja:
— Më shumë rëndësi zgjidhjeve organizative dhe arkitektonike
Performansa Microprocesorëve Intel
Rritja e kapacitetit te cache-it
• Në rastin tipik, dy-tri nivele të cache-it
mes procesorit dhe memories kryesore
• Rritja e dendësisë së çipave
—Më shumë cache memorie në një çip
– Qasja më e shpejtë
• Pentiumi ia dedikon cache-it 10% të
sipërfaqes së çipit.
• Pentium4 i dedikon cache-it përafërsiht
50% të sipërfaqes
Logjika komplekse e ekzekutimit
• Ekzekutimi paralel i instruksioneve
• Pipeline (tubacioni, gypsjellësi) funsionon
si linja montuese
—Instruksionet në stade të ndryshme të
ekzekutimit në kohë të njejtë përgjatë të
njejtit pipeline
• Procesorët superskalar me më shumë
pipeline në kuadër të një procesori
—Instruksionet që nuk varen nga njeri tjetri
mund të ekzekutohen paralelisht.
Mundësitë modeste për përmirësim
• Organizimi intern i procesorëve kompleks
—Paralelizmi
—Gjasa të vogla për përmirësime drastike
• Benefitet nga cache-i i janë afruar limitit
• Rritja e kllokut shkakton probleme të
dispacionit
• Janë arritur disa kufizime fundamentale
fizike
Qasja e re – Me shumë bërthama
• Me shumë procesorë në një çip.
— Cache-i i madh i përbashkët
• Brenda procesorit rritja e performansave
proporcionale me rrënjen katrore të rritjes së
kompleksitetit
• Nëse software-i mund të shfrytëzojë më shumë
procesorë, dyfishimi i numrit të procesorëve gati
dyfishon performansat.
• Pra, përdoren dy procesorë më të thjeshtë në një
çip, në vend të një procesori kompleks
• Me dy procesorë ka kuptim cache-i më i madh
— Shpenzimi i qarqeve memorike është më i vogël se i
qarqeve procesorike
• Shembull: IBM POWER4, Pentium Core 2 Duo
Organizimi i çipit POWER4
Evolucioni i Pentiumit
• 8080
— Procesori i parë me përdorim të gjithanshëm
— Rrugët 8 bitëshe të të dhënave
— Përdoret në kompjuterin e parë personal – Altair
• 8086
— Shumë më i fuqishëm
— 16 bitësh
— Cache-i i instruksioneve, paramarrja e disa
instruksioneve
— 8088 (busi i jashtëm 8 bitësh) përdoret në IBM PC
• 80286
— 16 Mbyte memorje të adresueshme
• 80386
— 32 bitësh
— Përkrahja për multitasking
Evolucioni i Pentiumit
• 80486
—Pipelining i cache-it dhe instruksioneve
—Koprocesori matematikor i integruar
• Pentium
—Superskalar
—Instruksione të shumëfishta ekzekutohen
paralelisht
• Pentium Pro
—Organizimi i theksuar superskalar
—Riemërimi i regjistrave
—Parashikimi i degëzimit
—Analiza e rrjedhës së të dhënave
—Ekzekutimi spekulativ
Evolucioni i Pentiumit
• Pentium II
— Teknologjia MMX
— Procesimi i grafikës, videos dhe zërit
• Pentium III
— Instruksione shtesë me pikë të lëvizshme për grafikën
3D
• Pentium 4
— Përmirësime shtesë për operacione me pikë të
levizshme dhe multimedia
• Itanium
— 64 bit
• Itanium 2
— Përmirësime hardware-ike për rritjen e shpejtësisë
PowerPC
• 1975, 801 projekti për mikrokompjuter (IBM) RISC
• Procesori Berkeley RISC I
• 1986, produkti komercial workstation i IBM-it RISC, RT
PC.
— Nuk pati sukses komercial
— Shumë rival me performanasa të ngjashme apo edhe më të
mira
• 1990, IBM RISC System/6000
— RISC-si makinë superskalare
— Arkitektura POWER
• Aleanca IBM me Motorola (68000 microprocessors) dhe
Apple, (te shfrytëzuara 68000 ne Macintosh)
• Rezultuan në arkitekturen PowerPC
— Derivuar nga arkitektura POWER
— Superscalar RISC
— Apple Macintosh
— Aplikacionet Embedded chip
Familja PowerPC
• 601:
— Paraqitje e shpejtë në treg. Makinë 32-bitëshe
• 603:
— Desktop me permasa të vogla dhe i lëvizshëm
— 32-bit
— Performansë të krahasueshme me 601
— Kosto më e ulët dhe implementim më eficient
• 604:
— Desktop dhe serverë të vegjël
— Makinë 32-bitëshe
— Dizajn superskalar shumë më i përparuar
— Performansë më e lartë
• 620:
— Serverë të mëdhenjë
— Arkitekturë 64-bitëshe
Familja PowerPC
• 740/750:
—E njohur edhe si G3
—Dy nivele të cache-it në çip
• G4:
—Rritjen e paralelizmit dhe shpejtësisë së
brendëshme
• G5:
—Përmirësime në paralelizëm dhe shpejtësinë e
brendshme
—Organizimi 64-bitësh