KOMPIUTERIŲ ARCHITEKTŪRA ir OPERACINĖS SISTEMOS

Download Report

Transcript KOMPIUTERIŲ ARCHITEKTŪRA ir OPERACINĖS SISTEMOS

KOMPIUTERIŲ
ARCHITEKTŪRA ir
OPERACINĖS SISTEMOS
Doc. Stasys Maciulevičius
Kompiuterių katedra
[email protected]
1
Trečiosios paskaitos santrauka
 komandų sistema






pagrindiniai komandų sistemų tipai
bendrosios paskirties registrų tipo architektūra
komandų formatai
operandų adresavimo būdai
komandų formatų pavyzdžiai
CISC ir RISC
 konvejeris
 konvejerio esmė
 kliūtys konvejeryje
2010-2012
S.Maciulevičius
2
Šios paskaitos turinys
 Procesoriai
 Intel procesorių raida
 64 bitai ir keli branduoliai
 Naujieji Intel procesoriai
 Naujieji AMD procesoriai
 x86 analogai
2010-2012
S.Maciulevičius
3
von Neuman'o tipo kompiuteris
von Neuman'o tipo kompiuterio struktūra:
Komandų
procesorius
Duomenų
procesorius
Įvesties ir
išvesties
procesorius
Ryšio įtaisas (magistralė)
Atmintis
2010-2012
S.Maciulevičius
4
Procesorius
 Dabar komandų ir duomenų procesorius
įprasta apjungti į vieną įtaisą – centrinį
procesorių (CPU).
 Todėl komandų ir duomenų procesorius
toliau vadinsime valdymo ir operaciniais
įtaisais, nes šie pavadinimai geriau
atspindi jų paskirtį ir funkcijas
4
2010-2012
S.Maciulevičius
5
Procesorius
PROCESORIUS
Valdymo
įtaisas
Valdymo
signalai
Informacija
apie operacijos eigą
Komanda
(iš atminties)
2010-2012
Operacinis
įtaisas
Duomenys
(iš atminties)
S.Maciulevičius
Rezultatai
(į atmintį)
6
Procesorius
 valdymo įtaisas išrenka iš atminties komandas, jas
analizuoja ir valdo operacinio įtaiso darbą (jame
vykdomas operacijas, kreipinius į atmintį duomenims
išrinkti ar rezultatui įrašyti);
 operacinis įtaisas vykdo operacijas, kurias nurodo
komanda;
 šie du įtaisai dirba kartu: valdymo įtaisas pagal
operacijos kodą formuoja signalus, valdančius
operacinio įtaiso darbą; pastarasis perduoda į valdymo
įtaisą signalus, informuojančius apie operacijos eigą,
nuo kurių gali priklausyti paskesnių valdymo įtaiso
signalų formavimas (pavyzdžiui, operando ženklas, jo
kurios nors skilties reikšmė ir t.t.).
4
2010-2012
S.Maciulevičius
7
Procesoriaus operacinis įtaisas
Operacinis įtaisas
operandai
Vidinė
atmintis
(registrai,
spart. atmintis)
Duomenys
(iš atminties)
rezultatai
Informacija
apie operacijos eigą
Valdymo
signalai
(iš valdymo įtaiso)
2010-2012
Operacijas
vykdančios
schemos
Rezultatai
(į atmintį)
(į valdymo įtaisą)
S.Maciulevičius
8
Procesoriaus operacinis įtaisas
Jei pažvelgtume į operacinio įtaiso vidų,
galėtume jame išskirti dvi schemų grupes:
 vidinę atmintį, kuri reikalinga apdorojamiems
duomenims (operandams) laikyti; ją sudaro
registrai, atskiri trigeriai, spartinančioji atmintis
[kešas], kai kuriuose įtaisuose – stekas;
 operacijas vykdančios schemas, kurios atlieka
visus informacijos apdorojimui reikalingus
veiksmus – sudėtį, logines operacijas, postūmius
ir t.t.
2010-2012
S.Maciulevičius
9
Procesorių rinka
 Intel firma – lyderis (apie 80,1%
procesorių rinkos 2011 m. – IDC
(International Data Corporation) duomenimis)
 AMD firma – pagrindinis Intel
konkurentas (apie 19,7% rinkos)
 Intel ir AMD – x86-64 ir kitos
naujos mikroarchitektūros
2010-2012
S.Maciulevičius
10
Intel procesoriai (1)
8085
4004
8008
8080
8088
8086
80386SX 80486SX
80286 80386 80486
80486DX2
4 bitų
8 bitų
80486DX4
16 bitų
32 bitų
2010-2012
S.Maciulevičius
11
Intel 4004
Intel 4004, pirmasis mikroprocesorius (1971 lapkr.).
 skirtas kalkuliatoriui
 duomenų žodis - 4 bitai
 komandų ilgis - 8 bitai, komandų skaičius - 46
 16 registrų (po 4 bitus)
 atskiros atmintys: 1 KB - duomenims, 4 KB –
programoms
 PC ilgis - 12 bitų
 4 lygių steką kreipiniams į paprogrames
 dažnis - 108 KHz
 2300 tranzistorių (10 m)
2010-2012
S.Maciulevičius
12
Intel 8080 (1974)
 16 bitų adreso ir 8 bitų duomenų magistralės,
 septyni 8 bitų registrai (A-E, H ir L galėjo būti
naudojami poromis - BC, DE ir HL - apjungus į
16 bitų registrus),
 16 bitų steko rodyklė ir 16 bitų programos
skaitiklis,
 adresuojama atmintis - 64 KB,
 tranzistorių skaičius - 6 000 (6 m),
 dažnis - 2 MHz.
2010-2012
S.Maciulevičius
13
Intel 8086 (1978)
 programiškai suderinamas su 8080, turi
panašų registrų rinkinį,
 duomenų ilgis išplėstas iki 16 bitų,
 6 baitų išankstinio komandų išrinkimo eilė,
 keturi 16 bitų bendrieji registrai,
 keturi 16 bitų adresavimui skirti registrai,
 4 segmentų registrai,
 adresuojama atmintis - 1 MB,
 tranzistorių skaičius - 29 000 (3 m),
 dažnis - 4,77 MHZ, kaina - 360 $.
2010-2012
S.Maciulevičius
14
Intel 8086
A19-A16(ST6-ST2) AD15-AD0
Adr./ būs.
buf.
Adreso/ duomenų buferis
Adresų sumatorius
8088:
• 8 bitų duomenų
magistralė
• 4 baitų komandų
eilė
2010-2012
CS
SS
DS
ES
AX
CX
DX
BX
AH
CH
DH
BH
IP
Komandų
eilė
AL
CL
DL
BL
SP
BP
SI
DI
S.Maciulevičius
ALU
F
Valdymo
ir
sinchronizacijos
schema
15
Koprocesorius
 Pirmieji mikroprocesoriai atliko veiksmus tik su
sveikaisiais skaičiais, o veiksmai su slankaus
kablelio skaičiais buvo emuliuojami, t.y., realizuojami
programiniu būdu (naudojant specialią paprogramių
biblioteką)
 Intel sukurtasis koprocesorius 8087 (dar vadinamas
matematiniu koprocesoriumi, aritmetiniu
koprocesoriumi) skirtas veiksmams su slankaus
kablelio skaičiais ir kai kurioms specialioms
operacijoms (sinuso, kvadratinės šaknies ir kt.)
2010-2012
S.Maciulevičius
16
Procesorius ir koprocesorius
Būsenos bitai
Koprocesorius
CPU
RQ/GT
AD
AD
Atmintis
2010-2012
S.Maciulevičius
17
Procesorius ir koprocesorius
 Komandų išrinkimą valdo 8086. Kai
koprocesorius pastebi, kad išrenkama slankaus
kablelio komanda, jis ją pasiima ir vykdo
 Pirmojo duomenų žodžio išrinkimą inicijuoja taip
pat 8086 (koprocesorius jį pasiima iš
magistralės), o sekančių (jei reikia) - pats
koprocesorius
 Magistralę pasidalija naudodami RQ/GT
(Request/Grant) liniją
2010-2012
S.Maciulevičius
18
Intel 80386 (1985)
 išplėstos adresavimo galimybės, pridedant indekso
daugiklį (bazės reg + ind. reg  daugiklis (1, 2, 4 ar 8)
+ posl. (8 / 32 bitų konstanta),
 pridėtas atminties dispečeris (MMU), apsaugos
režimai (vadinamieji žiedai),
 adresuojama atmintis - 4 GB,
 virtualioji atmintis - 64 TB,
 tranzistorių skaičius - 275 000 (1,5 m),
 dažnis - 16 MHz, kaina - 299 $,
 80386SX - su 16 bitų duomenų magistrale
 80386SL (1990) - pirmasis mikroprocesorius
portatyviems kompiuteriams
2010-2012
S.Maciulevičius
19
Intel 80486 (1989)
 įvestas komandos vykdymo konvejeris,
 bendras vidinis 8KB kešas, integruotas FPU,
 adresuojama atmintis - 4 GB, virtuali atmintis - 64
TB,
 tranzistorių skaičius - 1,2 mln. (1 m; 50 MHZ - 0,8
m),
 dažnis - 25 MHZ., kaina - 900 $.
 be pagrindinio varianto (DX) buvo leidžiami
80486DX2 (su dažnio dvigubinimu viduje) ir
80486DX4 (su dažnio trigubinimu),
 80486SX (1991) - be FPU,
 80486SL (1992) - portatyviems kompiuteriams
2010-2012
S.Maciulevičius
20
Intel 80486 konvejeris
Penkios pakopos:
Fetch D1 D2
EX WB
Fetch
D1
D2
EX
WB
Komandos išrinkimas (iš kešo arba išorinės
atminties)
Analizuojami pirmi 3 komandos baitai. Dekoduojami
OpK ir adresavimo būdai.
Formuojami valdymo signalai ALU. Formuojamas
adresas sudėtingesnės adresacijos atveju.
Vykdomos ALU operacijos, kreipiamasi į kešą.
Jei reikia, atnaujinami registrai ir požymiai
(vėliavėlės). Jei reikia, inf. irašoma į kešą arba
siunčiama į sąsają su atmintimi.
2010-2012
S.Maciulevičius
21
Intel 80486 konvejeris
Jei nėra trikdžių:
Fetch D1 D2
EX WB
MOV Reg1,Mem1
D1
D2
EX WB
MOV Reg1,Reg2
Fetch
D1
D2
MOV Mem2, Reg1
Fetch
EX WB
Jei yra trikdis, naudojant įkraunamą registrą kaip bazės:
Fetch D1
Fetch
D2
EX WB
D1
D2
MOV Reg1,Mem1
EX WB
Antrajai komandai reikalingas R1 pakopoje D2.
2010-2012
S.Maciulevičius
MOV Reg2,(Reg1)
22
Intel 80486 konvejeris
Perėjimo atveju:
Fetch D1 D2
Fetch
D1
EX WB
CMP Reg1, Imm
D2
Jcc Target
Target
EX
Fetch
D1
D2
EX WB
Čia parodytas atvejis, kai pereinama nurodytu adresu.
CMD rezultatą įrašo pakopoje WB. Kartu adresas per
apylanką perduodamas Jcc komandai. Lygiagrečiai
pradedamas išankstinis išrinkimas. Jei pasirodytų, kad
pereiti nereikia, šis išrinkimas būtų nutrauktas.
Tuomet būtų tęsiamos vykdyti jau išrinktos ir
dekoduotos komandos, programoje esančios po Jcc
2010-2012
S.Maciulevičius
23
Intel procesoriai (2)
P5
P6
Pentium
Pentium MMX
Pentium Pro
P7
Pentium 4
Pentium II
Pentium III
Prescott (P-4E)
IA-64
Itanium
P8
2010-2012
Core
Itanium2
Core Duo
S.Maciulevičius
Core i7
Core i5
24
Intel Pentium (1993)
 superskaliarinis (iki dviejų komandų sveikųjų skaičių
įtaisuose ir vienos FPU) procesorius,
 konvejeris - 5 pakopos,
 perėjimo prognozė,
 turi atskirus 8KB komandų ir duomenų kešus,
 išorinė duomenų magistralė - 64 bitų,
 adresuojama atmintis - 4 GB,
 virtualioji atmintis - 64 TB,
 tranzistorių skaičius - 3,1mln. ( 0,8 m),
 dažnis - 60 MHZ, kaina - 878 $.
2010-2012
S.Maciulevičius
25
Intel Pentium
Komandų kešas
(8 KB)
Išankstinio išrinkimo
buferis
BTB
FPU
Registrų
stekas
+
BIU
(Mag.
sąsajos įt.)
ALU
ALU
U-pipe
V-pipe


Registrai
Duomenų kešas
(8 KB)
2010-2012
S.Maciulevičius
26
Pentium 4
 7 kartos procesorius (P7)
 Šią architektūrą dar vadina NetBurst
 Ji buvo orientuota į aukštą taktų dažnį (1,4-
1,5 karto aukštesnį nei kitų procesorių)
 Tai smarkiai padidino konvejerio ilgį, padarė
įtaisus sudėtingesniais ir todėl padidino
energijos sunaudojimą
 Naujas šio procesoriaus variantas – Prescott
(P4-E)
 Prescott palaiko 64 bitų sveikųjų skaičių
operacijas ir EM64T adresų sistemą
2010-2012
S.Maciulevičius
27
Intel Pentium konvejeriai
2010-2012
S.Maciulevičius
28
Intel ir AMD procesorių dažnis
2010-2012
S.Maciulevičius
29
Intel ir AMD procesorių energetika
2010-2012
S.Maciulevičius
30
Nuo 32 prie 64 bitų
 32 bitų procesorius gali operuoti su sveikaisiais
skaičiais, siekiančiais 232 arba apie 4.3 milijardo
 64 bitų procesoriaus galimybės siekia 264 arba apie
18.4 kvintilijono (18,400,000,000,000,000,000);
 32 bitų procesoriai ir operacinės sistemos gali
palaikyti iki 4 gigabaitų atminties, iš jų taikomajai
programai gali būti skirta tik 2 gigabaitai; CAD/CAM
ir moksliniams skaičiavimams to ima nebepakakti
 Athlon 64 turi 40 bitų atminties registrus, taip
išplečiant palaikomą atmintį iki 164 gigabaitų
2010-2012
S.Maciulevičius
31
64 bitai ir našumas
 Taigi, perėjimas prie 64 bitų leidžia išplėsti
sveikųjų skaičių diapazoną (tai nėra taip
svarbu) ir adresavimo galimybes (tai
gerokai svarbiau)
 Ar perėjimas prie 64 bitų architektūrų
ženkliai padidina procesorių našumą?
 Gaila, bet žodžio ilgio padidėjimas visai
neiššaukia našumo padidėjimo. Operacijų
atlikimo požiūriu netgi priešingai – veiksmai
su didesnio ilgio operandais trunka ilgiau
2010-2012
S.Maciulevičius
32
64 bitai
Duomenų
tipas
Sveikieji
skaičiai
Registrų
tipas
Funkcinis
x86 plotis
įtaisas
x86-64
plotis
GPR
ALU
32
64
Adresai
GPR
ALU arba
AGU
32
64
Sl. kablelio
skaičiai
FPR
FPU
64
64
VR
VPU
128
128
Vektoriai
Kaip matome, skiriasi tik sveikųjų skaičių ir adresų
ilgis
2010-2012
S.Maciulevičius
33
Intel® EM64T
 Intel® Extended Memory 64 Technology
(Intel® EM64T) – tai 64 bitų adresavimo
galimybių panaudojimas serverių, darbo
stočių ir stalo kompiuterių platformose
kartu su atitinkama tai palaikančia
programine įranga.
 Intel EM64T padidina sistemos našumą
įgalindama adresuoti daugiau nei 4 GB
atminties.
2010-2012
S.Maciulevičius
34
x86-64 specifikacija
 Analogišką, x86-64 specifikaciją, sukūrė
AMD kaip x86 komandų sistemos tolesnį
išvystymą
 64 bitai leidžia naudoti gerokai daugiau
virtualios ir fizinės erdvės nei x86,
padvigubina sveikųjų skaičių registrų plotį
nuo 32 iki 64 bitų, padidina sveikųjų skaičių
registrų kiekį ir teikia kitus privalumus
2010-2012
S.Maciulevičius
35
EM64T (ir x86-64) registrai
2010-2012
S.Maciulevičius
36
Keli branduoliai procesoriuje
 Didinti dažnį, siekant vis didesnio našumo,
darėsi vis sunkiau ir sunkiau
 Vietoj to firmos nukreipė savo jėgas
lygiagretumo didinimui - dviejų branduolių
procesorių kūrimui, vėliau pereinant prie
kelių branduolių viename procesoriuje
 Šia kryptimi eina Intel, AMD, Motorola, Sun
ir kitos firmos
2010-2012
S.Maciulevičius
37
Intel “tik-tak” strategija
 Intel naujas mikroprocesorių
architektūras įveda kas 2 metai kaip jų
“tick-tock” strategijos dalį:
 Tarkime, vienais metais Intel pagerino
technologiją, nekeisdama procesoriaus
mikroarchitektūros (“tick”)
 Kitame etape (“tock”) Intel palieka gerai
įsisavintą technologiją, bet kuria naują
procesoriaus mikroarchitektūrą:
2010-2012
S.Maciulevičius
38
Intel procesorių raida
2010-2012
S.Maciulevičius
39
Intel Core mikroarchitektūra
 Intel firma sėkmingai dirba mobiliųjų procesorių
srityje, kur pasižymėjo jos Pentium M ir
Centrino technologija, pasiekę gerų rezultatų
bendrojo našumo, našumo vienam vatui ir
baterijos darbo laiko srityse
 Kitas žingsnis šių pasiekimų pagrindu – Core
mikroarchitektūra, kurios pagrindiniai bruožai
yra:
 Intel Wide Dynamic Execution
 Intel Advanced Smart Cache
 Intel Smart Memory Access
 Intel Advanced Digital Media Boost
 Intel Intelligent Power Capability
2010-2012
S.Maciulevičius
40
40
Intel Nehalem
 2008 m. Intel pristatė naują
mikroarchitektūrą, kurią pavadino Nehalem
 Ji buvo sumanyta kaip modulinė – sudaryta iš
blokų, kurie (tarsi Lego konstruktorius) leistų
kurti įvairius variantus
 Dabar šios mikroarchitektūros procesoriai
vadinami Core i3, i5, i7, i9
2010-2012
S.Maciulevičius
41
Nehalem moduliškumas
IA Core –
Intel archit.
branduolys
iGraphics –
integruota
grafika
IMC –
integruotas
atminties
kontroleris
QPI – Quick
Path
Interconnect
2010-2012
S.Maciulevičius
42
Intel: CPU ir integruota grafika
2010-2012
S.Maciulevičius
43
Intel: CPU ir moduliškumas
 Atkreipkite dėmesį į tai, kaip keičiasi
kompiuterio branduolys (stuburas):
 Kairėje – tradicinis dviejų dalių valdymo schemų
rinkinys (VSR), kuriame sutelktas kompiuterio
komponentų (atminties, grafikos, išorinės
atminties, įvesties ir išvesties) valdymas
 Dešinėje – nauja struktūra, kurioje atminties ir
grafikos valdymas perkeltas į procesoriaus
kristalą, o sumažėjus VSR funkcijoms, šios
realizuotos viename kristale, kuriam liko išorinės
atminties bei įvesties ir išvesties valdymas
2010-2012
S.Maciulevičius
44
Intel Sandy Bridge
2011 m. pradžioje pasirodys naujas Intel
procesorius Sandy Bridge:
tai Core i7, i5 ir i3 procesorių antroji karta
turi integruotą grafikos kontrolerį
gaminami naudojant 32 nm technologiją
turi 2x32 KB L1 ir 256 KB L2 spartinančiąsias
atmintis
 pavadinimas Core ... išlieka, tačiau skaitmeninio
numerio priekyje atsiranda skaitmuo 2, rodantis
antrąją kartą




2010-2012
S.Maciulevičius
45
Sandy Bridge mikroarchitektūra
2010-2012
S.Maciulevičius
46
46
Sandy Bridge mikroarchitektūra



Viršutinė konvejerio dalis – nuoseklioji (in order); čia
nuosekliai išrenkamos komandos ir perkoduojamos į
mikrooperacijas (MO)
Apatinė konvejerio dalis – lygiagrečioji (out-of-order); čia
superskaliariniame bloke vieno takto metu gali būti
inicijuotas net 6 MO vykdymas. Taip faktiškai
realizuojama duomenų srauto architektūra – MO
pradedamos vykdyti, kai tik turimi operandai ir vykdymui
reikalingi įtaisai
Konvejerio pabaigoje – užbaigimo įtaisas, kur
apdorojamos išskirtinės situacijos ir razultatai sutvarkomi
taip, kaip rodo nuoseklus programos kodas
2010-2012
S.Maciulevičius
47
Sandy Bridge mikroarchitektūra



CPU branduolys turi L1 komandų ir duomenų
kešus (po 32 KB) bei 256 KB L2 kešą
Naujiena – L0 lygmens kešas, kuriame telpa
1500 dekoduotų mikrooperacijų (MO). Jo nauda
– taupoma energija ir padidinama darbo sparta
(jei išrinkimo blokas randa reikalingą MO keše, jis
gali kuriam laikui išjungti dekodavimo įtaisus)
Tyrimas parodė, kad vykdant daugumą taikomųjų
programų apie 80% komandų randama
perkoduotos į MO šiame keše
2010-2012
S.Maciulevičius
48
Sandy Bridge mikroarchitektūra

Žemiau parodyti vieno testo rezultatai. Buvo
palygintos dvi tuo pačiu dažniu dirbančios sistemos
– senoji Nehalem ir naujoji Sandy Bridge:
2010-2012
S.Maciulevičius
49
Sandy Bridge mikroarchitektūra



Sandy Bridge procesoriuose pirmą kartą
panaudotos naujos vektorinės komandos AVX
(Advanced Vector Extensions) – 256 bitų ilgio
žodžiams apdoroti (AMD taip pat jos palaikomos
Bulldozer mikroarchitektūros procesoriuose)
Tai sudaro sąlygas aukštam našumui pasiekti
apdorojant slankaus kablelio skaičius
Pateiktame mikroarchitektūros paveiksle išskirti
įtaisai, realizuojantys šias komandas
2010-2012
S.Maciulevičius
50
Kai kurie Sandy Bridge modeliai
DažL3
Brand./
nis,
kešas Gijų
GHz
Intel HD graf.
Daudažnis/Max
gikl.
Turbo,
blok.
MHz
TDP
Intel Core i7 2600K
3.4
8 MB
4/8
850 / 1350
Ne
95W
Intel Core i7 2600
3.4
8 MB
4/8
850 / 1350
Taip
95W
Intel Core i5 2500K
3.3
6 MB
4/4
850 / 1100
Ne
95W
Intel Core i5 2500
3.3
6 MB
4/4
850 / 1100
Taip
95W
Intel Core i5 2400
3.1
6 MB
4/4
850 / 1100
Taip
95W
Intel Core i3 2120
3.3
3 MB
2/4
850 / 1100
Taip
65W
Intel Core i3 2100
3.1
3 MB
2/4
850 / 1100
Taip
65W
2010-2012
S.Maciulevičius
51
Intel “tik-tak” strategija
2010-2012
S.Maciulevičius
52
Intel Ivy Bridge

2012 m. pradžioje Intel žengė „tick+“ žingsnį,
Sandy Bridge pervesdama į 22 nm technologiją
ir išleisdama procesorių Ivy Bridge:
tai Core i7, i5 ir i3 procesorių trečioji karta
 gamybai panaudota trimatės struktūros tranzistorių
(Intel 3D Tri-Gate) technologija, užtikrinanti 50%
mažesnes energijos sąnaudas (lyginant su
planariniais tranzistoriais), esant tam pačiam
našumui
 naudojamas aparatūrinis atsitiktinių skaičių
generatorius

2010-2012
S.Maciulevičius
53
Intel Ivy Bridge





GPU atsirado DirectX 11 ir bendro pobūdžio
skaičiavimų technologijos OpenCL 1.1
palaikymas
aparatūros lygmenyje dekoduojama aukštos
raiškos vaizdo medžiaga iki 4K raiškos (Intel
Quick Sync Video)
integruotasis GPU turi 16 vykdymo įtaisų (EU)
palaikoma PCI Express 3.0
mobilieji Ivy Bridge palaikys žemesnės įtampos
DDR3L atmintis
2010-2012
S.Maciulevičius
54
Intel Ivy Bridge
Ivy Bridge pasiekia maždaug 10 proc. didesnį
našumą nei 32 nm Sandy Bridge (tai pasiekta
ne tik dėl pakeistos architektūros, bet ir dėl
padidinto taktinio dažnio)
 trečios kartos Core modeliai kainuoja ne
brangiau, nei Sandy Bridge linija, kurią Ivy
Bridge ir pakeis
 pagrindinis akcentas – Ivy Bridge procesorių
naudojimas mobiliosiose sistemose, kurioms
trečioji Core karta ir skirta (tai diktuoja situacija
kompiuterių rinkoje)

2010-2012
S.Maciulevičius
55
Ivy Bridge bendrasis našumas
Dažniai:
3,2 GHz
3,5 GHz
3,5 GHz
3,6 GHz
3,4 GHz
3,3 GHz
3,6 GHz
2010-2012
S.Maciulevičius
56
Intel Haswell
 2013 metais laukiama pasirodant Haswell
architektūros procesorių (tai jau 4-ji Core karta)
 Intel žada, kad Haswell procesorių energijos
suvartojimo lygis ramybės būsenoje bus maždaug
20 kartų mažesnis, nei tai gali pasiūlyti jos
dabartiniai sprendimai
 Ši technologija bus palaikoma operacinėje
sistemoje Windows 8 ir, pavyzdžiui, kompiuteris
galės atsisiųsti elektroninį paštą ar sisteminius
atnaujinimus, būdamas gilaus miego būsenoje
2010-2012
S.Maciulevičius
57
Intel Haswell
 2012 m Intel taip pristatė tris stulpus, ant kurių
remiasi Haswell mikroarchitektūra:
 našumas (išlaikant pasiektą esamai
programinei įrangai plius naujas našumas);
 moduliškumas (šeimos išplėtimas visam
kompiuterių spektrui – nuo serverių iki
planšetinių kompiuterių);
 energija (energijos valdymas ir sumažinimas)
2010-2012
S.Maciulevičius
58
Intel Atom
2008 m. pasirodęs Atom procesorius tapo
greitai tapo populiarus:
 tai labai mažai energijos (vieno branduolio – nuo
0,65 iki 4 W) naudojantis procesorius, skirtas
portatyviems kompiuteriams ir kt. mobiliesiems
interneto įtaisams
 turi x86 komandų sistemą
 kai kurie modeliai palaiko Intel EM64T
 palaiko HyperThreading technologiją
 palaiko virtualizacijos technologiją
2010-2012
S.Maciulevičius
59
59
Intel Atom
 turi 32 KB L1 komandų ir 24 KB L1 duomenų bei
512 KB (dviejų branduolių Atomai – 1 MB) L2
spartinančiąsias atmintis
 taupant energiją, dalis spartinančiosios atminties
gali būti išjungta
 vykdo komandas eilės tvarka, kaip senieji
Pentiumai (kad energijos sąnaudos būtų
mažesnės)
 gaminami naudojant 45 technologiją
 naujojo Atom N550 dažnis – 1,5 GHz, energijos
sąnaudos – 8,5 W
2010-2012
S.Maciulevičius
60
60
AMD K10 architektūra
 Naujoji AMD K10 architektūra remiasi K8
architektūra, tačiau joje buvo padaryti
patobulinimai:
 viename procesoriuje gali būti iki 12 branduolių
 didelis bendras L3 kešas
 iš karto (viename sinchronizavimo cikle) išrenkami 32
baitai (256 bitų) iš L1 komandų kešo – tai dvigubai
daugiau nei K8 architektūros procesoriuose
 naudojama 128 bitų vidinė duomenų magistralė;
ankstesniuose K8 architektūros procesoriuose ji buvo
64 bitų (tai kiek trukdė SSE komandoms, nes SSE
registrai (XMM) yra 128 bitų)
2010-2012
S.Maciulevičius
61
AMD K10 architektūra
 Šios architektūros procesoriuose realizuota
didelio pralaidumo magistralė HyperTransport
3.0, kuri gali užtikrinti 41,6 GB/s abiem
kryptimis 32 bitų režimu arba iki 10,4 GB/s viena
kryptimi 16 bitų režimu, o dažnis siekia 2,6 GHz
 Du nepriklausomi pagrindinės atminties DDR21066 arba DDR3-1333 kontroleriai, integruoti
procesoriaus kristale, užtikrina spartesnį darbą
su atminties moduliais
 Tai buvo Sempron, Athlon II, Phenom X3/X4,
Turion II Dual-Core Mobile, 6 branduolių ir 6100
serijos Opteron procesoriai
2010-2012
S.Maciulevičius
62
AMD Bulldozer
 AMD naujos kartos (15h) mikroarchitektūros kodiniu pavadinimu
„Bulldozer" procesorius pristatė parodoje „CeBIT 2011“
 Bulldozer procesoriai gaminami pagal 32 nm technologiją, jie
naudoja patobulintas energijos vartojimo priemones, palaiko
naująsias x86 komandas, turi specialias srautinių skaičiavimų
našumo didinimo priemones
 Bulldozer platforma išnaudoja dinaminio procesorių našumo
didinimo technologijos Turbo Core Dynamic Acceleration
galimybes, o tai prireikus leis padidinti visų branduolių taktinį dažnį
500 MHz.
 Slankaus kablelio skaičių įtaisas turi du 128 bitų konvejerius; kartu
jie gali vykdyti AVX 256 bitų komandas
2010-2012
S.Maciulevičius
63
AMD Bulldozer
2010-2012
S.Maciulevičius
64
AMD Bulldozer
 Šioje struktūroje matome Bulldozer branduolį,
kuriame yra dvi sveikųjų skaičių dalys, todėl
sakoma, kad šis branduolys tarsi gali vykdyti dvi
gijas (atitinka Intel hipergijų mechanizmą)
 Perkoduotos komandos nukreipiamos vykdymui į du
sveikųjų skaičių ir vieną slankaus kablelio skaičių
dispečerius
 Slankaus kablelio skaičių įtaisas turi du konvejerius,
apdorojančius 128 bitų žodžius; kartu jie gali
vykdyti AVX 256 bitų komandas
2010-2012
S.Maciulevičius
65
AMD Bulldozer
 Aktyvių schemų
dalis įvairiuose
režimuose
Bulldozer
procesoriuje kur
kas mažesnė nei
ankstesniuose
AMD CPU
modeliuose:
 Tai padeda
taupyti energiją
2010-2012
S.Maciulevičius
66
AMD Interlagos
 2011 m. tarptautinėje superkompiuterių
konferencijoje AMD pristatė naujausią
procesorių Interlagos (Bulldozer
architektūros pagrindu)
 Interlagos turi net 16 branduolių ir palaiko 4
kanalų DDR3 atmintį; jis skirtas labai
našiems serveriams
 Gaminami ir 8 branduolių, 2 kanalų
procesoriai “Valencia” (Opteron 4000 serija),
kurie skirti mažesniems HPC klasteriams
2010-2012
S.Maciulevičius
67
AMD posūkis
 Nuo Nehalem mikroarchitektūros įvedimo AMD ėmė
gerokai atsilikti našių procesorių srityje
 Nors AMD inžinieriai pirmieji yra sumanę ir
panaudoję tokius dalykus, kaip 64 bitų x86
mikroarchitektūra, kelių branduolių procesoriai,
atminties kontrolerio integravimas procesoriuje
 Manoma, kad AMD išgelbės naujoji idėja – kurti
specialius įtaisus skaičiavimams spartinti, kuriuos
jie pavadino APU (Accelerated Processing Units),
kai viename kristale apjungiami tradiciniai x86
branduoliai su našiu grafikos branduoliu
2010-2012
S.Maciulevičius
68
AMD Fusion
Procesoriaus kristalas
 Pirmasis žingsnis –
Fusion, kuriame
apjungti centrinis ir
grafikos procesoriai
DIMM
DIMM
CPU
L2 kešas
GPU
Buferiai
Kryžminis
komutatorius
Atminties
kontroleris
Hyper
Transport
Šiaurinis
tiltas
2010-2012
S.Maciulevičius
69
AMD Llano
 2011 m. vasarą AMD pristatė A-Series procesorius,
gaminamus naudojant 32 nm technologiją; jų
maks. galia (TDP) – 35 arba 45 W
 Kristaluose integruoti DDR3 atminties ir grafikos
kontroleriai, palaikantys DirectX 11 (srautinių
procesorių skaičius nuo 240 iki 400)
 Llano pavadinti procesoriai turi 2 arba 4
branduolius su 4 arba 2 МB L2 kešo, dirba nuo 1,4
iki 2,1 GHz dažniu
 Procesoriai palaiko našumo didinimo technologiją
Turbo Core
2010-2012
S.Maciulevičius
70
AMD Llano
2010-2012
S.Maciulevičius
71
AMD Llano
 AMD didesnį dėmesį skiria grafikai:
2010-2012
S.Maciulevičius
72
AMD Trinity
 2011 m. vasarą AMD pristatė antrąją Llano kartą Trinity procesorius, gaminamus naudojant tą pačią
32 nm technologiją
 Padidėjo kristalo plotas (iki 246 mm2) ir tranzistorių
skaičius (iki 1,3 mlrd)
 Procesoriaus x86 branduoliai atitinka Bulldozer
branduolius ir dirba iki 3,8 GHz dažniu
 Visiškai perdirbtas grafikos įtaisas, turintis 384
blokus (srautiniu procesorius), dirbantis 800 MHz
dažniu; jis palaiko DirectX 11 ir API OpenCL 1.1
2010-2012
S.Maciulevičius
73
AMD Trinity
2010-2012
S.Maciulevičius
74
Analogai
 X86 komandų sistemą turinčius procesorius
gamina ir kitos firmos
 VIA gamina procesorius, skirtus
nešiojamiems kompiuteriams. Naujausias
procesorius – Nano (7 FĮ, 1-2 GHz, 32 KB
L1 ir 1 MB L2)
 Transmeta – VLIW tipo procesorius, taip pat
skirtus nešiojamiems kompiuteriams
2010-2012
S.Maciulevičius
75
Transmetos Crusoe







Skirtas mobilioms sistemoms
Sava VLIW komandų sistema (4 komandos)
1 FPU, 2 ALU, 1 LSU, 1 BU
64 registrai
x86 komandų perkodavimas
Code Morphing Software
Patobulinta maitinimo valdymo metodika
2010-2012
S.Maciulevičius
76
Transmetos Crusoe
128 bitų komandų grupė
(molekulė)
FADD
ADD
LD
BRCC
FPU
ALU
LSU
BU
(Float
Point
Unit)
(Integer
ALU)
(Load-
(Branch
Unit)
2010-2012
Store
Unit)
S.Maciulevičius
77
Transmetos Crusoe
Komandų skirstymas
2010-2012
S.Maciulevičius
78
Transmetos Crusoe 6000
2010-2012
S.Maciulevičius
79
Transmetos Crusoe TM8000
2010-2012
S.Maciulevičius
80