Tobbmagos_Sokmagos-1_2012_oktober

Download Report

Transcript Tobbmagos_Sokmagos-1_2012_oktober

Többmagos/sokmagos
processzorok-1
Sima Dezső
2012. Október
Version 3.0
Áttekintés
•
1. Többmagos processzorok megjelenésének szükségszerűsége
•
2. Homogén többmagos processzorok
•
2.1 Hagyományos többmagos processzorok
•
2.2 Sokmagos processzorok
• 3. Heterogén többmagos processzorok
• 3.1 Mester/szolga elvű többmagos processzorok
• 3.2 Csatolt többmagos processzorok
• 4. Kitekintés
1. Többmagos processzorok megjelenésének
szükségszerűsége
1. Többmagos processzorok megjelenésének szükségszerűsége (1)
Shrinking: ~ 0.7/2 Years
1.1 ábra: Az integrált áramkörök gyártási technológiájának fejlődése
1. Többmagos processzorok megjelenésének szükségszerűsége (2)
IC gyártási technológia
(Jelenleg: lineáris zsugorítás ~ 0.7x/2 év)
Két évente
• azonos tranzisztorszám ½ Si területen
• azonos területen 2x annyi tranzisztor
Kétévente kb. duplázódik
az egy lapkán megvalósítható
ltranzisztorok száma
Moore szabály
1. Többmagos processzorok megjelenésének szükségszerűsége (3)
Possible use of surplus transistors
Wider processor width
1
2
Core enhancements
Cache enhancements
• branch prediction
• speculative loads
• ...
L2/L3
enhancements
(size, associativity ...)
4
pipeline
superscalar
1. Gen.
2. Gen.
Mire használhatók fel a
többlet-tranzisztorok
a mikroarchitektúra fejlesztésében?
A tranzisztorszámok
duplázódása ~ két évente
Moore
szabály
1. Többmagos processzorok megjelenésének szükségszerűsége (4)
Növekvő tranzisztorszámok
Egyre csökkenő teljesítményhozam
A többlet tranzisztorok felhasználása többmagos processzorként
A többmagos processzorok megjelenésének szükségszerűsége
1. Többmagos processzorok megjelenésének szükségszerűsége (5)
1.3 ábra: Intel többmagos processzorainak robbanásszerű elterjedése
1. Többmagos processzorok megjelenésének szükségszerűsége (7)
Multicore processors
Heterogenous
multicores
Homogenous
multicores
Conventional
MC processors
2≤
Desktops
n≤8
cores
Manycore
processors
Master/slave
architectures
Add-on
architectures
with >8 cores
Servers
MPC
CPU
General purpose
computing
Prototypes/
experimental systems
MM/3D/HPC
production stage
1.4 ábra: Többmagos processzorok főbb osztályai
GPU
HPC
near future
2. Homogén többmagos processzorok
2. Homogén többmagos procdesszorok (1)
Multicore processors
Heterogenous
multicores
Homogenous
multicores
Conventional
MC processors
2≤
Desktops
n≤8
cores
Manycore
processors
Master/slave
architectures
Add-on
architectures
with >8 cores
Servers
MPC
CPU
General purpose
computing
Prototypes/
experimental systems
MM/3D/HPC
production stage
2.1 ábra: Többmagos processzorok főbb osztályai
GPU
HPC
near future
2.2 Sokmagos processzorok (1)
Multicore processors
Heterogenous
multicores
Homogenous
multicores
Conventional
MC processors
2≤
Desktops
n≤8
cores
Manycore
processors
Master/slave
architectures
Add-on
architectures
with >8 cores
Servers
MPC
CPU
General purpose
computing
Prototypes/
experimental systems
MM/3D/HPC
production stage
2.8 ábra: Többmagos processzorok főbb osztályai
GPU
HPC
near future
2.2 Sokmagos processzorok
•
2.2 Sokmagos processzorok
•
2.2.1 Intel Larrabee processzora
•
2.2.2 Intel Tiled processszora
•
2.2.3 Intel SCC
•
2.2.4 Intel MIC
2.2.1 Intel Larrabee processzora (1)
2.2.1 Intel Larrabee processzora
2.2.1 Intel Larrabee processzora (2)
Larrabee
Intel’s Tera-Scale kezdeményezésének részeként.
• Célok:
Nagyteljesítményű grafikai processzor, HPC
Nem egyetlen termék, hanem egy termékcsalád alapjául szolgáló bázis architektúra.
• Előzmények:
Projekt kezdete ~ 2005
Az első nem nyilvános prezentáció: 03/2006 (visszavonva)
Az első nyilvános prezentáció: 08/2008 (SIGGRAPH)
Bejelentett megjelenés ~ 2009
Visszavonás: 2010 vége
• Teljesítmény (cél):
2 TFlops
2.2.1 Intel Larrabee processzora (3)
Basic architecture
2.9 ábra: A GPU-orientált Larrabe blokk diagramja (2008 aug. SIGGRAPH)
16-byte széles SIMD feldolgozó egységek
2.2.1 Intel Larrabee processzora (4)
Multi GPU?
2.10 ábra: GPU-orientált Larrabee alaplapja (2006, túlhaladott)
2.2.1 Intel Larrabee processzora (5)
CSI: Common Systems Interface
(csomagalapú soros IF)
2.11 ábra: Négyfoglalatos MP szerver célú Larrabee rendszer architektúrája
2.2.2 Intel 80-magos Tile processzora
2.2.2 Intel 80-magos Tile processzora (1)
80-magos Tile Processzor
• Intel Tera-Scale kezdeményezésének első megvalósítása
(több, mint 100 projekt között)
• Cél: Tera-Scale kísérleti chip
• Előzmények:
Bejelentése
Megjelenése
IDF 9/2006
2/2007
2.2.2 Intel 80-magos Tile processzora (2)
Bisection bandwidth:
If the network is segmented into two equal parts,
this is the bandwidth between the two parts
Mezosynchronous clock
Same clock frequency, different phase
Intel
2.2.2 Intel 80-magos Tile processzora (3)
Intel
2.2.2 Intel 80-magos Tile processzora (4)
(Clocks run with the same frequency
but unknown phases
FP Multiply-Accumulate
(AxB+C)
Intel
2.2.2 Intel 80-magos Tile processzora (5)
Figure: On board implementation of the 80-core Tile Processor
http://www.legitreviews.com/article/460/1/
2.2.2 Intel 80-magos Tile processzora (6)
WIMP stands for "window, icon, menu, pointing device",
Intel
2.2.2 Intel 80-magos Tile processzora (7)
Intel
2.2.2 Intel 80-magos Tile processzora (8)
VLIW
Intel
2.2.2 Intel 80-magos Tile processzora (9)
Intel
2.2.2 Intel 80-magos Tile processzora (10)
(Pentium II)
Intel
2.2.2 Intel 80-magos Tile processzora (11)
NoC: No Cache
Intel
2.2.2 Intel 80-magos Tile processzora (12)
Intel
2.2.3 Intel SCC (Single-chip Cloud Computer)
2.2.3 Intel SCC (Single-chip Cloud Computer) (1)
Intel SCC (Single-chip Cloud Computer)
• 12/2009: Announced
• 9/2010: Many-core Application Research Project (MARC) initiative started on the SCC
platform
• Designed in Braunschweig and Bangalore
• 48 core, 2D-mesh system topology, message passing
2.2.3 Intel SCC (Single-chip Cloud Computer) (2)
Intel
2.2.3 Intel SCC (Single-chip Cloud Computer) (3)
(350 nm)
Intel
2.2.3 Intel SCC (Single-chip Cloud Computer) (4)
(Joint Test Action Group)
Standard Test Access Port
Intel
2.2.3 Intel SCC (Single-chip Cloud Computer) (5)
Intel
2.2.3 Intel SCC (Single-chip Cloud Computer) (6)
2009
2.2.3 Intel SCC (Single-chip Cloud Computer) (7)
2009
2.2.3 Intel SCC (Single-chip Cloud Computer) (8)
Intel
2.2.3 Intel SCC (Single-chip Cloud Computer) (9)
(Message Passing Buffer)
Intel
2.2.4 Intel MIC (Many Integrated Cores) - Xeon Phi
(Knights Corner)
2.2.4 Intel MIC (Many Integrated Cores) (1)
Bevezetés
A Larrabee projekt továbbfejlesztése
Cél: Adatpárhuzamos gyorsító (GPGPU-k “kiszorítására”)
Bejelentés: 5/2010 (International Supercomputing Conference)
Gyártás: 2012 vége
50 mag, 22 nm
2.2.4 Intel MIC (Many Integrated Cores) (2)
https://www-304.ibm.com/services/learning/content/pdfs/IBM_May_9th_2012_Business_Partners_-_Intel_MIC_Overview_Public_Deck.pdf
2.2.4 Intel MIC (Many Integrated Cores) (3)
https://www-304.ibm.com/services/learning/content/pdfs/IBM_May_9th_2012_Business_Partners_-_Intel_MIC_Overview_Public_Deck.pdf
2.2.4 Intel MIC (Many Integrated Cores) (4)
G. Chrysos, Intel Xeon Phi Coprocessor, Hot Chips 2012
2.2.4 Intel MIC (Many Integrated Cores) (5)
G. Chrysos, Intel Xeon Phi Coprocessor, Hot Chips 2012
2.2.4 Intel MIC (Many Integrated Cores) (6)
G. Chrysos, Intel Xeon Phi Coprocessor, Hot Chips 2012
2.2.4 Intel MIC (Many Integrated Cores) (7)
G. Chrysos, Intel Xeon Phi Coprocessor, Hot Chips 2012
2.2.4 Intel MIC (Many Integrated Cores) (8)
Heavily customized Pentium P54C
G. Chrysos, Intel Xeon Phi Coprocessor, Hot Chips 2012
2.2.4 Intel MIC (Many Integrated Cores) (9)
http://h30613.www3.hp.com/media/files/downloads/Non-FilmedSessions/BB3330_Lafferty.pdf