IBM Road Runner - ภาควิชาวิทยาการคอมพิวเตอร์ คณะวิทยาศาสตร์

Download Report

Transcript IBM Road Runner - ภาควิชาวิทยาการคอมพิวเตอร์ คณะวิทยาศาสตร์

IBM ROADRUNNER
BLADE CENTER
QS22/LS21 CLUSTER
เสนอ
อาจารย ์ อภิศ ักดิ ์ พัฒน
จักร
โดย
1.513020388-3
นางสาว กมล
ชนก สามัคคีมต
ิ ร
2. 513020389-1 นาย จักรพงษ ์
ปั ก
กาเวสา
3. 513020390-6 นาย จิรานนท ์ โคตรชา
นักศึกษามหาวิทยาลัยขอนแก่น คณะ
วิทยาศาสตร ์
"ROADRUNNER"
่ ควำมเร็วในกำร
ตำแหน่ งซูเปอร ์คอมพิวเตอร ์ทีมี
่ ด
ประมวลผลสูงทีสุ
่
ในโลกเปลียนมื
อไปเป็ นของ RoadRunner แล ้วด ้วย
สถิต ิ 1.026 petaflop
้ ้วย
ผลงำนจำกกำรฝังชิป Cell จำนวน 12,240 ชินด
ฝี มือไอบีเอ็ม
"RoadRunner"
่
ชิป Cell นั้นเป็ นหน่ วยประมวลผลทีสำมยั
กษ ์ใหญ่
โลกเทคโนโลยี
อย่ำงไอบีเอ็ม โซนี่ และโตชิบำร่วมกันพัฒนำขึน้
้
่ จะ
แม้ขณะนี โซนี
ถอนตัวจำกกำรร่วมมือพัฒนำชิป Cell แล ้ว แต่
Cell ยังปรำกฏตัวใน
่
เครืองเกม
PlayStation 3, ทีวค
ี ณ
ุ ภำพสูงและ
คอมพิวเตอร ์พีซข
ี อง
โตชิบำ และล่ำสุดคือซูเปอร ์คอมพิวเตอร ์ของ
ไอบีเอ็ม
"ROADRUNNER"
่
Roadrunner เป็ นคอมพิวเตอร ์ทีมี
สถำปัตยกรรม
่ ลก
แบบคลัสเตอร ์ทีมี
ั ษณะเป็ น Hybrid คือใช ้
AMD Opteron DC
1.8GHz ผสมกับ PowerXCell 8i 3.2 Ghz
่ ้
(เป็ น Cell รุน
่ ใหม่กว่ำทีใช
่ อว่ำเป็ นเรืองค่
่ อนข ้ำงแปลกสำหร ับ
ใน PS3) ซึงถื
คอมพิวเตอร ์แบบนี ้
่ กจะใช ้หน่ วยประมวลผลชนิ ดเดียวทังระบบ
้
ซึงมั
โดยประสิทธิภำพที่
"ROADRUNNER"
่ ำเป็ นคอมพิวเตอร ์ลูกผสม
RoadRunner ได ้ชือว่
ประกอบด ้วย
-ชิป Cell 12,240 ตัว
-ชิปดูอลั คอร ์ AMD Opteron อีก 6,562 ตัว
CELL PROCESSOR
Cell Processor [Cell Broadband Engine
Architecture](CBEA)
่ ดตัวในปี 2005 ด ้วย
เป็ นโปรเซสเซอร ์ทีเปิ
สถำปัตยกรรมกำรออกแบบให ้
ในยุคนั้น ทำให ้หลำยฝ่ ำยให ้ควำมสนใจในตัว Cell
้
Processor นี มำก
CELL PROCESSOR
เป็ นกำรร่วมมือกันของสำมบริษท
ั ยักษ ์ใหญ่
ได ้แก่ Sony, Toshiba
่ ยกว่ำ STI Group เพือที
่ จะ
่
และ IBM หรือทีเรี
ออกแบบและผลิต
่ นได ้ช ัด
โปรเซสเซอร ์แห่งอนำคตจุดเด่นของ Cell ทีเห็
่ ดก็คอื
ทีสุ
การทางานแบบมัลติคอร ์
ประสิทธิภาพ
1 Cell มีคำ่ เท่ำกับ
5 Dual Opteron
CELL ARCHITECTURE
่
Cell เป็ นชือของซี
พย
ี ท
ู เจำะจง
ี่
้
พัฒนำขึนมำเพื
อ่ PS3 และ
่
่ อ
เครืองใช
้ไฟฟ้ ำยุคหน้ำ มันถูกมองว่ำเป็ นเครืองมื
ในกำรปฏิวต
ั ิ
่ ควำม
วงกำรคอมพิวเตอร ์Cell มีกำรออกแบบทีมี
แตกต่ำงจำกซีพย
ี ู
่ ้กันในปัจจุบน
แบบทีใช
ั มำก แต่จะมีสว่ นคล ้ำยกับ
Graphic Card
หรือ GPU มำกกว่ำ ตัวซีพย
ี ต
ู ระกูล X86
CELL ARCHITECTURE
ในส่วนของตัว Cell นั้น จะเป็ นกำรยอม
แลกควำมยืดหยุ่นใน
่ มขึ
่ นอย่
้
กำรใช ้งำนกับประสิทธิภำพทีเพิ
ำงมำก ใน
ส่วนของ cache
และ virtual memory จะถูกตัดออกไป แทนที่
ด ้วยแรมแบบ SRAM
่ จะได
่
ขนำดคงที่ (เพือที
้กำหนด address ทีอ่ ้ำง
แบบตำยตัวได ้เลย)
ลองมำดูตำมรูปด ้ำนล่ำงนี ้
้ั
เป็ นโครงสร ้ำงตำมลำดับชนของ
Cell ชน้ั
ใหญ่ทสุ
ี่ ดคือ
่
่ ให
้ ้เป็ น PS3 ซึงใน
่
อุปกรณ์เครืองใช
้ไฟฟ้ ำ ในทีนี
้
รูปนี จะเป็
นกำร
่
บอกว่ำตัว Cell นั้นถ ้ำหำกต ้องกำรเพิม
ประสิทธิภำพในกำรทำงำน ก็
้ั ด
ให ้นำ Cell มำใช ้ร่วมกันในกำรประมวลผลชนถั
มำคือภำยในตัว
Cell
่ ำคัญทีสุ
่ ดในตัว Cell นั้น
ส่วนประกอบทีส
คือ APU
(Attached Processor Unit) จำนวน 8 ตัว
หลักการ STREAM PROCESSING
Stream Processing คือกำรที่ APU
หนึ่ งตัวประมวลผล แล ้วเขียน
ข ้อมูล Output เอำไว ้ที่ RAM จำกนั้น APU ตัวต่อไปจะ
นำเอำ Output ของCell
้
่
ตัวแรกมำเป็ น Input ของตัวมันเอง เป็ นอย่ำงนี ไปเรื
อยๆ
แต่ละ APU จะทำ
่ ยงอย่ำงเดียว และจะส่งต่อกันไปเป็ นทอดๆ ซึงมั
่ น
หน้ำทีเพี
จะทำให ้เวลำในกำร
ทำงำนโดยรวมลดลงไปมำก
แต่ข ้อจำกัดของมันก็คอื หลักกำร Stream
Processing นั้นจะสำมำรถ
่ ำงำนร่วมกับ Program ทีท
่ ำมำ
ทำงำนได ้ ก็ตอ
่ เมือท
CELLULAR COMPUTING
้ั
เรำจะมำมองกันในชนของ
Cell แต่ละ Cell
หลักกำรทำงำนของ
Cellular Computing ตัว OS จะจัดกำรปริมำณกำร
่ ้องกำร รวม
คำนวณทีต
่
่ ข ้อมูลทีจะ
่
เป็ นชุดข ้อมูล ซึงประกอบไปด
้วย ชุดคำสัง,
่
่
ใช ้, และข ้อมูลอืนๆที
จะเป็ นในกำรประมวลผล จะเรียกชุดข ้อมูลเหล่ำนี ว่้ ำเป็ น
1 Software Cell
จำกนั้นตัว OS ก็จะทำกำรค ้นหำว่ำมี Cell ตัวไหนทีว่่ ำ
งอยู่ในระบบ
่ ทีอยู
่ ่ใน
( อำจรวมไปถึง Cell ในอุปกรณ์ไฟฟ้ ำตัวอืนๆ
CELL APPLICATIONS

IBM Roadrunner
CELL APPLICATIONS

SpursEngine
CELL APPLICATIONS

Sony Playstaion 3
AMD OPTERON PROCESSOR
AMD
่ AMD ย่อมำจำกชือเต็
่ มของบริษท
ชือ
ั
Advanced Micro
้
่ งบริษท
Devices ก ้ำวขึนมำผลิ
ต CPU ทีหลั
ั
่ ้ำง
Intel… รุน
่ CPU ทีสร
่ ้กับ AMD คือเมือคร
่
้ั เปิ
่ ดตัว K6 ครงนั
้ั ้น
ชือให
งที
ออกมำปะทะกับ
Intel Pentium II ผลงำนของ K6 ทำเอำ
่
Pentium II อำยม้วนเสือไป
หลำยตลบ
AMD OPTERON
่ ใหม่
้ เอียมคำดหวั
่
ชือนี
งให ้เป็ นหมัดเด็ดของ
AMD อีกตัว
เพรำะเป็ น CPU 64 Bit แท ้ ของ AMD แต่
แตกต่ำงไม่เหมือนกับ
Intel Itanium 64 Bit เพรำะ Opteron เป็ น 64
Bit แบบ x86-64Bit
(Itanium ไม่ใช่ x86)
่
ภำษำเครืองของ
Opteron กับ Itanium
เป็ นคนล่ะภำษำกัน ถึงจะ
เป็ น 64 Bit เหมือนกัน แต่ก็ใช ้ระบบปฏิบต
ั ก
ิ ำร
่ วทีสุ
่ ดใน
ซูเปอร ์คอมพิวเตอร ์ทีเร็
่
โลก มันใจใช้
AMD OPTERON
ใน กำรประชุมซูเปอร ์คอมพิวเตอร ์
นำนำชำติ (International
Supercomputing Conference) บริษท
ั เอเอ็ม
ดี (NYSE: AMD)
เปิ ดเผยว่ำ AMD Opteron™ คือโปรเซสเซอร ์ที่
ผูพ
้ ฒ
ั นำระบบซูเปอร ์
่ สมรรถนะสูงทีสุ
่ ดของ โลกให ้
คอมพิวเตอร ์ทีมี
ควำมไว ้วำงใจ นี่ เป็ น
้ั
่
ครงแรกที
เทคโนโลยี
ของ AMD มีบทบำทสำคัญ
จุดเด่นของAMD OPTERON
 สำมำรถทำงำนกับ
่ น 32 Bit
โปรแกรมเดิมๆทีเป็
ได ้ทันที
 สำมำรถประมวลผลโปรแกรม 32 Bit ได ้มี
ประสิทธิภำพกว่ำ Itanium
 ใช ้งำนได ้ง่ำยกว่ำ Itanium
้
 ช่วยลดต ้นทุนกำรจ่ำยเงินซือโปรแกรม
 ได ้ร ับควำมสนใจจำกผูผ
้ ลิตคอมพิวเตอร ์เลือกใช ้
มำก
ROADRUNNER
DETAILS
System Name
: Roadrunner
Site
: DOE/NNSA/LANL
System Family
: IBM Cluster
System Model
: BladeCenter QS22
Cluster
Computer
: BladeCenter QS22/LS21
Cluster, PowerXCell 8i
3.2 Ghz / Opteron DC 1.8
ROADRUNNER
DETAILS
Vendor
: IBM
Application area : Not Specified
Installation Year : 2008
Operating System : Linux
Interconnect
: Infiniband
Processor
: PowerXCell 8i
3200 MHz (12.8 GFlops)
TOP 10 SYSTEMS - 11/2008
1. Roadrunner - BladeCenter QS22/LS21
Cluster, PowerXCell 8i 3.2 Ghz / Opteron DC
1.8 GHz , Voltaire Infiniband
2 . Jaguar - Cray XT5 QC 2.3 GHz
3. Pleiades - SGI Altix ICE 8200EX, Xeon QC
3.0/2.8 GHz
4 . BlueGene/L - eServer Blue Gene Solution
5. Blue Gene/P Solution
TOP 10 SYSTEMS 11/2008
6. Ranger
- SunBlade x6420, Opteron QC
2.3 Ghz, Infiniband
7. Franklin - Cray XT4 QuadCore 2.3 GHz
8. Jaguar - Cray XT4 QuadCore 2.1 GHz
9. Red Storm - Sandia/ Cray Red Storm,
XT3/4, 2.4/2.2 GHz dual/quad core
10. Dawning 5000A - Dawning 5000A, QC
Opteron 1.9 Ghz, Infiniband, Windows
HPC 2008
"RoadRunner"
ควำมเร็ว 1 petaflop นั้นเทียบเท่ำ
กับควำมสำมำรถในกำร
่
่ง
ประมวลผลคำสัง่ 1 พันล ้ำนล ้ำนคำสังในหนึ
วินำที RoadRunner จึง
้ ง
เหนื อกว่ำแชมป์ เก่ำซูเปอร ์คอมพ ์ก่อนหน้ำนี ถึ
สองเท่ำตัว โดย
รำยกำร 500 อันดับซูเปอร ์คอมพิวเตอร ์ควำมเร็ว
สูงสุดของโลกฉบับ
ใหม่ถก
ู เผยแพร่ในงำนประชุมซูเปอร ์คอมพิวติง้
"ROADRUNNER"
ปัจจุบน
ั RoadRunner ปฏิบต
ั งิ ำน
ให ้กับสำนักงำนร ักษำควำม
ปลอดภัยนิ วเคลียร ์แห่งชำติสหร ัฐฯในควำม ดูแล
ของกระทรวง
พลังงำน สำหร ับใช ้ในห ้องปฏิบต
ั ก
ิ ำร Los
Alamos National
่ ำอยู่ทรำว
ี่
Laboratory ค่ำใช ้จ่ำยในกำรสังท
100
ล ้ำนเหรียญ
(ประมำณ 3,300 ล ้ำนบำท)
"ROADRUNNER"
ควำมเร็วของ RoadRunner นั้นเขีย่
BlueGene/L ซูเปอร ์
่
คอมพ ์ควำมเร็ว 478.2 teraflop เพือนร่
วมค่ำย
ไอบีเอ็มให ้ตกไปอยู่
อันดับ 2 โดย BlueGene/L นั้นปฏิบต
ั งิ ำนใน
Lawrence Livermore
้ เดือนพฤศจิกำยน
National Laboratory ตังแต่
ปี 2004
"ROADRUNNER"
ซูเปอร ์คอมพ ์ควำมเร็วอันดับสำมเป็ น
ของ Blue Gene/P ของ
่ อ SunBlade x6420
ไอบีเอ็มเช่นกัน อันดับสีคื
Ranger ของซ ัน
ไมโครซิสเต็มส๋ ถูกใช ้ในมหำวิทยำลัยแห่งร ัฐเท็ก
ซ ัส University of
Texas เมืองออสติน อันดับห ้ำคือ Cray XT4
Jaguar ใน Oak Ridge
National Laboratory
"ROADRUNNER"
หำกไม่นับรวมซูเปอร ์คอมพิวเตอร ์
ในสหร ัฐฯ ซูเปอร ์
คอมพิวเตอร ์อันดับหนึ่ งจะเป็ นของ Blue Gene/P
่ ้งำนใน
ซึงใช
ประเทศเยอรมนี เจ ้ำของควำมเร็ว 180 teraflop
สำหร ับซูเปอร ์
คอมพิวเตอร ์เบอร ์หนึ่ งในโลกธุรกิจคือ SGI Altix
เจ ้ำของคือบริษท
ั
้ นสัญชำติฝรงเศสนำม
่ั
ค ้ำนำมั
Total ควำมเร็ว
106 teraflop
"ROADRUNNER"
่ สั
่ งเกตได ้ช ัดเจนคือ 10 อันดับแรกใน
สิงที
กำรรำยกำรสุดยอด
ซูเปอร ์คอมพ ์โลกนั้นส่วนใหญ่เป็ นของไอบีเอ็ม
โดยในจำนวน 500
อันดับ ไอบีเอ็มสำมำรถกวำดไปได ้ 210 อันดับ
่ แ่ ข่งอย่ำง
ขณะทีคู
Hewlett-Packard สำมำรถทำได ้ 183 อันดับ
"ROADRUNNER"
ขณะเดียวกัน ผลกำรจัดลำดับซูเปอร ์
คอมคือชิปของ
้ 75 เปอร ์เซ็นต ์ของซูเปอร ์
อินเทลนั้นถูกติดตังใน
่ กำร
คอมพ ์ทีมี
่ มขึ
่ นจำก
้
สำรวจ เป็ นตัวเลขทีเพิ
71 เปอร ์เซ็นต ์
่ ้ร ับควำมนิ ยมมำกคือชิป 4 คอร ์
แน่ นอนว่ำชิปทีได
ประมวลผล
"ROADRUNNER"
่ น่่ ำสนใจนอกจำกเครืองที
่ เร็
่ ว
สิงที
่ ดแล ้ว ยังมีแถม
ทีสุ
กำรจัดอันดับคอมพิวเตอร ์ตำมปริมำณ
่ ้งำนด ้วย โดย
กำลังไฟฟ้ ำทีใช
่
่ ดในกลุม
คอมพิวเตอร ์ทีประหยั
ดพลังงำนทีสุ
่ 500
่
เครืองแรกก็
ยงั คง
เป็ น RoadRunner เจ ้ำเดิม ที่ 488 Mflop/s ต่อ
วัตต ์ โดยวัดจำกปริมำณ
่ กใช ้งำนระหว่ำงกำรวัดประสิทธิภำพ
กำลังไฟฟ้ ำทีถู
่
ของเครือง
อันดับสองคือ IBM Blugene/P ที่ 376