Transcript File
2. Performansat dhe zhvillimi i kompjuterëve Një historik i shkurtër Dizajnimi dhe performansat Evolucioni i Pentiumit dhe PowerPC ENIAC • ENIAC (Electronic Numerical Integrator And Computer) • Eckert and Mauchly • University of Pennsylvania • Fillimi 1943 • Filloi te përdoret më 1946 • Përdorimi deri më 1955 ENIAC • • • • • • • • Decimal (jo binar) 20 akumulator me nga 10 shifra Programimi manual permes nderpreresve 18,000 gypa katodik 30 ton 15,000 square feet (rreth 1,400 m2) 140 kW 5,000 operacione te mbledhjes ne sekonde Makina e von Neumann/Turing • Koncepti i kompjuterit me program të brendshëm (Stored Program). • Programi dhe të dhënat ruhen në memorien kryesore. • Njësia aritmetiko-logjike (ALU) operon me të dhëna binare. • Njësia kontrolluese interpreton instruksionet e vendosura ne memorie dhe i ekzekuton • Pajisjet hyrëse dhe dalëse udhëhiqen nga njësia kontrolluese • Princeton Institute for Advanced Studies —IAS • U kompletua me 1952 Struktura e makines se von Neumann-it Modeli IAS (Institute of Advanced Studies) • 1000 fjalë 40 bitëshe • Numrat binarë — 2 x 20 bit instruksione • Regjistrat (memoria në CPU) — Memory Buffer Register (bufer regjistri i memories) — Memory Address Register (regjistri asdresor i memories) — Instruction Register (regjistri i instruksioneve) — Instruction Buffer Register (bufer regjistri i instruksioneve) — Program Counter (numëruesi programor) — Accumulator (akumulatori) — Multiplier Quotient Formatet e memories IAS Struktura e zgjeruar e kompjuterit IAS Kompjuterët komercial • 1947 - Eckert-Mauchly Computer Corporation • UNIVAC I (Universal Automatic Computer) • Kalkulimet për US Bureau of Census 1950 • Prone e Sperry-Rand Corporation • Fundi i 1950ve - UNIVAC II —Më i shpejtë —Më shumë memorie IBM • Pajisjet për procesim të kartelave me vrima 1953 - IBM 701 —Kompjuteri i parë i IBM-it me program të brendshëm —Për kalkulime shkencore • 1955 – IBM 702 —Aplikacionet Biznes • Pararendës i serisë IBM 700/7000 Tranzistorët • • • • • • • • Zëvendsuan gypat katodikë Më të vegjël Më të lirë Lirojnë më pak nxehtësi Pajisje ‘solid state’ Prodhohen nga silikoni 1947 Bell Labs William Shockley etj. Kompjuterët e bazuar në tranzistorë • • • • Gjenerata e dytë NCR & RCA machines IBM 7000 DEC – 1957 —PDP-1 Kompjuteri IBM 7094 Gjenerata e tretë – qarqet e integruara • Një tranzistor i vetëm - komponentë diskrete (vitet 1950-1960). • Problem në industrinë kompjuterike. • Në fillim të gjeneratës së dytë, kompjuterët përmbanin rreth 100,000 tranzistorë. • Në vitin 1958 - një arritje që revolucionarizoi elektronikën. • Filloi era e mikroelektronikës: QARKU I INTEGRUAR. Qarku i integruar shënon edhe lindjen e gjeneratës së tretë të kompjuterëve. • Katër funksionet bazë: • Ruajtjen e të dhënave (data storage), që ofrojnë celulat memorike, • Procesimin e të dhënave (data processing), që ofrojnë portat, • Bartjen e të dhënave (data movement), shfrytëzohen shtigjet ndërmjet komponenteve për bartje të të dhënave prej memories në memorie dhe prej memories nëpërmejt portave te memorit tjera, • Kontrolli (control): shtigjet ndërmjet komponenteve duhet kontrolluar përmes sinjaleve. Mikroelektronika • Komponentet e kompjuterit: portet, qelizat memorike, ndërlidhjet • Prodhohen nga materiali gjysëmperçues Gjeneratat e kompjuterëve • Gypat katodikë - 1946-1957 • Tranzistorët - 1958-1964 • Small scale integration SSI – 1965+ —Deri 100 pajisje në çip • Medium scale integration MSI - deri 1971 —100-3,000 pajisje në çip • Large scale integration LSI - 1971-1977 —3,000 - 100,000 pajisje në çip • Very large scale integration VLSI- 1978 1991 —100,000 - 100,000,000 pajisje në çip • Ultra large scale integration ULSI – 1991 —Mbi 100,000,000 pajisje në çip Ligji i Moore-it • • • • Dendësia e rritur e komponenteve në çip Gordon Moore – bashkëthemelues i Intelit Numri i tranzistorëve në çip dyfishohet çdo vit Prej 1970’s zhvillimi ngadalësohet pak — Numri i tranzistorëve në çip dyfishohet çdo 18 muaj • Çmimi i çipit i pandryshuar • Paketimi më i dendur nënkupton rrugë më të shkurta elektrike, që rezulton me performansa më të mira • Madhësia më e vogël jep më shumë fleksibilitet • Nevoja më të vogla për energji dhe ftohje • Më pak ndërlidhje mes çipave zvogëlojnë problemet e mundshme Rritja e numrit te tranzistoreve ne CPU Sistemi i serisë IBM 360 • 1964 • Zëvendsoi serinë IBM 7000 • Familja e parë e kompjuterëve —Bashkësia e ngjashme ose identike e instruksioneve —Sistemi operativ identik ose i ngjashëm —Shpejtësia e rritur —Numri më i madh i porteve hyrëse/dalëse (p.sh terminaleve) —Memoria më e madhe —Çmimi më i lartë Seritë IBM 360 DEC PDP-8 • • • • • 1964 Minikompjuteri i parë Nuk i nevojitet klimatizimi Mund të vendoset mbi tavolinë $16,000 —$100k+ për IBM 360 • Aplikacionet e integruara dhe OEM • Struktura e bus-ave Struktura e Bus-it DEC PDP-8 Memoria gjysmëpërçuese • • • • • • • 1970 Fairchild Madhësia si e bërthamës magnetike Përmban 256 bita Non-destructive read Më e shpejtë se bërthamat magnetike Kapaciteti dyfishohet çdo vit Intel • 1971 - 4004 —Mikroprocesori i parë —Të gjitha komponentete CPU ne një cip —4 bit • 1972 - 8008 —8 bit • Të dizajnuar për aplikacione specifike • 1974 - 8080 —Mikroprocesori i parë i Intelit për përdorim të pergjithshëm Rritja e shpejtësisë • • • • • • Pipelining Cache në pllakë L1 & L2 cache në pllakë Parashikimi i degëzimit Analiza e rrjedhës së të dhënave Ekzekutimi spekulativ Procesorët Procesorët Procesorët Procesorët Performansat • Rritja e shpejtësisë së procesorit • Rritja e kapacitetit të memories • Shpejtësia e procesorit më e madhe se e memories Login and Memory Performance Gap Zgjidhja • Rritja e numrit të bitave që merren në një hap • Ndryshimi i interfejsit të DRAM-it —Cache • Zvogëlimi i shpeshtësisë (frekunecës) së qasjes memories —Cache më kompleks dhe cache në çip • Rritja e shpejtësisë së ndërlidhjeve —Busa të shpejtë —Hierarkia e busave Pajisjet H/D • Periferitë me kërkesa të mëdha për H/D • Kërkesa për transfer të madh të të dhënave në njësi kohore • Problemi i bartjes së të dhënave • Zgjidhjet: —Keshimi —Baferimi —Busa interkonektivë me shpejtësi të lartë —Struktura më komplekse e busave —Konfigurimet multiprocesorike Shpejtësitë tipike të të dhënave të paisjeve H/D Balancimi • • • • Procesorët Memoria kryesore Pajisjet H/D Strukturat ndërlidhëse Përmirësimet në organizimin dhe arkitekturën e çipit • Rritja e shpejtësisë së procesorit —Për shkak të zvogëlimit të madhësisë së porteve logjike – Më shumë porte, të paketuara më shpesh, me frekuencë më të lartë – Koha e shkurtuar e përhapjes së sinjaleve elektrike • Rritja e madhësisë dhe shpejtësisë së cache-it —Hapësira e dedikuar në çipin e procesorit – Koha e qasjes cache-it bjen drastikisht • Ndryshimi i organizimit dhe arkitekturës së procesorit — Rritja e shpejtësise se ekzekutimit — Paralelizmi Probleme me shpejtësinë e kllokut dhe dhe dendësinë • Fuqia — Dendësia e fuqisë rritet me dendësinë e qarqeve logjike dhe shpejtësinë e kllokut — Disipacioni i nxehtësisë • Vonesa RC — Shpejtësia me të cilën lëvizin elektronet kufizohet me rezistencën e përçuesve dhe kapacitetet — Rritje e RC rrit vonesat — Përçuesit më të hollë rrisin rezistencën — Përçuesit e vendosur më afër njeri tjetrit rrisin kapacitetin • Ngecja (latency) e memories — Shpejtësia e memories ngec pas shpejtësise së procesorit • Zgjidhja: — Më shumë rëndësi zgjidhjeve organizative dhe arkitektonike Performansa Microprocesorëve Intel Rritja e kapacitetit te cache-it • Në rastin tipik, dy-tri nivele të cache-it mes procesorit dhe memories kryesore • Rritja e dendësisë së çipave —Më shumë cache memorie në një çip – Qasja më e shpejtë • Pentiumi ia dedikon cache-it 10% të sipërfaqes së çipit. • Pentium4 i dedikon cache-it përafërsiht 50% të sipërfaqes Logjika komplekse e ekzekutimit • Ekzekutimi paralel i instruksioneve • Pipeline (tubacioni, gypsjellësi) funsionon si linja montuese —Instruksionet në stade të ndryshme të ekzekutimit në kohë të njejtë përgjatë të njejtit pipeline • Procesorët superskalar me më shumë pipeline në kuadër të një procesori —Instruksionet që nuk varen nga njeri tjetri mund të ekzekutohen paralelisht. Mundësitë modeste për përmirësim • Organizimi intern i procesorëve kompleks —Paralelizmi —Gjasa të vogla për përmirësime drastike • Benefitet nga cache-i i janë afruar limitit • Rritja e kllokut shkakton probleme të dispacionit • Janë arritur disa kufizime fundamentale fizike Qasja e re – Me shumë bërthama • Me shumë procesorë në një çip. — Cache-i i madh i përbashkët • Brenda procesorit rritja e performansave proporcionale me rrënjen katrore të rritjes së kompleksitetit • Nëse software-i mund të shfrytëzojë më shumë procesorë, dyfishimi i numrit të procesorëve gati dyfishon performansat. • Pra, përdoren dy procesorë më të thjeshtë në një çip, në vend të një procesori kompleks • Me dy procesorë ka kuptim cache-i më i madh — Shpenzimi i qarqeve memorike është më i vogël se i qarqeve procesorike • Shembull: IBM POWER4, Pentium Core 2 Duo Organizimi i çipit POWER4 Evolucioni i Pentiumit • 8080 — Procesori i parë me përdorim të gjithanshëm — Rrugët 8 bitëshe të të dhënave — Përdoret në kompjuterin e parë personal – Altair • 8086 — Shumë më i fuqishëm — 16 bitësh — Cache-i i instruksioneve, paramarrja e disa instruksioneve — 8088 (busi i jashtëm 8 bitësh) përdoret në IBM PC • 80286 — 16 Mbyte memorje të adresueshme • 80386 — 32 bitësh — Përkrahja për multitasking Evolucioni i Pentiumit • 80486 —Pipelining i cache-it dhe instruksioneve —Koprocesori matematikor i integruar • Pentium —Superskalar —Instruksione të shumëfishta ekzekutohen paralelisht • Pentium Pro —Organizimi i theksuar superskalar —Riemërimi i regjistrave —Parashikimi i degëzimit —Analiza e rrjedhës së të dhënave —Ekzekutimi spekulativ Evolucioni i Pentiumit • Pentium II — Teknologjia MMX — Procesimi i grafikës, videos dhe zërit • Pentium III — Instruksione shtesë me pikë të lëvizshme për grafikën 3D • Pentium 4 — Përmirësime shtesë për operacione me pikë të levizshme dhe multimedia • Itanium — 64 bit • Itanium 2 — Përmirësime hardware-ike për rritjen e shpejtësisë PowerPC • 1975, 801 projekti për mikrokompjuter (IBM) RISC • Procesori Berkeley RISC I • 1986, produkti komercial workstation i IBM-it RISC, RT PC. — Nuk pati sukses komercial — Shumë rival me performanasa të ngjashme apo edhe më të mira • 1990, IBM RISC System/6000 — RISC-si makinë superskalare — Arkitektura POWER • Aleanca IBM me Motorola (68000 microprocessors) dhe Apple, (te shfrytëzuara 68000 ne Macintosh) • Rezultuan në arkitekturen PowerPC — Derivuar nga arkitektura POWER — Superscalar RISC — Apple Macintosh — Aplikacionet Embedded chip Familja PowerPC • 601: — Paraqitje e shpejtë në treg. Makinë 32-bitëshe • 603: — Desktop me permasa të vogla dhe i lëvizshëm — 32-bit — Performansë të krahasueshme me 601 — Kosto më e ulët dhe implementim më eficient • 604: — Desktop dhe serverë të vegjël — Makinë 32-bitëshe — Dizajn superskalar shumë më i përparuar — Performansë më e lartë • 620: — Serverë të mëdhenjë — Arkitekturë 64-bitëshe Familja PowerPC • 740/750: —E njohur edhe si G3 —Dy nivele të cache-it në çip • G4: —Rritjen e paralelizmit dhe shpejtësisë së brendëshme • G5: —Përmirësime në paralelizëm dhe shpejtësinë e brendshme —Organizimi 64-bitësh