計算機構成: トップダウンの解説

Download Report

Transcript 計算機構成: トップダウンの解説

コンピュータアーキテクチャ
第1回 ガイダンスとPOCOの
命令セット
天野 [email protected]
授業計画
RISC命令セットとVerilogの復習…2回
 入出力と割り込み…4回
 パイプライン処理…3回
 命令レベル並列処理…3回
 マルチコアアーキテクチャ…2回
上記は目安なので注意!

テキスト:天野、西村「作りながら学ぶコンピュータアーキテ
クチャ」培風館
http://www.am.ics.keio.ac.jp上に資料を掲示
コンピュータの構成
計算機構成
Disk
Key
CPU
Display
System
Bus
Bridge
I/O Bus
Memory
System
コンピュータの3要素
重要な入出力(I/O)



バスブリッジを介してI/Oバスと接続
メモリと同様な番地付けをする場合が多い
(Memory-mapped I/O)
マルチメディア化により範囲が広がる





ディスク、テープ、CD、DVDなどの補助記憶
Ethernetなどのネットワーク
ビットマップディスプレイ、CDCビデオ入力
キーボード、マウス等の入力装置
音声出力、入力
IFで加算を行う
IF
EX
ID
rwe
decorder st_op
ld_op
funct
3:0
rwe_id
opcode
15:11
funct
2:0
THB
0 1
ir
ADD
com_id
rd_id
0
1
0
1
alu_bsel
r0
判定
daddr
ddataout
命令メモリ
creg dreg
S Y
10
0
1
breg
01
imm 7:0
PC
ext ext0
rs 7:5
B
00
+
rd_ex
A
0
1
rwe_ex
areg
‘1’
rd 10:8
rwe_ex
st_op_id
ld_op_id
00 01 10
ext
‘0’
WB
st_op_id
we
データ
メモリ
ddatain
高速化の流れ
スレッドレベルの
高速化
Simultaneous
Multithreading
複数命令の同時発行
(スーパースカラ)
命令レベルの
高速化
RISCの登場
パイプライン化
マルチコア化
パイプラインを細かく
(スーパーパイプライン)
周波数の向上
命令の動的スケジュール
マルチコア
革命
2003-2004
1980
1990
2000
授業の流れ1:
CPU性能向上のための技法
コンピュータアーキテクチャ(3年春)
マイクロプロセッサ特論(大学院)
コンピュータアーキテクチャ特論(大学院)
パイプライン処理
命令レベル並列処理
マルチコア
命令レベル並列処理
スーパースカラ
VLIW
SMT
マルチプロセッサ
クラスタコンピューティング
再構成可能プロセッサ
授業の流れ2:メモリシステムと入出力
メモリシステム
コンピュータアーキテクチャ (3年春)
オペレーティングシステム(3年秋)
情報工学実験 (3年秋)
マルチコアの
メモリシステム
入出力
I/Oの接続
割り込み
DMA(Direct Memory
Access)
仮想記憶
記憶管理
マイクロプロセッサ実験
FPGA上にCPUを実現
入出力プログラム
評価方法

毎回の演習



設計コンテスト


今年はコンピュータ部屋を使わない時がある
Web上の掲示に注意!
上位入賞者は試験免除でA
期末試験
POCOの命令セットアーキテクチャ
(Instruction Set Architecture: ISA)

ソフトウェアとハードウェアのインタフェース



プログラムはISAを対象にすれば個々のハードウェアは気にし
なくてもいい
ハードウェアはISAが動けば共通のプログラムが動く
IBM360開発時に明確になった概念
それまでは開発したマシン毎にソフトウェアを作っていた
 様々な性能、価格のモデルが同じISAを共通できた
→ IBMのメインフレームでの覇権を確立した


IntelのIA32、ARM、SPARC、MIPSなどが長期間に
渡って拡張され、利用されている
ISAの分類

オペランド数による分類

0:スタックマシン
PUSH 0
PUSH 1
ADD
POP 2



演算スタックを使う方法
B5000、HP9000などの名機があったが80年代に絶滅→スタックを使うとパイプライン化、
複数命令発行ができない
1:アキュムレータマシン
LD 0
ADD 1
ST 2





EDSAC、EDVACなど黎明期のマシン
6800、6502など黎明期のマイクロプロセッサ
当初からインデックスレジスタは必要としていた
レジスタが増えて汎用(専用)レジスタマシンに進化し、消滅
2,3:汎用(専用)レジスタマシン
LD R0,0
ADD R1,1
ST R0,2

現在のマシンは全てここに分類される
汎用レジスタマシンの分類

オペランド中にメモリの指定をいくつ許すか?
一つも許さない:register-register型 (load/storeマシン)
RISC (Reduced Instruction Set Computer)
〇命令長が固定、各命令が簡単、高速実行可能
×命令数が多くなる
ARM、MIPS、SPARCなど
一つだけ許す:register-memory型
中間的な性質: IA32(x86)など
全て許す:memory-memory型
CISC (Complex Instruction Set Computer)
〇命令数が少なくて済む
×命令長が可変、各命令が複雑になりがち
VAX-11、PDP-11など
register-register型の
データパス
S Y
A
B
必ずレジスタに持ってきてから演算を
行う
LD R0,0
LD R1,1
ADD R1,R0
ST R1,2
固定長命令が可能だが
命令数が増える
LD/STばかりやる→load/storeマシン
簡単な命令で構成
RISC(Reduced Instruction Set
Computer)
…
clk
we
各型の消長
1950
1960
1970
1980
1990
草創期のコンピュータ
アキュムレータ
マシン
IBM360/370
register-memory
memory-memory
x86の登場
メインフレーム
PDP-8
見た目は
全盛
Pentium-II
でバイナリ変換
VAX-11で全盛期
絶滅
RISC vs. CISC論争
register-register
スタック
マシン
IBM801
RISC-I,MIPS、ARM
B5000が慶應ITCに!
絶滅
教育用RISC POCO

16bitのregister-register型




命令メモリ、データメモリのアドレス、データ共に16bit(64K×16
ビット)
レジスタ16本 (r0-r7)
2オペランド命令
ADD r0,r1 r0 ← r0+r1
左:destination operand
右:source operand
(IBM/Intel方式)
前身のPICOをさらに簡単化

とにかく実装が楽になるように
メモリの読み書き

レジスタ間接指定
LD r0,(r1) r1の中身の番地のデータを読み出してr0に転送
ST r0,(r1) r1の中身の番地に、r0を書き込む


実効アドレス(実際に読み書きされるアドレス)=レジス
タの内容
他にもアドレッシングモード(実効アドレスを決める方法)
は色々あるがPOCOはレジスタ間接指定しか持って居
ない


アキュムレータマシンの際のLD 0は、直接指定と呼ぶ
しかしこれはPOCOでは持っていない
基本演算命令

レジスタ同士でしか演算はできない








ADD r1,r2
SUB r1,r2
AND r1,r2
OR r1, r2
SL r1
SR r1
MV r1,r2
NOP
r1←r1+r2
r1←r1-r2
r1←r1 AND r2
r1←r1 OR r2
r1<<1
r1>>1
r1 ← r2 単純な移動
何もしない(NoOperation)
イミーディエイト命令

命令コード中の数字(直値)がそのまま演算に使
われる
LDI r1,#1
r1←1
ADDI r1,#5
r1←r1+5
 直値は8ビット符号付 → 演算時は16ビットに符号
拡張(sign extension)される
 符号無し命令
LDIU r1,#200 r1←200
ADDIU r1,#0xf0 r1←r1+0xf0
(ADDI r1,#0xf0ならばr1←r1-16)
POCOの条件分岐命令
BEZ rx,X: if(rx=0) PC←PC+1+X
10000 ddd XXXXXXXX
BNZ rx,X: if(rx≠0) PC←PC+1+X
10001 ddd XXXXXXXX
 PC相対指定




命令の位置+1を起点としてX分命令を飛び越す
8ビットのフィールド→ -128から127まで飛べる
局所性(Locality)があるので多くの場合大丈夫
プログラムが再配置可能(Relocatable)になる
PC相対指定による分岐
(掛け算のプログラムの例)
LDIU r0,#2
LD r1,(r0)
LDIU r0,#3
LD r2,(r0)
LDIU r3,#0
ADD r3,r1
ADDI r2,#-1
BNZ r2, -3
LHIU r0,#0
ST r3,(r0)
BEZ r2,-1
r1 ← 2番地の内容
r2 ←3番地の内容
r3は答が入るので0に初期化
r3にr1を足しこむ
r2から1を引く
0でなければループ
JumpとJR
JMP X pc ← pc+1+X Jump
10100 XXXXXXXXXXX


無条件に相対指定でX分飛ぶ
レジスタ指定がない分遠くに飛べる
-1024~+1023
JR rd
pc←rd Jump Register
00000 ddd --- 01010




絶対指定
16ビットのアドレス空間のどこにでも飛べる
サブルーチンコールのリターン(来週)
テーブルジャンプ
Jump and Link

戻り番地を最大番号のレジスタに保存


POCOの場合r7
古典的な手法でマインフレーム時代に使われた


Branch and Link命令
RISCで最も良く使われる方式
JAL X : pc←pc+1+X, r7←pc+1
10101 XXXXXXXX
飛ぶ範囲はJMPと同じく11ビット(-1024~1023)
議論1:サブルーチンの入れ子(ネスト)に対応しない
議論2:r7にしまうのは命令の直交性を損ねる(格好わるい)
R型命令一覧
00000------00000
NOP
MV rd,rs
rd← rs
00000dddsss00001
AND rd,rs
rd← rd AND rs
00000dddsss00010
OR rd,rs
rd← rd OR rs
00000dddsss00011
SL rd
rd← rd<<1
00000ddd---00100
SR rd
rd← rd>>1
00000ddd---00101
ADD rd,rs
rd← rd + rs
00000dddsss00110
SUB rd,rs
rd← rd - rs
00000dddsss00111
ST rd,(ra)
(ra)← rd
00000dddaaa01000
LD rd,(ra)
rd← (ra)
00000dddaaa01001
JR rd
pc ← rd
00000ddd---01010
I型命令一覧
LDI rd,#X
rd← X(符号拡張)
01000dddXXXXXXXX
LDIU rd,rs
rd← X(ゼロ拡張)
01001dddXXXXXXXX
ADDI rd,#X
rd←rd+X(符号拡張)
01100dddXXXXXXXX
ADDIU rd,#X
rd←rd+X(ゼロ拡張)
01101dddXXXXXXXX
LDHI rd,#X
rd←{X,0}
01010dddXXXXXXXX
BEZ rd,X
if(rd=0) pc←pc+X+1
10000dddXXXXXXXX
BNZ rd,X
if(rd≠0) pc←pc+X+1
10001dddXXXXXXXX
BPL rd,X
if(rd>=0) pc←pc+X+1
10010dddXXXXXXXX
BMI rd,X
if(rd<0) pc←pc+X+1
10011dddXXXXXXXX
J型命令一覧
JMP #X
pc←pc+X+1
10100XXXXXXXXXXX
JAL #X
pc←pc+X+1,
r7←pc+1
10101XXXXXXXXXXX
すべてを忘れた人のために
tarの解凍
tar xvf file.tar
アセンブラshapa
./shapa file.asm –o imem.dat
論理シミュレーションiverilog
iverilog *.v
vvp a.out
波形ビューアgtkwave
gtkwave file.vcd
レポート提出
[email protected] Subject: ARCWORK1 Student_number Name
いつでもARCWORK1なので注意!
演習

0番地から8つの正の整数が並んでいる。このう
ち10より大きい(10は含まない)ものの個数を調
べるプログラムを書け