编译原理与技术考前辅导课件下载

Transcript 编译原理与技术考前辅导课件下载

编译原理与技术

课程总结
1
课程目录
第1章概论
第2章词法分析
第3章语法分析
第4章语法制导翻译生成中间代码
第5章运行环境
第6章代码生成
2
第1章概论
编译与解释是语言翻译的两种基本形式
编编编
编编编编
编编编
编编编编
编编编编
编编
编编编
编编编编
编编编
编编
1．编译器：先翻译后执行，工作效率高，即时间快、空间
省；交互性与动态特性差、可移植性差。大多数PL采用
此种方法翻译；
2．解释器：边翻译边执行，工作效率低，即时间慢、空间
费；交互性与动态特性好、可移植性好。早期的Basic和
现在的Java等。
3
编译过程
源程序
1．编译器的工作过程：
词法分析
词法分析、语法分析、语义分
语法分析
析
中间代码生成、代码优化
目标代码生成
符号表管理
出错处理
2．编译器的阶段
符
号
表
管
理
出
语义分析
错
中间代码生成
处
代码优化
理
目标代码生成
目标代码
4
编译过程各阶段工作的归纳
<1> 词法分析：识别单词，至少分以下几大类：关键字、
标识符、字面量、特殊符号；
<2> 语法分析：得到语言结构并以树的形式表示；
<3> 语义分析：考察结构正确的句子是否语义合法，可
修改树结构；
<4> 中间代码生成（可选）：生成一种既接近目标语言
，又与具体机器无关的表示，便于优化与代码生成；
（编译器与解释器的以上工作阶段可以一致）
5
编译过程各阶段工作的归纳
<5> 中间代码优化（可选）：局部优化、循环优化、全
局优化等；实际上是一个等价变换，变换前后的指令序列完
成同样的功能，而程序占用的空间和执行的时间都更省、更
有效。
<6> 目标代码生成：不同形式的目标代码－汇编、可重
定位、内存形式（Load-and-Go）;
<7> 符号表管理：合理组织符号，便于各阶段使用；
<8> 出错处理：错误的种类－词法错、语法错、静态语
义错、动态语义错。
6
编译器的分析/综合模式
编编编
编编编编编编
编编编
编编/编编编编
编编编编编编
编编编编
编编编编/编编
编编编编
1．前端：语言结构的分析
2．后端：语言意义的分析与处理
3．中间代码：前端与后端的分界
7
例题
1. 从程序运行的角度看，编译程序和解释程序的主
要区别是
是否生成目标代码。
2. 编译程序的基本组成有：词法分析、
、
、
中间代码生成、代码优化、
、
和
，
其中，中间代码生成和代码优化是可选的;对表
达式中运算数的类型检查一般在
阶段进
行。
3. 编译程序是对________。
A. 汇编语言的翻译
B. 高级语言的解释执行
C. 机器语言的执行
D. 高级语言的翻译
8
第2章词法分析
词法分析的两个重要环节：
规定所有合法输入＋识别合法输入
要点：
<1> 什么是正规式？什么是正规集？
<2> 什么是有限状态自动机？
<3> 如何利用Thomson算法从正则表达式构建NFA？
如何利用子集法从NFA得到DFA？
如何将一个DFA最小化？
9
第2章词法分析
要点：
<4> 为什么要进行词法分析？
<5> 如何从描述设计出正规式？
<6> 正则表达式、有限自动机、NFA、DFA与词法分析器的
关系？
10
疑难点
1. 为什么要进行词法分析？
词法分析的第一个目的是将输入的程序文本中所有符号分类，
使得接下来的语法分析可以在分析语法的过程中不再关心
程序文本的细节。举例来说：C语言语句：
int a;
int b
显然是两个不同的语句，但是对语法分析而言，它们是相同
的，其格式都是：
类型名标识符
（对语法分析器而言，变量的名称没有意义）。词法分析器
的作用就是将这些不同的部分先去除，只将语法分析需要
关心的部分整理出来，留待语法分析器处理。
语法分析的第二个目的是初步整理出符号表的内容，并将其
留给语义分析器处理。
11
疑难点
2. 如何从描述设计出正规式？
从描述生成正规式没有任何现成的、形式化的方法，只能
依靠经验。
3. 正则表达式、有限自动机、NFA、DFA与词法分析
器的关系？
正则表达式是一种描述字符串组成的规则。有限自动机可
以看作是一种利用状态转换表示字符串匹配过程的算法。
NFA和DFA则是有限自动机工作过程的图形化表示。其中
NFA可以利用Thomson算法与正则表达式建立一一对应的关
系。而词法分析器则是将DFA表示的算法用计算机程序实
现后得到的程序。词法分析器中可以直接用无限循环和
switch-case语句将自身的状态与DFA中的状态图实现一一
对应。
12
例题
1. 词法分析的输出由记号的种类和属性
分组成。
两部
2. 指出NFA与DFA的主要区别。
3. 正规式0*(10*1)*0*所表示的语言是含有偶数
个1的0、1串。
4. 词法分析是编译的第一阶段，其主要任务是读取
输入字符流（源程序），产生用于进行语法分析
的的记号序列，同时过滤空白符号和注释。
13
例题
5.有正规式r=(a|b)*(aa|bb)(a|b)*，试给出：
（1）r的正规集；
（2）识别该正规集的DFA（要有步骤）；
（3）最小化的DFA。
解：
（1）L(r)是至少含有两个相连的a或两个相连的b的a、
b串的集合。
14
例题
5.有正规式r=(a|b)*(aa|bb)(a|b)*，试给出：
（2）识别该正规集的DFA（要有步骤）； a
0
解：（2）构造r的NFA如图1所示。
b
1
a
b
a
b
2
a
3
b
图1
确定化：（NFA中没有ε状态转移，故仅需求smove）
初态：A={0}
m(A,a)={0,1} B
m(A,b)={0,2} C
m(B,a)={0,1,3}D
m(B,b)={0,2} C
m(C,a)={0,1} B
m(C,b)={0,2,3}E
m(D,a)={0,1,3}D
m(D,b)={0,2,3}E
m(E,a)={0,1,3}D
m(E,b)={0,2,3}E
15
例题
构造(a|b)*(aa|bb)(a|b)*的NFA如图1所示。
确定化：初态为A={0}
m(A,a)={0,1} B
m(A,b)={0,2} C
m(B,a)={0,1,3}D
m(B,b)={0,2} C
m(C,a)={0,1} B
m(C,b)={0,2,3}E
m(D,a)={0,1,3}D
m(D,b)={0,2,3}E
m(E,a)={0,1,3}D
m(E,b)={0,2,3}E
得DFA如图2所示。
a
a
0
b
a
1
b
a
b
2
a
3
b
a
A
b
B
a
b a
C
D
b a
b
E
b
图1
图2
16
例题
5.有正规式r=(a|b)*(aa|bb)(a|b)*，试给出：
（3）最小化的DFA。
解：（3）初始划分：{ABC，DE}
因为B状态经a状态转移与AC不在同一组，故B被分出，形
成新的划分：{AC，B，DE}
又因m(A,b)=C和m(C,b)=E不在同一组，所以最终划分：{A，
B，C，DE}
a
得最小DFA如图3。
a
A
b
B
a
b a
C
D
b a
b
E
B
a
A
b
b a
a
b
C
a
D
b
b
图2
图3
17
例：已知一个NFA如图。
(a) 用自然语言简要叙述该自动机所识别的语言
的特点，列举两个它可识别的串。
a,b
a,b
(b) 写出与该自动机等价的正规式r。
b
b
0
1
2
(c) 用子集法构造识别r的最小DFA。
解：
(a) 语言特点是包含子串“bb”的ab符号串。如abba、abbbab。
(b) r =(a|b)*bb(a|b)*
(c) 关键步骤：确定化、最小化
a b
1.确定化：子集法构造DFA(用状态矩阵表示)
a
{0}
A
{0,1} B
{0,1,2} C
{0} A
{0} A
{0,2} D
b
{0,1}
B
{0,1,2} C
{0,1,2} C
{0,2}
{0,2} D
{0,1,2} C
D
A
B
C
D
A
A
D
D
B
C
C
C
得到DFA如右（其中，C和D中含NFA的终态，故C和D是DFA的终态）
2．最小化DFA：(利用可区分概念)
原始划分(两个组)：1={A,B} 2={C,D}
考察所有状态转移：
move(A,a) = A, move(B,a) = B
move(A,b) = B, move(B,b) = C
move(C,a) = D, move(D,a) = C
move(C,b) = D, move(D,b) = C
根据可区分概念将1分割成两个组1和3，得到：
1={A} 2={C,D} 3={B}
由于状态C和D不可区分，因此可将C、D合并为
一个状态且选C作代表，得到最小DFA如右。
对应的图形表示如下。
a,b
0
a,b
b
1
b
NFA
2
a
A
a,b
b
B
a
DFA
b
C
A
B
C
D
a
A
A
D
D
A
B
C
a
A
A
C
b
B
C
C
C
b
B
C
C
第3章语法分析
要点：
<1> 什么是产生式？什么是上下文无关文法（CFG）？
<2> 什么是文法的二义性和语言的二义性？
消除文法二义性的方法有哪些？
<3> 什么是推导？最左推导？规范推导（最右推导）？
<4> 什么是语法树？什么是分析树？
<5> 自上而下语法分析与自下而上语法分析？
<6> 如何消除左递归和直接左递归？如何提取左因子？
<7> 如何计算FIRST和FOLLOW集？
<8> 什么是递归下降分析？
20
第3章语法分析
要点：
<8> 如何构造预测分析表并进行预测分析？
<9> 什么是短语、直接短语、句柄？
<10> 如何构造SLR(1)分析表并进行“移进－归约”分析？
<11> 什么是“移进－归约”和“归约－归约”冲突？
<12> 为什么要进行语法分析？
<13> 如何根据语言描述编写语法产生式？
<14> 为什么自上而下分析不能有公共左因子和左递归？
<15> 识别语言的自动机与文法的对应关系？
21
疑难点
1. 为什么要进行语法分析？
语法分析是对程序文本（实际上是经过词法分析器处理过
的，只保留了符号的类型的程序文本）进行合法性分析，
其作用在于保证传递给语义分析器的程序符合编译器定义
的编程语言的语法正确性要求，使语义分析器能够正确进
行语义分析。
22
疑难点
2. 自上而下分析和自下而上分析方式在分析的过程上
有什么区别和联系？
自上而下分析过程实际上是一个“先展开，再匹配”的过
程。它总是从开始符号开始，每一次都按照某一个产生式
进行展开，并与现有的输入字符串比较。在这个展开过程
中，就会产生一些可以与输入符号串的某个位置匹配的终
结符，同时还会产生一些产生式中出现的非终结符。自上
而下分析会反复匹配这个展开符号串中的非终结符，直到
这个展开符号串中再也没有任何非终结符为止。如果这时
得到的展开符号串与输入串的内容一致，则说明输入匹配
成功。自上而下分析过程总是试图用某一个已知的产生式
来“解释”（匹配）现在输入的状态，直到最终能够完全
“解释”（匹配）输入符号串为止。
23
疑难点
自下而上分析过程实际上是一个“先读入，再归纳（归约）”
的过程。自下而上分析过程一开始实际上程序并不知道自己
将得到什么样的产生式，它只是不停地先读入字符并将其存
储在一个堆栈之中，并依照某种标准（就是“移进－归约”
分析表）来判断堆栈之中这些已经读入的终结符和非终结符
是否可以归约成某个产生式。如果可以，它就将可以归约的
部分归约成一个新的非终结符，并用它替换原来堆栈中归约
出它来的那一部分（表示这一部分已经可以用这个新的非终
结符代表）。如此不停分析下去，如果最终我们可以将这整
个输入符号串归约成文法开始符号，就认为匹配成功。自下
而上分析过程可以试图用产生式“化简”（归约）读入的符
号，直到最后可以“化简”出文法开始符号为止。
24
疑难点
3. FIRST和FOLLOW集在语法分析过程中起到的作用是什
么？
FIRST集合用于标记文法每一个符号（终结符和非终结符）以
什么终结符开始。FOLLOW集则通常用于标记每一个非终结
符（注意，没有终结符）分析结束之后紧接着的终结符能
够有哪些。
FIRST集合的计算常常是自下而上计算出来的（从能右部最左
端能够得到终结符的产生式开始），而FOLLOW集合则常常
是自上而下计算出来的（从第一个产生式开始）。
25
疑难点
4. 自上而下分析和自下而上分析与FIRST、FOLLOW集的
关系是什么？
自上而下分析过程中实际上主要依赖FIRST集合，因为自上而
下分析的基本手段是“看到一个字符来决定现在应该是哪
个产生式的开始”。相反的，自下而上分析则主要依赖
FOLLOW集合，因为自下而上分析的方法是现不停移进，并
依照“下一个字符是什么”来决定自己移进的是不是已经
能够形成一个完整的产生式。在这个过程中，FOLLOW集合
就是“遇到什么终结符表示我们可以归约这个产生式”的
依据。
但是，FIRST和FOLLOW集合必须一同使用，因为FOLLOW集合的
计算必须建立在FIRST集合的基础之上。
26
疑难点
5. 为什么自上而下分析不能有公共左因子和左递归？
自上而下分析不能有公共左因子的原因在于自上而下分析是
依靠当前看到的第一个终结符来决定现在的格局应该按照
什么产生式进行展开的。如果用于推导出同一个非终结符
的不同产生式拥有相同的左因子，则自上而下分析过程就
不知道应该按哪个产生式作为展开的依据，从而无法分析
下去。如果使用预测分析方法分析带有公共左因子的文法，
最明显的表现就在于在预测分析表中的某个表格中会出现
必须填写多个产生式的情况，
27
疑难点
5. 为什么自上而下分析不能有公共左因子和左递归？
自上而下分析不能有左递归的原因则在于：自上而下分析总
是按照从左到右的方式分析输入的。因此，自上而下分析
的方式总是要求每一次展开都能“消去”产生式最左端的
一部分终结符，只有这样才能保证每一次展开都能够使剩
下未匹配的部分变“短”一些，最终做到完全匹配。如果
产生式最左端出现左递归，则每一次展开的最左边都不可
能产生可以消去的终结符，那么程序将永远无法继续分析
下去。值得注意的是，所谓的左递归不但包括可以看到的
直接左递归，还包括经过推导能够从文法中推导出来的间
接左递归。
28
疑难点
6. 为什么自下而上分析会出现“移进－归约”和“归
约－归约”冲突？
因为自下而上分析总是根据下一个终结符归属于哪一个非终
结符的FOLLOW集合来确定已经移进的符号将按照哪个产生
式归约。如果某一个终结符同时属于两个非终结符的
FOLLOW集合，则分析器就无法确定应该按照哪个非终结符
进行归约。这时就会产生“归约－归约”冲突。
29
疑难点
6. 为什么自下而上分析会出现“移进－归约”和“归
约－归约”冲突？
“移进－归约”冲突的产生则是由于LR(0)项目集合中可能出
现这样的一种情况：
A → X.
B → X.tY
其中，t是终结符，A、B、X、Y是非终结符，且t是A的FOLLOW
集合中的一个成员。
在以上情形之下：产生式A的右部正好是产生式B的右部的前
缀，而且B中在与A相同的前缀后紧跟的又是FOLLOW(A)中
的终结符。当产生式归约了X后，如果输入串的下一个字
符是t，则分析器就无法确定应该是归约还是移进，因为
两种操作按照文法来看都是合理的。但如果t没有在
FOLLOW(A)中出现，则不构成冲突。
30
例题
1. 对单词的识别，是依据词法（构词）规则进行的，
对句子的识别，是依据语法规则进行的。
2. 2型文法是上下文无关文法，对应的分析器是下
推自动机；3型文法是正规文法，对应的分析器
是有限自动机。
3. 文法的终结符集和非终结符集的交集一定为
空。词法分析器交给语法分析器的文法符号一定
是终结符，它只能出现在产生式的右部。
4. LL(1)分析法中，第一个L的含义是自左向右扫描
输入，第二个L的含义是最左推导，1的含义是确
定下一个动作向前看1个终结符。
31
例题
1. 最右推导(或规范推导) 是与规范归约（最左归约）
互逆的一个过程，规范归约每次归约的符号串称为
句柄
。
2. 自上而下分析的一般方法是：对于任何一个输入序
列，从文法开始符号开始，进行最左推导，反复
用产生式右部的文法符号序列替换句型中的非终
结符，最终得到一个句子（终结符序列）。
3. 用LR方法实现语法分析时，典型的操作有
移进、
归约、接受和报错。
4. 一个文法产生的句子的集合称为该文法产生的语
言。
5. 递归下降分析法是一种自上而下的语法分析方法。 32
例题
1. 在自上而下的语法分析方法中，应对文法实施以
下改造：消除左递归
以避免分析陷入死循
环，提取公共左因子以避免回溯。
2. 给定文法A→bA|cc，下面的符号串中，为该文法
句子的是 A
。
A. cc
B. bcbc C. bccbcc
3.已知文法G:S→A0
式是C 。
A. (0|1)*0
C.1(0|01)*0
D. ccb
A→A0|S1|1。与G等价的正规
B. 0*|1*0
D. (10|01)*0
33
例题
4. 设有文法G：S→aBc|bAB, A→aAb|b, B→b|ε。
<1> 计算非终结符S、A、B的FIRST和FOLLOW集合；
<2> 构造G的LL(1)分析表;
<3> 分析输入序列baabbb（以格局的形式写出具体
的分析步骤）。
5. 设有文法G：S→S(S),
S→ε。
<1> 构造识别G的活前缀的DFA；
<2> G是LR(0)的吗？请说明理由；
<3> G是SLR(1)的吗？若是构造出它的SLR分析
表;若不是请说明理由。
34
4. 设有文法G：S→aBc|bAB, A→aAb|b,
B→b|ε。
<1> 计算非终结符S、A、B的FIRST和FOLLOW集合；
<2> 构造G的LL(1)分析表;
<3> 分析输入序列baabbb（以格局的形式写出具体的分
析步骤）。
解：<1> 计算FIRST和FOLLOW：
FIRST(B)={b,ε}
FIRST(S)={a, b}
FOLLOW(B)={c,#}
FOLLOW(S)={#}
<2> 构造预测分析表：
S
A
B
a
aBc
aAb
FIRST(A)={a, b}
FOLLOW(A)={b,#}
b
bAB
b
c
#
b
ε
ε
<3> 分析输入序列baabbb
栈
#S
#BAb
剩余输入
baabbb#
baabbb#
产生式
S→bAB
#BA
#BbAa
#BbA
#BbbAa
aabbb#
aabbb#
abbb#
abbb#
A→aAb
#BbbA
#Bbbb
bbb#
bbb#
A→b
#Bbb
bb#
#Bb
#B
b#
#
#
#
A→aAb
B→ε
例题
5. 设有文法G：S→S(S),
S→ε。
<1> 构造识别G的活前缀的DFA；
<2> G是LR(0)的吗？请说明理由；
<3> G是SLR(1)的吗？若是构造出它的SLR分析表;若
不是请说明理由。
解：<1> 构造识别G的活前缀的DFA ：
I1
I0
S'→ .S
S →.S(S)
S →.
S
I4
S'→ S.
S →S.(S)
(
S → S(.S)
S →.S(S)
S →.
S → S(S).
I2
)
S
I3
S → S(S.)
S → S.(S)
(
37
例题
解：<1> 构造识别G的活前缀的DFA ：
I1
I0
S'→ .S
S →.S(S)
S →.
S
I4
S'→ S.
S →S.(S)
(
S → S(.S)
S →.S(S)
S →.
S → S(S).
I2
)
S
I3
S → S(S.)
S → S.(S)
(
<2> G是LR(0)的吗？请说明理由；
此文法不是LR(0)文法，因为在I1、I2中有移进/归约
冲突（如果仅考虑终结符，应该没有移进/归约冲突）；
38
I1
I0
S'→ .S
S →.S(S)
S →.
S
I4
S'→ S.
S →S.(S)
<3> G是SLR(1)的吗？若是构造出它
S
的SLR分析表;若不是请说明理由。
S
S
解：计算FOLLOW(S)={(, ), #}，
∵{(, ), #}∩{S}=Φ ∴ I1、I2中
的移进/归约冲突可通过简单向前看
一个符号解决，此文法是SLR(1)文法，
它的分析表如下：
状态
(
→ S(.S)
→.S(S)
→.
S → S(S).
I2
)
S
S → S(S.)
S → S.(S)
(
ACTION
GOTO
(
)
#
S
0
1
r2
s2
r2
r2
acc
1
2
3
r2
s2
r2
s4
r2
3
4
r1
r1
r1
I3
第4章语法制导翻译生成中间代码
要点：
<1> 程序的语法和语义，语义信息用文法符号的属性。
<2> 什么是语法制导翻译？
<3> 为什么生成中间代码？常见中间代码的形式有哪些？
<4> 符号表的作用和内容？
<5> 声明语句的翻译
<6> 可执行语句的翻译
40
第4章语法制导翻译生成中间代码
要点：
<5> 声明语句的翻译
定义与声明：
类型定义与变量声明，过程定义与声明
变量声明：填写符号表
过程声明：
左值和右值
四种过程调用时参数传递方式
名字的作用域：静态作用域原则和最近嵌套原则
声明中作用域信息的保存
41
第4章语法制导翻译生成中间代码
要点：
<6> 可执行语句的翻译
算术表达式和赋值语句的翻译
数组元素引用
布尔表达式短路计算方式的翻译：
真出口与假出口、真值链与假值链
控制语句的翻译：拉链-回填
42
疑难点
1. 为什么要进行语义分析？
语义分析是编译器中真正分析输入程序含义的部分。它根
据一组定义好的规则（语法制导定义）检查已经由语法分
析部分分析完毕的、没有语法错误的程序，并将其按照一
定的规则（翻译方案）生成我们想要的结果（如果是解释
器，就直接解释执行；如果是编译器，则通常将其翻译成
功能等价的汇编语言或其他高级语言程序）。
43
疑难点
2. 中间代码在分析方案中起到的作用是什么？
中间代码为语义分析程序定义了一种标准的形式，如果语
义分析程序需要生成不同的目标语言代码，只要更改中间
代码到目标代码翻译模块就可以达到目的，语义分析部分
可以不必改动。
44
疑难点
3. 符号表在语法制导翻译过程中的作用是什么？
符号表存储了程序中所有变量、常量或过程的名字（标识
符）。在最终生成的代码中，这些名字都将被转换成对应
的地址（变量和常量是存储地址，而过程则是入口地址），
而这一部分工作主要就是在语法制导翻译的过程中完成的，
符号表在这一过程中的作用有两个：1、允许翻译程序快
速地检索某一个标识符对应数据或过程的信息；2、提供
一个正确的作用域管理机制，使得翻译程序能够正确访问
到它当前应该访问到的地址（例如，重名的局部变量和全
局变量）。
45
疑难点
4. 为什么需要进行计算数组下标映射？
数组就是一块用于存储数据的固定大小的内存。由于现代
计算机内部的内存都是按照一维线性结构排列的，所以现
代的计算机实际上无法实现真正意义上的多维数组，必须
使用一维数组来模拟。如果程序需要提供多维数组的机制，
就必须设法把多维数组的多维下标映射成为一维的下标，
才能做到正常访问。
46
疑难点
5. “拉链－回填”分析方法的作用是什么？用在何处？
“拉链－回填”主要用于这样一种情况：在生成代码的过
程中，有时需要生成一些跳转到另一个过程首地址的程序
语句，但是这个目的地地址必须在后面的代码中生成，当
前还没有确定。于是我们必须将要填入这个还未生成的地
址的位置记录下来，留待当这个目的地地址生成之后再回
头补上，就是所谓的“回填”。如果这个跳转地址在它定
义之前被引用的次数有许多次，那么这些引用的位置通常
用一个链表的形式记录下来（因为不能确定这个地址要被
引用多少次，用链表处理比较方便），这就是所谓的“拉
链”。
47
例题
1.中间代码的主要形式有后缀式、三地址码和
树（或图）。
2.与后缀式abc*+-d/对应的表达式是 -(a+b*c)/d 。
3.中间代码的特点是什么？采用中间代码有什么好处？
答：中间代码的特点是与具体机器（指令系统）
无关；采用中间代码可以明确区分前端与后端；便
于优化和移植。
48
例题
1. 语义错误可分为静态语义错误和动态语义错误，
“运算符与运算对象的类型不一致”属于静态语
义错误，“无穷递归”属于动态语义错误。
2. 过程（或函数）调用中，引用
调用传递给形
参的是实参的左值，
值
调用传递给形参的是
实参的右值，复写/恢复调用传递给形参的是实参
的右值。
49
例题
1. 数组元素的地址计算公式由两部分组成，一部分
是不变部分，它在编译时确定；另一部分是可
变部分，它在运行时确定。
2. 为数组声明a:array[1..3, 2..4]中a分配的存储
空间的首地址为base_a，且每个数组元素占据一
个存储单元。若以行为主存放，数组元素a[3, 3]
在存储空间中相对base_a的偏移量是 7 ；若以列
为主存放，数组元素a[3, 3]在存储空间中相对
base_a的偏移量是 5 。
50
例题
3. 对下述C++程序，(a) 指出p1和p2分别采用什么
样的参数传递方式； (b)给出程序的执行结果。
void p1(int a,
int b,
int c) {c=c+10;
b=a*b+c;}
void p2(int &a, int &b, int &c){c=c+10;
b=a*b+c;}
void main()
{ int x=80, y=20, z=0, t=0;
z=x+y*90;
p1(x+y,x,z); cout << "p1结果=" << x << endl;
t=x+y;
p2(t,x,z);
cout << "p2结果=" << x << endl;
}
51
例题
解：
(a) 指出p1和p2分别采用什么样的参数传递方式；
p1采用值调用，p2采用引用调用
(b) 给出程序的执行结果。
p1 结果=80
p2 结果=9890
52
例题
4.有文法G如下（注：G中终结符id仅由单个英文字母组成，如a,
b等）：E→E*T|T
T→T+F|F
F→ (E)|id
和G的语法制导翻译如下：
E→E1*T
{E.place=newtemp; emit(*,E1.place,T.place,E.place;}
| T
{E.place=T.place;}
T→T1+F
| F
{T.place=newtemp; emit(+,T1.place,F.place,T.place;}
{T.place=F.place;}
F→ (E)
| id
{F.place=E.place;}
{F.place=id.name;}
(a) 求句型(T+F)*id 的短语、直接短语以及句柄；
(b) 根据语法制导翻译写出句子a*b+c*d的中间代码；
(c) 若a=3，b=5，c=7，d=8，请给出中间代码计算结果；
(d) 将文法G简化为：E→E*T|T，T→T+F|F，F→id。给出它的识
别活前缀的DFA。
53
解：（无论是求短语还是计算值，首先
应该给出它们的分析树，因为分析树是
分析过程和句子结构的最直观表示）
(a) 短语：T+F，(T+F)，id，(T+F)*id
直短：T+F，id，句柄：T+F
(b)句子a*b+c*d的四元式组：
(1) (+, b, c, t1)
E t3
(2) (*, a, t1, t2)
(3) (*, t2, d, t3)
E t2 * T
(c) 将a=3，b=5，c=7，d=8
F
E * T t1
代入四元式组，
得计算结果：288
T T + F d
F
F
a
b
c
a*b+c*d的分析树
E
E *
T
T
F
F
id
( E )
T
T + F
(T+F)*id 的分析树
(d) E→E*T|T，T→T+F|F，F→id的识别活前缀的DFA：
E’→.E I0 E E’→E. I1
*
E→E.*T
E→.E*T
E→.T
T→.T+F T E→T. I2
T→.F
T→T.+F
F→.id
F
F
T→F. I3
id
id
F→id. I4
id
E→E*.T T E→E*T.I7
T→T.+F
T→.T+F
T→.F I5
F→.id
+
+
T→T+.F
F T→T+F.
I8
F→.id I6
例题
1. 程序代码如下
if (b>0) then
while (a>b) do a:=a-1
else a:=a+b;
（1）请画出它的代码结构图（程序流程图）；
（2）给出其三地址码序列。
解：
b > 0?
N
Y
a:=a+b
a:=a-1
Y
a > b?
N
1:
2:
3:
4:
5:
6:
7:
8:
9:
10:
if b>0 goto
goto 8
if a>b goto
goto 10
t1:=a-1
a:=t1
goto 3
t2:=a+b
a:=t2
3
5
56
2. 给出语句while (a<b) do if (c<d) then x:= y+z的中间
代码序列。
开始
解：程序流程图：
N
a<b
结束
中间代码：
101 (j<, a, b, 103)
Y
N
102 (j, -, -, 108)
c<d
或：
103 (j<, c, d, 105)
Y
101 if a<b goto 103
104 (j, -, -, 101)
102 goto 108
x:=y+z
105 (+, y, z, t1)
103 if c<d goto 105
104 goto 101
106 (:=, t1, -, x)
105 t1 := y+z
107 (j, -,
-, 101)
106 x := t1
108 ...
107 goto 101
108 ...
（也可以先给出语句的分析树，然后剪句柄生成中间代码）
第5章运行环境
要点：
<1> 什么是活动？什么是活动树？
<2> 什么是活动记录？
<3> 控制栈的作用是什么？
<4> 内存空间（数据空间）的存储分配策略有哪些？
<5> 什么是调用序列和返回序列？
<6> 栈分配方式
控制栈中活动记录的具体内容，指针top和sp
控制链和访问链
非本地数据的访问：访问链方式、显示表方式
58
例题
1. 常用的存储分配策略有静态分配、栈分配和
堆分配。
2.
静态数据区用于存放一对一的绑定、且编译
时就可确定存储空间大小的数据；栈
用于存
放一对多的绑定且与活动同生存期的数据。
3. 过程的嵌套层次树反映了过程之间的嵌套的关
系；活动的活动树反映了顺序执行程序的活动的
调用关系。
59
例题
4. 简述活动记录和访问链的主要作用，以及访问链
的指向。
答：活动记录用于提供活动所需的环境，访问链
用于访问非本地数据。访问链的指向有两种：非
显示表指向直接外层的最新活动记录，显示表指
向同层次新活动记录。
60
例题
5. 设有一程序在执行到某一时刻时，控制栈中的活动记录如
下图所示（其中A是主程序，B、C、D、E均是过程）。
控
制
链
C的活动记录
B的活动记录
E的活动记录
D的活动记录
B的活动记录
A的活动记录
访
问
链
(a)给出所有在活动期的活动的调用关系(提示：若A调用B，
则记为A→B)；
解：所有在活动期的活动的调用关系：A→B→D→E→B→C；
61
例题
设有一程序在执行到某一时刻时，控制栈中的活动记录如下
图所示（其中A是主程序，B、C、D、E均是过程）。
控
制
链
C的活动记录
B的活动记录
E的活动记录
D的活动记录
B的活动记录
A的活动记录
访
问
链
(b) 分别指出A、B、C、D、E的嵌套深度；
(c)试根据访问链中的内容画出过程的嵌套关系树。
解： A、B、C、D、E的嵌套深度分别为：
1、2、3、3、2；
D
A
E
B
C
62
6. 有C++程序如下所示：
#include <iostream.h>
int f(int n)
{ if (n<2) return n;
return f(n-1)+f(n-2);
}
void main(){ int a=4; cout<<f(a)<<endl;}
(a) 画出程序运行时的活动树；
(b) 给出程序的运行结果；
(c) 若控制栈从左向右增长（最右边是栈顶），请问(main,
f(4), f(1))是不是一个可能的控制栈状态？为什么？
解：
(a) 活动树如下：
main()
f(4)
f(3)
f(2)
f(2) f(1) f(1) f(0)
f(1) f(0)
(b) 程序的运行结果为：3
(c) 不是一个可能的控制栈状态，因为f(4)不能直接调用f(1)。
从活动树也可以看出，在f(4)所在的任何一条路径上，f(4)和
f(1)不相邻。
结束
65

编译原理与技术考前辅导课件下载

Transcript 编译原理与技术考前辅导课件下载

Directory