编译原理复习整理(每页15张)
编译原理总复习
中间代码生成的自动生成工具
工具介绍
自动生成工具是一种辅助编译器设计的软件工具,它可以自动生成中间代码,从而简化编 译器的设计和实现过程。
工具分类
根据生成中间代码的方式不同,自动生成工具可以分为解析型和抽象语法树型两类。解析 型工具将源代码直接翻译成中间代码;抽象语法树型工具则将源代码先转换为抽象语法树 ,然后再将抽象语法树转换为中间代码。
Antlr
一个强大的语法分析器生成器,支持多种语言和复杂 的文法规则。
GOLD
一个高效的语法分析器生成器,支持多种目标语言和 优化选项。
04 中间代码生成
中间代码生成的定义与任务
定义
中间代码生成是编译过程的一个阶段,将源代码转化为一种中间表示形式,这种中间表 示形式称为中间代码。
任务
其任务包括控制结构的抽象、语义的消除、代码优化等,以简化后续的代码优化和目标 代码生成阶段。
循环结构的优化
循环展开
将循环体中的代码复制到循环 外部,以减少循环次数。
循环合并
将多个循环合并为一个循环, 以减少循环次数。
循环嵌套
将一个循环嵌套在另一个循环 内部,以减少循环次数。
循环展开与循环合并的优 缺点
循环展开可以减少循环次数, 但会增加代码量;循环合并可 以减少代码量,但会增加循环 次数。在实际应用中,需要根 据具体情况选择合适的优化方 法。
算法优化
根据问题的特点,选择合适的算法,以提高程序 执行效率。
系统资源优化
根据系统资源的特点,合理分配和利用系统资源, 以提高系统运行效率。
循环优化
1 2
循环展开
将循环体中的操作展开,以减少循环次数和减少 循环开销。
循环合并
将多个循环合并为一个循环,以减少循环次数和 减少循环开销。
编译原理总复习
编译原理总复习总复习■第1章1、编译程序是⼀种翻译程序,它将⾼级语⾔所写的源程序翻译成等价的机器语⾔或者汇编语⾔的⽬标程序。
2、编译程序是计算机系统中重要的系统软件!3、解释程序与编译程序的主要区别是解释程序在执⾏过程中不产⽣⽬标程序。
4、编译的各个阶段。
答:整个编译过程可以分为5个阶段:词法分析,语法分析,语义分析及中间代码⽣成,代码优化和⽬标代码⽣成。
5、编译程序的结构框图或步骤。
6、遍(趟):是对源程序或源程序的中间结果从头到尾扫描⼀遍,并作有关加⼯处理,⽣成新的中间结果或⽬标程序的过程。
■第2章1、符号串的基本运算。
2、简单的说⽂法由产⽣式组成;产⽣式中的符号分为两类:终结符号和⾮终结符号。
3、推导(最左、最右)、句型、句⼦、短语、句柄4、乔姆斯基层次中:L3 ? L2 ? L1 ? L0■第2章例题已知⽂法G[E]:E→T|E+T|E-TT→F|T*F|T/FF→(E)|i(1)该⽂法的开始符号是什么?(2)请给出该⽂法的终结符号集合VT和⾮终结符号集合VN。
(3)找出句型T+T*F+i的所有短语、直接(简单)短语、句柄。
■第3章1、词法分析程序的输出是单词符号序列。
2、DFA的三种表⽰形式——状态转移图、状态转换表和五元组表⽰(Q, ∑, f, S, Z );3、正规式向DFA的转换:(1)正规式——NFA;(转换原则见下页)(2)NFA——DFA;(3)DFA的最⼩化。
4、DFA向正规式的转换。
正则式向NFA转换的原则:例:构造与正则表达式R=ba(a|b)*等价的状态最少的DFA,并写出该DFA的五元组形式或状态转换表。
■第4章1、语法分析⽅法的各种分类;2、LL(1)分析⽅法。
提⽰:在此算法中注意First集和Follow集的求法。
并且⼀定要注意分析过程中步骤要完整。
(分析步骤见下页总结)例:⽂法:S?a|^|(T) T?T,S|S试判断该⽂法是否是LL(1)⽂法。
习题4:P100 4.3 4.7 4.9■LL(1)分析⽅法相关知识总结1、消除⽂法中的左递归或提取左因⼦;(1)简单直接左递归的消除A →βA’A →Aα| β→A’ →αA’| ε(2)将⽂法G:A→αβ|αγ提取左因⼦。
编译原理全复习(完整版)
1》编译程序的框架图与功能块:(1)画出编译程序的总体结构,并简述各部分的主要功能:七个部分(2)编译程序的结构分为几个阶段,各阶段的任务是什么?答编译程序总框架(1)词法分析器,又称扫描器,输入源程序,进行词法分析,输出单词符号。
(2)语法分析器,简称分析器,对单词符号串进行语法分析(根据语法规则进行推导或规约),识别出各类语法单位,最终判断输入串是否构成语法上正确的“程序”。
(3)语义分析与中间代码产生器,按照语义规则对语法分析器归约出(或推导出)的语法单位进行语义分析并把它们翻译成一定形式的中间代码。
(4)优化器,对中间代码进行优化处理。
(5)目标代码生成器,把中间代码翻译成目标程序。
(6)表格管理,登记源程序的各类信息,编译各阶段的进展状况。
(7)出错管理,把错误信息报告给用户。
编译程序的结构分为五个阶段:(1)词法分析.任务是:输入源程序,对构成源程序的字符串进行扫描和分解,识别出一个个的单词(亦称单词符号或简称符号),如基本字,标识符,常熟,算符和界符。
(2)。
语法分析,任务是:在词法分析的基础上,根据语言的语法规则,把单词符号串分解成各类语法单位(语法范畴)。
(3)语义分析与中间代码产生。
任务:对语法分析所识别出的各类语法范畴,分析其含义,并进行初步翻译(产生中间代码)。
(4)优化。
任务在于对前段产生的中间代码进行加工变换,以期在最后阶段能产生出更为高效(省时间和空间)的目标代码。
(5)目标代码生成。
任务是:把中间代码(或优化出理之后)变换成特定机械上的低级语言代码。
2》.重要概念:a. 编译程序:是指能够把源语言程序转换成逻辑上等价的目标语言程序的一个程序。
b. 单词符号:是语言的基本组成成分,是人们理解和编写程序的基本要素,是语言中具有独立意义的最基本结构,它一般包括:基本字、标识符、常数、运算符和界符等c. 中间代码:是一种含义明确,便于处理的记号系统,它通常独立于具体的硬件。
编译原理复习汇总
复习汇总一、第一章概述1.文法与自动机的等价1)0型文法—图灵机2)1型文法—线性有界非确定图灵机3)2型文法—非确定下推自动机4)3型文法—有限状态自动机2.编译技术的应用1)语法制导的结构化编辑器2)程序格式化工具3)软件测试工具4)程序理解工具5)高级语言的翻译工具6)等等3.从面向机器的语言到面向人类的语言(结合第二章第9小点理解)1)面向机器的语言:机器指令,汇编语言2)面向人类的语言:通用程序设计语言,数据查询语言,形式化描述语言(正规式,产生式)等等。
4.各语言的分类(结合第二章第9小点理解)1)过程式语言,面向对象语言:通用程序设计语言。
2)函数语言:面向特点领域的,递归特性。
例如LISP语言3)说明性,非算法式语言:LEX/YACC,SQL。
4)脚本式语言:Shell语言5.语言之间的转换(李静PPT41)1)高级语言之间的转换一般称为预处理或转换。
2)高级语言翻译成汇编语言或机器语言称之为编译。
3)把汇编语言翻译成机器语言称之为汇编。
4)将一个汇编语言程序汇编为可在另一台机器上运行的机器指令称之为交叉汇编。
5)把机器语言翻译成汇编语言称之为反汇编。
6)把汇编语言翻译成高级语言称之为反编译。
6.编译器和解释器1)编译器●源程序的翻译和翻译后的程序的运行是两个不同的阶段。
◆编译阶段:用户输入源程序,经过编译器的处理,生成目标程序。
◆目标程序的运行阶段:根据要求输入数据,得出结果。
2)解释器(凡是可以采用编译器的地方均可以采用解释器)●解释器把翻译和运行结合到一起,编译一段源程序,紧接着就执行它。
这种方式称为解释。
7.解释器的优点(对比与编译器)1)具有较好的动态特性。
2)具有较好的移植特性。
8.解释器的缺点(对比于编译器)1)相比于编译器需花费大量的时间。
2)占用更多的内存空间。
9.编译器的工作阶段(结合第二章6小点红色部分理解)1)源程序->词法分析器->语法分析器->语义分析器->中间代码生成器->代码优化器->目标代码生成器->目标代码2)工作过程中的每个阶段均采用了符号表管理器,出错处理器。
编译原理期末复习总结
1文法的类型
通过对产生式施加不同的限制,Chomsky将文法分为四种类型:? 0型文法? 1型文法
? 2型文法? 3型文法
0型文法(短语文法)
对任一产生式 ,都有 且 至少包含一个非终结符,? 0型文法又称为无限制文法? 其所描述的0型语言又称无限制语言
AB={ x y | x A , y B } 满足条件的所有xy的集合。
例:符号串集合A={ab,aa},B={ba,bb}
乘积AB={abba,abbb,aaba,aabb}
注:{ε}A=A{ε}=A
3 符号串的幂运算
符号串自身连接n次得到的符号串
如:x的n次连接为xx…..x(n个x),也可 记 NhomakorabeaX^n
注:x0=ε
4 集合的幂运算
集合A连接自身n次所得到的集合
假设A={a,b}
A0={ }
A1=A={a,b}
A2=AA={aa,bb,ab,ba}
A A1A2,…,Ak一定是P中的一个产生式
1 语法树
子树:某一结点连同所有分支组成的部分
短语:子树的叶子结点形成的符号串
直接短语:单层分支子树所形成的短语
句柄:最左直接短语
若一个文法存在某个句型对应两棵不同的语法树,则称这个文法是二义的。
若一个文法存在某个句型有两个不同的最左(最右)推导,则称这个文法是二义的。
3型文法(正规文法)
例子 G(S):S 0A|1B|0
A 0A|1B|0S
B 1B|1|0
例 文法G(S):S aB|bA
A a|aS|bAA
例1 设L1={a2n,b2n|n>=1},试构造出生成L1的文
编译原理期末考试复习整理(详细列出考试重点+重点例题)
编译原理期末考试复习整理(详细列出考试重点+重点例题)本页仅作为文档封面,使用时可以删除This document is for reference only-rar21year.March目录第一章 (3)词法分析: (3)语义法分析 (3)中间代码 (3)第二章 (3)1.根据语言写出文法 (4)2.根据文法写语,描述其特点(必考大题2-3类型) (4)3.文法的规范推导、语法树、短语、句柄(必考大题,2-7,2-11) (6)第三章 (11)1.给出一个正规文法 (左线性、右线性方法),写出其状态转换图(必考) (11)1.1右线性文法写出状态转换图 (必考) (11)1.2状态转换图写出右线性文法G (12)1.3左线性文法写出状态转换图 (必考) (13)2.非确定自动机的确定化 (14)第四章 (15)第五章 (15)属性文法与属性翻译文法 (15)逆波兰式(大题) (16)四元式(大题) (16)第一章词法分析:分析源程序的结构,判断它是否是相应程序设计语言的合法程序语义法分析的任务是根据语言的语义规则对语法分析得到的语法结构进行静态的语义检查(确定类型、类型与运算合法性检查、识别含义等),并且转换成另一种内部形式(语义树)表示出来或者直接用目标语言表示出来。
中间代码是一种结构简单、含义明确的记号系统,这种记号系统可以设计为多种多样的形式,重要的设计原则为两点:一是容易生成;二是便于优化、移值;三是容易将它翻译成目标代码第二章文法G定义为四元组(V N,V→,P,S )其中V N为非终结符号(或语法实体,或变量)集;V→为终结符号集;P为产生式(也称规则)的集合; V N,V→和P是非空有穷集。
S称作识别符号或开始符号,它是一个非终结符,至少要在一条产生式中作为左部出现。
V N和V→不含公共的元素,即V N ∩V→ = φ,通常用V 表示V N∪ V→,V称为文法G的字母表或字汇表。
《编译原理》总复习
17
<2> 符号表的组织
1. 符号表的条目与信息的存储(关键字+内容) 2. 作用域信息的保存(栈结构) 3. 线性表与散列表
<3> 声明语句的翻译
1. 定义与声明:类型定义与变量声明,过程定义与过程声明 2. 变量声明:符号表信息的填写 3. 过程声明: • 左值与右值 • 参数传递:参数传递的不同形式 • 名字的作用域:静态作用域与最近嵌套原则 • 声明中作用域信息的保存
12
<3> 自上而下分析
1. 分析方法:推导,从上到下构造分析树,是一种预测的、 试探的方法; 2. 对文法的要求:没有公共左因子和左递归; 3. 递归下降子程序方法:匹配终结符,展开非终结符(子 程序调用) 4. 预测分析表方法: • 工作方式与过程:PDA(DPDA)、格局与改变格局的 动作; • 预测分析表的构造:FIRST集合与FOLLOW集合, FIRST与FOLLOW的计算; • LL(1)文法及其判别:预测分析表中没有多重定义条 目(推论3.2)。
2. 移进-归约分析表:动作表+转移表; 3. LR文法与LR分析:LR(0)、SLR(1)、LALR(1)、LR(1)。
15
第四章 语法制导翻译生成中间代码
本章讨论程序设计语言的静态语义分析,并且在语法分析 的基础上生成中间代码,采用的基本方法是语法制导翻译。 与前两章词法分析和语法分析不同的是,词法分析和语法 分析的讨论侧重于理论,而本章则侧重于结合程序设计语言的 实际例子讨论语言结构的具体翻译方法和一些实用的技术。
西安电子科技大学软件工程研究所归纳总结所学内容锻炼提高抽象能力一引言二词法分析三语法分析四语法制导翻译生成中间代码学习不能走捷径付出多少劳动就有多少收获
编译原理复习
编译原理复习《编译原理》第⼀章:绪论1.翻译器:把⼀种语⾔变换到另外⼀种语⾔的软件。
这两种语⾔分别称为源语⾔和⽬标语⾔。
2.编译器:⼀种翻译器,它的⽬标语⾔⽐源语⾔低级。
3.典型的编译器可以划分成6个逻辑阶段:词法分析,语法分析,语义分析,中间代码⽣成,代码优化,代码⽣成。
4.按照对⽬标机器的依赖性,把编译过程分成前端(依赖于源语⾔,独⽴于⽬标机器)和后端(依赖于⽬标机器,独⽴于源语⾔,只与中间语⾔有关(从中间代码⽣成⽬标代码))。
5.前端包括:词法分析,语法分析,语义分析,中间代码⽣成。
6.后端包括:代码优化,代码⽣成。
7.解释器:不同于编译器的另⼀类语⾔处理器,直接执⾏源程序所指定的运算。
解释器的执⾏效率⽐编译器低,因为解释器⽆法解开循环。
8.遍:编译的⼏个阶段常⽤⼀遍(pass)扫描实现,⼀遍扫描包括读⼀个输⼊⽂件和写⼀个输出⽂件。
《编译原理》第⼆章:词法分析⼀些概念:1.词法单元:⼜称单词,是编程语⾔中合法的字符串。
2.词法记号:满⾜某种规则的词法单元,采⽤同⼀种记法——词法记号。
该规则称为模式。
3.模式:描述词法单元与词法记号对应关系的规则。
是描述源程序中某个记号的词法单元集合的规则。
4.字母表:符号的有限集合,例:∑={0,1}串:符号的有穷序列,例:0110,ε语⾔:字母表上的⼀个串集{ε,0,00,000,…},{ε},?正规式(运算符的优先级:*>连接运算>|)N F A是这样⼀个数学模型,包括1)状态集合S2)输⼊字母表∑3)转换函数m o v e:S?(∑?{ε})→P(S)4)唯⼀的初态s∈S5)终态集合F?SD F A是这样⼀个数学模型,包括1)状态集合S2)输⼊字母表∑3)转换函数m o v e:S?∑→S4)唯⼀的初态s∈S5)终态集合F?S第三章语法分析3.1 上下⽂⽆关⽂法上下⽂⽆关⽂法是四元组(V T , V N, S , P )1) V T: 终结符集合(⾮空有限集合,记号名是其同义词)2) V N: ⾮终结符集合(⾮空有限集合)3) S : 开始符号4) P : 产⽣式集合,产⽣式形式 : A →α上下⽂⽆关⽂法没有强制的顺序关系。
编译原理复习
编译原理复习《编译原理》复习README来源⽹络&书本&PPT整理截取了⽼师课上讲解or布置的题⽬⼀些题⽬懒得贴答案了,写了些注意事项第1 章引论运⾏编译程序的计算机:宿主机运⾏编译程序所产⽣的⽬标代码的计算机:⽬标机第1 题解释下列术语:(1)编译程序:如果源语⾔为⾼级语⾔,⽬标语⾔为某台计算机上的汇编语⾔或机器语⾔,则此翻译程序称为编译程序。
(2)源程序:源语⾔编写的程序称为源程序。
(3)⽬标程序:⽬标语⾔书写的程序称为⽬标程序。
(4)编译程序的前端:它由这样⼀些阶段组成:这些阶段的⼯作主要依赖于源语⾔⽽与⽬标机⽆关。
通常前端包括词法分析、语法分析、语义分析和中间代码⽣成这些阶段,某些优化⼯作也可在前端做,也包括与前端每个阶段相关的出错处理⼯作和符号表管理等⼯作。
(5)后端:指那些依赖于⽬标机⽽⼀般不依赖源语⾔,只与中间代码有关的那些阶段,即⽬标代码⽣成,以及相关出错处理和符号表操作。
(6)遍:是对源程序或其等价的中间语⾔程序从头到尾扫视并完成规定任务的过程。
第2 题⼀个典型的编译程序通常由哪些部分组成?各部分的主要功能是什么?并画出编译程序的总体结构图。
(区别编译程序的六个阶段)答案:⼀个典型的编译程序通常包含8 个组成部分,它们是词法分析程序、语法分析程序、语义分析程序、中间代码⽣成程序、中间代码优化程序、⽬标代码⽣成程序、表格管理程序和错误处理程序。
其各部分的主要功能简述如下。
词法分析程序:输⼈源程序,拼单词、检查单词和分析单词,输出单词的机内表达形式。
语法分析程序:检查源程序中存在的形式语法错误,输出错误处理信息。
语义分析程序:进⾏语义检查和分析语义信息,并把分析的结果保存到各类语义信息表中。
中间代码⽣成程序:按照语义规则,将语法分析程序分析出的语法单位转换成⼀定形式的中间语⾔代码,如三元式或四元式。
中间代码优化程序:为了产⽣⾼质量的⽬标代码,对中间代码进⾏等价变换处理。
编译原理 复习资料
教材资料授课顺序:1教学目的:正确理解什么是编译程序;了解编译程序工作的基本过程及其各阶段的基本任务;熟悉编译程序总框;了解编译程序的生成过程和构造工具。
教学重点与难点:编译程序工作的基本过程及其各阶段的基本任务,编译程序总框。
授课学时:2学时教学方式:多媒体讲授教学内容:第一章引论1.1什么是编译程序一、基本概念1、翻译程序:是指这样的一种程序,它能够把一种语言程序(源语言程序)转换成另一种功能等价的语言程序(目标语言程序)。
2、编译程序是一种翻译程序,其源程序是高级语言,目标语言程序是低级语言。
通常是一次性翻译方式。
如TC等高级语言编译程序。
3、解释程序也是一种翻译程序,它与编译程序的区别:立即执行源程序,通常是逐句翻译执行。
如BASIC、SQL、JA V A的BYTECODE解释程序等。
二、高级语言程序的处理过程高级程序设计语言程序的典型处理过程如下图所示:1.2编译过程和编译程序结构一、编译过程的阶段划分一般编译程序的工作过程按阶段进行,每个阶段将源程序从一种表示形式转换成另一种表示形式。
典型的阶段划分方法是将整个编译过程分为如下六个阶段:1、词法分析:任务:对构成源程序的字符串进行扫描和分解,识别出单词(如标识符等)符号。
输入:源程序输出:单词符号序列例子:有待分析源程序:main(){int x=10,y;}词法分析后的输出:1)保留字:main2)界符:左圆括号(3)界符:右圆括号)4)界符:左大括号{5)保留字:int6)标识符:x7)运算符:=8)常数:10 ,界符:,9)标识符:y10)界符:;11)界符:右大括号}2、语法分析任务:根据语言的语法规则对单词符号串(符号序列)进行语法分析,识别出各类语法短语(可表示成语法树的语法单位),判断输入串在语法上是否正确。
输入:单词序列输出:语法分析后的单词序列3、语义分析任务:按语义规则对语法分析器归约出的语法单位进行语义分析,审查有无语义错误,为代码生成阶段收集类型信息,并进行类型审查和违背语言规范的报错处理。
编译原理考试知识点复习
第一章:编译过程的六个阶段:词法分析,语法分析,语义分析,中间代码生成,代码优化,目标代码生成解释程序:把某种语言的源程序转换成等价的另一种语言程序——目标语言程序,然后再执行目标程序。
解释方式是接受某高级语言的一个语句输入,进行解释并控制计算机执行,马上得到这句的执行结果,然后再接受下一句。
编译程序:就是指这样一种程序,通过它能够将用高级语言编写的源程序转换成与之在逻辑上等价的低级语言形式的目标程序(机器语言程序或汇编语言程序)。
解释程序和编译程序的根本区别:是否生成目标代码第三章:Chomsky对文法中的规则施加不同限制,将文法和语言分为四大类:0型文法(PSG)◊ 0型语言或短语结构语言文法G的每个产生式α→β中:若α∈V*VNV*, β∈(VN∪VT)* ,则G是0型文法,即短语结构文法。
1型文法(CSG)◊ 1型语言或上下文有关语言在0型文法的基础上:若产生式集合中所有|α|≤|β|,除S→ε(空串)外,则G是1型文法,即:上下文有关文法另一种定义:文法G的每一个产生式具有下列形式:αAδ→αβδ,其中α、δ∈V*,A∈VN,β∈V+;2型文法(CFG)◊ 2型语言或上下文无关语言文法G的每个产生式A→α,若A∈VN ,α∈(VN∪VT)*,则G是2型法,即:上下文无关文法。
3型文法(RG)◊ 3型语言或正则(正规)语言若A、B∈VN,a∈VT或ε,右线性文法:若产生式为A→aB或A→a左线性文法:若产生式为A→Ba或A→a都是3型文法(即:正规文法)最左(最右)推导在推导的任何一步α⇒β,其中α、β是句型,都是对α中的最左(右)非终结符进行替换规范推导:即最右推导。
规范句型:由规范推导所得的句型。
句子的二义性(这里的二义性是指语法结构上的。
)文法G[S]的一个句子如果能找到两种不同的最左推导(或最右推导),或者存在两棵不同的语法树,则称这个句子是二义性的。
文法的二义性一个文法如果包含二义性的句子,则这个文法是二义文法,否则是无二义文法。
编译原理知识点汇总
编译原理的复习提纲1.编译原理=形式语言+编译技术2.汇编程序:把汇编语言程序翻译成等价的机器语言程序3.编译程序:把高级语言程序翻译成等价的低级语言程序4.解释执行方式:解释程序,逐个语句地模拟执行翻译执行方式:翻译程序,把程序设计语言程序翻译成等价的目标程序5.计算机程序的编译过程类似,一般分为五个阶段:词法分析、语法分析、语义分析及中间代码生成、代码优化、目标代码生成词法分析的任务:扫描源程序的字符串,识别出的最小的语法单位(标识符或无正负号数等)语法分析是:在词法分析的基础上的,语法分析不考虑语义。
语法分析读入词法分析程序识别出的符号,根据给定的语法规则,识别出各个语法结构。
语义分析的任务是检查程序语义的正确性,解释程序结构的含义,语义分析包括检查变量是否有定义,变量在使用前是否具有值,数值是否溢出等。
语法分析完成之后,编译程序通常就依据语言的语义规则,利用语法制导技术把源程序翻译成某种中间代码。
所谓中间代码是一种定义明确、便于处理、独立于计算机硬件的记号系统,可以认为是一种抽象机的程序代码优化的主要任务是对前一阶段产生的中间代码进行等价变换,以便产生速度快、空间小的目标代码编译的最后一个阶段是目标代码生成,其主要任务是把中间代码翻译成特定的机器指令或汇编程序编译程序结构包括五个基本功能模块和两个辅助模块6.编译划分成前端和后端。
编译前端的工作包括词法分析、语法分析、语义分析。
编译前端只依赖于源程序,独立于目标计算机。
前端进行分析编译后端的工作主要是目标代码的生成和优化后端进行综合。
独立于源程序,完全依赖于目标机器和中间代码。
把编译程序分为前端和后端的优点是:可以优化配置不同的编译程序组合,实现编译重用,保持语言与机器的独立性。
7.汇编器把汇编语言代码翻译成一个特定的机器指令序列第二章1.符号,字母表,符号串,符号串的长度计算P18,子符号串的含义,符号串的简单运算XY,Xn,2.符号串集合的概念,符号串集合的乘积运算,方幂运算,闭包与正闭包的概念P19,P20A0={ε}3.重写规则,简称规则。
编译原理期末复习
编译原理期末复习鉴于编译原理马上就要期末考试,我将手中集中的一些资料上的题目进行了整理归类,每种类型题目给出了所涉及到的基本知识,然后对每类题目中的第一道例题进行了做法进行了讲解,剩下的例题请给大家作为练习,答案也都给出,希望对大家复习有所帮助,最后由于时间很紧,整理的有些仓促,整理中难免有遗漏或错误,请大家见谅;注:下面出现的字母中,若无特别说明,小写英文字母为终结符,大写英文字母为非终结符,希腊字母为终结符与非终结符的任意组合;1、简答题或者名词解释下面涉及到的概念中,加下划线的都是在以往一些试卷中出现的原题,务必掌握;注:这类题目老师说答案不会超过一百个字,否则写的再多也不给分,有些点到即可,不要重复啰嗦;1简述编译程序的概念及其构成答:1编译程序:它特指把某种高级程序设计语言翻译成等价的低级程序设计语言的翻译程序;2构成:2简述词法分析阶段的主要任务也有可能问语法分析阶段主要任务答:词法分析的任务是输入源程序,对源程序进行扫描,识别其中的单词符号,把字符串形式的源程序转换成单词符号形式的源程序;语法分析的主要任务是对输入的单词符号进行语法分析根据语法规则进行推导或者归约,识别各类语法单位,判断输入是不是语法上正确的程序3 简述编译程序的构造过程这个大家看看,是对1和2的综合答:1构造词法分析器:用于输入源程序进行词法分析,输出单词符号;2构造语法分析器:对输入的单词符号进行语法分析,识别各类语法单位,判断输入是不是语法上正确的程序3构造语义分析和中间代码产生器:按照语义规则对已归约出的语法单位进行语义分析并把它们翻译成中间代码;4构造优化器:对中间代码进行优化;5 构造目标代码生成器:把中间的代码翻译成目标程序;6 构造表格管理程序:登记源程序的各类信息和编译各阶段的进展情况;7构造错误处理程序:对出错进行处理;4 说明编译和解释的区别:1编译要程序产生目标程序,解释程序是边解释边执行,不产生目标程序; 2编译程序运行效率高而解释程序便于人机对话;5 文法:描述语言语法结构的形式规则,一般用一个四元式表示: G=VT ,VN,S,P,其中VT :终结符集合非空 VN:非终结符集合非空,且VTVN= S:文法的开始符号,SVNP:产生式集合有限;6二义性文法:一个文法中存某个句子,它有两个不同的最左或者最右推导,则称该文法是二义性的;例子如文法G :S →if expr then S |otherS →if expr then S else S 句子if e1 then if e2 then s1else s2是二义性的;7文法的形式注:文法的形式一定要牢记,特别是2型和3型文法一定要牢记,不仅在概念题中有用,在下面的根据语言写文法题中也有重要作用,如果所写的文法形式不对,一切都是无用功……10型文法短语文法,图灵机:产生式形式为: ,其中: V T V N 且至少含有一个非终结符; V T V N21型上下文有关文法,线性界限自动机:产生式形式为: 其中:|| ||,仅 S 例外但是S 不得出现在任何产生式右部;32型文法上下文无关文法,非确定下推自动机:产生式形式为:P, PV N , V T V N ; 43型文法正规文法,有限自动机:右线性文法:产生式形如:A B 或 A 其中: V T ;A,BV N 左线性文法:产生式形如:A B 或 A 其中: V T ;A,BV N例题:设G=V T ,V N ,S,P 是一个上下文无关文法,产生集合P 中的任一个产生式应具有什么样的形式若G 是1型文法呢若G 是正则文法呢 上下文无关文法, 产生式形式为:P, PV N , V T V N ; 1型文法:产生式形式为: 其中:|| ||,仅 S 例外;正则文法:右线性文法:产生式形如:A B 或 A 其中: V T ;A,BV N左线性文法:产生式形如:A B 或 A 其中: V T ;A,BV N 8什么是PDA 下推自动机答:PDA 是下推自动机,PDA M 用一个七元组表示K,Σ,f,H,h0,S,Z K: 有穷状态集 :输入字母表有穷 H:下推栈符号的有穷字母表h0 :H中的初始符号f: K Σ{} H –> K H S:属于K是初始状态;Z:包含于K,是终结状态集合;9 什么是DFA有穷状态自动机, F,其中:自动机M是一个五元式M=S, , f, S1S: 有穷状态集, 2 :输入字母表有穷,3 f: 状态转换函数,为SS的单值部分映射,fs,a=s’表示:当现行状态为s,输入字符为a时,将状态转换到下一状态s’;我们把s’称为s的一个后继状态;S是唯一的一个初态; 5 FS :终态集可空;4 S10推导:所谓推导就是对于一个含非终结符A的符号串,利用规则A→α,把A替换成α得到新符号串的过程;最左推导:在推导的每一步,选择符号串最左边的非终结符进行替换;最右推导:在推导的每一步,选择符号串最右边的非终结符进行替换;11归约:归约是推倒的逆过程,即用产生式的左部非终结符替换右部符号串;12什么是句型什么称为句子什么是语言句型:从文法的起始符号出发,经过有限步的推导能够推导出来的符号称为句子;句子:只由终结符构成的句型称为句子;语言:所有句子的集合构成该文法描述的语言;13什么是短语什么是直接短语也称为简单短语什么是句柄什么是素短语什么是最左素短语以下几个概念一定要理解,考试中肯定会考哪些是短语,直接短语,句柄等,具体方法请参见后面的短语:如果存在某个文法非终结符P,满足S*⇒βPγ,并且P+⇒α则称α为句型βαγ相对于非终结符P的短语;直接短语:如果Pα,即从P出发一步推出α,则α称为直接短语;句柄:一个句型的最左直接短语称为该句型的句柄;素短语:至少含有一个终结符的短语,并且除了自身外,不包含更小的素短语;最左素短语:句型中最左边的素短语;14自顶向下的语法分析方法中需要解决的主要问题什么如何表示答:1主要需要解决回溯和左递归问题;2表示方式,回溯:文法中存在形如A→α1|α2|…|αn,即产生式右部存在多个候选,导致推导时不能确定到底应该选择哪个候选式;左递归:文法中存在形如P→Pα的形式,推导时会导致推导过程无休止的进行下去;注:解决方法,对回溯采取的是提取左公因子,对左递归使消除左递归包括直接左递归和间接左递归;15内情向量:一般编译程序对数组说明的处理是把数组的有关信息汇集在一个叫做“内情向量”或“信息向量”的表格中,以便以后计算数组元素的地址时引用这些信息;每个数组有一个内情向量;其中的信息包括,数组的类型,维数,各维的上、下界,以及数组的首地址;(16) C语言的活动记录:SP TOP2、最左最右推导,画语法树,找短语、直接短语、句柄等;这种题目很简单,送分题,一定不能丢分考题:1文法GS为:S→SdT | T T→T<G | G G→S | a试给出句型SdG<a的推导过程及语法树,并找出SdG<a的短语,直接简单短语、句柄和最左素短语;分析:1推导和画语法树这些都很简单,不再赘述;2根据所画出的语法树,可以很快的找出短语,直接短语,句柄和最左素短语等,先讲一个简单子树的概念,所谓简单子树是指仅具有单层分支的子树;具体方法如下:短语:任一子树的树叶全体具有共同祖先的叶节点符号串皆为短语;直接短语:任一简单子树的树叶全体具有共同父亲的叶节点符号串皆为简单短语;句柄:最左边的直接短语;素短语:至少含有一个终结符的短语,并且除了自身外,不包含更小的素短语;最左素短语:最左边的素短语;答:1S T T<G G<G S<GSdT<G SdG<GSdG<a语法树:2短语:G,SdG, SdG, a, SdG<a 直接短语:G,a 句柄:G 最左素短:a 注:还有一份试卷将句型改为adT<S,与这个类似,大家自己做做,答案是短语:a,S,T<S,adT<S 直接短语:a,S 句柄:a 最左素短语:SdG下面两道例题大家看看,一定要会找短语,直接短语,句柄等.考题:2文法GE的产生式为E→E+T|T T→TF|F F→i|E①对于句型i+ii,给出最左最右推导及相应的推导树②列出句型的所有短语、简单短语;还有一份试卷上是出句型F+TF的所有短语、简单短语和句柄,大家自己做做答:1最左推导:E TTFFFEFE+TFT+TFF+TFi+TFi+FFi+iFi+ii最右推导ETTFTiFiEiE+TiE+FiE+iiT+iiF+iii+ii推导树如下:2短语;i,i+i,i+i,i+ii 直接短语:i 句柄:i3、根据语言推文法这类题目首先要看清题目,指定的是什么文法,一般都是2型上下无关文法或者3型正规文法,这两类文法形式一定要记住,具体请参见第2页的文法分类;掌握几个基本形式{a n| n>0}对应文法S→aS| a 如果是n>=0则为S→a S|εε是空字{a n b n | n>0}对应文法S→aSb| ab下面这四道题目老是在试卷中重复出现,所以大家好好看看;考题这是书P36 第11题的答案如下:大家作为练习,可以发现比上述题目简单的多了;或者 G4:4、词法分析———正规式、NFA 和DFA 之间的转化:1这类题目一般是三者之间的转换,正规式→NFA →确定化的DFA→最小化的DFA,有时已经给出NFA 了,则只需要确定化为DFA 和最小化就行了,一般每一步都是五分;具体怎么转换请参照我期中考试时整理的提纲,主要就是下面这幅关系对照图,因时间和篇幅限制不再追溯; 2注意优先级关系,闭包运算最高,连接运算.次之,或运算|最低; 3考题1:1构造正则式ab|abb 对应的DFA;15分 ①画出NFA ②确定化DFAG1: S →ACG2: S →ABG3: S →AB A →aAb|εG4:S →1S0|A注:C和E是终态③最小化DFA首先将集合分为{A,B,D,F,G},{C,E};{A,B,D,G}都有a,b作为条件输出,F只有b输出,所以分为{A,B,D,G}和{F} 同理{C,E}分为{C},{E};{A,B,D}a ={B,D} {G}a={F}所以{A,B,D,G}分为{A,B,D}和{G};{A}b ={C} {B,D}a={D}所以分为{A} {B,D}综上所述:划分的结果为{A},{B,D},{C},{E},{G}.考题2:将NFA确定化为DFA10分NFA:含有Y的状态子集为DFA的终态,题目中要求是确定化,{F},{D},{E}然后再画出最小化后的考题3:构造奇数个0和奇数个1组成的自动机;10分状态1:偶数个0 偶数个1 状态2:奇数个0偶数个1状态3:奇数个0 奇数个1 状态4:偶数个0奇数个1如果题目改成偶数个0,奇数个1,只要将状态4转换成终态即可,其他类似;5、语法分析——自顶向下分析法LL1分析法和递归向下构造子程序法注:自顶向下分析法本质是由开始符号,按照产生式逐步推导看能否产生需要分析的句子;1自顶向下分析中存在的问题左递归和回溯具体请参见简答题中的第14题 2消除回溯——提取公因子法提取公共左因子:假定关于A 的规则 A→ 1 | 2 | …| n | 1 | 2 | … | m 其中,每个 不以开头 那么,可以把这些规则改写成A→A | 1 | 2 | … | mA→ 1 | 2 | … | n3消除左递归1消除直接左递归:直接消除见诸于产生式中的左递归:假定关于非终结符P 的规则为P→P | ,其中不以P 开头; 我们可以把P 的规则等价地改写为如下的非直接左递归形式:P→P P→P|注:一般而言,假定P 关于的全部产生式是P→P 1 | P 2 | … | P m | 1 | 2|…|n 其中,每个都不等于,每个都不以P 开头 那么,消除P 的直接左递归性就是把这些规则改写成: P→1P | 2P | … | n P P→1P | 2P |… | m P | 例:文法GE:E→E +T | T T→TF | F F→E | i 经消去直接左递归后变成:E→TE E→+TE | T→FT T →FT | F→E | i2消除间接左递归这个请参见我期中整理的提纲篇幅较多,这里不再重复赘述,请参照下面的考题2;考题1:将文法GS改写为等价的G’S,使得G’S不含左递归和左公因子;S→A A→B|AS B→aB|a答:消除左递归和左公因子后的文法为:S→A A→ BA’A’ → S A’| B→aB’B’ →B|考题2:写出文法GA: A→Ba|Cb|c B→dA|Ae|f C→Bg|h消除左递归后的文法;答:1经分析发现文法GA并无直接左递归;2消除间接左递归:将A,B,C按照B,C,A排序建议将A放在最后由于出现C →Bg形式,将B代入C得:C→dAg|Aeg|fg|h又由于A出现A→Ba A→Cb将B,C带入A得到:A→dAa|Aea|fa|dAgb|Aegb|fgb|hb|c等价于A→Aea|Aegb |dAa|fa|dAgb |fgb|hb|c将A消除直接左递归A→dAaA’|fa A’|dAgb A’ |fgb A’|hb A’|c A’A’→ea A’| egb A’|此时,对于B→dA|Ae|f,C→dAg|Aeg|fg|h由于未在任何产生式的右部出现,所以是多余的;综上所述:消除递归后的文法为:A→dAaA’|fa A’|dAgb A’ |fgb A’|hb A’|c A’A’→ea A’| egb A’|4LL1分析法1含义:LL1分析方法也叫预测分析法:是指从左到右扫描、最左推导LL和只查看一个当前符号括号中的 1;2判断一个文法是否是LL1文法的充要条件:1. 文法不含左递归,2. 对于文法中每一个非终结符A的各个产生式的候选首符集两两不相交;即,若A→ 1| 2|…| n则FIRST i∩FIRST j=ij3. 对文法中的每个非终结符A,若它存在某个候选首符集包含,则FIRSTi∩FOLLOWA= i=1,2,...,n如果一个文法G满足以上条件,则称该文法G为LL1文法;5LL1文法分析表的构造与运用这类题目,主要就是判断文法是否满足LL1文法的三个充要条件,分为以下几步:1首先将文法分解,判断是否有左递归好,有的话肯定不是LL1文法;2算非终结符的First集合和Follow集合,具体方法请参见期中考试的提纲,其实最本质的要抓住first集合是U*a…,Follow集合石…Ua…即可;3算Select集合,书上没有提到Select集合,计算Select集合实质就是计算First,当然考试时不一定非要写成Select集合形式,可以直接计算First来判断交集是否为空,从而是否为LL1文法,请看考题1;4至于判断一个句子的分析过程,大家注意一下,所给的句子不一定是能通过该文法分析出来的,实际上在分析之前可以自己根据文法推推看,请看考题1.5分析表中没有填的空格代表出错,如果分析时遇到了代表该句子不符合该文法; 考题1:判断下面文法是否为LL1文法,若是,请构造相应的LL1分析表并分析句子aabe的分析过程;15分S→aD D→STe|εT→bM M→bH H→M|ε分析:判断一个文法是否为LL1文法是否为LL1文法,主要就是判断是否满足LL1文法的充要条件,有一个不满足就不是LL1文法;对于aabe根据文法SaDaSTeaaDTeaaTeaabMe由于M不能为空字ε,所以最后肯定推不出来,也就是该句子不能由该文法推出,出错;当然一般题目都是LL1文法,否则题目就不好往下做,没有意义;答:1经分析该文法无左递归;2①非终结符的First和Follow集合如下表所示②将文法分解为:S→aD D→Ste D→ε T→bM M→bH H→M H→ε依次计算:FirstaD={a} FirstSte={a}FollowD={ b} FirstbM={b}FirstbH={b} FirstM={b} FollowH={ e }∵FirstSte∩FollowD=ФFirstM∩FollowH=Ф∴该文法是LL1文法LL1分析表如下:3aabe的分析过程如下:考题2:判断下面文法是不是LL1文法,若是请构造相应的LL1分析表,写出aaabd 的分析过程;S→aH H→aMd|d M→Ab|A→aM|e答:1可以判断该文法无左递归;2将文法分解为分解:S→aH H→aMd H→d M→Ab M→A→aM A→e 求First和Follow集合求Select集合SelectS→aH=FirstaH={a} SelectH→aMd=FirstaMd={a}SelectH→d={d} SelectM→Ab=FirstAb={a,e}SelectM→=FirstUFollowM= FollowM={d,b}Select A→aM=First{aM}={a} Select A→e=Firste={e}∵SelectH→aMd ∩SelectH→d= ФSelectM→Ab ∩SelectM→e=ФSelectA→aM ∩SelectA→e= Ф∴该文法是LL1文法;3LL1分析表如下:aaabd的分析过程如下:考题3:构造LL1分析方法的总控流程图6、构造递归下降识别程序这类题目首先看文法有无左递归和左公因子,有的话一定要消除,我期中给大家的答案错了,考题1为更正后的答案;考题1:为文法GE:E → V | V+E V → N | NE N → i构造递归下降识别程序10分解:1提取左公因子:E→VE’E’ →+E|V →NV’V’→E|N → i(3)构造递归下降识别程序PROCEDURE E;BEGINV; E’END; PROCEDURE E’;IF SYM=‘+’ THENBEGINADVANCE;EENDPROCEDURE V;BEGINEND;PROCEDURE F;IF SYM=‘’ THEN BEGINADVANCE; E;IF SYM=‘’PROCEDURE N;IF SYM=‘i’ THENADVANCEELSE ERROR;THENADVANCEELSE ERRORENDELSE ERROR;考题2:为文法GE:E→E+T|T T→TF|F F→E|i构造递归下降识别程序解:1消除左递归:E→TE E→+TE | T→FT T→FT | F→E | i 2构造递归下降识别程序PROCEDURE E;BEGINT;E END;PROCEDURE T;BEGINF;TENDPROCEDURE F;IF SYM=‘i’ THENADVANCEELSEIF SYM=‘’ THENBEGINADVANCE;E;IFSYM=‘’ THENADVANCEELSE ERRORENDELSE ERROR;PROCEDURE E;IF SYM=‘+’ THENBEGINADVANCE; T;EEND PROCEDURE T;IF SYM=‘’ THENBEGINADVANCE; F;TEND7、自底向上分析法——LR0分析法注:自底向上分析法本质是从输入串开始,逐步进行“归约”,直到文法的开始符号,其关键问题是寻找句柄;自底向上分析法还有算符优先分析法,SLR1,LR1等等,老师那天重点讲了一道LR0分析法的题目,他说算符优先分析法A卷不考,但是补考的B卷会考,按照他的意思,这次期末考试LR0是考定的了,SLR1,LR1应该不考,因为LR0分析法个人感觉也是所有题目中最繁的了,下面已老师讲的题目为例这,也是一份试卷上的考题,首先介绍一些相关知识;(1)LR0项目:通俗点讲,文法G中的任何一个产生式的右部的任何位置添加一个圆点就成了LR0项目,比如A→Ab是产生式,则A→Ab A→Ab A→Ab都是该产生式对应的全部项目;项目动态的表示归约的一个阶段:对于项目A→A b,可以这样理解它:“”之前的A表示的是在识别Ab过程中已输入到栈终的部分;“”之后的表示在识别Ab过程中期望出现的部分;“”表示则是在识别Ab过程中当前的识别进度的定位;项目A→Ab 已经具备了识别Ab的一切条件,因此被称为归约项目;项目可以分为以下四类:P→αaβ称为移进项目其中, P→αXβ称为待约项目,其中X为非终结符,P→α称为归约项目,S’→S称为接收项目2LR0的分析栈可以看成两部分状态栈LR分析器的核心是一张分析表:ACTIONs,a:当状态s面临输入符号a时,应采取什么动作.GOTOs,X:状态s面对文法符号X时,下一状态是什么. 下面几张PPT大家看看,对基本概念有个印象:这一章的概念较多较抽象,我一时半会也讲不完讲不清楚,这里不再赘述,直接看题目,知道怎么做就行,下面以一道考题这也是老师讲的原题为例讲解如何做这类题目,首先一般这种题目分三步走:1拓广文法:假定文法G是一个以S为开始符号的文法,我们构造一个G,它包含了整个G,但它引进了一个不出现在G中的非终结符S,并加进一个新产生式S→S,而这个S是G的开始符号;那么,我们称G是G的拓广文法;这样,便会有一个仅含项目S→S.的状态,这就是唯一的“接受”态;2构造识别文法活前缀的DFA:对于任意的项目即I,其闭包CLOSUREI计算方法如下,I中的所有项目都属于CLOSUREI;如果P→αXβ,并且X为非终结符,则所有形如X→γ的项目也属于ClOSUREI定义函数GOI,X,其中I是项目集,X是任意的文法符号终结符,非终结符都可以,GOI,X=CLOSUREJ.J是从I中项目出发后读取X后到达的后继项目,即J={P→αXβ| P→αXβ∈I}有了上述CLOSURE和GO的定以后,从CLOSURE{S→S}出发,利用GO函数,产生出它在每个可能的文法符号下,要转移的项目集,再对新产生的项目集采取同样的方法直到没有新产生的项目集未被处理为止;(4) 根据计算出的项目集之间的关系画出DFA 和LR0分析表,其中LR0构造方法如下:(5) 对具体的句子运用LR0分析的方法如下: 每一项ACTIONs,a 所规定的四种动作:1. 移进 把s,a 的下一状态s’和输入符号a 推进栈,下一输入符号变成现行输入符号.2. 归约 指用某产生式A →β进行归约. 假若β的长度为r, 归约动作是, 去除栈顶r 个项,使状态s m-r 变成栈顶状态,然后把s m-r, A 的下一状态s’=GOTOs m-r, A 和文法符号A 推进栈.3. 接受即acc 宣布分析成功,停止分析器工作.4. 报错 考题:构造文法GE 的LR0分析表,并给出accd 的分析过程; 0S→E1E →aA 2E →bB 3A →cA 4 A →d 5B →cB 6B →d分析:题中已经进行了推广文法,所以第一步就不需要了,下面就是开始构造识别活前缀的DFA,然后构造出LR0分析表,最后在进行分析,实际上对于accd 我们自己可以先推一下,EaAacAaccAaccd 所以该句子符合文法,那么最终构造出的LR0分析表对该句子进行分析后必定得到“acc ”接受的意思,否则构造的LR0分析表出错; 答:1构造识别活前缀的DFA:I 0=Closure{S→E }={ S→E , E→aA, E→bB } I1=GOI0,E=Closure{S→E }={ S→E }I 2=GOI 0,a=Closure{ E→aA }={ E→aA ,A→cA ,A→d } I 3=GOI 0,b=Closure{ E→bB }={E →bB, B→cB ,B→d }为了方便,下面计算中的Closure 不再写了,直接给出答案,考试时可以不写,当然计算I 0是必须要的I 4=GOI 2,A={ E→aA} I 5=GOI 2,c={ A→cA ,A→cA ,A→d } I 6= GOI 2,d={ A→d} I 7=GOI 3,B ={ E→bB}I 8= GOI 3,c= { B→cB ,B→cB ,B→d } I 9= GOI 3,d={ B→d} I 10= GOI 5,A ={ A→cA } GOI 5,c=I 5 GO=I 6 I 11= GOI 8,B { B→cB } GOI 8,c=I 8 GO=I 9 画出DFA:注:实际上构造LR0分析表时这个图没有必要画,根据上述计算结果即可填写下表; 2画出LR0分析表注:至于怎么填这个表请参见上一页中的PPT,这里不再赘述,Action 表中si 代表跳转到第i 个状态,ri 代表选择文法中第i 条规则进行归约,acc 代表接受,即分析成功;Goto 表中数字i 代表跳转到第i 个状态; (3)对accd 进行分析逆波兰式和四元式是三地址代码的两种记录表现形式,当然表示形式还有三元式、间接三元式等等,根据老师的意思应该不考,四元式和逆波兰式必考;1逆波兰表达式逆波兰表达式即后缀表达式,就是中缀表达式也就是我们一般看到的表达式形式对应的后续遍历结果,这个方法有很多,个人认为搞清楚运算优先级,观察一下就可写出,先算谁就将其对应的操作数写出,运算符放在后面就行很简单:例如:写出下列各式的逆波兰表示1 -a-bc/c-d + -ba2 -A+BC↑ D/E/F解: 1 abccd-/ba+ - 2 ABCDE/↑F/+注:代表负号“-”2四元式四元式形式如下op,arg1,arg2,Result从左至右分别代表运算符,第一操作数,第二操作数,运算结果;如:A + B C - D + E / C - D ^N 对应的四元式序列如下:四元式 : 1 - ,C ,D,T1 2 ,B,T1,T23 + ,A,T2,T34 - ,C,D,T45 ^ ,T4,N,T56 / ,E ,T5,T67 + ,T3 ,T6 ,T7注:T1,T2等等位存放结果的临时变量;条件语句等四元式的表示jnz , a ,-- , p 表示 if a goto pjrop, x , y, p 表示 if x rop y goto prop代表关系运算符,如<,>等等j , --, --- , p 表示 goto p例如:写出条件语句 IF a>0 THEN x:=x+1 ELSE x:=4 x- 1 四元式序列解:1 j > , a ,0 ,32 j , -, -,63+,x , 1 , T14 := , T1,-, T25j ,-, -,96 -, x,1, T37 , 4 ,T3 ,T48 := , T4 ,-,x9注意:5和9不能写丢,否则一分没有上述四元式中第二第三个位置的“-”代表没有元素;其实四元式就是对上述程序进行解释,如果满足则跳转到哪里执行,不满足则跳转到哪里执行,大家自己分析一下,应该能够看懂;考题:根据要求写出下列表达式的中间形式;15+6a+b写出表达式的逆波兰式逆波兰表达式为:56ab++2注意:同上题,本题答案加红色的部分此外上述编号随意,从0开始也行从100开始也行;不能丢,否则一分没有9、参数传递这种题目很简单,是送分题,一定要做对参数传递方式分为三种,值传递,地址传递和传名;值传递过程中形参值的改变不会影响实参值的改变,地址传递形参值的改变导致对应是实参值的改变,传名传递类似于C语言中的宏展开,将实参原封不动的替换相应的形参文字替换;请看下题:(1)高级语言程序中常用的参数传递方式有哪些请根据这些传递方式写出程序的运行结果;static int a=1;int pint x,int y,int z {y=y+1;z=z+x;cout<<"In P "<<a<<endl; } int main{int a=2;int b=3;pa,a,a;cout<<"In main "<<a<<endl; return 0;}分析:函数p中输出地a的值是全局变量a的值,与主函数中的局部变量a无关,不要被迷惑住,所以p中输出的a就是1.传值时,由于实参值不受影响,所以a仍为2;传地址时,在函数P中,将实参代入后a=a+1得a=3;再由a=a+a得到a=6;传名时,直接将实参带入形参,原来程序被替换为:a=a+1;a=a+a;将a=2代入得到结果为6.答:①C语言中函数传递的方式有1传值 2传地址 3传名②运行结果:1传值方式:In P 1In main 2 2传地址:In P 1In main 63传名: In P 1In main 62Procedure p x,y,z ; beginy:=y+1;z:=z+x;end; {p} begina:=2;b:=3;pa+b , a , a print a end.传值传递时输出结果为: 2 实参值不受影响,a=2传地址传递时输出结果为:8 a=2+1=3;a=3+5=8传名传递时输出结果为:9 a=a+1;a=a+a+b;得到a=2+1=3;a=3+3+3=910、程序分块、画DAG图这个也比较简单,具体方法如下:(1)分块就是将程序分成一块块的,主要就是确定每一块的入口语句:1寻找入口语句的方法:满足以下条件之一的都是入口语句a程序的第一条语句;b条件转移语句或无条件转移语句可以转移到的语句c紧跟在条件转移语句后面的语句2对每一入口语句,构造其所属的基本块;它是由该语句到下一入口语句不包括下一入口语句,或到一转移语句包括该转移语句,或到一停语句包括该停语句之间的语句序列组成的;3凡未被纳入某一基本块的语句,都是程序中控制流程无法到达的语句,因而也是不会被执行到的语句,我们可以把它们删除;根据基本块画DAG图上述图中的DAG只给出了最后完整的结果,老师要求在考试中需要把每一步都体现出来,具体请参见书上284页,因为篇幅限制所以不再赘述;另外,根据老师的意思可能会将DAG和四元式结合在一起考,给一段程序,先写出其四元式然后在画出其DAG图,四元式与DAG对应关系如下:根据下面的对应关系,DAG图很容易画出来;。
编译原理复习(有答案)
第一章引论1.编译过程的阶段由词法分析、语法分析、语义分析、中间代码生成、代码优化和目标代码生成六个阶段2.编译程序的概念3.编译程序的结构例:(B)不是编译程序的组成部分。
A. 词法分析器;B. 设备管理程序C. 语法分析程序;D. 代码生成程序4.遍的概念对源程序(或其中间形式)从头至尾扫描一次并进行有关加工处理,生成新的中间形式或最终目标程序,称为一遍。
5.编译程序与解释程序的区别例:解释程序和编译程序是两类程序语言处理程序,它们的主要区别在于(D)。
A. 单用户与多用户的差别B. 对用户程序的差错能力C. 机器执行效率D. 是否生成目标代码第三章文法和语言文法的概念字母表、符号串和集合的概念及运算例:(ab|b)*c 与下面的那些串匹配?(ACD)A. ababbc;B. abab;C. c;D. babc;E. aaabc例:ab*c*(a|b)c 与后面的那些串匹配?(BC)A.acbbcB.abbcacC.abcD.acc例:(a|b)a+(ba)*与后面的那些串匹配? (ADE)A.baB.bbaC.ababaD.aaE.baa文法的定义(四元组表示)文法G定义为四元组(V N,V T,P,S)V N:非终结符集V T:终结符集P:产生式(规则)集合S:开始符号(或识别符号)例:给定文法,A::= bA | cc,下面哪些符号串可由其推导出(①② ⑤)。
①cc ②b*cc ③b*cbcc ④bccbcc ⑤bbbcc什么是推导例:已知文法G:E->E+T|E-T|TT->T*F|T/F|FF->(E)|i试给出下述表达式的推导:i*i+i 推导过程:E->E+T->T+T->T*F+T->F*F+T->i*F+T->i*i+T->i*i+F->i*i+i●句型、句子的概念例:假设G一个文法,S是文法的开始符号,如果S=>*x,则称x是句型。
编译原理总复习
编译原理总复习总复习⼀、基本概念:1、请简单解释编译程序的概念。
答:编译程序是现代计算机系统的基本组成部分之⼀。
简⽽⾔之, 编译程序就是⼀种语⾔翻译程序。
所谓翻译程序,是指这样⼀个程序,它能将⾼级程序设计语⾔程序翻译成逻辑上等价的低级语⾔(汇编语⾔,机器语⾔) 程序。
编译程序⼀般由词法分析程序、语法分析程序、语义分析程序、中间代码⽣成程序、⽬标代码⽣成程序、代码优化程序、表格管理程序和出错处理程序等成分构成。
2、请解释编译程序的前端和后端的概念,试问前端通常包括那些阶段,后端包括那些阶段?(10分)答:编译程序的前端只依赖于源语⾔,由⼏乎独⽴于⽬标机器的阶段或阶段的⼀部分组成。
编译程序的前端通常包括词法分析程序、语法分析程序、语义分析程序、中间代码⽣成程序及相关的表格管理程序和出错处理程序。
编译程序的后端是指编译器中依赖于⽬标机器的部分,它们⼀般独⽴于源语⾔,⽽与中间代码有关。
通常包括⽬标代码⽣成程序、代码优化程序以及相关的表格管理程序和出错处理程序。
3、语⾔的语法描述⽅法有其三,请列举出来。
答:⽤⾃然语⾔描述语⾔的语法,⽤语法图描述语⾔的语法和⽤巴科斯-瑙尔范式及扩充的巴科斯-瑙尔范式(EBNF)两种形式给出语⾔的语法描述。
答:根据Chomcky⽂法的定义,该⽂法是2类⽂法,即上下⽂⽆关⽂法。
4、请写出Chomcky关于⽂法的定义。
答:Chomcky⽂法的定义:⽂法G定义为四元组,记为:G=(V N,V T,P,S)其中:V N—⾮空有限的⾮终结符号集V T—⾮空有限的终结符号集P —产⽣式集S —开始符号/识别符号5、已知⽂法:(20分)E→X|E+XX→Y|X*YY→(E)|i请判定该⽂法是那类⽂法?5、简单说明词法分析程序的主要任务。
答:词法分析程序是编译程序的⼀个构成成分,它的主要任务是扫描源程序,按构词规则识别单词,并报告发现的词法错误。
6、请简单介绍确定的有穷⾃动机。
答:确定的有穷⾃动机也称有限⾃动机,它是作为⼀种识别装置,它能准确地识别正规集,即识别正规⽂法所定义的语⾔和正规式所表⽰的集合。
编译原理期末复习总结
一、简答题1.什么是编译程序?答:编译程序是一种将高级语言程序(源程序)翻译成低级语言(目标程序)的程序。
将高级程序设计语言程序翻译成逻辑上等价的低级语言(汇编语言,机器语言)程序的翻译程序。
2.请写出文法的形式定义?答:一个文法G抽象地表示为四元组 G=(Vn,Vt,P,S)–其中Vn表示非终结符号–Vt表示终结符号,Vn∪Vt=V(字母表),Vn∩Vt=φ–S是开始符号,–P是产生式,形如:α→β(α∈V+且至少含有一个非终结符号,β∈V*)3.语法分析阶段的功能是什么?答:在词法分析的基础上,根据语言的语法规则,将单词符号串分解成各类语法短语(例:程序、语句、表达式)。
确定整个输入串是否构成语法上正确的程序。
4.局部优化有哪些常用的技术?答:优化技术1—删除公共子表达式优化技术2—复写传播优化技术3—删除无用代码优化技术4—对程序进行代数恒等变换(降低运算强度)优化技术5—代码外提优化技术6—强度削弱优化技术7—删除归纳变量优化技术简介——对程序进行代数恒等变换(代数简化)优化技术简介——对程序进行代数恒等变换(合并已知量)5.编译过程分哪几个阶段?答:逻辑上分五个阶段:词法分析、语法分析、语义分析与中间代码生成、代码优化、目标代码生成。
每个阶段把源程序从一种表示变换成另一种表示。
6. 什么是文法?答:文法是描述语言的语法结构的形式规则。
是一种工具,它可用于严格定义句子的结构;用有穷的规则刻划无穷的集合;文法是被用来精确而无歧义地描述语言的句子的构成方式;文法描述语言的时候不考虑语言的含义。
7. 语义分析阶段的功能是什么?答:对语法分析所识别出的各类语法范畴分析其含义,进行初步的翻译(翻译成中间代码);并对静态语义进行审查。
8.代码优化须遵循哪些原则?答:等价原则:不改变运行结果有效原则:优化后时间更短,占用空间更少合算原则:应用较低的代价取得较好的优化效果9.词法分析阶段的功能是什么?答:逐个读入源程序字符并按照构词规则切分成一系列单词任务:读入源程序,输出单词符号—滤掉空格,跳过注释、换行符—追踪换行标志,指出源程序出错的行列位置—宏展开,……10.什么是符号表?答:符号表在编译程序工作的过程中需要不断收集、记录和使用源程序中一些语法符号的类型和特征等相关信息。
《编译原理》期末复习资料完整版
《编译原理》期末复习资料【题1】(此题中第一个空愉入Q可臥省略,V即①可以眷略渝Ia Ib① 1,2,32,3,42,3,5② 2,3,42,3,4,6,7,82,3,5③ 2,3,52,3,42,,3,5,6,7,8④ 2,3,4,6,7,82,3,4,6,7,82,3,5,7,8⑤ 2,3,5,6,7,82,3,4,7,82,3,5,6,7,8⑥ 2,3,5,7,82,3,4,7,82,3,5,6,7,8⑦ 2,3,4,7,82,3,4,6,7,82,3,5,7,8Ia Ib1232431. ( a|b) * (aa|bb) (a|b) *画出状态转换图。
(1)A={1,2,3} , B={4,5,6,7} Aa={2,4} X(2)A={1,3} , B={2} , C={4,5,6,7} Aa={2} B, Ab={3,5} X(3)A={1} , B={2} , C={3},D={4,5,6,7}(单元素可以不用看,必有,古先看D), Ba={4} D , Bb={3} C, Ca={2} Cb={5} C,则有2. ( a*|b* ) b (ba) *的状态转换图。
Ia lb① 1,2,3,42,43,4,5,6,8②2,42,45,6,8③ 3,4,5,6,8---3,4,5,6,7,8④ 5,6,8---7⑤ 3,4,5,6,7,86,83,4,5,6,7,8⑥76,8---⑦6,8---7la lb1232243—54—657567—7—6abA B CB D CC B DD D D新的状态转换图如下:化简:(用终结状态与非终结状态,然后输出状态一致分一类) (1) A={1,2,6} , B={3,4,5,7} Aa={2} X(2)A={1,2} , B={6} , C={3,4,7} , D={5} Cb={5,6} X(只要有一个不属于任何一个集合,就不行) (3) A={1,2} , B={6} , C={3} , D={4,7} , E={5} Ab={3,4} X(4) A={1} , B={2} , C={6} , D={3} , E={4,7} , F={5}Aa={2} B , Ab={3} D , Ba={2} B , Bb={4}正则表达式: a , a | b, ab,(ab) , (a |b) ,a(a|b) , a | a b,a | ab*Ca={7} E , Db={5}F , Eb={6} C , Fa={7}E , Fb={5} Fab A B D B B E C E --- D --- F E--- C FEFb[注意事项]:[知识要点]:a , a, aa, aaa,a a ;a |b(a或b) a,b ;ab(a禾口b) ab ;ab a | ba | b合}a | ab ab的情2aab开始2ac b开躺终结a终结幵始ab开始终结2{a 和若 ab, abab, ababab a |ba a |b a, b, ab,aab, aaab, aaaab a | b a | ba | a ba,b, aab, aabb, baba个(包括 o{a 和a 后跟若 a | ba aaa |ba, ab, abb, abbb,abbbb,个a (包括0的情形)后跟一个 b 构成的符号串集7Vrvb 构成的符号串集合} 状态转换图(有穷状态自动机)是最左边一个字母一定是 a ,其余字母为a 、b 的任意组合,不包括终结【题2】1•求如下简单算术表达式文法G enr中语法变量的FOLLOW集。
编译原理总复习
DFA和NFA
DFA M=K,,f,S,Z
K为状态的有穷非空集; 为有穷输入字母表; f是转换函数,是在K×Σ* →K上的映射; S∈K是唯一的一个初态; Z K是终止状态集; K为状态的有穷非空集; 为有穷输入字母表; f是转换函数,是在K×Σ* →2K上的映射; SK是初始状态集; Z K为终止状态集.
3. 4.
解释程序和一些软件工具 程序设计语言泛型
1.1 什么是编译程序
编译程序是现代计算机系统的基本组成部分。
1.1 什么是编译程序
编译程序是一个语言翻译程序。
高级语言程序 (源程序)
编译程序
机器(汇编种语言(源语言)书写的程序翻译 成另一种语言(目标语言)的等价程序。 编译程序把高级语言所写的源程序翻译成等价的 机器语言或汇编语言的目标程序。
符号串的头尾,固有头和固有尾 符号串的连接 符号串的方幂 符号串集合的乘积 符号串集合的方幂 符号串集合的闭包
符号串集合——句子的集合
主要目的:将语言形式化表示的基础
知识点二:文法的形式定义
规则的非空有穷集合,通常表示 成四元组 G={VN,VT, P, S } VN是规则中非终结符号的集合。
文法等价 若L(G1)=L(G2),则称文法G1和G2是等价的
知识点四: 文法的类型
通过对产生式施加不同的限制,Chomsky将文 法分为四种类型:
0型文法:对任一产生式α →β ,都有α ∈ (VN∪VT)* 且 至少含有一个非终结符, β ∈(VN∪VT)* 1型文法:对任一产生式α →β ,都有|β |≥|α |, 仅 仅 S→ε 除外 2型文法:对任一产生式α →β ,都有α ∈VN , β ∈(VN∪VT)* 3型文法:任一产生式α →β 的形式都为A→aB或A→a, 其中A∈VN ,B∈VN ,a∈VT *