编译原理课程设计——算术表达式、for、while语句转换为四元式

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

计算机与信息学院

《操作系统与编译原理联合课程设计报告》

专题:编译原理部分

学生姓名:

学号:

专业班级:

指导教师:

2014 年 7 月

一、设计目标

设计一个语法制导翻译器,将算术表达式、for语句、while语句翻译成四元式。要求先确定一个定义算术表达式、for语句、while语句的文法,为其设计一个语法分析程序,为每条产生式配备一个语义子程序,按照一遍扫描的语法制导翻译方法,实现翻译程序。对用户输入的任意一个正确的表达式,程序将其转换成四元式输出。

二、设计思路

开发平台:Visual C++ MFC

解决这个问题的方案分为以下几个步骤:

1.将算数表达式、for语句、while语句转换为四元式的第一步为对读入的表达式进行处理,即删除不必要的空格、回车、换行等,保证之后的步骤能够顺利进行。

2.分析算术表达式、for语句、while语句的文法。

3.通过词法分析判断语句中的每个字符的类型,如:数字、字母、符号等。

4.建立每种文法的LR(0)分析表,通过每个文法的LR(0)分析表对相应的表达式进行语法分析。

5.在语法分析正确的情况下,通过语法分析的中间过程的符号栈输出四元式,四元式的形式为:(op arg1 arg2 result)。

(一)算术表达式转换为四元式

将算术表达式转换为四元式首先考虑了括号的

问题,对于不同的算术表达式第一步进行词法分析,

即确定各种符号的位置。而括号中的式子是优先级

最高的,应该最先进行处理。我使用了一个数组记

录算术表达式中括号的位置,并且定义了first_cc

和first_jj函数对括号内的乘除法和加减法分别

进行处理。后将括号内的式子以四元式的形式输出。

通过以上转换,已将原算术表达式中的括号中

的内容使用大写字母’A’、’B’……等代替(其

中定义声明了change函数,用来将括号部分替换为

大写字母)。新的式子中,只含有加减乘除以及赋值

这四种运算,后根据优先级的不同,逐步生成四元

式。

其算法流程图如右图所示。

(二)for语句转换为四元式

1.For语句的文法如下:

S-> f ( E ; F ; G ){ H ;}

S-> f ( E ; X ; Y ){ H ;}

E-> id = c

F-> id < c

G-> id + +

X-> id > c

Y-> id ––

H-> id1 = id2 + id3

H-> id1 = id2 + c

H-> id1 = c+ id2

其中c 表示常数const,f表示关键字for, id表示一般标识符。for循环体内部的表达式一般为算术表达式,而算术表达式转换为四元式的方法在第一部分已给出,此处H只考虑比较简单的情况。

2.for语句的LR(0)分析表如下:

3. 基本算法流程:

本算法定义声明了两个结构体:一个是Node结构体,其中char型的type中存储当前符号的类型,CString型的sValue中存储的为当前符号,int型的eValue只有在符号类型为数字的情况下才进行存储,存储数字的大小;另一个为stack结构体,这个结构体是实现

语法分析中的符号栈和状态栈使用的,并未这两个栈分别定义了各自的pop函数和push函数。

除此之外,本算法中的LR(0)分析表通过二维数组存储。其中分为action表和goto表。action表中的状态转换符号,用2-44表示,规约的符号,用101-110表示。

具体的算法流程图如下:

(三)while语句转换为四元式

1.while语句的文法如下:

(1)S->while(B){E}

(2)E->AE

(3)E->A

(4)A->iPA

(5)A->i

(6)B->iTi

(7)B->i

其中while、( 、) 、{ 、} 、P、T 、;和i均为终结符,而S、A、B、E这些大写字母均为非终结符。T表示比较运算符,P表示算术运算符,i表示合法标识符。

2.While语句的LR(0)分析表如下:

3.基本算法流程:

本算法的基本思想与for语句转换成四元式的思想比较相似,都是对读入的语句进行词法分析,后再通过LR(0)分析表对语句进行语法分析,并同时输出四元式。

与for语句转换成四元式不同的是,while语句转换为四元式在结构体定义等方面做了改进。首先是LR(0)分析表的存储方式进行了改进,本算法中为LR(0)分析表定义了一个table的结构体,将action和goto两个部分全部存入table的结构体中,是查表的时候更加方便。

除此之外,还定义了obj结构体,此结构体主要是为了存储所要输出的四元式,定义了此结构体之后,程序的调理变得更为清晰了。

本算法中符号栈以及状态栈的部分主要调用了c++中原有的stack结构体,使用其本身定义的pop函数以及push函数,简化的代码。

以下为算法的流程图:

(四)输入、输出以及界面设计

1.输入:

本程序的输入均为语句或表达式,若每次测试程序均输入表达式,则会输入大量式子,浪费时间。所以本程序采用文件读入的形式,只需要在指定位置输入文件名即可。

2.输出:

本程序输出的四元式全部在MFC界面的文本框中显示。可以复制,方便之后的使用。

3.界面设计:

本程序为了方便使用以及界面美观,使用了MFC中的TabControl控件,界面设计如下:

相关文档
最新文档