编译原理课程设计——算术表达式、for、while语句转换为四元式
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
计算机与信息学院
《操作系统与编译原理联合课程设计报告》
专题:编译原理部分
学生姓名:
学号:
专业班级:
指导教师:
2014 年 7 月
一、设计目标
设计一个语法制导翻译器,将算术表达式、for语句、while语句翻译成四元式。要求先确定一个定义算术表达式、for语句、while语句的文法,为其设计一个语法分析程序,为每条产生式配备一个语义子程序,按照一遍扫描的语法制导翻译方法,实现翻译程序。对用户输入的任意一个正确的表达式,程序将其转换成四元式输出。
二、设计思路
开发平台:Visual C++ MFC
解决这个问题的方案分为以下几个步骤:
1.将算数表达式、for语句、while语句转换为四元式的第一步为对读入的表达式进行处理,即删除不必要的空格、回车、换行等,保证之后的步骤能够顺利进行。
2.分析算术表达式、for语句、while语句的文法。
3.通过词法分析判断语句中的每个字符的类型,如:数字、字母、符号等。
4.建立每种文法的LR(0)分析表,通过每个文法的LR(0)分析表对相应的表达式进行语法分析。
5.在语法分析正确的情况下,通过语法分析的中间过程的符号栈输出四元式,四元式的形式为:(op arg1 arg2 result)。
(一)算术表达式转换为四元式
将算术表达式转换为四元式首先考虑了括号的
问题,对于不同的算术表达式第一步进行词法分析,
即确定各种符号的位置。而括号中的式子是优先级
最高的,应该最先进行处理。我使用了一个数组记
录算术表达式中括号的位置,并且定义了first_cc
和first_jj函数对括号内的乘除法和加减法分别
进行处理。后将括号内的式子以四元式的形式输出。
通过以上转换,已将原算术表达式中的括号中
的内容使用大写字母’A’、’B’……等代替(其
中定义声明了change函数,用来将括号部分替换为
大写字母)。新的式子中,只含有加减乘除以及赋值
这四种运算,后根据优先级的不同,逐步生成四元
式。
其算法流程图如右图所示。
(二)for语句转换为四元式
1.For语句的文法如下:
S-> f ( E ; F ; G ){ H ;}
S-> f ( E ; X ; Y ){ H ;}
E-> id = c
F-> id < c
G-> id + +
X-> id > c
Y-> id ––
H-> id1 = id2 + id3
H-> id1 = id2 + c
H-> id1 = c+ id2
其中c 表示常数const,f表示关键字for, id表示一般标识符。for循环体内部的表达式一般为算术表达式,而算术表达式转换为四元式的方法在第一部分已给出,此处H只考虑比较简单的情况。
2.for语句的LR(0)分析表如下:
3. 基本算法流程:
本算法定义声明了两个结构体:一个是Node结构体,其中char型的type中存储当前符号的类型,CString型的sValue中存储的为当前符号,int型的eValue只有在符号类型为数字的情况下才进行存储,存储数字的大小;另一个为stack结构体,这个结构体是实现
语法分析中的符号栈和状态栈使用的,并未这两个栈分别定义了各自的pop函数和push函数。
除此之外,本算法中的LR(0)分析表通过二维数组存储。其中分为action表和goto表。action表中的状态转换符号,用2-44表示,规约的符号,用101-110表示。
具体的算法流程图如下:
(三)while语句转换为四元式
1.while语句的文法如下:
(1)S->while(B){E}
(2)E->AE
(3)E->A
(4)A->iPA
(5)A->i
(6)B->iTi
(7)B->i
其中while、( 、) 、{ 、} 、P、T 、;和i均为终结符,而S、A、B、E这些大写字母均为非终结符。T表示比较运算符,P表示算术运算符,i表示合法标识符。
2.While语句的LR(0)分析表如下:
3.基本算法流程:
本算法的基本思想与for语句转换成四元式的思想比较相似,都是对读入的语句进行词法分析,后再通过LR(0)分析表对语句进行语法分析,并同时输出四元式。
与for语句转换成四元式不同的是,while语句转换为四元式在结构体定义等方面做了改进。首先是LR(0)分析表的存储方式进行了改进,本算法中为LR(0)分析表定义了一个table的结构体,将action和goto两个部分全部存入table的结构体中,是查表的时候更加方便。
除此之外,还定义了obj结构体,此结构体主要是为了存储所要输出的四元式,定义了此结构体之后,程序的调理变得更为清晰了。
本算法中符号栈以及状态栈的部分主要调用了c++中原有的stack结构体,使用其本身定义的pop函数以及push函数,简化的代码。
以下为算法的流程图:
(四)输入、输出以及界面设计
1.输入:
本程序的输入均为语句或表达式,若每次测试程序均输入表达式,则会输入大量式子,浪费时间。所以本程序采用文件读入的形式,只需要在指定位置输入文件名即可。
2.输出:
本程序输出的四元式全部在MFC界面的文本框中显示。可以复制,方便之后的使用。
3.界面设计:
本程序为了方便使用以及界面美观,使用了MFC中的TabControl控件,界面设计如下: