编译原理—pl0实验报告
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
PL/0实验报告
课程名称编译原理
题目名称PL/0编译程序
学生学院计算机科学与技术学院专业班级
学号
学生姓名
班内序号
山东理工大学实验报告纸第 1 页
姓名:蔡鹏飞计算机院_11_级02班同组者成绩_________室温:气压:课程名称:编译原理教师签字
实验项目
编号(1)
PL/0编译程序的分析指导教师鞠传香
实验目的1.熟悉pl/0语言并能编写小程序
2.掌握pl/0编译程序的编译过程(词法分析、语法分析、语义分析等)
实验仪器(编号)
材料、工具
PC机、VC++6.0
(原理概述)
pl/0语言编译程序采用以语法分析为核心、一遍扫描的编译方法。词法分析和代码生成作为独立的子程序供语法分析程序调用。语法分析的同时,提供了出错报告和出错恢复的功能。在源程序没有错误编译通过的情况下,调用类pcode解释程序解释执行生成的类pcode代码。
PL/0语言文法的EBNF表示
EBNF表示的符号说明。
〈〉:用左右尖括号括起来的中文字表示语法构造成分,或称语法单位,为非终结符。
∷= :该符号的左部由右部定义,可读作'定义为'。
| :表示'或',为左部可由多个右部定义。
{ } :花括号表示其内的语法成分可以重复。在不加上下界时可重复0到任意次数,
有上下界时为可重复次数的限制。
如:{*}表示*重复任意次,{*}38表示*重复3-8次。
[ ] :方括号表示其内的成分为任选项。
( ) :表示圆括号内的成分优先。
例:用EBNF描述<整数>文法的定义:
<整数>∷=[+|-]<数字>{<数字>}
<数字>∷=0|1|2|3|4|5|6|7|8|9
或更好的写法
<整数>∷=[+|-]<非零数字>{<数字>}|0
<非零数字>∷=1|2|3|4|5|6|7|8|9
<数字>∷=0|<非零数字>
PL/0语言文法的EBNF表示
PL/0语言文法的EBNF表示为:
〈程序〉∷=〈分程序〉.
〈分程序〉∷=[〈常量说明部分〉][〈变量说明部分〉][〈过程说明部分〉]〈语句〉
〈常量说明部分〉∷=CONST〈常量定义〉{,〈常量定义〉};
〈常量定义〉∷=〈标识符〉=〈无符号整数〉
〈无符号整数〉∷=〈数字〉{〈数字〉}
〈变量说明部分〉∷=VAR〈标识符〉{,〈标识符〉};
〈标识符〉∷=〈字母〉{〈字母〉|〈数字〉}
〈过程说明部分〉∷=〈过程首部〉〈分程序〉{;〈过程说明部分〉};
〈过程首部〉∷=PROCEDURE〈标识符〉;
〈语句〉∷=〈赋值语句〉|〈条件语句〉|〈当型循环语句〉|
〈过程调用语句〉|〈读语句〉|〈写语句〉|〈复合语句〉|〈空〉
〈赋值语句〉∷=〈标识符〉∶=〈表达式〉
〈复合语句〉∷=BEGIN〈语句〉{;〈语句〉}END
〈条件〉∷=〈表达式〉〈关系运算符〉〈表达式〉|ODD〈表达式〉
〈表达式〉∷=[+|-]〈项〉{〈加法运算符〉〈项〉}
〈项〉∷=〈因子〉{〈乘法运算符〉〈因子〉}
〈因子〉∷=〈标识符〉|〈无符号整数〉|'('〈表达式〉')'
〈加法运算符〉∷=+|-
〈乘法运算符〉∷=*|/
// 栈顶指针减一
相关过程:base(),interpret()。其中base()的功能是根据层次差并从当前数据区沿着静态链查找,以便获取变量实际所在的数据区其地址;interpret()则完成各种指令的执行工作。
错误诊断处理
一个编译程序,在多数情况下,所接受的源程序正文都是有错误的。发现错误,并给出合适的诊断信息且继续编译下去从而发现更多的错误,对于编译程序而言是完全必要的。一个好的编译器,其特征在于:
任何输入序列都不会引起编译程序的崩溃。
一切按语言定义为非法的结构,都能被发现和标志出来。
经常出现的错误,程序员的粗心或误解造成的错误能被正确地诊断出来,而不致引起进一步的株连错误。
根据这样的要求,我们为PL/0编译程序制定了以下两条规则:
(1)关键字规则;程序员在写程序时,可能会因为粗心而漏掉语句的分隔符——“;”,但他决不会漏掉算术运算符“+”,对于编译程序而言,不论是分隔符号类的符号还是关键字符号类的符号,它们都具有同等重要的地位。基于这样的特点,我们可以采用不易出错的部分来作为恢复正常步调的标记。每当遇到错误时,分析程序跳过后面的某些部分,直到出现所期望的符号为止。对于程序设计语言来说,这种符号(称为同步符号)的最好选择就是关键字。PL/0的每一种构造语句以begin、if或while开头;每种说明则以var、const或procedure开头。每遇到错误时,编译程序便可跳过一段程序,直到遇到这类符号为止,而继续编译。
(2)镇定规则;自顶向下分析的特点在于目标对分成一些子目标,分程序则用别的分析程序来处理其子目标。镇定规则是说一个分析程序发现了错误,它不应该消极地停止前进,仅仅向调用它的程序报告发生的错误;而应该自己继续向前扫描,找到似乎可以使正常的分析得以恢复的地方。这一规则在程序设计上的含义就是任一分析程序除了正常终止外,没有其它出口。
对于镇定规则,一个可能的严格解释为:一旦发现非法结构,即跳过后面的输入正文,直到下一个可以正确地跟随当前正在分析的句子结构的符号为止。这意味着每一分析程序需知道其当前活动结点的后继符号集合。
为了找到这个后继符号集合,我们给对应语法图的每一个分析过程提供一个显式参数,set,它指明可能的后继集合。不过在任何条件下,如果都跳到输入正文中下一个这种后继符号出现的地方,未免太短视了。程序中所含的错误可能只不过是漏掉了一个符号(如“;”)而己,由此而忽略去源程序的符号集合中,再凑加一些关键字,它们用于标记那些不容忽略的结构的开始符,因此,作为参数传递给分析过程的那些符号就不仅是后继符号了。
对于这样的符号集,我们采用这样的计算策略:先用一些明显的关键符号给它赋初值,然后随着分析子目标的层次深入,逐步补充别的合法符号。为了灵活起见,我们引入test子程序来实现所说的验证工作。
test过程有三个参数:
(1)可允许的下一个符号集合S1,如果当前符号不在此集合中,当即得到一个错误号;
(2)另加的停止符号集合S2,有些符号的出现,虽然无疑是错的,但它们绝对不应被忽略而跳过;
(3)整数n,表示有关错误的诊断号:
void test(symset s1, symset s2, int n)
{ symset s;
if (! inset(sym, s1))
{ error(n);
s = uniteset(s1, s2);
while(! inset(sym, s))