词法分析实验原理_编译原理实验报告范文分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
词法分析实验原理_编译原理实验报告范文分析
1.实验目的根据Sample语言或者自定义的某种语言,设计该语言的
编译前端。包括词法分析,语法分析、语义分析及中间代码生成部分。
2.实验内容及要求
(1)词法分析器
输入源程序,输出对应的token表,符号表和词法错误信息。按规则
拼单词,并转换成二元形式;滤掉空白符,跳过注释、换行符及一些无用
的符号;进行行列计数,用于指出出错的行列号,并复制出错部分;列表
打印源程序;发现并定位词法错误;
(2)语法分析器
输入token串,通过语法分析,寻找其中的语法错误。要求能实现Sample语言或自定义语言中几种最常见的、基本的语法单位的分析:算
术表达式、布尔表达式、赋值语句、if语句、for语句、while语句、dowhile语句等。
(3)语义分析和中间代码生成
输入token串,进行语义分析,修改符号表,寻找其中的语义错误,
并生成中间代码。要求能实现Sample语言或自定义语言中几种最常见的、基本的语法单位的分析:算术表达式、布尔表达式、赋值语句、if语句、for语句、while语句、dowhile语句等。
实验要求:功能相对完善,有输入、输出描述,有测试数据,并介绍
不足。
3.实验方案设计
3.1编译系统原理介绍
编译器逐行扫描高级语言程序源程序,编译的过程如下:
(1).词法分析
识别关键字、字面量、标识符(变量名、数据名)、运算符、注释行(给人看的,一般不处理)、特殊符号(续行、语句结束、数组)等六类
符号,分别归类等待处理。
(2).语法分析
一个语句看作一串记号(Token)流,由语法分析器进行处理。按照
语言的文法检查判定是否是合乎语法的句子。
如果是合法句子就以内部格式保存,否则报错。直至检查完整个程序。
(3).语义分析
语义分析器对各句子的语法做检查:运算符两边类型是否相兼容;该
做哪些类型转换(例如,实数向整数赋值要"取整");控制转移是否到不
该去的地方;是否有重名或者使语义含糊的记号,等等。如果有错误,则
转出错处理,否则可以生成执行代码。
.中间代码生成中间代码是向目标码过渡的一种编码,其形式尽可能
和机器的汇编语言相似,以便下一步的代码生成。
但中间码不涉及具体机器的操作码和地址码。
采用中间码的好处是可以在中间码上做优化。
.优化
对中间码程序做局部优化和全局(整个程序)优化,目的是使运行更快,占
用空间最小。局部优化是合并冗余操作,简化计算,例如某:=0可用
一条"清零"指令替换。全局优化包括改进循环、减少调用次数和快速地址
算法等。
.代码生成
由代码生成器生成目标机器的目标码(或汇编)程序,其中包括数据分段、
选定寄存器等工作,然后生成机器可执行的代码。
3.1.1编译程序介绍
编译程序是指把用高级程序设计语言书写的源程序,翻译成等价的机
器语言格式目标程序的翻译程序。编译程序属于采用生成性实现途径实现
的翻译程序。它以高级程序设计语言书写的源程序作为输入,而以汇编语
言或机器语言表示的目标程序作为输出。编译出的目标程序通常还要经历
运行阶段,以便在运行程序的支持下运行,加工初始数据,算出所需的计
算结果。
3.1.2对所写编译程序的源语言的描述
Sample语言是一种类PASCAL语言,他以赋值语句为基础,包括顺序、条
件和循环三种结构。有变量说明和常量说明,有多种数据类型、如整型、实型、字符型等。它包括如下一些语法成分:
.数据类型:整型、布尔型、实型和字符类型。
.表达式:可进行算术、布尔表达式的运算。
.说明语句:常量说明(用cont定义)、变量说明(用var定义)。
.赋值语句。
.控制语句:if语句、while语句,repeat语句和for循环语句。
⑹.Begin…end复合语句。
.程序(program)语句和结束(end.)语句。
3.2词法分析程序的设计
图1词法分析总流程
词法分析将源程序读入一个个的字符,根据一定的构词规则,识别出各类有用的单词。当输入字母时,开始识别标识符或关键宇,边拼写边从缓冲区读入下一符号,当读入一非字母数字符号时,标识符识别完成,但已多读入一个符号,所以列记数回退。然后查关键字表,判断拼出的符号串是否为关键字。
若是关键字,输出其种别码。否则识别的单词就是标识符,同时输出标识符及其种别码。
当输入数字时,开始识别整数或实数。边拼写边读入下一符号,当遇到“.”时,还要继续拼写该常数(实数情况)。如果遇到E,要识别带指数的常数,当遇到其它非数字符号时,数字常数拼写完毕,列计数也要退1。输出常数及其种别码。
当输入“/”时,开始识别注解或除号,若是注解时,最后两个连续
读出的符号是“某/”,不需再读下一符号,列计数不变。当判定是除号“/”时,已多读入一字符,列计数一1,输出“/”的种别码。
3.3语法分析程序设计
图2语法分析总流程
不断地读入token文件中的单词,根据不同的语句,使用不同的方法
进行分析,直到token文件的结束。程序头部以program开头,变量说明
以var开头,常量说明是以cont开头的,从begin开始就是可执行语句,可执行语句分为五种:for语句(以for语句开头),while语句(以
while开头),if语句(以if开头),repeat语句(以repeat开头),赋值语句(以标识符开头)。每当读到前导词,表明一个新的语法结构的
开始,以此识别该语法单位是否符合定义。
3.4语义分析和中间代码生成程序的设计
4.结果及测试分析
4.1软件运行环境及限制
程序是使用C#语言编写的,开发软件是VS2022。VS是一个基本完整
的开发工具集,它包括了整个软件生命周期中所需要的大部分工具,如UML工具、
代码管控工具、集成开发环境(IDE)等等。所写的目标代码适用于
微软支持的所有平台。使用VS调试程序会很方便,可以实时观察程序的
运行状态。用VS制