词法分析实验原理_编译原理实验报告范文分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

词法分析实验原理_编译原理实验报告范文分析

1.实验目的根据Sample语言或者自定义的某种语言,设计该语言的

编译前端。包括词法分析,语法分析、语义分析及中间代码生成部分。

2.实验内容及要求

(1)词法分析器

输入源程序,输出对应的token表,符号表和词法错误信息。按规则

拼单词,并转换成二元形式;滤掉空白符,跳过注释、换行符及一些无用

的符号;进行行列计数,用于指出出错的行列号,并复制出错部分;列表

打印源程序;发现并定位词法错误;

(2)语法分析器

输入token串,通过语法分析,寻找其中的语法错误。要求能实现Sample语言或自定义语言中几种最常见的、基本的语法单位的分析:算

术表达式、布尔表达式、赋值语句、if语句、for语句、while语句、dowhile语句等。

(3)语义分析和中间代码生成

输入token串,进行语义分析,修改符号表,寻找其中的语义错误,

并生成中间代码。要求能实现Sample语言或自定义语言中几种最常见的、基本的语法单位的分析:算术表达式、布尔表达式、赋值语句、if语句、for语句、while语句、dowhile语句等。

实验要求:功能相对完善,有输入、输出描述,有测试数据,并介绍

不足。

3.实验方案设计

3.1编译系统原理介绍

编译器逐行扫描高级语言程序源程序,编译的过程如下:

(1).词法分析

识别关键字、字面量、标识符(变量名、数据名)、运算符、注释行(给人看的,一般不处理)、特殊符号(续行、语句结束、数组)等六类

符号,分别归类等待处理。

(2).语法分析

一个语句看作一串记号(Token)流,由语法分析器进行处理。按照

语言的文法检查判定是否是合乎语法的句子。

如果是合法句子就以内部格式保存,否则报错。直至检查完整个程序。

(3).语义分析

语义分析器对各句子的语法做检查:运算符两边类型是否相兼容;该

做哪些类型转换(例如,实数向整数赋值要"取整");控制转移是否到不

该去的地方;是否有重名或者使语义含糊的记号,等等。如果有错误,则

转出错处理,否则可以生成执行代码。

.中间代码生成中间代码是向目标码过渡的一种编码,其形式尽可能

和机器的汇编语言相似,以便下一步的代码生成。

但中间码不涉及具体机器的操作码和地址码。

采用中间码的好处是可以在中间码上做优化。

.优化

对中间码程序做局部优化和全局(整个程序)优化,目的是使运行更快,占

用空间最小。局部优化是合并冗余操作,简化计算,例如某:=0可用

一条"清零"指令替换。全局优化包括改进循环、减少调用次数和快速地址

算法等。

.代码生成

由代码生成器生成目标机器的目标码(或汇编)程序,其中包括数据分段、

选定寄存器等工作,然后生成机器可执行的代码。

3.1.1编译程序介绍

编译程序是指把用高级程序设计语言书写的源程序,翻译成等价的机

器语言格式目标程序的翻译程序。编译程序属于采用生成性实现途径实现

的翻译程序。它以高级程序设计语言书写的源程序作为输入,而以汇编语

言或机器语言表示的目标程序作为输出。编译出的目标程序通常还要经历

运行阶段,以便在运行程序的支持下运行,加工初始数据,算出所需的计

算结果。

3.1.2对所写编译程序的源语言的描述

Sample语言是一种类PASCAL语言,他以赋值语句为基础,包括顺序、条

件和循环三种结构。有变量说明和常量说明,有多种数据类型、如整型、实型、字符型等。它包括如下一些语法成分:

.数据类型:整型、布尔型、实型和字符类型。

.表达式:可进行算术、布尔表达式的运算。

.说明语句:常量说明(用cont定义)、变量说明(用var定义)。

.赋值语句。

.控制语句:if语句、while语句,repeat语句和for循环语句。

⑹.Begin…end复合语句。

.程序(program)语句和结束(end.)语句。

3.2词法分析程序的设计

图1词法分析总流程

词法分析将源程序读入一个个的字符,根据一定的构词规则,识别出各类有用的单词。当输入字母时,开始识别标识符或关键宇,边拼写边从缓冲区读入下一符号,当读入一非字母数字符号时,标识符识别完成,但已多读入一个符号,所以列记数回退。然后查关键字表,判断拼出的符号串是否为关键字。

若是关键字,输出其种别码。否则识别的单词就是标识符,同时输出标识符及其种别码。

当输入数字时,开始识别整数或实数。边拼写边读入下一符号,当遇到“.”时,还要继续拼写该常数(实数情况)。如果遇到E,要识别带指数的常数,当遇到其它非数字符号时,数字常数拼写完毕,列计数也要退1。输出常数及其种别码。

当输入“/”时,开始识别注解或除号,若是注解时,最后两个连续

读出的符号是“某/”,不需再读下一符号,列计数不变。当判定是除号“/”时,已多读入一字符,列计数一1,输出“/”的种别码。

3.3语法分析程序设计

图2语法分析总流程

不断地读入token文件中的单词,根据不同的语句,使用不同的方法

进行分析,直到token文件的结束。程序头部以program开头,变量说明

以var开头,常量说明是以cont开头的,从begin开始就是可执行语句,可执行语句分为五种:for语句(以for语句开头),while语句(以

while开头),if语句(以if开头),repeat语句(以repeat开头),赋值语句(以标识符开头)。每当读到前导词,表明一个新的语法结构的

开始,以此识别该语法单位是否符合定义。

3.4语义分析和中间代码生成程序的设计

4.结果及测试分析

4.1软件运行环境及限制

程序是使用C#语言编写的,开发软件是VS2022。VS是一个基本完整

的开发工具集,它包括了整个软件生命周期中所需要的大部分工具,如UML工具、

代码管控工具、集成开发环境(IDE)等等。所写的目标代码适用于

微软支持的所有平台。使用VS调试程序会很方便,可以实时观察程序的

运行状态。用VS制

相关文档
最新文档