实验1-3-《编译原理》词法分析程序设计方案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
实验1-3-《编译原理》词法分析程序设计方案
实验1-3 《编译原理》S语言词法分析程序设计
方案
一、实验目的
了解词法分析程序的两种设计方法之一:根据状态转换图直接编程的方式;
二、实验内容
1.根据状态转换图直接编程
编写一个词法分析程序,它从左到右逐个字符的对源程序进行扫描,产生一个个的单词的二元式,形成二元式(记号)流文件输出。在此,词法分析程序作为单独的一遍,如下图所示。
源程序词法分析程序二元式文件
具体任务有:
(1)组织源程序的输入
(2)拼出单词并查找其类别编号,形成二元式输出,得到单词流文件
(3)删除注释、空格和无用符号
(4)发现并定位词法错误,需要输出错误的位置在源程序中的第几行。将错误信息输出到屏幕上。
(5)对于普通标识符和常量,分别建立标识符表和常量表(使用线性表存储),当遇到一
个标识符或常量时,查找标识符表或常量表,若存在,则返回位置,否则返回0并且填写符号表或常量表。
标识符表结构:变量名,类型(整型、实型、字符型),分配的数据区地址
注:词法分析阶段只填写变量名,其它部分在语法分析、语义分析、代码生成等阶段逐步填入。
常量表结构:常量名,常量值
三、实验要求
1.能对任何S语言源程序进行分析
在运行词法分析程序时,应该用问答形式输入要被分析的S源语言程序的文件名,然后对该程序完成词法分析任务。
2.能检查并处理某些词法分析错误
词法分析程序能给出的错误信息包括:总的出错个数,每个错误所在的行号,错误的编号及错误信息。
本实验要求处理以下两种错误(编号分别为1,2):
1:非法字符:单词表中不存在的字符处理为
非法字符,处理方式是删除该字符,给出错误信息,“某某字符非法”。
2:源程序文件结束而注释未结束。注释格式为:/* …… */
四、保留字和特殊符号表
单词
代码
1 2 3 4 5 6 7 8 9
单词int cha
r floa
t
vo
id
con
st
fo
r
if else then
单词助记符int cha
r
floa
t
vo
id
con
st
fo
r
if else then
内码
值
- - - - - - - - -
单词
代码
10 11 12 13 14 15 16 17 18
单词w
hil
e swi
tch
bre
ak
be
gi
n
end 标识
符
数字
(包
括整
数和
实
数)
单词助记符w
hil
e
swi
tch
bre
ak
be
gi
n
end id num
内码值- - - - - 在符
号表
中的
位置
在常
数表
中的
位置
单词
代码
19 20 21 22 23 24 25 26 27 单词+ - * / % ( ) [ ] 单词
助记
符
+ - * / % ( ) [ ]
内码
值
- - - - - - - - -
单词
代码
28 28 29 30 单词!= < > <= >= == ;{ }
单词
助记
符
rlop ;{ }
内码
值
!= < > <= >= == - -
单词
代码
37 38 39 40 41 42 43 44 45
单词/= += -= *= %= || &
&
! =
单词助记符/= += -= *= %= or an
d
not =
内码
值
- - - - - - - - -
单词的构词规则:
字母=[A-Za-z]
数字=[0-9]
标识符=(字母|_)(字母|数字)*
数字=数字(数字)*(.数字+| )
四、S语言表达式和语句说明
1.算术表达式:+、-、*、/、%
2.关系运算符:>、>=、<、<=、==、!= 3.赋值运算符:=,+=、-=、*=、/=、%= 4.变量说明:类型标识符变量名表;5.类型标识符:int char float
6.If语句:if 表达式then 语句[else 语句]
7.For语句:for(表达式1;表达式2;表达式3)语句
8.While语句:while 表达式do 语句9.S语言程序:由函数构成,函数不能嵌套定义。
函数格式为:
返回值函数名(参数)
{
数据说明
语句
}
五、程序参考结构说明
Scanner close
Isalpha Isnumber Isanotation Output Isother
Error
主函数
Initscanner Lexscan
1.Initscanner 函数:程序初始化:输入并打开源程序文件和目标程序文件,初始化保留字表 2.Scanner 函数:若文件未结束,反复调用lexscan 函数识别单词。
3.Lexscan 函数:根据读入的单词的第一个字符确定调用不同的单词识别函数 4.Isalpha 函数:识别保留字和标识符 5.Isnumber 函数:识别整数,如有精力,可加入识别实数部分工功能
6.Isanotation 函数:处理除号/和注释 7.Isother 函数识别其他特殊字符
8.Output 函数:输出单词的二元式到目标文