词法分析器的设计
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
学生实验报告册2017 ——2018 学年第1学期
学院:信息与电气工程学院
专业:计算机科学与技术
姓名:***
学号:*********
班级:计算机2班
实验一词法分析器的设计
一、实验目的
1、通过设计编制一个调试一个具体的此法分析程序,理解词
法分析在编译程序中的作用。
2、加深对有穷自动机模型的理解。
3、掌握词法分析程序的实现方法和要求。
4、用C语言,对一个简单语言的子集编制一个一遍扫描的
程序,以加深对编译原理的理解,掌握编译程序的实现方
法和技术。
编制一个读单词过程,从输入的源程序中,识别出
各个具有独立意义的单词,即基本保留字、标识符、
常数、运算符、分隔符五大类,并依次输出各个单
词的内部编码及单词符号自身值(遇到错误时课显
示“Error”,然后跳过错误部分继续显示)
一、程序要求
程序输入/输出示例
如源程序为C语言,输入如下一段:
Main()
{
int a,b;
a = 10;
b = a + 20;
}
要求输出如下图
(2,main) (4,=)
(5,() (3,10)
(5,)) (5,;)
(5,{) (2,b)
(1,int) (4,=)
(2,a) (2,a)
(5,,) (4,+)
(2,b) (3,20)
(5,;) (5,;)
(2,a) (5,})
要求:
1、识别保留字:if,int,for,while,do,return,break,continue; 单
词识别码为1;
2、其他的都识别为标识符;单词识别码为2;
3、常数为无符号整数;单词识别码为3;
4、运算符包括:+,-,*,/,=,<,<=,!=;单词识别码为4;
5、分隔符包括:,、;、{、}、(、);单词识别码为5;
二、实验步骤
1、定义部分:定义常亮、变量、数据结构。
2、初始化:从文件源程序全部输入到字符缓冲区中。
3、取单词前后去掉多余空格和回车空行。
4、取单词:读出单词的每一个字符,组成单词,分析类型。
(1)识别标识符(包括保留字)
关键字作为特殊标识符处理,把他们预先安排在
一张表格中(保留字表),当扫描程序识别标识符
时,查找关键字,否则一般标识符,
识别保留字:if,int,for,while,do,return,break,continue;
单词识别码为1;其他的都识别为标识符;单词识
别码为2。
(2)识别常数:
注意:常数的有效范围,如果产生溢出则设置syn
的值,与主函数的代码呼应。常数为无符号整数;
单词识别码为3。
(3)识别运算符
区分运算符<和<=,>和>=,+和++,--和--。
运算符包括:+,-,*,/,=,<,=,<=,!=;单词识别码
为4;
(4)识别分隔符
分隔符包括:,、;、{、}(、)单词识别码为5;
5、流程图
三、程序代码
#include
#include
char program[80],token[8];
char ch;
int syn,p,m,n,row;
long int sum;
char *key[8]={"if","int","for","while","do","return","break","continue"};
void scaner()
{
for(n=0;n<8;n++)
token[n]=NULL;
m=0;
ch=program[p++];
while((ch==' ')||(ch=='\n'))
ch=program[p++];
if(((ch<='z')&&(ch>='a'))||((ch<='Z')&&(ch>='A')))
{
//标识符判断
while(((ch<='z')&&(ch>='a'))||((ch<='Z')&&(ch>='A'))||((ch>='0')&&(ch<='9')))
{
token[m++]=ch;
ch=program[p++];
}
p--;
syn=2;
for(n=0;n<8;n++)
if(strcmp(token,key[n])==0)
{
syn=1;
break;
}
}
else if((ch>='0')&&(ch<='9'))
{
//无符号常数的判断
sum = 0;
while((ch>='0')&&(ch<='9'))
{
sum=sum*10+ch-'0';
ch=program[p++];
}
p--;
syn=3;
}
else
{
switch(ch)
{
case '<':
token[m++]=ch;
ch=program[p++];
if(ch=='=')
{
syn=4;
token[m++]=ch;
}
else
{
syn=4;
p--;
}
break;
case '>':
token[m++]=ch;
ch=program[p++];
if(ch=='=')
{
syn=4;
token[m++]=ch;
}
else
{
syn=4;
p--;
}
break;
case '+':
token[m++]=ch;
ch=program[p++];
if(ch=='+')
{