词法分析器的设计 - 360文档中心

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

学生实验报告册2017 ——2018 学年第1学期

学院：信息与电气工程学院

专业：计算机科学与技术

姓名：***

学号：*********

班级：计算机2班

实验一词法分析器的设计

一、实验目的

1、通过设计编制一个调试一个具体的此法分析程序，理解词

法分析在编译程序中的作用。

2、加深对有穷自动机模型的理解。

3、掌握词法分析程序的实现方法和要求。

4、用C语言，对一个简单语言的子集编制一个一遍扫描的

程序，以加深对编译原理的理解，掌握编译程序的实现方

法和技术。

编制一个读单词过程，从输入的源程序中，识别出

各个具有独立意义的单词，即基本保留字、标识符、

常数、运算符、分隔符五大类，并依次输出各个单

词的内部编码及单词符号自身值（遇到错误时课显

示“Error”，然后跳过错误部分继续显示）

一、程序要求

程序输入/输出示例

如源程序为C语言，输入如下一段：

Main()

{

int a,b;

a = 10;

b = a + 20;

}

要求输出如下图

(2,main) (4,=)

(5,() (3,10)

(5,)) (5,;)

(5,{) (2,b)

(1,int) (4,=)

(2,a) (2,a)

(5,,) (4,+)

(2,b) (3,20)

(5,;) (5,;)

(2,a) (5,})

要求：

1、识别保留字：if,int,for,while,do,return,break,continue; 单

词识别码为1；

2、其他的都识别为标识符；单词识别码为2；

3、常数为无符号整数；单词识别码为3；

4、运算符包括：+,-,*,/,=,<,<=,!=；单词识别码为4；

5、分隔符包括：，、；、{、}、（、）；单词识别码为5；

二、实验步骤

1、定义部分：定义常亮、变量、数据结构。

2、初始化：从文件源程序全部输入到字符缓冲区中。

3、取单词前后去掉多余空格和回车空行。

4、取单词：读出单词的每一个字符，组成单词，分析类型。

（1）识别标识符（包括保留字）

关键字作为特殊标识符处理，把他们预先安排在

一张表格中（保留字表），当扫描程序识别标识符

时，查找关键字，否则一般标识符，

识别保留字：if,int,for,while,do,return,break,continue;

单词识别码为1；其他的都识别为标识符；单词识

别码为2。

(2)识别常数：

注意：常数的有效范围，如果产生溢出则设置syn

的值，与主函数的代码呼应。常数为无符号整数；

单词识别码为3。

(3)识别运算符

区分运算符<和<=,>和>=,+和++，--和--。

运算符包括：+，-，*，/，=，<,=,<=,!=;单词识别码

为4；

(4)识别分隔符

分隔符包括：，、；、{、}（、）单词识别码为5；

5、流程图

三、程序代码

#include

char program[80],token[8];

char ch;

int syn,p,m,n,row;

long int sum;

char *key[8]={"if","int","for","while","do","return","break","continue"};

void scaner()

{

for(n=0;n<8;n++)

token[n]=NULL;

m=0;

ch=program[p++];

while((ch==' ')||(ch=='\n'))

ch=program[p++];

if(((ch<='z')&&(ch>='a'))||((ch<='Z')&&(ch>='A')))

{

//标识符判断

while(((ch<='z')&&(ch>='a'))||((ch<='Z')&&(ch>='A'))||((ch>='0')&&(ch<='9')))

{

token[m++]=ch;

ch=program[p++];

}

p--;

syn=2;

for(n=0;n<8;n++)

if(strcmp(token,key[n])==0)

{

syn=1;

break;

}

else if((ch>='0')&&(ch<='9'))

{

//无符号常数的判断

sum = 0;

while((ch>='0')&&(ch<='9'))

{

sum=sum*10+ch-'0';

ch=program[p++];

}

p--;

syn=3;

}

else

{

switch(ch)

{

case '<':

token[m++]=ch;

ch=program[p++];

if(ch=='=')

{

syn=4;

token[m++]=ch;

}

else

{

syn=4;

p--;

}

break;

case '>':

token[m++]=ch;

ch=program[p++];

if(ch=='=')

{

syn=4;

token[m++]=ch;

}

else

{

syn=4;

p--;

}

break;

case '+':

token[m++]=ch;

ch=program[p++];

if(ch=='+')

{