编译原理实验报告2-词法分析程序的设计

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

实验2 词法分析程序的设计

一、实验目的

掌握计算机语言的词法分析程序的开发方法。

二、实验内容

编制一个能够分析三种整数、标识符、主要运算符和主要关键字的词法分析程序。

三、实验要求

1、根据以下的正规式,编制正规文法,画出状态图;

标识符<字母>(<字母>|<数字字符>)*

十进制整数0 | ((1|2|3|4|5|6|7|8|9)(0|1|2|3|4|5|6|7|8|9)*)

八进制整数0(1|2|3|4|5|6|7)(0|1|2|3|4|5|6|7)*

十六进制整数0x(0|1|2|3|4|5|6|7|8|9|a|b|c|d|e|f)(0|1|2|3|4|5|6|7|8|9|a|b|c|d|e|f)*

运算符和界符+ - * / > < = ( ) ;

关键字if then else while do

2、根据状态图,设计词法分析函数int scan( ),完成以下功能:

1)从文本文件中读入测试源代码,根据状态转换图,分析出一个单词,

2)以二元式形式输出单词<单词种类,单词属性>

其中单词种类用整数表示:

0:标识符

1:十进制整数

2:八进制整数

3:十六进制整数

运算符和界符,关键字采用一字一符,不编码

其中单词属性表示如下:

标识符,整数由于采用一类一符,属性用单词表示

运算符和界符,关键字采用一字一符,属性为空

3、编写测试程序,反复调用函数scan( ),输出单词种别和属性。

四、实验环境

PC微机

DOS操作系统或Windows 操作系统

Turbo C 程序集成环境或Visual C++ 程序集成环境

五、实验步骤

1、根据正规式,画出状态转换图;

2、根据状态图,设计词法分析算法;

观察状态图,其中状态2、4、7、10(右上角打了星号)需要回调一个字符。

声明一些变量和函数:

ch: 字符变量,存放最新读进的源程序字符。

strToken: 字符串变量,存放构成单词符号的字符串。

GetChar(): 子函数,将下一输入字符读到ch中,搜索指示器前移一字符位置。

GetBC(): 子函数,检查ch中的字符是否为空白。若是,则调用GetChar()直至ch 中进入一个非空白字符。

Concat(): 子函数,将ch中的字符连接到strToken之后。

IsLetter(): 布尔函数,判断ch中的字符是否为字母。

IsDigit(): 布尔函数,判断ch中的字符是否为数字。

Reserve(): 整型函数,对strToken中的字符串查找保留字表,若它是一个保留字则返回它的编码,否则返回0。

SearchOp(): 整型函数,对ch查找运算符和界符,若它是一个运算符或界符,则返回它的编码,否则返回0。

Retract(): 子函数,将搜索指示器回调一个字符位置,将ch置为空白字符。

ProError(): 错误处理函数。

关键字保存在字符数组中,定义编码为相对数组首地址的位置+ 1。保留子表顺序如下:{ if ,then,else,while,do } ,则相应编码为:1,2,3,4,5。

运算符和界符保存在字符数组中,编码定义与关键字相同,顺序如下:{ + ,- , * , / , > , < , = , ( , ) , ;},编码为:1~10。

二元表

算法如下:

ch=’‘ ; strToken=””;

GetBC();

if(IsLetter()) {

while(IsLetter() || IsDigit())

{ Concat(); GetChar(); }

Retract();

If(Reserve()) printf("<%s , ->", strToken);

else printf("<,0,%s >", strToken);

}

else if(‘1’ < =ch && ch <=’9’) {

while(IsDigit())

{ Concat(); GetChar(); }

Retract();

printf("<,1,%s >", strToken) ;

}

else if(ch==’0’) {

GetChar();

if(ch >= ‘1’ && ch <= ‘7’) {

while(ch >= ‘0’ && ch <= ‘7’)

{ Concat(); GetChar(); }

Retract();

printf("<,2,%s >", strToken) ;

}

else if(ch==’x’) {

GetChar();

while(IsDigit() || ch>= ‘a’ && ch<=’f’)

{ Concat(); GetChar(); }

Retract();

printf("<,3,%s >", strToken);

}

else {

Retract();

printf(“<1,0> “) ;

}

}

else if(SearchOp()) printf("<%c,- >", ch);

else ProError();

3、采用C或C++语言,设计函数scan( ),实现该算法;

char GetChar(FILE* fp) { //读取文件中的一个字符

char ch;

ch = fgetc(fp);

return ch;

}

char GetBC(FILE* fp) { //读取文件的字符直至ch不是空白char ch;

do {

ch = GetChar(fp);

} while (ch == ' ' || ch == '\t' || ch == '\n');

return ch;

}

void Concat(char ch ,char strToken[]) { //将ch中的字符连接到strToken之后char str[2];

str[0] = ch;

str[1] = '\0';

strcat(strToken,str);

}

int IsLetter(char ch) { //布尔函数,判断ch中的字符是否为字母,是返回1,否则返回0

int flag = 0;

if (ch >= 'a' && ch <= 'z')

flag = 1;

return flag;

}

int IsDigit(char ch) { //布尔函数,判断ch中的字符是否为数字,是返回1,否则返回0

int flag = 0;

if (ch >= '0' && ch <= '9')

flag = 1;

return flag;

}

相关文档
最新文档