编译原理实验报告2-词法分析程序的设计
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
实验2 词法分析程序的设计
一、实验目的
掌握计算机语言的词法分析程序的开发方法。
二、实验内容
编制一个能够分析三种整数、标识符、主要运算符和主要关键字的词法分析程序。
三、实验要求
1、根据以下的正规式,编制正规文法,画出状态图;
标识符<字母>(<字母>|<数字字符>)*
十进制整数0 | ((1|2|3|4|5|6|7|8|9)(0|1|2|3|4|5|6|7|8|9)*)
八进制整数0(1|2|3|4|5|6|7)(0|1|2|3|4|5|6|7)*
十六进制整数0x(0|1|2|3|4|5|6|7|8|9|a|b|c|d|e|f)(0|1|2|3|4|5|6|7|8|9|a|b|c|d|e|f)*
运算符和界符+ - * / > < = ( ) ;
关键字if then else while do
2、根据状态图,设计词法分析函数int scan( ),完成以下功能:
1)从文本文件中读入测试源代码,根据状态转换图,分析出一个单词,
2)以二元式形式输出单词<单词种类,单词属性>
其中单词种类用整数表示:
0:标识符
1:十进制整数
2:八进制整数
3:十六进制整数
运算符和界符,关键字采用一字一符,不编码
其中单词属性表示如下:
标识符,整数由于采用一类一符,属性用单词表示
运算符和界符,关键字采用一字一符,属性为空
3、编写测试程序,反复调用函数scan( ),输出单词种别和属性。
四、实验环境
PC微机
DOS操作系统或Windows 操作系统
Turbo C 程序集成环境或Visual C++ 程序集成环境
五、实验步骤
1、根据正规式,画出状态转换图;
2、根据状态图,设计词法分析算法;
观察状态图,其中状态2、4、7、10(右上角打了星号)需要回调一个字符。
声明一些变量和函数:
ch: 字符变量,存放最新读进的源程序字符。
strToken: 字符串变量,存放构成单词符号的字符串。
GetChar(): 子函数,将下一输入字符读到ch中,搜索指示器前移一字符位置。
GetBC(): 子函数,检查ch中的字符是否为空白。若是,则调用GetChar()直至ch 中进入一个非空白字符。
Concat(): 子函数,将ch中的字符连接到strToken之后。
IsLetter(): 布尔函数,判断ch中的字符是否为字母。
IsDigit(): 布尔函数,判断ch中的字符是否为数字。
Reserve(): 整型函数,对strToken中的字符串查找保留字表,若它是一个保留字则返回它的编码,否则返回0。
SearchOp(): 整型函数,对ch查找运算符和界符,若它是一个运算符或界符,则返回它的编码,否则返回0。
Retract(): 子函数,将搜索指示器回调一个字符位置,将ch置为空白字符。
ProError(): 错误处理函数。
关键字保存在字符数组中,定义编码为相对数组首地址的位置+ 1。保留子表顺序如下:{ if ,then,else,while,do } ,则相应编码为:1,2,3,4,5。
运算符和界符保存在字符数组中,编码定义与关键字相同,顺序如下:{ + ,- , * , / , > , < , = , ( , ) , ;},编码为:1~10。
二元表
算法如下:
ch=’‘ ; strToken=””;
GetBC();
if(IsLetter()) {
while(IsLetter() || IsDigit())
{ Concat(); GetChar(); }
Retract();
If(Reserve()) printf("<%s , ->", strToken);
else printf("<,0,%s >", strToken);
}
else if(‘1’ < =ch && ch <=’9’) {
while(IsDigit())
{ Concat(); GetChar(); }
Retract();
printf("<,1,%s >", strToken) ;
}
else if(ch==’0’) {
GetChar();
if(ch >= ‘1’ && ch <= ‘7’) {
while(ch >= ‘0’ && ch <= ‘7’)
{ Concat(); GetChar(); }
Retract();
printf("<,2,%s >", strToken) ;
}
else if(ch==’x’) {
GetChar();
while(IsDigit() || ch>= ‘a’ && ch<=’f’)
{ Concat(); GetChar(); }
Retract();
printf("<,3,%s >", strToken);
}
else {
Retract();
printf(“<1,0> “) ;
}
}
else if(SearchOp()) printf("<%c,- >", ch);
else ProError();
3、采用C或C++语言,设计函数scan( ),实现该算法;
char GetChar(FILE* fp) { //读取文件中的一个字符
char ch;
ch = fgetc(fp);
return ch;
}
char GetBC(FILE* fp) { //读取文件的字符直至ch不是空白char ch;
do {
ch = GetChar(fp);
} while (ch == ' ' || ch == '\t' || ch == '\n');
return ch;
}
void Concat(char ch ,char strToken[]) { //将ch中的字符连接到strToken之后char str[2];
str[0] = ch;
str[1] = '\0';
strcat(strToken,str);
}
int IsLetter(char ch) { //布尔函数,判断ch中的字符是否为字母,是返回1,否则返回0
int flag = 0;
if (ch >= 'a' && ch <= 'z')
flag = 1;
return flag;
}
int IsDigit(char ch) { //布尔函数,判断ch中的字符是否为数字,是返回1,否则返回0
int flag = 0;
if (ch >= '0' && ch <= '9')
flag = 1;
return flag;
}