编译原理实验词法分析实验报告
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
编译技术实验报告
实验题目:词法分析
学院:信息学院
专业:计算机科学与技术学号:
姓名:
一、实验目的
(1)理解词法分析的功能;
(2)理解词法分析的实现方法;
二、实验内容
PL0的文法如下
‘< >’为非终结符。
‘::=’ 该符号的左部由右部定义,可读作“定义为”。
‘|’ 表示‘或’,为左部可由多个右部定义。
‘{ }’ 表示花括号内的语法成分可以重复。在不加上下界时可重复0到任意次
数,有上下界时可重复次数的限制。
‘[ ]’ 表示方括号内的成分为任选项。
‘( )’ 表示圆括号内的成分优先。
上述符号为“元符号”,文法用上述符号作为文法符号时需要用引号‘’括起。
〈程序〉∷=〈分程序〉.
〈分程序〉∷= [〈变量说明部分〉][〈过程说明部分〉]〈语句〉
〈变量说明部分〉∷=V AR〈标识符〉{,〈标识符〉}:INTEGER;
〈无符号整数〉∷=〈数字〉{〈数字〉}
〈标识符〉∷=〈字母〉{〈字母〉|〈数字〉}
〈过程说明部分〉∷=〈过程首部〉〈分程序〉{;〈过程说明部分〉};
〈过程首部〉∷=PROCEDURE〈标识符〉;
〈语句〉∷=〈赋值语句〉|〈条件语句〉|〈过程调用语句〉|〈读语句〉|〈写语句〉|〈复合语句〉|〈空〉
〈赋值语句〉∷=〈标识符〉∶=〈表达式〉
〈复合语句〉∷=BEGIN〈语句〉{;〈语句〉}END
〈条件〉∷=〈表达式〉〈关系运算符〉〈表达式〉
〈表达式〉∷=〈项〉{〈加法运算符〉〈项〉}
〈项〉∷=〈因子〉{〈乘法运算符〉〈因子〉}
〈因子〉∷=〈标识符〉|〈无符号整数〉|'('〈表达式〉')'
〈加法运算符〉∷=+|-
〈乘法运算符〉∷=*
〈关系运算符〉∷=<>|=|<|<=|>|>=
〈条件语句〉∷=IF〈条件〉THEN〈语句〉
〈字母〉∷=a|b|…|X|Y|Z
〈数字〉∷=0|1|2|…|8|9
实现PL0的词法分析
三、实验分析与设计
PL0词法分析程序是一个独立的过程,其功能是为语法语义分析提供单词,把输入的字符串形式的源程序分割成一个个单词符号传递给语法语义分析。
其主要方法步骤为从源程序扫描下一个字符,忽略空格、换行、TAB和注释并识别单词,再将不同类别的单词归类输出。
四、实验的实现
#include
#include
#include
#include
#include
#define norw 11 //norw-1个关键字
#define al 20 //最长的关键字的长度
#define ID norw
#define INT norw+1
#define COMMA norw+2
#define ENDF norw+3
#define COLON norw+4
#define SEMIC norw+5
#define ADD norw+6
#define MINUS norw+7
#define MULTI norw+8
#define EV ALU norw+9
#define LE norw+10
#define NE norw+11
#define LT norw+12
#define EQ norw+13
#define GE norw+14
#define GT norw+15
#define FLOAT norw+16
char TOKEN[20]; //字符数组用来依次存放单词词文的各个字符
extern int lookup(char *); //以TOKEN字符串查保留字表
extern void report_error(char); //报告程序中的词法错误
bool isalpha(char); //判断接收字符是否为字母
bool isalnum(char); //判断接收字符是否为字母或者数字
bool isdigit(char); //判断接收字符是否为数字
bool isannotation(char); //判断接收字符是否为注释
extern char letter(char c); //用来将大写字母转化成小写字母
FILE* fin;
FILE* fout;
void scanner()
{//词法分析的主体程序,对输入的文本文件进行词法分析
char ch;
int i,c;
int error=0; //记录文件中词法错误的个数
ch=fgetc(fin); //从输入文件中读取一个字符
while(ch!=EOF)
{//当从输入文件接收的字符不是文件结束符时,执行循环
if(isalpha(ch))
{//如果从输入文件接收的第一个字符是字母
ch=letter(ch);
TOKEN[0]=ch;
ch=fgetc(fin);i=1;
while(isalnum(ch))
{ ch=letter(ch);
TOKEN[i]=ch;i++;
ch=fgetc(fin);
}
TOKEN[i]='\0';
c=lookup(TOKEN); //查保留字表
if(c==0) {fprintf(fout,"(%d,%s)\n", ID,TOKEN);} //输出标识符
else fprintf(fout,"(%d,%s)\n", c,TOKEN); //输出接收单词为保留字
}
if(isdigit(ch)) //如果从输入文件接收的第一个字符是数字
{
int cdot=0; //统计小数点个数
TOKEN[0]=ch;
ch=fgetc(fin);i=1;
while(isdigit(ch)||ch=='.')
{//从第二个接收字符开始,当是数字或者是小数点时,执行循环if(ch=='.')
cdot++;
TOKEN[i]=ch;i++;
ch=fgetc(fin);//重复接收字符,直到接收到非数字
if(cdot>=2)
{
error++;
TOKEN[i]='\0';