编译原理词法分析报告
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1、实验目的
1、为初等函数运算语言构造词法分析器。
2、掌握生成词法分析器的方法,加深对词法分析原理的理解。
3、掌握设计、编制并调试词法分析程序的思想和方法
2、实验内容
一、根据下面的要求设计初等函数运算语言的词法模式,并用正则式表达出来
1、初等函数运算语言的常量为实数类型,其定义方式为实数的最一般书写方式,如:
123.321。具体要求:不支持整数部分大于。时首数字为0;不支持小数点后结尾为
0;不支持科学记数法;不支持仅为整数时有小数点;支持负数符号,不支持正数
符号。
2、初等函数运算语言的变量采用与C语言的标识符定义一样的方式:首字符为字母或
下划线;其他的为字母、数字及下划线的混合串;区分大小写;变量长度不超过32 个字符。
3、初等函数运算语言需要处理的函数仅为表一中所列举的内容。函数的格式及参数内
容也如表一所示。
4、初等函数运算语言支持四则运算,其计算的符号与C语言相同,为:+-*/。
5、初等函数运算语言的合法的分隔符包括:空格、制表符、、分行符圆括号(左、右)、
分号。其中空格、制表符、分行符可以出现在任何两个不同的单词中间;圆括号(左、右)用于表达式中,用于改变运算的优先级,以及标识函数的参数;分号用于标识一个语句的结束。
6、初等函数运算语言支持的常量还包括:PI,Eo其中,PI为圆周率,E为自然常数。
二、将正则式转化为最小DFA,给出该DFA的形式化表示和图形表示。
三、根据DFA给出状态转换表。
四、给出初等函数运算语言的记号表,即词法分析中,语言中的记号将分为多少类,每一类型的编码、类型、属性等内容是什么。
五、编写词法分析器,将输入的字符串转化成为记号流,便于后续的语法分析工作。要求词法分析器中能够识别词法错误。
2.1词法模式设计/正则式
分隔符compart=\t|\n|(|)|;|空格
运算符:operation=+|-|*|/|=|^
变量:variable=[a~zA~Z]([ a~zA~Z_0~9])*
常量:constant=(ε |-)((0|(1~9)(0~9)*)(.(0~9)*(1~9)|ε ))|PI|E 2.2DFA
注:id表示字母,num表示数字
2.3状态转换表
注:0是初态,2,6是中间状态,1,3,4,7是终态,其中1表示标示符,3,4,7是实数,8表示不合法的状态,9表示'-'为减号
2.4记号表
3、实验程序清单
#include
#include
using namespace std;
#define max 10
char ch =' ';
string key[7]={"sin","cos","tg","ctg","log","lg","ln"};//关键字
char compart[6]={'\t','\n','(',')',';',' '};//分隔符
char operation[5]={'+','-','*','/','='};//运算符
//int s[8]={0,1,2,3,4,6,7,8};//状态集合,0 是初态,2,6 是中间状态, 1,3,4,7 是终态,其中1
表示标示符,3,4,7 是实数,8 表示不合法的状态
int token[23]={0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22};
//0 表示 sin, 1 表示 cos, 2 表示 tg,3 表示 ctg,4 表示 log, 5 表示 lg,6 表示 ln,7 表示(, 8 表示), 9 表示;, 10 表示?, 11 表示+, 12 表示-, 13 表示*, 14 表示/,15 表示=,
//16 表示常量, 17 表示变量,18 表示不可识别标示符, 19 表示^,20 表示逗号, 21 表示{, 22 表示}
char arr[32];
int state=0;
int s=0;
bool tag=0;//tag=0 表示'-'为负数的负号, tag=1 表示'-'为减号
FILE *fp;
int IsKey(string c)
{ //判断是否为关键字
for(int i=0;i<7;i++)
{
if(key[i].compare(c)==0) return i;//返回下标,下标和其 token 记号一致}
return -1;
}
bool IsLetter(char c)
{ //判断是否为字母
if(((c<='z')&&(c>='a'))||((c<='Z')&&(c>='A')))
return 1;
else
}
bool IsNum(char c)
{ //判断是否为 1-9 的数字
if(c>='1'&&c<='9')
return 1;
else
return 0;
}
bool IsUnderline(char c)
{ //判断是否为下划线
if(c=='_')
return 1;
else
return 0;
}
void move(char ch,int s)
{//在状态 s 接收字符 ch 后,移动的新状态