编译原理实验报告1
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
03091337 李璐 03091339 宗婷婷
一、上机题目:实现一个简单语言(CPL)的编译器(解释器)
二、功能要求:接收以CPL编写的程序,对其进行词法分析、语法分
析、语法制导翻译等,然后能够正确的执行程序。
三、试验目的
1.加深编译原理基础知识的理解:词法分析、语法分析、语法制导
翻译等
2.加深相关基础知识的理解:数据结构、操作系统等
3.提高编程能力
4.锻炼独立思考和解决问题的能力
四、题目说明
1.数据类型:整型变量(常量),布尔变量(常量)
取值范围{…, -2, -1, 0, 1, 2, …}, {true, false}
2、运算表达式:简单的代数运算,布尔运算
3、程序语句:赋值表达式,顺序语句,if-else语句,while语句
五、环境配置
1.安装Parser Generator、Visual C++;
2.分别配置Parser Generator、Visual C++;
3.使用Parser Generator创建一个工程
编写l文件mylexer.l;
编译mylexer.l,生成mylexer.h与mylexer.c;
4.使用VC++创建Win32 Console Application工程并
配置该项目;
加入mylexer.h与mylexer.c,编译工程;
执行标识符数字识别器;
注意:每次修改l文件后,需要重新编译l文件,再重新编译VC工程
六、设计思路及过程
设计流程:
词法分析
LEX的此法分析部分主要利用有限状态机进行单词的识别,在分析该部分之前,首先应该对YACC的预定义文法进行解释。在YACC中用%union扩充了yystype的内容,使其可以处理char型,int型,node型,其中Node即为定义的树形结点,其定义如下:typedef enum { TYPE_CONTENT, TYPE_INDEX, TYPE_OP } NodeEnum;
/* 操作符 */
typedef struct {
int name; /* 操作符名称 */
int num; /* 操作元个数 */
struct NodeTag * node[1]; /* 操作元地址可扩展 */
} OpNode;
typedef struct NodeTag {
NodeEnum type; /* 树结点类型 */
/* Union 必须是最后一个成员 */
union {
int content; /* 内容 */
int index; /* 索引 */
OpNode op; /* 操作符对象 */
};
} Node;
extern int Var[26];
结点可以是三种类型(CONTENT,INDEX,OP)。结点如果是操作符对象(OpNode)的话,结点可继续递归结点。操作符结点包括了名称,
个数和子结点三个要素,其中子结点可以为多个。
在YACC定义的文法中将
YACC的语法分析和语义制导
在YACC中首先定义了与函数相关的文法和与运算相关的文法,其中函数定义的文法中可以处理
if-else,if,while,print,x=exp;类型,在与运算相关的文法中可以
处理+,-,*,/,>,<,>=,<=,!==,&&,||运算。在语义制导翻译部分
主要目的是在内存建立一颗语法树来实现刚才所说的函数。扩展了
set_index,set_value两个赋值语句,其操作实质是在内存空间分配
index和value的两种树结点。opr这个扩展函数很重要,而且使用
了动态参数,主要考虑操作符的操作元个数是可变的,这个也与头
文件“struct NodeTag * node[1];”的定义思想一致。opr主要在
内存空间中分配操作符相关的树结点。Set_index,set_value,opr
从概念上是完全一致的,目的就是在内存中构造一颗可以递归的语
法树。
程序代码
mylexer.l文件如下:
%{
#include
#include "node.h"
#include "myparser.h"
void yyerror(char *);
%}
%%
"/*"([^\*]|(\*)*[^\*/])*(\*)*"*/" ;
"while" {return WHILE;}
"if" {return IF;}
"else" {return ELSE;}
"print" {return PRINT;}
"false" {yylval.iValue = 0;
return INTEGER;
}
"true" {yylval.iValue = 1;
return INTEGER;
}
[a-z] {yylval.sIndex = *yytext - 'a';
return VARIABLE;
}
[0-9]+ {yylval.iValue = atoi(yytext);
return INTEGER;
}
[-()<>=+*/%;{}.] {return *yytext;}
">=" {return GE;}
"<=" {return LE;}
"==" {return EQ;}
"!=" {return NE;}
"<>" {return NE;}
"&&" {return AND;}
"||" {return OR;}
"!" {return NOT;}
[ \t\n]+ ; /* 去除空格,回车*/
. printf("unknow symbol:[%s]\n",yytext);
%%
int yywrap(void)
{
return 1;
}
myparser.y文件如下: