编译原理实验指导书

合集下载

编译原理实验指导

编译原理实验指导编译原理实验指导⽬录实验1：⽂法的读⼊和输出 (3)实验2：词法分析程序的设计 (5)实验3：LL（1）⽂法构造 (7)实验4：语法分析程序的设计（1） (9)实验5：语法分析程序的设计（2） (11)实验6：逆波兰式的翻译和计算 (15)实验7：语法制导的三地址代码⽣成 (17)实验1 ⽂法的读⼊和输出⼀、实验⽬的熟悉⽂法的结构，了解⽂法在计算机内的表⽰⽅法。

⼆、实验内容1、设计⼀个表⽰⽂法的数据结构；2、从⽂本⽂件中读⼊⽂法，利⽤定义的数据结构存放⽂法，并输出；3、本实验结果还将⽤于实验3。

三、实验要求1、了解⽂法定义的4个部分：G（Vn, Vt, S, P）Vn ⽂法的⾮终结符号集合，在实验中⽤⼤写的英⽂字母表⽰；Vt ⽂法的终结符号集合，在实验中⽤⼩写的英⽂字母表⽰；S 开始符号，在实验中是Vn集合中的⼀个元素；P 产⽣式，分左部和右部，左部为⾮终结符号中的⼀个，右部为终结符号或⾮终结符号组成的字符串，如S->ab|c2、根据⽂法各个部分的性质，设计⼀个合理的数据结构⽤来表⽰⽂法，1）若使⽤C语⾔编写，则⽂法可以设计成结构体形式，结构体中应包含上述的4部分，2）若使⽤C++语⾔编写，则⽂法可以设计成⽂法类形式，类中⾄少含有4个数据成员，分别表⽰上述4个部分⽂法数据结构的具体设计由学⽣根据⾃⼰想法完成，并使⽤C或C++语⾔实现设计的数据结构。

3、利⽤完成的数据结构完成以下功能：1）从⽂本⽂件中读⼊⽂法（⽂法事先应写⼊⽂本⽂件）；2）根据⽂法产⽣式的结构，分析出⽂法的4个部分，分别写⼊定义好的⽂法数据结构的相应部分；3）整理⽂法的结构；4）在计算机屏幕或者⽂本框中输出⽂法，⽂法输出按照⼀个⾮终结符号⼀⾏，开始符号引出的产⽣式写在第⼀⾏，同⼀个⾮终结符号的候选式⽤“|”分隔的⽅式输出。

四、实验环境PC微机DOS操作系统或Windows 操作系统Turbo C 程序集成环境或Visual C++ 程序集成环境五、实验步骤1、根据⽂法定义，设计出⽂法数据结构2、⽤学⽣选择的语⾔，实现⽂法的数据结构3、编写调试⽂法读⼊和输出程序，4、测试程序运⾏效果：从⽂本⽂件中读⼊⼀个⽂法，在屏幕上输出，检查输出结果。

《编译原理》实验指导书

《编译原理》实验指导书编译⽅法实验指导书柴本成赵晨编写浙江万⾥学院2010.01⽬录实验⼀有限⾃动机的构造与实现 (1)实验⼆词法分析器的设计 (3)实验三语法分析－递归下降分析器 (5)实验四LL(1)⽂法预测分析表的实现 (6)附录 (9)附录⼀实验结果的提交与检查 (9)附录⼆实验报告参考格式 (9)附录三Visual C++上机环境简介 (10)附录四参考程序 (13)实验⼀有限⾃动机的构造与实现⼀、实验⽬的1、正确理解正规式和正规集以及有限⾃动机的定义；2、熟练掌握⽤状态转换图表⽰有限⾃动机的⽅法。

⼆、实验预习提⽰1、正规表达式就是⼀种形式化的表⽰法，它可以表⽰单词符号的结构，从⽽精确地定义单词符号集。

正规表达式简称为正规式，它表⽰的集合即为正规集。

2、状态转换图是⼀张当输⼊不同内容时选择不同分析路径的有向图。

⼀个状态转换图可⽤于识别⼀定的字符串。

3、有限⾃动机（FA）是更⼀般化的状态转换图，可⽤来识别正规集；分为DFA和NFA 两种。

三、实验内容构造识别如下字符串的状态转换图，并将其编程实现。

1、识别标识符(以字母开始由字母和数字构成的字符串，要求长度不超过10)；参考程序：#include#include //字符串处理的头⽂件//判断⼀个字符是不是字母bool Isletter(char ch){if(ch>='a' && ch<='z' || ch>='A' && ch<='Z') return true;return false;}//判断⼀个字符是不是数字bool IsDigit(char ch){if(ch>='0' && ch<='9') return true;return false;}//判断⼀个字符串是不是标识符bool IsId(char *str){if(!Isletter(str[0]) ) return false;int l=strlen(str); //计算字符串的长度for(int i=1;iif(Isletter(str[i]) || IsDigit(str[i])) continue; //如果是字母或数字就继续循环else return false; //否则，返回不是字符串return true;}void main(){char *str="1abc"; //初始化字符串，也可键盘输⼊if(IsId(str)) cout<<"accept!"<else cout<<" not accept!"<}2、识别实数(要求正负号可有可⽆，长度不超过20，不要求识别⽤科学记数法表⽰的实数)。

编译原理实验指导书

编译原理实验指导书计算机学院实验1 词法分析程序一、实验目的构造simple语言的词法分析程序，程序要求能对输入的字符串流进行词法分析。

在实验的过程中，学会应用单词分析的方法——NFA(非确定有穷自动机)和DFA(确定有穷自动机)，加深对词法分析原理的理解。

二、实验内容编写为任一正则文法(见实验参考(一)simple惯用的词法)构造非确定有穷自动机NFA并转换成确定有穷自动机DFA，并对任给的一个输入串(见实验参考(二)测试用输入串)进行词法分析的程序，程序的输出为单词的序列(见实验参考(三)程序输出形式)。

三、实验参考(一)simple 惯用的词法1. 下面是语言的关键字：Begin if then while do end所有的关键字都是保留字，并且必须是小写。

2. 下面是专用符号：:= + * / < <= <> > >= = ; ( ) #3. 其他单词是标识符(ID)和整型常数(NUM)，通过下列正规式定义：ID = letter(letter| digit)*NUM = digit digit*letter = a |…| z | A |…| Zdigit = 0 |…| 9小写和大写字母是有区别的。

思考：构造实数的正规表达式，力争实现对实数的识别及表示。

4. 空格由空白、换行符和制表符组成。

空格一般用来分隔ID、NUM、运算符和关键字，词法分析阶段通常被忽略。

5. 各种单词符号对应的种别码如下表所示：(二)词法分析程序的功能1. 输入为所给文法的源程序字符串。

2. 程序的输出形式为单词串的输出形式。

所输出的每一单词，均按形如(syn，token和sum)的二元式编码。

其中，syn 为单词种别码；token为存放的单词自身字符串；sum为整型常数。

3．测试源程序片断：begin x:=9; if x>0 then x:=2*x+1/3;end #。

编译原理实验指导书

陕西理工学院数学与计算机科学学院《编译原理》实验指导班级网络10级指导教师曹阳计算机工程教研室2012年8月25日编译原理实验指导书一、实验的目的《编译原理》是针对计算机专业的学生开设的一门专业基础课程，对引导学生进行科学思维和提高学生解决实际问题的能力有重要的作用。

开设“编译原理实验”的主要目的是让学生加深理解编译原理的基本理论、方法、词法分析、语法分析、中间代码的生成直到最后的代码生成，了解编译器原理，从而提高学生分析问、题解决问题的能力。

通过实验实现以下基本目标：1.深化已学的知识，完成从理论到实践的转化通过实验，进一步加深对编译原理基本思想、原理的了解。

2. 提高分析和解决实际问题的能力实验不仅是编译原理的一次模拟训练，同时通过实验，积累经验，提高分析和解决问题的能力。

3.培养“开拓创新”能力大力提倡和鼓励在程序中使用新方法，新技术。

激发学生实践的积极性与创造性，开拓思路，设计新算法，进行新创意，培养创造性能力。

二、参加实验的学生应具备的条件参加实验的学生应当具备计算机程序设计的一些基础的知识。

即学生应当熟练掌握和使用一种计算机操作系统(windows操作系统等)、一种程序设计语言(vb、vc、c、delphi等)。

三、实验要求实验的要求体现于整个工作的各个阶段中，可根据所选课题的特点而有所侧重，但应达到如下的基本要求：(1) 根据课题任务制定合理、可行的工作计划任务；(2) 制定适当的技术方案；(3) 学生在老师的指导下独立完成设计过程；(4) 撰写实验报告（包括实验内容中各个阶段所要求的文字材料）；(5) 通过实验检查评定；四、实验项目与内容提要五、实验课程考核办法1、该实验课程考核成绩按百分制计算，满分为100分，60分为及格，60分以上者可获取该学分。

2、该实验课考核由三部分组成：实验课前预习（20%），实验操作（60%），实验报告（20%）。

3、各部分成绩由实验指导教师在每个实验项目完成后分别给出，在学期结束后或完成全部实验项目后综合给出该门实验课的成绩。

学生用-编译原理实验指导书

实验一无符号数的有穷自动机的实现(一)实验目的无符号数的有穷自动机的实现目的是使学生掌握文法的形式描述，穷自动机的概念。

将文法转换成有穷自动机的方法，理解出错处理程序思想，如何用状态矩阵实现一个穷自动机的机内表示。

3．构造状态矩阵；将有穷自动机的状S1 S2 ……Sn及输入的字a1 a2 ……am 构成一个n*m的矩阵。

4．用状态矩阵设计出一个词法分析程序。

5．扫描无符号数，根据文法给出无符号数出错的位置。

(三)实验要求1.学生课前要认真阅读实验指导，理解实验内容与相关理论知识的关系，并完成预习报告2．用C语言或其它高级语言编写程序3．写出实验报告实验二语法制导把表达式翻译成逆波兰式(一)实验目的进一步掌握语法制导翻译的概念，理解中间语言，设计出错处理程序方法，掌握把表达式翻译成中间语言的算法。

(二)实验内容1．从左到右扫描中缀表达式，经语法分析找出中缀表达式出现的错误并给出错误的具体位置和类型。

编译原理—实验指导书-1

(13)end.#
4.词法分析器的功能和输出格式
词法分析器的功能是输入以字符串表示的源程序，从左向右扫描每行源程序的符号，拼成单词，换成统一的二元式(单词种别码，单词符号的属性值)表示。对给定的程序通过词法分析器识别一个个单词符号，并以二元式(单词种别码，单词符号的属性值)显示，本程序是通过对给定路径的文件的分析后以单词符号和文字提示显示），本实验中，采用单词种别码是一符一种种别码的方式。
(4)var
(5)a,b,c:integer;
(6)x:char;
(7)begin
(8)if(a+c*3>b)and(b>3)thenc:=3;
(9)x:=2+(3*a)-b*c*8;
(10)forx:=1+2to3dob:=100;
(11)whilea>bdoc:=5;
(12)repeata:=10;untila>b;
(124){
(125)printf("%s\t$运算符\n\n",Word);
(126)}
(127)else if(ch=='-')
(128){
(129)printf("%s\t$运算符\n\n",Word); //判断结果为“--”
(2)设计描述Sample语言各类单词结构的状态转换图（即有限自动机FA）；
如标识符的状态转换图可以用下图表示
其相应代码科为
(1)recog_id(char ch)
(2){
(3)char state='0';
(4)while(state!='2')
(5){
(6)switch(state)

编译原理实验指导书

编译原理实验指导书计算机科学与技术系2007年6月目录实验目的和任务 (1)实验一：词法分析器 (1)实验二：语法分析器1 (5)实验三：语法分析器2 (9)实验四：语义分析和中间代码生成器 (11)实验目的和任务编译原理是一门实践性很强的课程，只有通过实践，才能真正理解其理论的深层内涵，切实掌握编译器的生成技术。

实际的编译程序是十分复杂的，有时多达十几万条指令组成，实现起来难度很大。

在编译原理的实验中，简化了真实程序设计语言要面临的许多问题，选用了具有一定表现能力的实用语言的子集。

实验主要涉及最关键的３个环节──词法分析、语法分析和中间代码生成，每个环节既独立又相互关联，前后衔接，可合为一体，能较清楚地展现编译器前端的工作状况。

编程语言要求：C、C++或JAVA。

实验一：词法分析器一、实验目的通过编写词法分析程序，了解词法分析的过程。

二、实验内容编写能识别给定的程序设计语言的词法规则，输出单词流的识别程序。

三、实验设备及工具1．硬件：PC机Pentium100以上。

2．软件：Win2000或WinXP、BC++、VC++或JA V A开发环境。

四、实验说明以下所给文法是进行词法分析和语法分析的依据，并将该文法中涉及到的单词信息提取到了单词符号与种别对照表中。

本次实验要求编写符合该文法构词规则的词法分析器。

1. 文法G（<程序>）<程序>→BEGIN <语句表> END.<语句表>→<语句>|<语句>;<语句表><语句>→<赋值语句>︱<条件语句>︱<WHILE语句>︱<复合语句><赋值语句>→<变量>=<算术表达式><条件语句>→IF <关系表达式> THEN <语句> ELSE <语句><WHILE语句>→WHILE <关系表达式> DO <语句><复合语句>→BEGIN <语句表> END<算术表达式>→<项>|<算术表达式>+<项>|<算术表达式>-<项><项>→<变量>|<整数><关系表达式>→<算术表达式><关系运算符><算术表达式><关系运算符>→<︱= =︱><变量>→<标识符><标识符>→<标识符><字母>|<标识符><数字>|<字母><整数>→<数字>|<数字><整数><字母>→A|B|C|D|E|F|G|H|I|J|K|L|M|N|O|P|Q|R|S|T|U|V|W|X|Y|Z<数字>→0|1|2|3|4|5|6|7|8|9注意阴影部分，其中<整数>和<标识符>被看作最小词法单位。

编译原理实验指导书

编译原理实验指导书第1节概述1、本课程实践的目的和任务编译原理是一门实践性很强的课程，只有通过实践，才能真正掌握。

实际的编译程序是十分复杂的，有时由多达十几万条指令组成。

为此，编译原理的实践教学，采用简化编译过程的办法，选择最关键的３个环节──词法分析、语法分析（包括语义处理、产生无优化的目标指令）、连接调试，进行编程和调试训练。

每个环节作为一个实践课题。

2、实践方法任何一个实用的高级语言，其语法都比较复杂，如选其作为源语言，很难实践全过程。

故本实践将定义一个简化的语言──PASCAL语言的一个子集作为源语言，也可以自行定义一个简单的C语言子集，在3个题目中选择两个题目，也可以自行选择与编译技术相关的实验题目，设计调试出它的编译程序。

前后贯穿这一条主线进行实践。

每次都可利用课余时间编程，利用上机时间进行输入和调试。

建议使用C或C++或JAVA语言。

3、实践报告的规范和要求每个课题完成后写出实践报告。

实践报告包括程序设计时考虑的算法和方法；调试过程中出现的问题和解决的措施；提交电子版的程序清单和调试时所用的源程序。

4、简化的PASCAL语言子集的定义〈PASCAL子集程序〉→〈变量说明〉〈分程序〉。

〈变量说明〉→〈空〉｜VAR〈变量表〉：INTEGER；〈变量表〉→〈变量〉｜〈变量〉，〈变量表〉〈变量〉→〈标识符〉〈分程序〉→BEGIN〈语句组〉END〈语句组〉→〈语句〉｜〈语句〉；〈语句组〉〈语句〉→〈赋值语句〉｜〈条件语句〉｜〈WHILE语句〉｜〈分程序〉〈赋值语句〉→〈变量〉：＝〈算术表达式〉〈条件语句〉→IF〈布尔表达式〉THEN〈语句〉ELSE〈语句〉〈WHILE语句〉→WHILE〈布尔表达式〉DO〈语句〉〈算术表达式〉→〈项〉｜〈算术表达式〉＋〈项〉｜〈算术表达式〉－〈项〉〈项〉→〈初等量〉｜〈项〉＊〈初等量〉｜〈项〉／〈初等量〉〈初等量〉→〈无符号数〉｜〈变量〉｜（〈算术表达式〉）〈关系表达式〉→〈算术表达式〉〈关系运算符〉〈算术表达式〉〈标识符〉→〈字母〉｜〈标识符〉〈字母〉｜〈标识符〉〈数字〉〈无符号数〉→〈数字〉｜〈无符号数〉〈数字〉〈关系运算符〉→〈|〈＝| ＝| 〉＝| 〉|〈〉〈字母〉→ A│B│C│D│E│F│G│H│I│J│K│L│M│N│O│P│Q│R│S│T││U│V│W│X│Y│Z〈数字〉→ 1│2│3│4│5│6│7│8│9│0第2节词法分析本节进行词法分析程序的编程与调试。

编译原理综合实验指导书

编译原理综合实验指导书序言《编译原理综合实验》作为《编译原理》课程的延伸，其目的是让同学动手设计和实现一个简单语言的编译器和解释器。

通过上机实践，来设计这个相对完整的编译器设计，一方面可以使学生增加对编译程序的整体认识和了解——巩固《编译原理》课程所学知识，另一方面，通过上机练习，学生也可以学到很多程序调试技巧和设计大型程序一般的原则，如模块接口的协调，数据结构的合理选择等等。

一、上机实践要求（1）综合实验的成绩占总成绩的30%；（2）本次实验的所有代码都需要自行编码实现，不能用lex、yacc、JavaCC 等软件自动生成；（3）本次实验要求单人独立完成，综合实验提交的截止日期是2016-6-20；（4）本次综合实验须经授课教师当面验收考核后才予评分，否则以缺交处理；（5）实验结束后提交：源代码和实验报告。

实验报告的格式参见“实验报告模板”。

注：实验报告中不要贴代码。

二、实验内容：（一）词法分析程序的设计与实现：20分要求：设计一个词法分析程序，每调用一次就从源程序文件中顺序识别出一个单词符号。

单词种类与识别规则○1标识符：首字符为字母或’#’，其后由字母、数字或’#’组成；○2整数：由一个或多个数字组成、带正负号的数字串，首位数字不能为0；○3小数：[+|-] 正整数1 ·正整数2[+|-]：表示可选的+或-注意：正整数1不能为空，正整数2可以为空，例如：23.○4字符串：由一对双引号括起来的文本注意：字符串不需要支持多行，即假定任意一串字符串都不能超过一行；字符串不需要支持转义符。

○5保留字：class、if、then、else、call、while、do、string、integer、float、○6单目运算符：＋－* / = < >○7双目运算符：<= >= <> ==⑧布尔运算符：&& ||⑨界符：( ) { } ，；此外，该词法分析程序还要能支持单行注释和多行注释（注释语法同C语言）。

编译原理compiler-实验-指导书

编译原理compiler-实验-指导书编译原理实验指导书课程名称 : 编译原理英文名称 : Compiler Principle 课程性质 : 必修编写人: 编译原理课程组2013年9月1日计算机学院1. 阅读说明基础实验?、选做实验?、实验中的附加内容★未加标注的实验为参考实验2. 实验要求从以下方案中选一方案A (成绩上限:120%)-完成1个基础实验?: 90%-完成选做实验?或实验中的附加内容★: 30%方案B (成绩上限:150%)-完成综合实验3.1: 150%3. 成绩评定成绩评定依据原创性、工作量（自己编写的代码部分才能得分，参考的部分不得分）代码质量、丰富的测试用例、功能和实现上的独立思考与创新实验验收顺序、主动性评分标准源码、验收、答辩(90%)实验报告、作品及文档提交(10%)4. 验收流程必须携带打印版实验报告进行验收，验收顺序依据实验报告提交的顺序验收分―申优验收‖和―抽查‖两种形式，参加―申优验收‖才能获得B（百分制85%）以上的成绩。

必须当面验收的实验 - 选做内容、选做实验、综合实验5. 设计文档要求设计文档参照模板书写。

所有实验必须提交设计文档的打印版本（A4）6. 作品提交要求参加―申优验收‖的同学需提交作品的电子文档及源码，否则，只需提交打印版实验报告。

将作品打包成 .rar文件发送至指定电子邮箱邮箱地址: ytuCompiler@/doc/d506f661102de2bd960588 c4.html请大家参考以下目录命名与结构提交实验所有文档及源码COMPILER_班级_学号_姓名_本次实验名称(根目录)├ bin 存放可执行程序├ config 存放各种配置文件├ lib 存放类库文件├ doc 存放设计文档及readme.txt├ src 存放源程序及项目工程文件├ test 存放测试程序├ references存放参考文档、代码、其他资源根目录命名举例：COMPILER_0813_200825501101_张三_实验1.1若发现程序或文档雷同，按作弊处理完全雷同，取消参加期末考试资格，本学期理课程总评成绩为0分。

编译原理实验指导书

《编译原理》实验指导书别小川于枫编写适用专业：计算机科学与应用江苏科技大学电子信息学院2005年2月前言《编译原理》是计算机专业的一门核心课程，在计算机本科教学中占有十分重要的地位。

由于《编译原理》课程兼有很强的理论性和实践性，并且编译程序构造的算法比较复杂，因而让学生在学习时普遍感到内容抽象、不易理解，难易掌握。

但是掌握编译原理的基本理论和设计思想是非常重要的，尤其是将本课程的理论知识与计算机应用中的许多领域紧密联系与广泛应用结合。

将有利于学生提高专业素质和适应社会多方面需要的能力。

因此，通过理论授课和上机实践，使学生对编译的基本概念、原理和方法有完整的和清楚的理解，并能正确地、熟练地加以运用。

通过实验逐步提高学生的编程能力和调试程序的能力以及解决实际问题的能力。

使学生培养出扎实的软件开发基本技能，并养成良好的编程风格，为进一步学习后续课程和将来从事应用软件开发奠定良好的基础。

实验课时具体内容安排如下：一、实验课的性质和目的（1）深刻理解程序语言编译系统的结构及各部分的功能。

（2）熟练掌握设计和构造程序语言编译系统的基本原理和技术。

（3）能独立编写清晰、工整、结论正确的编译原理的源程序。

（4）能学会上机进行正确调试，并进行程序修改。

即培养发现程序错误，排除错误的能力和经验。

二、实验课的基本要求：（1）掌握编译程序的功能和结构。

（2）掌握词法分析器的设计方法与实现步骤加深对讲授内容的理解，尤其是一些语法给定，通过上机实验帮助掌握。

（3）掌握语法分析器的设计方法与实现步骤。

（4）掌握符号表和存储空间的组织。

（5）掌握代码优化的作用与实现方法（6）掌握错误的诊断和校正方法。

三、主要实验教学方法实验前，由任课教师落实实验任务，每个学生必须事先独立完成好程序的设计的源程序编写工作。

实验课上对疑难点作集中辅导。

实验过程中随时针对不同的情况作个别启发式辅导。

实验后，学生撰写并提交实验报告。

最后，由实验教师根据每个学生的编程、上机调试能力、编程能力和实验结果及实验报告综合评定学生的实验成绩。

《编译原理》实验指导书

《编译原理》实验指导书目录编译原理一共开设了三个实验，它们是：1.词法分析程序，占2个学时2.语法分析程序，占2个学时3.扩充的PL/0分析程序（综合实验），占6个学时。

实验报告格式1.姓名班级学号2.实验名称3.实验目的4.实验要求5.实验内容(这个是实验报告的主要部分)6.实验总结(实验心得)7. 实验报告人报告时间实验一 PL/O语言的词法分析程序GETSYM过程GETSYM的说明：由于一个单词往往是由一个或几个字符组成，所以在词法分析过程GETSYM中又定义一个取字符过程GETCH，由词法分析需要取字符时调用。

实验目的：1.为了更好的配合《编译原理》有关词法分析章节的教学2.加深和巩固学生对于词法分析的了解和掌握3.让学生初步的认识PL/0语言的基础和简单的程序编写4.学生通过本实验能够初步的了解和掌握程序词法分析的整个过程5.提高学生的上机和编程过程中处理具体问题的能力实验要求:1.做本实验之前要先阅读完总体的预备知识以及本实验相关的基础知识2.实验要求自己独立的完成,不允许抄袭别人的实验结果3.编写和调试过程中出现的问题最好做一下记录4.实验程序调试完成后,用给定的PL0测试程序(test.pl0)进行测试，由老师检查测试结果，并给予相应的成绩5.实验完成后,要上交实验报告。

实验内容：1.阅读所给出的词法分析程序（pl0_lexical.c），搞懂程序中每一个变量的含义，以及每一个过程的作用，并在该过程中进行中文注释。

2.阅读完程序后，画出各过程的流程图。

3.给出的程序包含两处输入错误，利用所给的pl/0源程序(test.pl0)对程序进行调试，使其能正确对所给文件进行分析并能够解释运行。

4.在阅读懂所给出的词法分析程序后，将你对词法分析的理解写在实验报告上。

实验环境：1.操作系统为Windows 2000或Dos6.2以上2.应用软件为Pascal或C语言GETCH 所用单元说明：CH ：存放当前读取的字符，初值为空，LINE：为一维数组，其数组元素是字符；界对为1：80。

《编译原理》实验指导书

编译原理实验报告班级：计134班姓名：***学号：******实验一词法分析程序设计与实现一、实验目的通过编写和调试一个词法分析程序，掌握在对程序设计语言的源程序进行扫描的过程中，将字符流形式的源程序转化为一个由各类单词序列的词法分析方法。

二、基本实验内容与要求假定一种高级程序设计语言中的单词主要包括五个关键字begin、end、if、then、else；标识符；无符号常数；六种关系运算符；一个赋值符和四个算术运算符，试构造能识别这些单词的词法分析程序（各类单词的分类码可参见表1）。

输入：由符合和不符合所规定的单词类别结构的各类单词组成的源程序文件。

输出：把所识别出的每一单词均按形如（CLASS，V ALUE）的二元式形式输出，并将结果放到某个文件中。

对于标识符和无符号常数，CLASS字段为相应的类别码的助记符；V ALUE字段则是该标识符、常数的具体值；对于关键字和运算符，采用一词一类的编码形式，仅需在二元式的CLASS字段上放置相应单词的类别码的助记符，V ALUE字段则为“空”。

表1 语言中的各类单词符号及其分类码表要求：1、上机前完成词法分析程序的程序流图，并选择好相应的数据结构。

2、用于测试扫描器的实例源文件中至少应包含两行以上的源代码。

3、对于输入的测试用例的源程序文件，词法正确的单词分析结果在输出文件中以二元式形式输出，错误的字符串给出错误提示信息。

例如，若输入文件中的内容为：“if myid>=1.5E−2+100 then x:=y”，则输出文件中的内容应为：（IF，）（ID，’myid’）（GE，）（UCON，0.015）（PL，）（UCON，100）（THEN，）（ID，’x’）（IS，）（ID，’y’）三、实现方法1、一般实现方法说明词法分析是编译程序的第一个处理阶段，可以通过两种途径来构造词法分析程序。

其一是根据对语言中各类单词的某种描述或定义（如BNF），用手工的方式（例如可用C语言）构造词法分析程序。

编译原理实验指导

编译原理实验指导目录实验1：文法的读入和输出 (3)实验2：词法分析程序的设计 (5)实验3：LL（1）文法构造 (7)实验4：语法分析程序的设计（1） (9)实验5：语法分析程序的设计（2） (11)实验6：逆波兰式的翻译和计算 (15)实验7：语法制导的三地址代码生成 (17)实验1 文法的读入和输出一、实验目的熟悉文法的结构，了解文法在计算机内的表示方法。

二、实验内容1、设计一个表示文法的数据结构；2、从文本文件中读入文法，利用定义的数据结构存放文法，并输出；3、本实验结果还将用于实验3。

三、实验要求1、了解文法定义的4个部分：G（Vn, Vt, S, P）Vn 文法的非终结符号集合，在实验中用大写的英文字母表示；Vt 文法的终结符号集合，在实验中用小写的英文字母表示；S 开始符号，在实验中是Vn集合中的一个元素；P 产生式，分左部和右部，左部为非终结符号中的一个，右部为终结符号或非终结符号组成的字符串，如S->ab|c2、根据文法各个部分的性质，设计一个合理的数据结构用来表示文法，1）若使用C语言编写，则文法可以设计成结构体形式，结构体中应包含上述的4部分，2）若使用C++语言编写，则文法可以设计成文法类形式，类中至少含有4个数据成员，分别表示上述4个部分文法数据结构的具体设计由学生根据自己想法完成，并使用C或C++语言实现设计的数据结构。

3、利用完成的数据结构完成以下功能：1）从文本文件中读入文法（文法事先应写入文本文件）；2）根据文法产生式的结构，分析出文法的4个部分，分别写入定义好的文法数据结构的相应部分；3）整理文法的结构；4）在计算机屏幕或者文本框中输出文法，文法输出按照一个非终结符号一行，开始符号引出的产生式写在第一行，同一个非终结符号的候选式用“|”分隔的方式输出。

四、实验环境PC微机DOS操作系统或Windows 操作系统Turbo C 程序集成环境或Visual C++ 程序集成环境五、实验步骤1、根据文法定义，设计出文法数据结构2、用学生选择的语言，实现文法的数据结构3、编写调试文法读入和输出程序，4、测试程序运行效果：从文本文件中读入一个文法，在屏幕上输出，检查输出结果。

《编译原理》科学实验指导说明书

《编译原理》实验指导书实验一词法分析器的设计一、实验目的和要求加深对状态转换图的实现及词法分析器的理解。

熟悉词法分析器的主要算法及实现过程。

要求学生掌握词法分析器的设计过程，并实现词法分析。

二、实验基本内容给出一个简单语言的词法规则，画出状态转换图，并依据状态转换图编制出词法分析程序，能从输入的源程序中，识别出各个具有独立意义的单词，即基本保留字、标识符、常数、运算符、分隔符五大类。

并依次输出各个单Error”，然后跳过错误部分继续显示）词法规则如下：三、实验时间：上机三次。

第一次按照自己的思路设计一个程序。

第二、三次在理论课学习后修改程序，使得程序结构更加合理。

四、实验过程和指导：（一）准备：1.阅读课本有关章节（c/c++，数据结构），花一周时间明确语言的语法，写出基本算法以及采用的数据结构和要测试的程序例。

2.初步编制好程序。

3.准备好多组测试数据。

（二）上课上机：将源代码拷贝到机上调试，发现错误，再修改完善。

（三）程序要求：程序输入/输出示例：输入如下一段：main(){/*一个简单的c++程序*/int a,b; //定义变量a = 10;b = a + 20;}要求输出如右图。

要求：(1) 剔除注解符(2) 常数为无符号整数（可增加实型数，字符型数等）（四）练习该实验的目的和思路：程序开始变得复杂起来，可能是大家以前编过的程序中最复杂的，但相对于以后的程序来说还是简单的。

因此要认真把握这个过渡期的练习。

程序规模大概为200行及以上。

通过练习，掌握对字符进行灵活处理的方法。

（五）为了能设计好程序，注意以下事情：1.模块设计：将程序分成合理的多个模块（函数/类），每个模块（类）做具体的同一事情。

2.写出（画出）设计方案：模块关系简图、流程图、全局变量、函数接口等。

3.编程时注意编程风格：空行的使用、注释的使用、缩进的使用等。

4．程序设计语言不限，建议使用面向对象技术及可视化编程语言，如C++，VC,JA V A,VJ++等。

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

《编译原理》课程实验指导书计算机学院编２００７年９月实验一 C语言子集编译程序一、实验目的用C语言对一个C语言的子集编制一个一遍扫描的编译程序，以加深对编译原理的理解，掌握编译程序的实现方法和技术。

1．设计、编制并调试一个词法分析程序，加深对词法分析原理的理解。

2．编制一个递归下降分析程序，并对C语言的简单子集进行分析。

3．通过上机实习，加深对语法制导翻译原理的理解，掌握将语法分析所识别的语法成分变换中间代码的语义翻译方法。

二、实验要求、内容及学时词法分析部分：2学时（一）待分析的C语言子集的词法：1．关键字main if else int return void while所有关键字都是小写。

2．专用符号= + - * / < <= > >= == != ; : , { } [ ] ( )3.其他标记ID和NUM通过以下正规式定义其他标记：ID→letter(letter|digit)*NUM→digit(digit)*letter→a|…|z|A|…|Z digit→0|…|94.空格由空白、制表符和换行符组成空格一般用来分隔ID、NUM、专用符号和关键字，词法分析阶段空格通常被忽略。

各种（二）词法分析程序的功能：输入：所给文法的源程序字符串。

输出：二元组（syn,token或sum）构成的序列。

其中，syn 为单词类别码。

token 为存放的单词自身字符串。

sum 为整型常量。

具体实现时，可以将单词的二元组用结构进行处理。

例如：对源程序main(){int i=10;while(i) i=i-1;}的源文件，经词法分析后输出如下序列：(1,main) (26,() (27,)) (30,{) (2,int) (10,i) (21,=) (20,10)(34,;) (7,while) (26,() (10,i) (27,)) (10,i) (21,=) (10,i)(23,-) (20,1) (34,;) (31, })（三）词法分析程序主要算法思想：算法的基本任务是从字符串表示的源程序中识别出具有独立意义的单词符号，其基本思想是根据扫描到单词符号的第一个字符的种类，拼出相应的单词符号。

1．主程序示意结构图（如下）：注：①关键字表初值关键字作为特殊标识符处理，把它们预先安排在一张表格中（称为关键字），当扫描程序识别出标识符时，查关键字表。

如能查到匹配的单词，则该单词为关键字，否则为一般标识符。

关键字表可处理为一个字符串数组（实际为指向字符数组的指针数组），其描述如下：char *KEY_WORDS[8]={“main”,”int”,”char”,”if”,”else”,”for”,”while”};为分析方便,这里把main作关键字处理。

②程序中需要用到的主要变量：syn,token和sum。

2．扫描子程序（scaner）的算法思想首先设置三个变量：token用来存放构成单词符号的字符串；sum用来存放整型单词；syn用来存放单词的类别码。

扫描子程序主要部分N—S图如下：语法分析部分：2学时（一）待分析的C语言子集的语法用扩充的BNF表示如下：1．<程序>→main()<语句块>2. <语句块>→’{‘<语句串>’}’3. <语句串>→<语句>{;<语句>};4. <语句>→<赋值语句>|<条件语句>|<循环语句>5. <赋值语句>→ID=<表达式>6. <条件语句>→if(<条件表达式>)<语句块>7. <循环语句>→while(<条件表达式>)<语句块>8. <条件表达式>→<表达式><关系运算符><表达式>9. <表达式>→<项>{+<项>|-<项>}10.<项>→<项>{*<因子>|/<因子>}11.<因子>→ID|NUM|(<表达式>)12.<关系运算符>→<|<=|>|>=|==|!=（二）语法分析程序的主要算法思想1．主程序结构示意图如下：2．递归下降分析程序结构示意图如下：3．语句块分析结构示意图。

4．语句串分析结构示意图如下：67．term函数结构示意图如下：8.condition函数结构示意图如下：9语义分析部分：2学时（一）实验的输入和输出输入是语法分析提供的正确的单词串，输出是四元式序列。

例如，对于语句串i=2*3+4;if(i>10) {j=3;}while(j>0) k=1;输出的四元式序列如下：1:*, 2, 3, T12:+, T1, 4, T23:=, T2, , i4:j>, i, 10, 65:j, , , 76:=, 3, , j7:j>, j, 0, 98:j, , , 119:=, 1, , k10:j, , , 7（二）算法思想1．设置语义过程①int gen(op,arg1,arg2,result)该函数是将四元式(op,arg1,arg2,result)送到四元式表中。

②char *newtemp()该函数回送一个新的临时变量名，临时变量名产生的顺序为：T1，T2，……③int merg(p1,p2)该函数将以p1和p2为头指针的两条链合并为一，合并后的链表首为返回值。

④int bp(p,t)该函数的功能是把p所链接的每个四元式的第四区段都填为t。

23．函数lrparse在原来语法分析的基础上插入相应的语义动作。

将输入串翻译成四元式序列。

在实验中我们只对表达式、if语句和while语句进行翻译，其具体翻译程序见实例。

算符优先分析法部分：（选作）算符优先分析法特别有利于表达式的处理，宜于手工实现。

算符优先分析过程是自下而上的归约过程，但这种归约未必是严格的规范归约。

因此，所谓算符优先分析法就是定义算符之间的某种优先关系，并借助这种关系寻找句型的最左素短语进行归约。

算符优先分析法通常有两种：优先矩阵法和优先函数法。

前者是提供一张算符优先关系表，后者提供两个优先函数（入栈优先函数f和比较优先函数g），优先函数法比优先矩阵法节约存储空间，所以较为普遍。

下面介绍使用优先函数法的分析过程。

分析过程：先在算符栈置“$”，然后开始顺序扫描表达式。

若读来的单词符号是操作数，则直接进操作数栈，然后继续下一个单词符号。

分析过程从头开始，并重复进行；若读来的单词符号是运算符2θ，则将当前处于运算符栈顶的运算符1θ的入栈优先函数f 与2θ的比较优先函数g 进行比较。

1．若12()()f g θθ≤，则2θ进算符栈，并继续顺序往下扫描，分析过程重复进行。

2．若12()()f g θθ>，则产生对操作数栈顶的若干项进行1θ运算的中间代码，并从运算符栈顶移去1θ，且从操作数栈顶移去相应若干项，然后把执行1θ运算的结果压入操作数栈。

接着以运算符栈新的项与2θ进行上述比较。

3．重复步骤1，2，直到“$”和“$”配对为止。

三、实验环境DOS 或Windows 操作系统 TURBO C 2.0或Visual C++ 四、实验参考（参考代码） #ifndef _GLOBALS_H #define _GLOBALS_H#include<stdio.h> #include<stdlib.h> #include<string.h>#define _SYN_MAIN 1 #define _SYN_INT 2 #define _SYN_CHAR 3 #define _SYN_IF 4 #define _SYN_ELSE 5 #define _SYN_FOR 6 #define _SYN_WHILE 7#define _SYN_ID 10 #define _SYN_NUM 20#define _SYN_ASSIGN 21 #define _SYN_PLUS 22 #define _SYN_MINUS 23 #define _SYN_TIMES 24 #define _SYN_DIVIDE 25 #define _SYN_LPAREN 26 #define _SYN_RPAREN 27 #define _SYN_LEFTBRACKET1 28 #define _SYN_RIGHTBRACKET1 29 #define _SYN_LEFTBRACKET2 30 #define _SYN_RIGHTBRACKET2 31 #define _SYN_COMMA 32 #define _SYN_COLON 33 #define _SYN_SEMICOLON 34#define _SYN_LG 35 #define _SYN_LT 36 #define _SYN_ME 37 #define _SYN_LE 38 #define _SYN_EQ 39 #define _SYN_NE 40 #define _SYN_END 1000#define _SYN_ERROR -1 #define MAXLENGTH 255#ifndef _SEMANTEM_H#define _SEMANTEM_H/*四元组的结构*/typedef struct QUAD{char op[MAXLENGTH]; /*操作符*/char argv1[MAXLENGTH]; /*第一个操作数*/char argv2[MAXLENGTH]; /*第二个操作数*/char result[MAXLENGTH]; /*运算结果*/ }QUATERNION;void lrparse(void); /*语法语义分析主函数*/#endifunion WORDCONTENT{char T1[MAXLENGTH];int T2;char T3;};typedef struct WORD{int syn;union WORDCONTENT value;}WORD;#ifndef _SCAN_H#define _SCAN_H#define _TAB_LEGNTH 4#define _KEY_WORD_END "waiting for you expanding"void Scaner(void);#endifQUATERNION *pQuad;int nSuffix,nNXQ,ntc,nfc;extern WORD uWord;extern int gnColumn,gnRow;FILE *fw;char *strFileName;char *strSource;char *Expression(void);char *Term(void);char *Factor(void);void Statement_Block(int *nChain);/*FILE *Source;*/FILE *fw;char *strSource;void Do_Tag(char *strSource);void Do_Digit(char *strSource);void Do_EndOfTag(char *strSource);void Do_EndOfDigit(char *strSource);void Do_EndOfEqual(char *strSource);void Do_EndOfPlus(char *strSource);void Do_EndOfSubtraction(char *strSource); void Do_EndOfMultiply(char *strSource);void Do_EndOfDivide(char *strSource);void Do_EndOfLParen(char *strSource);void Do_EndOfRParen(char *strSource);void Do_EndOfLeftBracket1(char *strSource); void Do_EndOfRightBracket1(char *strSource);void Do_EndOfLeftBracket2(char *strSource);void Do_EndOfRightBracket2(char *strSource);void Do_EndOfColon(char *strSource);void Do_EndOfComma(char *strSource);void Do_EndOfSemicolon(char *strSource);void Do_EndOfMore(char *strSource);void Do_EndOfLess(char *strSource);void Do_EndOfEnd(char *strSource);void PrintWord(WORD uWord);void ApartWord(char *strSource);void PrintError(int nColumn,int nRow,char chInput);void Scaner(void);int gnColumn,gnRow,gnLocate,gnLocateStart;WORD uWord;char *KEY_WORDS[20]={"main","int","char","if","else","for","while","void",_KEY_WORD_END};int IsDigit(char chInput)//判断扫描的字符是否数字{if(chInput<='9'&&chInput>='0') return 1;else return 0;}int IsChar(char chInput)//判断扫描的字符是否字母{if((chInput<='z'&&chInput>='a')||(chInput<='Z'&&chInput>='A'))return 1;else return 0;}void Do_Start(char *strSource)//开始识别一个单词{gnLocateStart=gnLocate;switch(strSource[gnLocate]){case '+': Do_EndOfPlus(strSource); break;case '-': Do_EndOfSubtraction(strSource); break;case '*': Do_EndOfMultiply(strSource); break;case '/': Do_EndOfDivide(strSource); break;case '(': Do_EndOfLParen(strSource); break;case ')': Do_EndOfRParen(strSource); break;case '[': Do_EndOfLeftBracket1(strSource); break;case ']': Do_EndOfRightBracket1(strSource); break;case '{': Do_EndOfLeftBracket2(strSource); break;case '}': Do_EndOfRightBracket2(strSource); break;case ':': Do_EndOfColon(strSource); break;case ',': Do_EndOfComma(strSource); break;case ';': Do_EndOfSemicolon(strSource); break;case '>': Do_EndOfMore(strSource); break;case '<': Do_EndOfLess(strSource); break;case '=': Do_EndOfEqual(strSource); break;case '\0': Do_EndOfEnd(strSource); break;default:if(IsChar(strSource[gnLocate])){Do_Tag(strSource);}if(IsDigit(strSource[gnLocate])){uWord.value.T2=strSource[gnLocate]-'0';Do_Digit(strSource);}else{if(strSource[gnLocate]!=' '&&strSource[gnLocate]!='\t'&&strSource[gnLocate]!='\n'&&strSource[gnLocate]!='\r'){PrintError(gnColumn,gnRow,strSource[gnLocate]);}if(strSource[gnLocate]=='\n'||strSource[gnLocate]=='\r'){gnColumn++;gnRow=1;}elseif(strSource[gnLocate]=='\t'){gnColumn+=_TAB_LEGNTH;}elsegnRow++;gnLocate++;Do_Start(strSource);break;}return;}void Do_Tag(char *strSource)//识别标识符的中间状态{gnLocate++;gnRow++;if(IsChar(strSource[gnLocate])||IsDigit(strSource[gnLocate])) {Do_Tag(strSource);}elseDo_EndOfTag(strSource);return;}void Do_Digit(char *strSource)//识别整数的中间状态{gnLocate++;gnRow++;if(IsDigit(strSource[gnLocate])){uWord.value.T2=uWord.value.T2*10+strSource[gnLocate]-'0';Do_Digit(strSource);}else Do_EndOfDigit(strSource);return;}void Do_EndOfTag(char *strSource)//识别标识符的最后状态{int nLoop;uWord.syn=_SYN_ID;strncpy(uWord.value.T1,strSource+gnLocateStart,gnLocate-gnLocateStart);uWord.value.T1[gnLocate-gnLocateStart]='\0';nLoop=0;while(strcmp(KEY_WORDS[nLoop],_KEY_WORD_END)){if(!strcmp(KEY_WORDS[nLoop],uWord.value.T1)){uWord.syn=nLoop+1;}nLoop++;}return;}void Do_EndOfDigit(char *strSource)//识别数的最后状态{uWord.syn=_SYN_NUM;return;}void Do_EndOfEqual(char *strSource)//识别==的最后状态，它的开始状态在Do_Start中已处理，//运算符没有中间状态，因为最多由两个符号组成，//而数和标识符可以由多个终结符组成。