无符号数的有穷自动机的实现
编译原理 实验1 有穷自动机的构造与实现
}
char digitprocess(char buffer, FILE* fp)
{
int i=-1;
while((IsDigit(buffer)))
{
digittp[++i]=buffer;
buffer=fgetc(fp);
}
digittp[i+1]=\0';
return(buffer);
buffer=fgetc(fp);
}
alphatp[i+1]='\0';
return(buffer);
}
int main(int argc, char* argv[])
{
FILE *fp;//文件指针,指向要分析的源程序
char cbuffer;//保存最新读入的字符
if((fp=fopen(sourceFile,"r"))==NULL)//判断源文件是否存在
}
int main(int argc, char* argv[])
{
FILE *fp;//文件指针,指向要分析的源程序
char cbuffer;//保存最新读入的字符
if((fp=fopen(sourceFile,"r"))==NULL)//判断源文件是否存在
printf("文件%s不存在", sourceFile);
(2)无符号整型数,要求长度不超过20。
四、实验结果
1.识别标识符(以字母开始由字母和数字构成的字符串,要求长度不超过10)。
#include <stdio.h>
#include <string.h>
《编译原理》期中及期末习题
第一章高级语言与编译程序概述典型例题:单项选择题1.1.1.将编译程序分成若干个“遍”是为了___。
a.提高程序的执行效率b.使程序的结构更加清晰c.利用有限的机器内存并提高机器的执行效率d.利用有限的机器内存但降低了机器的执行效率1.1.2.构造编译程序应掌握____。
(陕西省2000年自考题)a.源程序b.目标语言c.编译方法d.以上三项都是1.1.3.变量应当_。
a.持有左值b.持有右值c.既持有左值又持有右值d.既不持有左值也不持有右值1.1.4.编译程序绝大多数时间花在____上。
(陕西省1998年自考题)a.出错处理b.词法分析c.目标代码生成d.管理表格1.1.5.____不可能是目标代码。
( 陕西省1997年自考题)a.汇编指令代码b.可重定位指令代码c.绝对指令代码d.中间代码1.1.6.数组A[1…20,1…10]的首地址偏移量为0,按列存储,每个元素占一个字节,存储器按字节编址,则A[i,j]的偏移地址为____。
a.(i-1)X10+(j-1)b.(i-1)X20+(j-1)c. (i-1)+(j-1)X10d.(i-1)+(j-1)X201.1.7.使用____可以定义一个程序的意义。
a.语义规则b.词法规则c.产生规则d.左结合规则1.1.8.表达式X:=5中,变量x____。
a.只有左值b.只有右值c.既有左值又有右值d.没有左值也没有右值1.1.9.词法分析器的输入是__。
a.单词符号b.源程序c.语法单位d.目标程序1.1.10.中间代码生成时所遵循的是_。
a.语法规则b.词法规则c.语义规则d.等价变换规则1.1.11.编译程序是对__。
a.汇编程序的翻译b.高级语言程序的解释执行c.机器语言的执行d.高级语言的翻译1.1.12.词法分析应遵循_。
(陕西省2000年自考题)a.语义规则b.语法规则c.构词规则d.等价变换规则多项选择题:1.2.1 编译程序各阶段的工作都涉及到___。
实验报告-有穷状态自动机
if(temp>='A'&&temp<='Z')//非终结符号的判断条件
{
bool state=true;
for(int k=0;k<VN;k++)
{
if (temp==K[k]) //避免重复
{state=false;break;}
{ char temp=p[i][j]; //暂时存放一个确定的符号
if(!((temp>='A'&&temp<='Z')||temp==':'||temp=='='||temp=='\0'))
//终结符号的判断条件
{
bool state=true;
for(int k=0;k<VT;k++)
{
if (temp==E[k]) //避免重复
*****大学**学院学生实验报告
学号:年月日
系别
专业
计算机科学与技术
班级
姓名
课程名称
编译原理
课程类型
必修课
学时数
实验名称
从正则文法构造有穷状态自动机及运行
实验目的:
一、从正则文法构造有穷状态自动机(1)、掌握有穷状态自动机的概念、其存储表示及其与正则文法的联系。(2)、输入任意的正则文法,输出相应的有穷状态自动机。
(3)、将文法按五元组形式输出。
(4)、编写若干个函数,其中包括在规则中找出终结符号和非终结符号的函数,字符串输入及识别字符串函数,DFA和NFA的相关判断和输出函数,映射关系函数。
有穷状态机
第4章 形式化说明技术
上海海洋大学爱恩学院
图4.1 保险箱的状态转换图
第4章 形式化说明技术
上海海洋大学爱恩学院
图4.1是一个有穷状态机的状态转换图。 从上面这个简单例子可以看出,一个有穷状 态机包括下述 5 个部分:状态集 J 、输入集 K 、 由当前状态和当前输入确定下一个状态(次态) 的转换函数 T 、初始态 S 和终态集 F 。对于保 险箱的例子,相应的有穷状态机的各部分如 下。 状态集 J :{保险箱锁定, A , B ,保险箱解 锁,报警}。 输入集 K :{ 1L , 1R , 2L , 2R , 3L , 3R }。
假定dfa或nfa有m个状态n个输入字符或字则这个状态转换图含有m个状态每个状态最多有n条输出边与其它状态相连接每一条输出边用或中的一个不同的输入字符或一个输入字作标记整个图含有惟一一个初态和若干个终态
第4章 形式化说明技术
上海海洋大学爱恩学院
4.2 有穷状态机
4.2.1 概念 下面通过一个简单例子介绍有穷状态机的基 本概念。 一个保险箱上装了一个复合锁,锁有三个位 置,分别标记为 1 、 2 、 3 ,转盘可向左 (L) 或 向右 (R) 转动。这样,在任意时刻转盘都有 6 种可能的运动,即 1L 、 1R 、 2L 、 2R 、 3L 和 3R。保险箱的排列(非组合)密码是1L、3R、 2L,转盘的任何其他运动都将引起报警。图 4.1描绘了保险箱的状态转换情况。
第4章 形式化说明技术
上海海洋大学爱恩学院
a
s2
a
s1
a
s3
c
s4
图 NFA的状态转换示意
第4章 形式化说明技术
上海海洋大学爱恩学院
例如,对上图所给出的状态s1有: f(s1 , a)={s1 , s2 , s3} 即 f 是一个从 S×Σ* 到S的子集映射; Σ* 表示 输出边上所标记的不仅是字符,也可以是字。 此外,NFA还允许f(s1,ε)={某些状态的集合}, 即在NFA的状态转换图中输出边上的标记还 可是ε (空字)。
实验一 编写词法分析程序
实验一编写词法分析程序1 实验类型设计型实验,4学时。
2 实验目的通过设计、调试词法分析程序,掌握词法分析程序的设计工具,即有穷自动机,进一步理解自动机理论;掌握文法转换成自动机的技术及有穷自动机实现的方法;会确定词法分析器的输出形式及标识符与关键字的区分方法;加深对课堂教学的理解,提高词法分析方法的实践能力。
3 背景知识词法分析作为相对独立的阶段来完成(对源程序或中间结果从头到尾扫描一次,并作相应的加工处理,生成新的中间结果或目标程序)。
在词法分析过程中,编译程序从外部介质中读取源程序文件中的各个字符,为正确地识别单词,有时还需进行超前搜索和回退字符等操作。
因此,为了提高读盘效率和便于扫描器进行工作,通常可采用缓冲输入的方案,即在内存中设置一个适当大小的输入缓冲区,将磁盘上的源程序字符串分批送入该缓冲区中,供扫描器进行处理。
词法分析程序的一般设计方案是:1、程序设计语言词法规则⇒正则文法⇒ FA;或:词法规则⇒正则表达式⇒ FA;2、NFA确定化⇒ DFA;3、DFA最小化;4、确定单词符号输出形式;5、化简后的DFA+单词符号输出形式⇒构造词法分析程序。
从设计方案可知,要构造词法分析程序,必须掌握以下三个知识点:文法、正则表达式和FA。
文法与语言的形式定义如下:一个形式文法G 是下述元素构成的一个元组(V N,V T,P,S )。
其中:1、V T—非空有限的终结符号集,即Σ;终结符:一个语言不可再分的基本符号。
2、V N—非空有限的非终结符号集;非终结符:也称语法变量,用来代表语法范畴。
一个非终结符代表一个一定的语法概念,是一个类(集合)记号,而不是一个体记号。
3、S —开始符号/识别符号,S∈V N;4、P —产生式规则集(或叫规则或生成式或重写规则);产生式:形如α → β或α ::= β的表达式,其中α为左部,β为右部。
α∈(V T∪V N)+且至少含一个V N;β∈(V T∪V N)*。
《编译原理》第2章 编译基础-形式语言与有穷自动机
句型、推导
G[E]: E→E+T|T T→T*F|F F→(E)|a
对于句子a+a*a 有不同 的推导
EE+T T+T F+T a+T a+T*F a+F*F a+a*F a+a*a
EE+T E+T*F E+T*a E+F*a E+a*a T+a*a F+a*a a+a*a
整理课件
例:奇偶测试器
0
0
1
q0
q1
∈
1
自动机:M=(Q,∑ ,δ ,q0,Z)
Q={ q0, q1}
∑ ={0,1}
q0=q0 Z={q1}
整理课件
映射函数:
δ( q0,0)= q0 0
0
δ( q0,1)= q1
1
δ( q1,0)= q1 q0
q1
δ( q1,1)= q0
1
例:000110001
整理课件
第四节 正规文法与有穷自动机 1、正规文法 产生的语言的推导 例:文法 G=(VN,VT,P,S) 其中: VN={A,B,C}
VT={a,b,c} S=A P:A →aB A →aA
B →bB B →bC C →cC C →c
整理课件
A=>aA=>aaA=>…..=>aa…aB =>aa…abB=>aa…abb…bC =>aa…abb…bcC=> aa…abb…bccC => aa…abb…bcc…c
D→ε
Aa→bD
自然语言属于上下文有关文法
整理课件
文法的类型
实现有穷状态自动机
#include <stdio.h>#include <string.h>#define STATE_NUMBER 4 //状态数目#define CHAR_NUMBER 2 //输入字符的种类: d 和 .#define DIGIT 0 //输入数字在状态表中位于第0列#define DOT 1 //小数点位于状态表的第1列//State[][]为状态表,以整数组形式存放,0,1,2,3表示状态,-1表示没有此状态int State[STATE_NUMBER][CHAR_NUMBER]= {{1,-1},{1,2},{3,-1},{3,-1}};int Q[STATE_NUMBER] = {0,1,0,1}; //终态标志:0非终态,1终态。
//缓冲区://输入缓冲区:由专门函数操作(ReadALine(),GetChar())#define BUFFER_SIZE 1000 //表达式缓冲区大小char Buffer[BUFFER_SIZE]; //表达式缓冲区,以'\0'表示结束int ipBuffer = 0; //表达式缓冲区当前位置序号char ch; //存放取得的一个字符//*****************************************************//函数声明:bool Run(); //对存储在缓冲区的一行字符串(以'#'结束)进行运行void Init(); //全局初始化bool ReadALine(); //从键盘读一行(没有空格),存于表达式缓冲区Buffer[]中char GetChar(); //从缓冲区取一个字符,返回该字符的同时将它存于全局变量ch中//*****************************************************//主程序:void main(){Init();while(ReadALine()) //读一行成功,对它进行判断{if(Run()) //对该行进行运行,看是否能被接受?printf("接受\n\n");elseprintf("不接受\n\n");}}//对存储在缓冲区的一行字符串(以'#'结束)进行运行//返回:如果是无符号定点实数,返回true;否则返回:falsebool Run(){int S=0; //S存放运行时的当前状态,目前为初态while(GetChar()!='#'){if(ch >= '0' && ch <= '9') //数字S = State[S][DIGIT]; //将状态转换成输入数字后的状态else if(ch == '.') //小数点S = State[S][DOT]; //将状态转换成输入小数点后的状态else //其他都为非法字符return false;if(S == -1) //处于非法状态return false;}//运行结束,判断S是否为终态if(Q[S] == 1) //终态return true;else //非终态return false;}//全局初始化void Init(){//好像无需初始化printf("程序功能:输入一个字符串,判断它是否是无符号定点实数。
编译原理:第3章 有穷自动机
编译原理第3章内容简介学习目标第3章有穷自动机3.1 有穷自动机的形式定义3.1 有穷自动机的形式定义DFA的表示举例——状态转换表DFA的表示举例——状态转换图 3.13.1 FA的形式定义有穷自动机识别的符号串举例DFA A3.1 有穷自动机的形式定义 3.1 有穷自动机的形式定义NFA举例 3.13.1用NFA识别符号串yFA的构造FA的构造举例—1FA的构造举例—2FA的构造举例—3请构造一个有穷自动机FA的构造举例—4 3.1请构造一个有穷自动机FA的等价性举例3.2 NFA到DFA的转换 3.2 NFA到DFA的转换—NFA确定化3.2 NFA到DFA的转换3.2 NFA到DFA的转换—NFA确定化——ε闭包状态子集I的ε闭包——举例状态子集I的状态子集I的ε闭包——举例状态子集I的——Ia 子集3.2 NFA到DFA的转换Ia子集——举例Ia子集——举例 3.2 NFA到DFA的转换NFA到DFA的转换——子集法NFA=(Q NFA到DFA的转换——举例1aNFA到DFA的转换——举例2NFA DFA DFA NFA DFA DFADFA化简举例1DFA化简——注意NFA到最小化DFA的转换——举例33.3 正规文法与FA3.3 正规文法与FAFA⇒右线性正规文法FA⇒右线性正规文法——举例1y3.4 正规表达式RE与FA 正规表达式与有穷自动机3.4 RE与FA——RE的性质 3.4 RE与FA—RE⇒FARE⇒FA举例1RE⇒FA举例23.4 RE与FA——FA⇒RE FA⇒REFA⇒RE FA⇒RE举例FA⇒RE举例正规文法到正规表达式正规文法到正规表达式DFA的程序实现DFADFA的程序实现DFA DFA的程序实现lDFA的程序实现l第3章内容小结第3章内容小结参考文献。
第二章:有穷自动机和正规文法
上一页
下一页
退 出
10
2.3 DFA与NFA等效 由于DFA是NFA的特例,所以DFA能接受的语言必能为 NFA所接受,相反,NFA接受的语言,则能找到一个等效 的DFA接受语言。 定理2.3.1 设L(MN)是NFA MN接受的语言,则存在一DFA MD接受L(MD),满足L(MD)=L(MN)
上一页 下一页 退 出
12
n
可见[q1,q2,…,qn]是DFA MD的一个状态 通过对输入行ω的长度作归纳容易证明: δ D(q0D, ω )=[q1,q2,…,qn]⇔ δ (q0, ω )= {q1,q2,…,qn} 当|ω|=0时,即ω=ε,有δD(q0D,ε)=q0D, δ(q0,ε)={q0} 因为q0D=[q0],所以结论成立。 当|ω|≤K时,设 δD(q0D,ω)=[q1,q2,…,qn]⇔ δ(q0,ω)={q1,q2,…,qn}成立。 那么|ω|=K+1时,即:ω=ω1a,ω1∈T*,a∈T,则 δD(q0D,ω1a)=δD(δD(q0D,ω1),a)
T(M)={0,1} * 中的所有含偶数个0和偶数个1的句子集 合。
上一页 下一页 退 出
4
2.2不确定有穷自动机 1. NFA NFA M=(K,∑,δ,q0,把字的输入头右移一个单 元,并选择P1 ,P2 ,…,PK 中任意一个作为下一个状 态。 把映射δ定义域扩大到K×Σ* :当输入一个字符串 时,将δ改为δ'。 △ δʹ(q,ε)={q}和δ(q,xa)= ∪ δ(p,a)
20
2.有ε转换NFA和无ε转换的NFA的等效 如果有ε转换的NFA M接受语言L(M),则存 在无ε转换的NFA M1 使L(M1)=L(M)。 证明:首先对应有ε转换的NFA M=(Q,T,δ,q0,F) 构造无ε转换的 NFA M1=(Q,T,δ1,q0,F1) F1= F∪{q0} 当ε-closure(q0)含F的一个状态 F 否则 定义δ1:对任意q∈Q,a∈T则δ1(q, a)=δ'(q, a) 因为M1是无ε转换,对于δ1’可用δ1代替, 但要区别δ和δ’。 对字符串ω的长度进行归纳证明: δ1(q0,ω)=δ’(q0,ω)
形式语言与自动机_课件_陈有祺第03章 有穷自动机
从定义3.7可知,在δ(q0,x)的众多状态中,只要有一个状态属于 终结状态集F,则x就被该NFA M接受。如对例3.4中的NFA,字 符串01001是被接受的,因为δ(q0 ,01001)={q0,q1,q4} ,而 q0∈F。但字符串010是不被接受的,因为δ(q0 ,010)={q0,q3} ,其中没有一个状态在F中。
从给定集合构造接受该集合的FA
实现上述思路的FA M1如图所示
初始状态标记为“1”,表示要么还没有读入符号,要么刚读过符号1。对 于“0”状态遇1,“01” 状态遇0,“010”状态再遇0或1的情况,上 面已经做了解释。其他情况是:“0”状态遇0,此时应当保持在“0”状 态,意味着刚读过的符号是0;再有“01”状态遇1,表示这次的期望“ 半途而废”,只能从头再来,所以转回到“1”状态。
形式语言与自动机
第三章 有穷自动机
非形式化描述 有穷自动机的基本定义 非确定的有穷自动机 具有ε转移的有穷自动机 有穷自动机的应用 具有输出的有穷自动机
有穷状态系统
指针式钟表共有12*60*60个状态
围棋共有3361个状态
电梯的控制结构
某些电子产品中的开关电路,具有n个门的开关网络有 2n种状态
分析:x∈L当且仅当把x看成二进制数时,x模5与0同余。换句话说,x 要能被5整除。例如,0,101,1010,1111等都能被5整除,而10, 11,100,110等都不能被5整除。
当二进制数x的位数向右不断增加时,它的值(换算成十进制)的增加很 有规律:x0的值等于2x,x1的值等于2x+1。
第三章有穷自动机
C
01 S0 S1 S5 0 S1 S2 S7 1 S2 S2 S5 1 S3 S5 S7 0 S5 S3 S1 0 S7 S0 S1 1
3.2.3 合并等价状态
等价状态
若s和t是M的两个不同状态,称s和t等 价:如果从状态s出发能读出某个字而停 于终态,同样从t 出发也能读出同一个字 而停于终态;反之若从t 出发能读出某个字 而停于终态,则从s出发也能读出同一个 字而停于终态。
第三章 有穷自动机
本章介绍有关有穷自动机的基本概念和 理论以及正规文法、正规表达式与有穷自动 机之间的相互关系。
§3.1 有穷自动机的形式定义
有穷状态自动机(Finite-state Automata 或简称FA)在识别功能上与正 规文法类等价,而且也等价于一个特殊类 型的语言产生器——正规表达式(Regular Expression)。因此许多简单的程序语言 都可由FA所识别。事实上,它是描述词法 的有效工具,也是进行词法分析的主要理 论基础。
消除多余状态
多余状态是指从该自动机的开始状态出发, 任何 0 S1 S2 S7 1 S2 S2 S5 1 S3 S5 S7 0 S4 S5 S6 0 S5 S3 S1 0 S6 S8 S0 1 S7 S0 S1 1 S8 S0 S6 0
B
01 S0 S1 S5 0 S1 S2 S7 1 S2 S2 S5 1 S3 S5 S7 0 S5 S3 S1 0 S6 S8 S0 1 S7 S0 S1 1 S8 S0 S6 0
l, d
l, d
l
q0
q1
l q0
q1
q2
非 l,d
图(a)
图(b)
如果赋予状态q0、q1与q2一定的操作,则
编译原理实验 无符号数的有穷自动机的实现
实验二 无符号数的有穷自动机的实现学时数:4[实验内容]:无符号数的有穷自动机的实现。
利用状态表和有限自动机的运行原理编制程序,使得程序能够识别一个输入串是否为一个无符号定点实数。
[实验目的]:1、理解有限自动机的作用;进一步理解自动机理论。
1、 用状态图和状态表表示有限自动机;3、以程序实现有限自动机的运行过程;掌握文法转换成自动机的技术及有穷自动机实现的方法。
[实验要求]:1、 设计要求:利用状态图或状态表相关理论,利用有限自动机理论。
2、 功能要求:输入一个单行无空格的字符串(以“#”号结束),如果该字符串是一个合法的输入,则显示“接受”,否则显示“不接受”。
3、 输入/输出示例(以无符号定点实数为例):(1)输入:“3.14”,输出:“接受”;(2)输入:“3.1.4”,输出:“不接受”;(3)输入:“3ab ”,输出:“不接受”。
[实验提示]:1、无符号数的BNF 描述如下:0.<无符号数> → d <余留无符号数> | . <十进制数> | e <指数部分>1.<余留无符号数> → d <余留无符号数> | . <十进制数> | e <指数部分> | ε2.<十进制小数> → d <余留十进制小数>3.<余留十进制小数> e <指数部分> | d <余留十进制小数> | ε4.<指数部分> → d <余留整指数数> | + <整指数> | - <整指数>5.<整指数> → d <余留整指数数>6.<余留整指数数> → d <余留整指数数> | ε2、将G[<无符号数>]文法转换成有穷自动机见图1。
图13、构造状态矩阵;将有穷自动机的状S 1 S 2 ……S n 及输入的字a 1 a 2 ……a m 构成一个n*m 的矩阵。
03有穷状态自动机
状态
q0 q1
输入字符
0 q1 q2 1 q0 q0
q2
终止状态 q3
q3
q3
q0
q3
16
例3-2
一种更为直观的表示
17
状态转移图
状态转移图(transition diagram) (1) q∈Q q是该有向图中的一个顶点; (2)δ(q,a)=p 图中有一条从顶点q到顶点p的标记为a的弧; (3) q∈F 标记为q的顶点被用双层圈标出; (4) 用标有S的箭头指出M的开始状态。 状态转移图又可以叫做状态转换图。
18
例3-3
构造一个DFA,它接受的语言为{ x000 | x∈{0,1}* }。 在状态q0读到的0可能是输入字符串的最后三个0的第1个0; 在状态q1紧接着读到的0可能是输入字符串的最后三个0的第 2个0; 在状态q2紧接着读到的0可能是输入字符串的最后三个0的第 3个0; 在状态q3紧接着读到的0也可能是输入字符串的最后三个0的 第3个0; 如果在状态q1 ,q2 ,q3读到的是1,则要重新检查输入串是否以 三个0结尾。
M2=({q0,q1,q2,q3},{0,1,2},δ2,q0,{q2}) δ2(q0,0)= q1,δ2(q1,0)= q2,δ2(q2,0)= q1,δ2(q3,0)= q3 δ2(q0,1)= q3,δ2(q1,1)= q3 ,δ2(q2,1)= q3,δ2(q3,1)= q3 δ2(q0,2)= q3,δ2(q1,2)= q3 ,δ2(q2,2)= q3,δ2(q3,2)= q3 表3-2 δ 2转换函数 状态说明 开始状态 终止状态 状态 0 q0 q1 q2 q3 q1 q2 q1 q3 输入字符 1 q3 q3 q3 q3 2 q3 q3 q3 q3
有穷自动机
有几个输入符号 都导致从q到p的转 移.
§2.2 确定型有穷自动机(DFA)
其转移表(函数)为:
3、 转移函数的扩充(处理串)
ˆ : Q Q
称为扩展转移函数。
描述从任何转态开始读任何输入序列时所发生的事情。 接受状态q和串w, 返回状态p。
§2.2 确定型有穷自动机(DFA)
⑷ 用标有Start的箭头指出的DFA的初始状态。
定义2.2.3 转移表,就是列出δ函数的表格,隐含地说明状态 集合和输入字母表。
§2.2 确定型有穷自动机(DFA)
例2 设计一个DFA满足如下情况:
Q q0 , q1, q2 , 0,1, F q1
(q0 ,0) q2 , (q1,0) q1, (q2 ,0) q2 , (q0 ,1) q0 , (q1,1) q1, (q2 ,1) q1,
对(q,a)∈Q×∑,δ(q,a)= {p1,p2,…,pm}表示A在状态q读入字符a, 可以选择地将状态变成p1、或者p2、…、或者pm ,并将读头向右移动一个带
方格而指向输入字符串的下一个字符。
§2.3 非确定型有穷自动机(NFA)
FA的状态转移图、FA的状态对应的等价类对NFA都有效。
读入0时,引导A到达下一个状态的字符串为x0, x0=2*(3*n+2)=3*2*n+4=3*(2*n+1)+1。所以δ(q2,0)= q1;
读入1时,引导A到达下一个状态的字符串为x1,
x1=2*(3*n+2)+1=3*2*n+4+1=3*(2*n+1)+2。所以,δ(q2,1)= q2 。
无符号数的有穷自动机的实现
内蒙古工业大学信息工程学院实验报告课程名称: _____编译原理 _____ _实验名称:无符号数的有穷自动机的实现实验类型:验证性□ 综合性□ 设计性□实验室名称:电力大楼九楼东班级:计12-1班学号: 201220201006 姓名:初旭组别:同组人:成绩:实验日期: 2015年6月2日实验一无符号数的有穷自动机的实现(一)实验目的无符号数的有穷自动机的实现目的是使学生掌握文法的形式描述,穷自动机的概念。
将文法转换成有穷自动机的方法,理解出错处理程序思想,如何用状态矩阵实现一个穷自动机的机内表示。
(二)实验内容1.无符号数的BNF描述(0)<无符号数> → d <余留无符号数> | .<十进制数> | e <指数部分> (1)<余留无符号数>→d <余留无符号数>|.<十进制数> | e <指数部分>|ε(2)<十进制小数> → d <余留十进制小数>(3)<余留十进制小数> e <指数部分> | d <余留十进制小数> | ε(4)<指数部分> → d <余留整指数> | + <整指数> | - <整指数>(5)<整指数> → d <余留整指数>(6)<余留整指数> → d <余留整指数> | ε2.将G[<无符号数>]文法转换成有穷自动机。
3.构造状态矩阵;将有穷自动机的状S1S2……Sn及输入的字a1a2……am构成一个n*m的矩阵。
4.用状态矩阵设计出一个词法分析程序。
5.扫描无符号数,根据文法给出无符号数出错的位置。
(三)实验原理1)无符号数的文法描述如下:0.<无符号数> → d <余留无符号数> | . <十进制数> | e <指数部分> 1.<余留无符号数> → d <余留无符号数> | . <十进制数> | e <指数部分> | ε2.<十进制小数> → d <余留十进制小数>3.<余留十进制小数> e <指数部分> | d <余留十进制小数> | ε4.<指数部分> → d <余留整指数> | + <整指数> | - <整指数>5.<整指数> → d <余留整指数>6.<余留整指数> → d <余留整指数> | ε2)无符号数的有穷自动机实现的思想用0-----表示无符号数;用1-----表示余留无符号数;用2----表示十进制小数;用3-----表示余留十进制小数;用4-----表示指数部分;用5-----表示整指数;用6-----表示余留整指数。
习题参考答案-编译原理及实践教程(第3版)-黄贤英-清华大学出版社
附录部分习题参考答案第1章习题1. 解释下列术语。
翻译程序,编译程序,解释程序,源程序,目标程序,遍,前端,后端解答:略!2. 高级语言程序有哪两种执行方式?阐述其主要异同点。
描述编译方式执行程序的过程。
解答:略!3. 在你所使用的C语言编译器中,观察程序1.1经过预处理、编译、汇编、链接四个过程生成的中间结果。
解答:略!4. 编译程序有哪些主要构成成分?各自的主要功能是什么?解答:略!5. 编译程序的构造需要掌握哪些原理和技术?编译程序构造工具的作用是什么?解答:略!6. 复习C语言,其字母表中有哪些符号?有哪些关键字、运算符和界符?标识符、整数和实数的构成规则是怎样的?各种语句和表达式的结构是什么样的?解答:略!7.编译技术可应用在哪些领域?解答:略!8. 你能解释在Java编译器中,输入某个符号后会提示一些单词、某些单词会变为不同的颜色是如何实现的吗?你能解释在Code Blocks中在输入{后,会自动添加},输入do 会自动添加while()是为什么吗?解答:略!第2章习题1. 判断题,对下面的陈述,正确的在陈述后的括号内画√,否则画×。
(1) 有穷自动机识别的语言是正规语言。
()(2) 若r1和r2是Σ上的正则表达式,则r1|r2也是。
()(3) 设M是一个NFA,并且L(M)={x,y,z},则M的状态数至少为4个。
()(4) 令Σ={a,b},则所有以b开头的字构成的正规集的正则表达式为b*(a|b)*。
()(5) 对任何一个NFA M,都存在一个DFA M',使得L(M')=L(M)。
()1解答:略!2.从供选择的答案中,选出应填入下面叙述中?内的最确切的解答。
有穷自动机可用五元组(Q,V T,δ,q0,Q f)来描述,设有一有穷自动机M定义如下:V T={0,1},Q={q0,q1,q2},Q f={q2},δ的定义为:δ (q0,0)=q1δ (q1,0)=q2δ (q2,1)=q2δ (q2,0)=q2M是一个 A 有穷状态自动机,它所对应的状态转换图为 B ,它所能接受的语言可以用正则表达式表示为 C 。
有穷自动机的原理及应用-old
Partition Refinement
Hopcroft 算法伪代码
P := {F, Q \ F }; // \ 表示集合减法,Q表示所有状态的集合,F 表示终止状态集合 W := {F, Q \ F }; // 此伪代码来源于维基百科,但维基百科此行有误 // Q \ F 也必须加入 W (WaitingSet) // 其它一些论文中将 W 初始化为 { min(F, Q \ F) }, 也不对 while (W is not empty) do choose and remove a set A from W for each c in ∑ do let X be the set of states for which a transition on c leads to a state in A for each set Y in P for which X ∩ Y is nonempty do replace Y in P by the two sets X ∩ Y and Y \ X if Y is in W replace Y in W by the same two sets else add min( X ∩ Y, Y \ X ) to W
10缩可以应用到任意形状的dfa上包括有环有环的dfaradixtree是一种应用了路径压缩的trie在mindfa上应用路径压缩可进一步减小状态数应用了路径压缩的dfa不再是严格意义上的dfa无法很难进行修改操作通用的dfa算法不再适用与计算字典序的算法完美兼容acahocorasick自动机ac自动机与trieac自动机是基于trie的每个状态中有附加数据一个faillink模式串集合的一个子集因为一个模式串可能是另一个模式串的后缀ac自动机可以用doublearray实现ac自动机最坏情况时间复杂度是最优的扩展的ac自动机dfa的实现最简单的实现需附带
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
编译原理》无符号数的有穷自动机的实现(2007-12-04 15:07:27)
package test;
import java.io.*;
public class Test1 {
public static void main(String args[]){
InputStream input=System.in;
InputStreamReader reader=new InputStreamReader(input);
BufferedReader buf=new BufferedReader(reader);
char num[]=new char[10];
String line=null;
int i,flag;
char ch1,ch2;
while(true){
System.out.println("Please Input Number:");
try{
line=buf.readLine();
}catch(Exception e){
e.printStackTrace();
}
if(line.equals("exit")){
System.out.println("退出");
break;
}
line=line+"$";
num=line.toCharArray();
i=0;
flag=0;
while(num[i]!='$'){
ch1=num[i];
ch2=num[i+1];
if(ch1>='0'&&ch1<='9'){
if((ch2>='0'&&ch2<='9') || ch2=='.' || ch2=='e' || ch2=='$'){
flag=1;
}
else
flag=0;
}
if(ch1=='.'){
if(ch2>='0'&&ch2<='9'||ch2=='$'){
flag=1;
}
else
flag=0;
}
if(ch1=='e'){
if(ch2>='0'&&ch2<='9'||ch2=='+'||ch2=='-'||ch2=='$'){ flag=1;
}
else flag=0;
}
if(ch1=='+'||ch1=='-'){
if(i==0)break;
if(ch2>='0'&&ch2<='9'||ch2=='$'){
flag=1;
}
else flag=0;
}
if(flag==0)break;
++i;
}
if(flag==0){
System.out.println("You have Input a error number!");
i=i+2;
System.out.println("The error number is "+i+" letter!"); }
else
System.out.println("You Input a right number!");
}
if(input!=null){
try{
input.close();
}catch(Exception e){
e.printStackTrace();
}
} }
}。