编译原理 词法分析+语法分析

合集下载

编译原理词法分析与语法分析的核心算法

编译原理词法分析与语法分析的核心算法

编译原理词法分析与语法分析的核心算法编译原理是计算机科学与技术领域中的一门重要课程。

在编程中,我们常常需要将高级语言编写的程序翻译成机器语言,使计算机能够理解并执行我们编写的程序。

而编译原理中的词法分析和语法分析是编译器的两个核心算法。

一、词法分析词法分析是编译器的第一个阶段,它负责将输入的字符序列(源代码)划分为一个个的有意义的词素(Token),并生成相应的词法单元(Lexeme)。

词法分析的核心算法主要包括以下两个步骤:1. 正则表达式到有限自动机的转换:正则表达式是一种描述字符串匹配模式的表达式,它可以用来描述词法分析中各种词素的规则。

而有限自动机则是一种用来识别或匹配正则表达式所描述的模式的计算模型。

将正则表达式转换为有限自动机是词法分析的关键步骤之一。

2. 词法分析器的生成:在将正则表达式转换为有限自动机后,我们可以使用生成器工具(如Lex、Flex等)来生成词法分析器。

词法分析器可以按照预定的规则扫描源代码,并将识别出的词素转换成相应的词法单元,供后续的语法分析使用。

二、语法分析语法分析是编译器的第二个阶段,它负责分析和处理词法分析阶段生成的词法单元序列,并根据预定的语法规则确定语法正确的序列。

语法分析的核心算法主要包括以下两个步骤:1. 上下文无关文法的定义:上下文无关文法(Context-Free Grammar,简称CFG)是一种用于描述形式语言的文法。

它由一组产生式和终结符号组成,可以用于描述语法分析中的语法规则。

在语法分析中,我们需要根据具体编程语言的语法规则,编写相应的上下文无关文法。

2. 语法分析器的生成:通过使用生成器工具(如Yacc、Bison等),我们可以根据上下文无关文法生成语法分析器。

语法分析器可以根据预先定义的文法规则,对词法单元序列进行分析,并构建出语法树(Parse Tree)供后续的语义分析和代码生成使用。

综上所述,词法分析与语法分析是编译原理中的两个重要阶段,也是实现编译器的核心算法。

编译原理与技术

编译原理与技术

编译原理与技术
当我们谈论编译原理与技术时,我们在讨论的是一种方法和技术,通过它们可以将高级编程语言转换为计算机可执行的机器码。

编译原理是计算机科学的一个重要领域,涉及到编译器的设计和开发过程。

编译原理的基本概念包括词法分析、语法分析、语义分析、中间代码生成、代码优化和代码生成等。

词法分析是将源代码转换成单词序列的过程,而语法分析则是将这些单词序列组织成语法树的过程。

语义分析负责检查语义错误,并生成中间代码。

中间代码生成是将高级语言转换为中间表示形式的过程,可以是抽象语法树、三地址码或类似的形式。

在这个阶段,编译器还可以进行各种优化,如常量折叠、循环展开和内联优化等。

代码生成是将中间代码转换为目标代码的过程,目标代码可以是机器码、汇编代码或其他可执行形式。

在最终的代码生成阶段,还可以进行最后的优化和调整,以提高代码的运行效率。

编译原理与技术在软件开发过程中起着关键作用。

通过使用编译原理与技术,开发人员可以更高效地将高级编程语言转换为计算机可以理解和执行的代码。

这种转换过程不仅可以提高程序的执行效率,还可以提供更好的错误检测和调试功能。

总之,编译原理与技术是一门重要的学科,可以帮助开发人员更好地理解和应用编译器技术,从而提高软件开发的效率和质量。

编译原理中的词法分析与语法分析原理解析

编译原理中的词法分析与语法分析原理解析

编译原理中的词法分析与语法分析原理解析编译原理是计算机科学中的重要课程,它研究的是如何将源程序翻译成目标程序的过程。

而词法分析和语法分析则是编译过程中的两个重要阶段,它们负责将源程序转换成抽象语法树,为接下来的语义分析和代码生成阶段做准备。

本文将从词法分析和语法分析的原理、方法和实现技术角度进行详细解析,以期对读者有所帮助。

一、词法分析的原理1.词法分析的定义词法分析(Lexical Analysis)是编译过程中的第一个阶段,它负责将源程序中的字符流转换成标记流的过程。

源程序中的字符流是没有结构的,而编程语言是有一定结构的,因此需要通过词法分析将源程序中的字符流转换成有意义的标记流,以便之后的语法分析和语义分析的进行。

在词法分析的过程中,会将源程序中的字符划分成一系列的标记(Token),每个标记都包含了一定的语义信息,比如关键字、标识符、常量等等。

2.词法分析的原理词法分析的原理主要是通过有限状态自动机(Finite State Automaton,FSA)来实现的。

有限状态自动机是一个数学模型,它描述了一个自动机可以处于的所有可能的状态以及状态之间的转移关系。

在词法分析过程中,会将源程序中的字符逐个读取,并根据当前的状态和字符的输入来确定下一个状态。

最终,当字符读取完毕时,自动机会处于某一状态,这个状态就代表了当前的标记。

3.词法分析的实现技术词法分析的实现技术主要有两种,一种是手工实现,另一种是使用词法分析器生成工具。

手工实现词法分析器的过程通常需要编写一系列的正则表达式来描述不同类型的标记,并通过有限状态自动机来实现这些正则表达式的匹配过程。

这个过程需要大量的人力和时间,而且容易出错。

而使用词法分析器生成工具则可以自动生成词法分析器的代码,开发者只需要定义好源程序中的各种标记,然后通过这些工具自动生成对应的词法分析器。

常见的词法分析器生成工具有Lex和Flex等。

二、语法分析的原理1.语法分析的定义语法分析(Syntax Analysis)是编译过程中的第二个阶段,它负责将词法分析得到的标记流转换成抽象语法树的过程。

编译原理词法分析和语法分析

编译原理词法分析和语法分析
if(ch=='=')
{ syn=21;
token[m++]=ch;
}
else
{ syn=31;
p--;
}
break;
case '=':token[m++]=ch;
ch=prog[p++];
if(ch=='=')
{ syn=25;
token[m++]=ch;
}
else
{ syn=18;
p--;
}
break;
break;
case -1:printf("you have input a wrong string\n");
getch();
exit(0);
default: printf("( %-10s%5d )\n",token,syn);
break;
}
}while(syn!=0);
getch();
}
scaner()
printf("success!\n");
}
else { if(kk!=1) printf("the string haven't got a 'end'!\n");
kk=1;
}
}
else { printf("haven't got a 'begin'!\n");
kk=1;
}
return;
}
yucu()
if(syn==18)
{ scaner();/*读下一个单词符号*/

C语言编译原理词法分析和语法分析

C语言编译原理词法分析和语法分析

C语言编译原理词法分析和语法分析编程语言的编写和使用离不开编译器的支持,而编译器的核心功能之一就是对代码进行词法分析和语法分析。

C语言作为一种常用的高级编程语言,也有着自己的词法分析和语法分析规则。

一、词法分析词法分析是编译器的第一阶段,也是将源代码拆分为一个个独立单词(token)的过程。

在C语言中,常见的单词包括关键字(如if、while等)、标识符(如变量名)、常量(如数字、字符常量)等。

词法分析器会根据预定义的规则对源代码进行扫描,并将扫描到的单词转化为对应的符号表示。

词法分析的过程可以通过有限自动机来实现,其中包括各种状态和状态转换规则。

词法分析器通常会使用正则表达式和有限自动机的方法来进行实现。

通过词法分析,源代码可以被分解为一个个符号,为后续的语法分析提供基础。

二、语法分析语法分析是编译器的第二阶段,也是将词法分析得到的单词序列转换为一棵具有语法结构的抽象语法树(AST)的过程。

在C语言中,语法分析器会根据C语言的文法规则,逐句解析源代码,并生成相应的语法树。

C语言的语法规则相对复杂,其中包括了各种语句、表达式、声明等。

语法分析的过程主要通过递归下降分析法、LR分析法等来实现。

语法分析器会根据文法规则建立语法树的分析过程,对每个语法结构进行逐步推导和分析,最终生成一棵完整的语法树。

三、编译器中的词法分析和语法分析在编译器中实现词法分析和语法分析是一项重要的技术任务。

编译器通常会将词法分析和语法分析整合在一起,形成一个完整的前端。

在C语言编译器中,词法分析和语法分析器会根据C语言的词法规则和文法规则,对源代码进行解析,并生成相应的中间表示形式,如语法树或者中间代码。

词法分析和语法分析的结果会成为后续编译器中各个阶段的输入,如语义分析、中间代码生成、目标代码生成等。

编译器的优化和错误处理也与词法分析和语法分析有密切关系。

因此,对词法分析和语法分析的理解和实现对于编译器开发者而言是非常重要的。

java编译原理

java编译原理

java编译原理Java编译原理。

Java编译原理是指Java程序在编译过程中所遵循的规则和原理。

了解Java编译原理对于理解Java程序的运行机制和优化程序性能具有重要意义。

本文将从词法分析、语法分析、语义分析、中间代码生成、代码优化和目标代码生成等方面介绍Java编译原理的相关知识。

首先,词法分析是编译器的第一步,它将源代码分解成一个个的词素,即标识符、关键字、运算符等。

词法分析器会去除掉源代码中的注释,并将源代码转换成一个个的标记,以便后续的处理。

词法分析的结果是一个标记流,它是语法分析的输入。

接着,语法分析是词法分析的下一步,它将标记流转换成抽象语法树。

抽象语法树是一种树状结构,它反映了源代码的语法结构。

语法分析器会根据语法规则对标记流进行分析,如果源代码不符合语法规则,语法分析器会报告错误。

一旦语法分析完成,就可以进行语义分析。

语义分析是编译器的下一步,它对抽象语法树进行分析,检查源代码中是否存在语义错误。

语义分析器会对标识符的声明和使用进行检查,以及类型的匹配等。

如果源代码存在语义错误,语义分析器会报告错误。

一旦语义分析完成,就可以进行中间代码生成。

中间代码生成是编译器的下一步,它将抽象语法树转换成一种中间表示形式,以便后续的处理。

中间代码是一种抽象的机器语言,它反映了源代码的计算过程。

中间代码生成器会根据源代码生成中间代码,并将中间代码传递给代码优化器。

代码优化是编译器的下一步,它对中间代码进行优化,以提高程序的性能。

代码优化器会对中间代码进行各种优化,如常量折叠、死代码删除、循环展开等。

优化后的中间代码将传递给目标代码生成器。

目标代码生成是编译器的最后一步,它将优化后的中间代码转换成目标机器的机器语言。

目标代码生成器会根据目标机器的特性生成机器语言,并将机器语言输出到目标文件中。

一旦目标代码生成完成,编译过程就结束了。

综上所述,Java编译原理涉及词法分析、语法分析、语义分析、中间代码生成、代码优化和目标代码生成等方面的知识。

编译原理的词法分析与语法分析

编译原理的词法分析与语法分析

编译原理的词法分析与语法分析编译原理是计算机科学中的一门重要课程,它研究如何将源代码转换为可执行的机器代码。

在编译过程中,词法分析和语法分析是其中两个基本的阶段。

本文将分别介绍词法分析和语法分析的基本概念、原理以及实现方法。

1. 词法分析词法分析是编译过程中的第一个阶段,主要任务是将输入的源代码分解成一个个的词法单元。

词法单元是指具有独立意义的最小语法单位,比如变量名、关键字、操作符等。

词法分析器通常使用有限自动机(finite automaton)来实现。

在词法分析的过程中,需要定义词法规则,即描述每个词法单元的模式。

常见的词法规则有正则表达式和有限自动机。

词法分析器会根据这些规则匹配输入的字符序列,并生成相应的词法单元。

2. 语法分析语法分析是编译过程中的第二个阶段,它的任务是将词法分析器生成的词法单元序列转换为语法树(syntax tree)或抽象语法树(abstract syntax tree)。

语法树是源代码的一种抽象表示方式,它反映了源代码中语法结构和运算优先级的关系。

语法分析器通常使用上下文无关文法(context-free grammar)来描述源代码的语法结构。

常见的语法分析算法有递归下降分析法、LR分析法和LL分析法等。

递归下降分析法是一种自顶向下的分析方法,它从源代码的起始符号开始,递归地展开产生式,直到匹配到输入的词法单元。

递归下降分析法的实现比较直观,但对于左递归的文法处理不方便。

LR分析法是一种自底向上的分析方法,它使用一个自动机来分析输入的词法单元,并根据文法规则进行规约操作,最终生成语法树。

常见的LR分析法有LR(0)、SLR、LR(1)和LALR等。

LL分析法是一种自顶向下的分析方法,它从源代码的起始符号开始,预测下一个要匹配的词法单元,并进行相应的推导规则。

LL分析法常用于编程语言中,如Java和Python。

3. 词法分析和语法分析的关系词法分析是语法分析的一个子阶段,它为语法分析器提供了一个符号序列,并根据语法规则进行分析和匹配。

编译原理词法分析和语法分析报告+代码[C语言版]

编译原理词法分析和语法分析报告+代码[C语言版]

词法分析一、实验目的设计、编制并调试一个词法分析程序,加深对词法分析原理的理解。

二、实验要求2.1 待分析的简单的词法(1)关键字:begin if then while do end所有的关键字都是小写。

(2)运算符和界符:= + - * / < <= <> > >= = ; ( ) #(3)其他单词是标识符(ID)和整型常数(SUM),通过以下正规式定义:ID = letter (letter | digit)*NUM = digit digit*(4)空格有空白、制表符和换行符组成。

空格一般用来分隔ID、SUM、运算符、界符和关键字,词法分析阶段通常被忽略。

2.2 各种单词符号对应的种别码:表2.1 各种单词符号对应的种别码2.3 词法分析程序的功能:输入:所给文法的源程序字符串。

输出:二元组(syn,token或sum)构成的序列。

其中:syn为单词种别码;token为存放的单词自身字符串;sum为整型常数。

例如:对源程序begin x:=9: if x>9 then x:=2*x+1/3; end #的源文件,经过词法分析后输出如下序列:(1,begin)(10,x)(18,:=)(11,9)(26,;)(2,if)……三、词法分析程序的算法思想:算法的基本任务是从字符串表示的源程序中识别出具有独立意义的单词符号,其基本思想是根据扫描到单词符号的第一个字符的种类,拼出相应的单词符号。

3.1 主程序示意图:主程序示意图如图3-1所示。

其中初始包括以下两个方面:⑴关键字表的初值。

关键字作为特殊标识符处理,把它们预先安排在一张表格中(称为关键字表),当扫描程序识别出标识符时,查关键字表。

如能查到匹配的单词,则该单词为关键字,否则为一般标识符。

关键字表为一个字符串数组,其描述如下:Char *rwtab[6] = {“begin”, “if”, “then”, “while”, “do”, “end”,};是图3-1(2)程序中需要用到的主要变量为syn,token和sum3.2 扫描子程序的算法思想:首先设置3个变量:①token用来存放构成单词符号的字符串;②sum用来整型单词;③syn用来存放单词符号的种别码。

编译原理pdf

编译原理pdf

编译原理pdf编译原理是计算机科学中的一门重要课程,它涉及到计算机程序的编写、编译和执行过程,对于理解计算机程序的工作原理和优化程序性能具有重要意义。

本文将介绍编译原理的基本概念、主要内容和相关知识点,并提供编译原理pdf文档供大家学习参考。

编译原理是指将高级语言程序翻译成机器语言程序的过程,这个过程主要包括词法分析、语法分析、语义分析、中间代码生成、代码优化和目标代码生成等阶段。

在这个过程中,编译器需要将高级语言程序转换成中间代码,然后再将中间代码转换成目标机器的机器语言程序,最终实现程序的执行。

在编译原理的学习过程中,我们需要了解一些基本概念,比如文法、自动机、语法分析、语义分析、中间代码等。

文法是描述程序语言结构的形式化方法,它由终结符、非终结符、产生式和起始符号组成。

自动机是一种抽象的数学模型,用来描述程序的执行过程。

语法分析是指根据给定的文法规则,将输入的程序文本分析成语法树的过程。

语义分析是指确定程序文本的含义和执行过程的过程。

中间代码是指将高级语言程序转换成的一种中间形式,它比源程序更接近目标机器的机器语言程序。

编译原理pdf文档是学习编译原理的重要资源,它可以帮助我们更好地理解编译原理的基本概念和知识点。

在编译原理pdf文档中,通常会包括编译原理的基本概念、词法分析、语法分析、语义分析、中间代码生成、代码优化、目标代码生成等内容。

通过阅读编译原理pdf文档,我们可以更加系统地学习编译原理的相关知识,加深对编译原理的理解。

除了编译原理pdf文档,我们还可以通过其他途径学习编译原理,比如参加相关课程、阅读相关书籍、参与编译原理的实践项目等。

通过多种途径的学习,我们可以更全面地掌握编译原理的知识,提高编译原理的应用能力。

总之,编译原理是计算机科学中的重要课程,它涉及到计算机程序的编写、编译和执行过程,对于理解计算机程序的工作原理和优化程序性能具有重要意义。

通过学习编译原理pdf文档和其他途径,我们可以更好地掌握编译原理的基本概念和知识点,提高编译原理的应用能力。

编译原理词法分析与语法分析

编译原理词法分析与语法分析

编译原理词法分析与语法分析在计算机科学领域,编译器是一个非常重要的工具,它将高级程序语言转换为能够被计算机处理的低级机器语言。

编译器的设计与开发离不开以下两个主要部分:词法分析和语法分析。

本文将着重介绍编译原理中的词法分析和语法分析的定义、原理、方法以及它们之间的关系。

一、词法分析词法分析是编译器的第一个阶段,负责将源代码转化为一个个“词法单元”,也称为“记号”。

词法单元是计算机程序中的最小语义单位,例如变量名、关键字、操作符等。

词法分析器会从源代码中连续读取字符,并将其组成具有独立意义的词法单元。

词法分析的主要任务是识别代码中的词法单元,并将其分类。

它采用正则表达式来定义词法单元的模式,并通过有限状态自动机(FSM)进行匹配。

以下是词法分析的一般步骤:1. 输入源代码,逐字符读取。

2. 将字符组合成词法单元。

3. 跳过空格、换行符等不相关的字符。

4. 使用正则表达式判断词法单元的类型。

5. 将识别出的词法单元传递给语法分析阶段。

二、语法分析语法分析是编译器的第二个阶段,它将从词法分析器获得的词法单元串转换为语法树。

语法树是一种树状结构,用于表示程序的语法结构。

它通过分析词法单元之间的关系来检查程序是否符合语法规则。

在语法分析过程中,会根据源代码中的语法规则使用上下文无关文法(Context-Free Grammar)进行分析。

常用的语法分析算法有自顶向下分析(Top-Down Parsing)和自底向上分析(Bottom-Up Parsing)。

自顶向下分析是从语法的起始符号开始,逐步展开已识别的符号,直到生成源代码。

这种分析方法常用的算法有LL(k)和递归下降(Recursive Descent)。

自顶向下分析器按照语法规则从上到下预测并展开符号。

自底向上分析是从词法单元串的底部开始,逐步归约已识别的符号,直到生成源代码。

这种分析方法常用的算法有LR(k)和LALR(k)。

自底向上分析器按照语法规则从下往上扫描,并进行归约操作。

编译原理-语法分析

编译原理-语法分析
03
自顶向下的语法分析方法简单直观,易于实现,但可能存在 左递归和回溯的问题。
自底向上的语法分析
01
自底向上的语法分析方法从源代码中的每个符号出发
,逐步归约到文法的起始符号。
02
该方法通常采用LR(0)、SLR(1)、LALR(1)等算法进行
实现。
03
自底向上的语法分析方法可以避免回溯问题,但需要
• 随着人工智能和机器学习技术的不断发展,可以利用这些技术来辅助语法分析 过程,提高语法分析的准确性和效率。例如,可以使用机器学习算法来自动识 别和处理语法规则和歧义问题。
• 另外,随着软件工程和代码质量的重视程度不断提高,对编译器和语法分析器 的要求也越来越高。未来的研究需要更加注重编译器和语法分析器的可维护性 和可扩展性,以满足不断变化的软件需求。
词法分析的算法
自底向上算法
自底向上算法是从源代码的左向右进行扫描,并从下到上构建语法结构。常见 的自底向上算法有预测分析法和移进-规约法。
自顶向下算法
自顶向下算法是从语法结构的顶层开始,向下进行推导,直到找到与源代码相 匹配的语法结构。常见的自顶向下算法有规范分析法和贪婪分析法。
语法分析概述
语法分析是编译过程的核心环节,其任务是将源代码分解成一系列的语法 结构,以便后续的语义分析和代码生成。
自底向上的算法,通过构建归 约表进行移进和规约操作。
LALR(1)算法
扩展的LR(0)算法,能够处理 更广泛的文法,生成更小的归 约表。
03
语义分析
语义分析概述
01
Байду номын сангаас02
03
语义分析是编译过程的 一个阶段,它是在语法
分析之后进行的。
语义分析的主要任务是 检查源代码的语义是否 正确,例如变量是否已 经声明,类型是否匹配

编译原理概述

编译原理概述

编译原理概述
编译原理是计算机科学中的重要概念,是指设计和构建编译器的理论和技术。

编译器是一种将高级语言代码翻译成底层机器语言代码的程序,它起着将源代码翻译成目标代码的作用。

编译原理的主要研究对象是编译器的构造和实现方法,以及编译过程中涉及的各种理论和技术问题。

编译原理的基本概念包括词法分析、语法分析、语义分析、中间代码生成、代码优化和目标代码生成等几个方面。

其中,词法分析是将源代码分解成一个个单词或记号的过程,语法分析是对单词或记号进行语法规则分析的过程,语义分析是确定代码真正含义的过程,中间代码生成是生成与源代码等价的目标代码的过程,代码优化是提高目标代码质量和性能的过程,目标代码生成是将中间代码翻译成机器代码的过程。

在编译原理中,最核心的部分是语法分析,它决定了编译器对源代码的理解和转换能力。

语法分析可以分为自上而下的分析方法和自下而上的分析方法。

自上而下的分析方法是从最抽象的语法规则开始逐步向下分解源代码,直到分解到最细粒度;自下而上的分析方法则是从最细粒度的语法规则开始逐步向上合成源代码,直到合成到最抽象的语法规则。

在编译原理的研究中,还涉及到一些高级主题,如编译器前端和后端的设计、编译器生成器的设计、抽象语法树和符号表的表示、代码生成技术、及时编译技术等。

总的来说,编译原理是计算机科学中非常重要的一个领域,它的研究成果直接影响着编程语言的设计和实现方式,也是软件工程师必须掌握的基础知识之一。

通过学习编译原理,可以更好地理解计算机语言的工作原理,提高编程能力和代码质量,为软件开发提供更好的支持和保障。

编译原理课程(词法分析器及语法分析器)

编译原理课程(词法分析器及语法分析器)

编译原理实验报告词法分析器与语法分析器I. 问题描述设计、编制并调试一个词法分析子程序,完成识别语言单词的任务;设计、编制、调试一个语法分析程序,并用它对词法分析程序所提供的单词序列进行语法检查和结构分析。

ii. 设计简要描述界面需求:为了更加形象的模拟过程,此实验使用图形界面。

要求从图形界面上输入输入串,点击词法分析,可以将词法分析后识别的单词符号显示,点击语法分析,可以将语法分析的堆栈过程显示,并且显示结果(是否是符合文法的句子),清空则可以将所有置空。

功能分析:1、由用户输入输入串;2、用户点击“词法分析”,可以将词法分析后识别的单词符号显示。

3、用户点击语法分析,可以将语法分析的堆栈过程显示,并且显示结果(是否是符合文法的句子)4、用户点击清空,则将界面所有组件置为空思路描述:一、设计构想:本实验决定编写一个简易C语言的词法分析器和语法分析器。

使其能够识别while,if等关键字,可以判断赋值语句、条件语句、循环语句。

二、文法分析1、需要识别的关键字及其识别码有:关键字识别码关键字识别码关键字识别码main 0 - 11 ;22int 1 * 12 > 23char 2 / 13 < 24if 3 ( 14 >= 25else 4 ) 15 <= 26for 5 [ 16 == 27while 6 ] 17 != 28ID 7 { 18 ERROR -1NUM 8 } 19= 9 , 20+ 10 : 212、文法〈程序〉→ main()〈语句块〉〈语句块〉→{〈语句串〉}〈语句串〉→〈语句〉;〈语句串〉|〈语句〉;〈语句〉→〈赋值语句〉|〈条件语句〉|〈循环语句〉〈赋值语句〉→ ID =〈表达式〉;〈条件语句〉→ if〈条件〉〈语句块〉〈循环语句〉→ while〈条件〉〈语句块〉〈条件〉→(〈表达式〉〈关系符〉〈表达式〉)〈表达式〉→〈表达式〉〈运算符〉〈表达式〉|(〈表达式〉)|ID|NUM〈运算符〉→+|-|*|/〈关系符〉→<|<=|>|>=|=|!>转化为符号表示:S→ main() K|空K→ { C }C→Y;C |空Y→F | T | XF→ ID = BT→ if J KX→ while J KJ→( B G B )B→ B Z B |( B )| ID | NUMZ→ + | - | * | /G→< | <= | > | >= | == | !>表示含义:S:程序 K:语句块 C:语句串 Y:语句 F :赋值语句T:条件语句 X:循环语句 J:条件 B:表达式 I:项 Z :运算符G:关系符3、LL(1)分析表(1),求出first集及follow集:FIRST(S)={mian}FIRST(K)={{}FIRST(C)= FIRST(Y)= {ID,if,while,空};FIRST(Y)= FIRST(F)+ FIRST(T)+ FIRST(X)={ID,if,while};FIRST(F)={ID};FIRST(T)={if};FIRST(X)={while};FIRST(J)= FIRST(B)={};FIRST(B)={(,ID,NUM };FIRST(Z)={+,-,*,/}FIRST(G)={<,<= ,>,>=,==,!= };FOLLO W(S)={#};FOLLO W(K)={;};FOLLO W(C)={}};FOLLO W(Y)={;}FOLLO W(F)={;};FOLLO W(T)={;};FOLLO W(X)={;};FOLLO W(J)={{,;};FOLLO W(B)={+,-,*,/,),<,<= ,>,>=,==,!=,;};FOLLO W(B’)={+,-,*,/,),<,<= ,>,>=,==,!=,;};FOLLO W(Z)={(,ID,NUM };FOLLO W(G)={(,ID,NUM };(2)消除左递归,拆分文法关系并编号0、S→ 空1、S→ main() K2、K→ { C }3、C→Y;C4、C→空5、Y→ F6、Y→ T7、Y→ X8、F→ ID = B9、T→ if J K10、X→ while J K11、J→( B G B )12、 B→( B )B'13、B→ ID B'14、B→ NUM B'15、B'→ BZB B'16、B'→空17、Z→ +18、Z→ -19、Z→ *20、Z→ /21、 G→ <22、 G→ <=23、 G→ >24、 G→ >=25、 G→ ==26、 G→ !=(3)构造LL(1)分析表(注:在表中用上一步的编号表示所需要的产生式)main 空( ) { } ; = if while ID num + - * / < <= > >= == != #iii. 详细设计描述 项目构架:各函数功能介绍:1、word.wordList 包(存储了关键字):word :此类是定义了存储关键字的结构:包括String 型的关键字,和int 型的识别符。

编译原理流程

编译原理流程

编译原理流程编译原理是计算机科学的重要分支,主要研究如何将高级语言程序转化为机器语言的过程。

编译原理的流程可以分为词法分析、语法分析、语义分析、中间代码生成、代码优化和目标代码生成等几个阶段。

1. 词法分析词法分析是编译原理的第一步,主要任务是将源代码分解成一个个的词法单元,如标识符、关键字、运算符和常量等。

词法分析器会根据预先定义的词法规则,逐个扫描源代码,将识别出的词法单元转化为记号(token)并生成记号流。

2. 语法分析语法分析是编译原理的第二步,主要任务是根据词法分析生成的记号流,判断程序是否符合语法规则。

语法分析器会根据预先定义的语法规则,逐个分析记号流,构建语法树(parse tree)。

如果程序存在语法错误,则会报告错误信息。

3. 语义分析语义分析是编译原理的第三步,主要任务是对语法树进行语义检查,并生成中间代码。

语义分析器会根据预先定义的语义规则,对语法树进行遍历,检查变量的声明和使用是否符合规范,以及类型的一致性等。

同时,语义分析器会根据语义规则生成中间代码,用于后续的优化和目标代码生成。

4. 中间代码生成中间代码生成是编译原理的第四步,主要任务是将源代码转化为一种中间表示形式,以便进行优化和目标代码生成。

中间代码可以是抽象语法树(Abstract Syntax Tree,AST)、三地址码(Three Address Code)或虚拟机代码等。

中间代码的生成可以通过遍历语法树并根据语法规则进行转换。

5. 代码优化代码优化是编译原理的第五步,主要任务是对中间代码进行优化,以提高程序的执行效率。

代码优化包括常量折叠、公共子表达式消除、循环优化等技术。

优化器会根据预先定义的优化规则,对中间代码进行分析和转换,以减少不必要的计算和内存访问。

6. 目标代码生成目标代码生成是编译原理的最后一步,主要任务是将中间代码转化为目标机器代码,使得程序可以在目标机器上运行。

目标代码生成器会根据目标机器的特定指令集和寄存器分配策略,将中间代码转化为对应的目标机器代码,并生成可执行文件或目标文件。

编译原理基础:词法分析与语法分析

编译原理基础:词法分析与语法分析

编译原理基础:词法分析与语法分析一、引言- 编译器是一种将高级语言翻译成机器语言的重要工具,是计算机科学中的核心概念之一。

编译器的基本工作分为两个阶段:词法分析和语法分析。

本文将详细介绍和分析这两个步骤的内容和流程。

二、词法分析1. 定义- 词法分析是编译器的第一个阶段,也是最基本的阶段。

它负责对源代码进行词法单位的划分,生成词法单元流。

每个词法单元包括一个标识符和一个属性值。

2. 步骤- 读入源代码:编译器首先从源代码文件中读入整个代码内容。

- 去除空格和注释:通过正则表达式或其他方法,编译器去除源代码中的空格和注释,以便更好地处理剩余的代码。

- 划分词法单元:编译器根据一定的规则将代码划分为不同的词法单元,如关键字、标识符、运算符、常量等。

- 构建符号表:编译器将关键字和标识符添加到符号表中,以便后续的语法分析和语义分析过程中使用。

三、语法分析1. 定义- 语法分析是编译器的第二个阶段,它将词法分析生成的词法单元流作为输入,根据语法规则生成语法树或抽象语法树。

2. 步骤- 定义语法规则:编译器根据语言的语法规范定义语法规则,通常使用上下文无关文法(Context-Free Grammar)来描述。

- 构建语法分析器:编译器使用递归下降法或者LR分析法等算法来实现语法分析器。

递归下降法通过递归地调用子过程来实现语法分析,而LR分析法则通过建立一个有限状态机来分析源代码。

- 生成语法树或抽象语法树:编译器根据语法规则和输入的词法单元流,生成对应的语法树或抽象语法树。

语法树表示源代码的语法结构,抽象语法树还会剔除掉不必要的细节。

- 错误处理:在生成语法树或抽象语法树的过程中,编译器会检测到一些语法错误。

此时,编译器会输出错误信息,并尽可能恢复到正常的语法分析流程。

四、词法分析与语法分析的关系- 词法分析和语法分析是紧密关联的两个阶段。

词法分析阶段提供给语法分析阶段的词法单元流作为输入,语法分析阶段通过分析词法单元的序列来理解源代码的语法结构。

理解编译原理中的词法分析和语法分析

理解编译原理中的词法分析和语法分析

理解编译原理中的词法分析和语法分析词法分析和语法分析是编译原理中两个重要的步骤。

词法分析将源代码分成一个个词素(也称为token),并对每个词素进行词法分析。

词法分析器会根据语法规则,将源代码中的字符序列组合成一个个有意义的词素。

例如,在计算机程序中,词法分析器可以将源代码中的字符串"if"、"else"、"for"等识别为关键字,将变量名、函数名等识别为标识符,将数字识别为常量等。

词法分析器常使用正则表达式来描述和识别不同类型的词素。

语法分析则进一步分析词法分析生成的词素序列,检查其是否遵循给定的语法规则。

语法分析器会根据语法规则构建语法树(也称为抽象语法树),用于表示程序的结构和语义。

语法分析器常使用上下文无关文法来描述和分析程序的语法结构。

常见的语法分析方法有递归下降分析、LL分析、LR分析等。

词法分析和语法分析是编译原理中紧密联系的两个步骤。

词法分析将字符序列转换为有意义的词素,为后续的语法分析提供了基础。

语法分析则在词法分析的基础上,进一步分析词素序列的语法结构,以便进行语义分析和代码生成等后续步骤。

拓展:除了词法分析和语法分析,编译原理还涉及其他重要的步骤,如语义分析、优化和代码生成等。

语义分析阶段主要对语法分析生成的语法树进行语义检查,确保程序的语义正确。

优化阶段则对中间代码进行优化,以提高程序的性能。

代码生成阶段将优化后的中间代码转换为目标代码,以便在目标平台上执行。

此外,编译原理还涉及词法分析和语法分析的错误处理和恢复机制。

当遇到词法或语法错误时,编译器需要能够准确地诊断错误,并尽可能地提供有用的错误信息。

对于一些常见错误,编译器还可以提供纠正错误的建议。

同时,编译器还可以采用恢复机制,在错误发生后仍然能够继续进行词法分析和语法分析,尽可能多地发现错误。

编译原理中的词法分析与语法分析

编译原理中的词法分析与语法分析

编译原理中的词法分析与语法分析在编译原理中,词法分析和语法分析是构建编译器的两个关键步骤。

词法分析器和语法分析器被称为编译器前端的两个主要组成部分。

本文将分别介绍词法分析和语法分析的定义、作用、实现方法以及它们在编译过程中的具体应用。

词法分析词法分析是编译器的第一个阶段,也叫扫描器(Scanner)或词法扫描器。

它的主要任务是将输入的字符流(源代码)转换为一系列的单词或词法单元(Token),词法单元是编译器在后续分析中使用的最小有意义的单位,如关键字、标识符、运算符和常量等。

词法分析器的作用是将源代码分解成一个个词法单元,并对这些词法单元进行分类和标记。

常用的实现方法是有限自动机(DFA)或正则表达式,他们通过模式匹配来识别和处理词法单元。

在词法分析的过程中,我们可以排除源代码中不需要的信息,例如空格、注释等,只保留有实际意义的词法单元。

词法分析的结果是一个词法单元序列,它作为语法分析的输入。

词法分析器还可以进行错误检查,如识别出非法的标识符或操作符等。

语法分析语法分析是编译器的第二个阶段,也称为解析器(Parser)。

它的主要任务是将词法分析阶段产生的词法单元序列转换为一个抽象语法树(Abstract Syntax Tree,AST)或语法分析树,并根据语法规则检查源代码的语法正确性。

语法分析器的作用是根据预先定义的文法规则,对词法单元序列进行推导和匹配,并构建一个代表源代码结构的语法树。

常用的实现方法有LR分析器和LL分析器,它们通过构建状态转换图和预测分析表来确定下一步的推导动作。

语法分析的结果是一个表示源代码结构的语法树,它为后续的语义分析和代码生成提供了便利。

语法分析器还可以检测和报告语法错误,如不匹配的括号或缺失的分号等。

词法分析与语法分析在编译过程中的应用词法分析和语法分析是编译器的两个关键阶段,它们完成了源代码解析和结构分析的任务,为后续的语义分析和代码生成提供了基础。

词法分析的结果是一个词法单元序列,它提供了源代码中最小有意义的单位,为语法分析提供了输入。

(完整)编译原理实验报告(词法分析器 语法分析器)

(完整)编译原理实验报告(词法分析器 语法分析器)

编译原理实验报告实验一一、实验名称:词法分析器的设计二、实验目的:1,词法分析器能够识别简单语言的单词符号2,识别出并输出简单语言的基本字。

标示符。

无符号整数.运算符.和界符。

三、实验要求:给出一个简单语言单词符号的种别编码词法分析器四、实验原理:1、词法分析程序的算法思想算法的基本任务是从字符串表示的源程序中识别出具有独立意义的单词符号,其基本思想是根据扫描到单词符号的第一个字符的种类,拼出相应的单词符号.2、程序流程图(1)主程序(2)扫描子程序3、各种单词符号对应的种别码五、实验内容:1、实验分析编写程序时,先定义几个全局变量a[]、token[](均为字符串数组),c,s( char型),i,j,k(int型),a[]用来存放输入的字符串,token[]另一个则用来帮助识别单词符号,s用来表示正在分析的字符.字符串输入之后,逐个分析输入字符,判断其是否‘#’,若是表示字符串输入分析完毕,结束分析程序,若否则通过int digit(char c)、int letter(char c)判断其是数字,字符还是算术符,分别为用以判断数字或字符的情况,算术符的判断可以在switch语句中进行,还要通过函数int lookup(char token[])来判断标识符和保留字。

2 实验词法分析器源程序:#include 〈stdio.h〉#include <math.h>#include <string。

h>int i,j,k;char c,s,a[20],token[20]={’0’};int letter(char s){if((s〉=97)&&(s〈=122)) return(1);else return(0);}int digit(char s){if((s〉=48)&&(s<=57)) return(1);else return(0);}void get(){s=a[i];i=i+1;}void retract(){i=i-1;}int lookup(char token[20]){if(strcmp(token,"while")==0) return(1);else if(strcmp(token,"if")==0) return(2);else if(strcmp(token,"else”)==0) return(3);else if(strcmp(token,"switch”)==0) return(4);else if(strcmp(token,"case")==0) return(5);else return(0);}void main(){printf(”please input string :\n");i=0;do{i=i+1;scanf("%c",&a[i]);}while(a[i]!=’#’);i=1;j=0;get();while(s!=’#'){ memset(token,0,20);switch(s){case 'a':case ’b':case ’c':case ’d':case ’e’:case ’f’:case 'g’:case ’h':case 'i':case ’j':case 'k’:case ’l':case 'm’:case 'n':case ’o':case ’p':case ’q’:case 'r’:case 's’:case 't’:case ’u’:case ’v’:case ’w’:case ’x':case ’y':case ’z’:while(letter(s)||digit(s)){token[j]=s;j=j+1;get();}retract();k=lookup(token);if(k==0)printf("(%d,%s)”,6,token);else printf("(%d,—)",k);break;case ’0':case ’1’:case ’2':case ’3':case '4’:case '5’:case ’6':case ’7’:case ’8’:case '9’:while(digit(s)){token[j]=s;j=j+1;get();}retract();printf(”%d,%s",7,token);break;case '+':printf(”(’+',NULL)”);break;case ’-':printf("(’-',null)");break;case ’*':printf(”('*’,null)");break;case '<':get();if(s=='=’) printf(”(relop,LE)”);else{retract();printf("(relop,LT)");}break;case ’=':get();if(s=='=’)printf("(relop,EQ)");else{retract();printf(”('=',null)”);}break;case ’;':printf(”(;,null)");break;case ' ’:break;default:printf("!\n”);}j=0;get();} }六:实验结果:实验二一、实验名称:语法分析器的设计二、实验目的:用C语言编写对一个算术表达式实现语法分析的语法分析程序,并以四元式的形式输出,以加深对语法语义分析原理的理解,掌握语法分析程序的实现方法和技术.三、实验原理:1、算术表达式语法分析程序的算法思想首先通过关系图法构造出终结符间的左右优先函数f(a),g(a)。

编译原理词法分析与语法分析的过程与方法

编译原理词法分析与语法分析的过程与方法

编译原理词法分析与语法分析的过程与方法编译原理是计算机科学领域中的重要内容之一,它研究如何将高级语言程序转化为机器语言的过程。

其中,词法分析和语法分析是编译原理中的两个重要阶段。

本文将详细介绍词法分析与语法分析的过程与方法。

一、词法分析的过程与方法词法分析是编译器的第一个阶段,其主要任务是将源程序的字符序列划分成有意义的语言单元,也就是词法单元。

以下是词法分析的过程与方法:1. 扫描:词法分析器从源程序中读取字符序列,并按照事先定义的规则进行扫描。

2. 划分词法单元:根据事先定义的规则,词法分析器将字符序列划分为不同的词法单元,如关键字、标识符、常量、运算符等。

3. 生成词法单元流:将划分好的词法单元按照顺序生成词法单元流,方便后续的语法分析阶段使用。

4. 错误处理:在词法分析过程中,如果发现了不符合规则的字符序列,词法分析器会进行错误处理,并向用户报告错误信息。

二、语法分析的过程与方法语法分析是编译器的第二个阶段,其主要任务是分析词法单元流,并判断是否符合语法规则。

以下是语法分析的过程与方法:1. 构建语法树:语法分析器根据语法规则构建抽象语法树(AST),用于表示源程序的语法结构。

2. 自顶向下分析:自顶向下分析是一种常用的语法分析方法,它从根节点开始,按照语法规则向下递归分析,直到生成叶子节点对应的词法单元。

3. 底部向上分析:底部向上分析是另一种常用的语法分析方法,它从词法单元开始,逐步合并为更高级的语法结构,直到生成抽象语法树的根节点。

4. 错误处理:在语法分析过程中,如果发现了不符合语法规则的词法单元流,语法分析器会进行错误处理,并向用户报告错误信息。

三、词法分析与语法分析的关系与区别词法分析和语法分析在编译原理中起着不同的作用:1. 关系:词法分析是语法分析的前置阶段,它为语法分析提供了有意义的词法单元流。

语法分析基于词法单元流构建语法树,判断源程序是否满足语法规则。

2. 区别:词法分析主要关注词法单元的划分和分类,它是基于字符序列的处理;而语法分析主要关注词法单元之间的组合和语法结构的判断,它是基于语法规则的处理。

编译原理的名词解释

编译原理的名词解释

编译原理的名词解释编译原理是计算机科学中的一门重要课程,它研究的是如何将高级语言程序转化为计算机能够执行的机器指令。

编译原理涉及许多专业术语和概念,下面将对其中一些重要的名词进行解释。

词法分析(Lexical Analysis)词法分析是编译过程中的第一个阶段,也被称为扫描器。

它负责将源程序中的字符序列转化为单词(词法单元)的序列。

在词法分析的过程中,会忽略不需要关注的字符,如空格和注释。

语法分析(Syntax Analysis)语法分析是编译过程中的第二个阶段,也被称为解析器。

它负责根据词法分析阶段产生的词法单元序列,构建出一棵语法树。

通过语法分析,可以检查源程序是否符合语法规范,并将程序转化为抽象语法树。

语义分析(Semantic Analysis)语义分析是编译过程中的第三个阶段,它负责对语法树进行语义检查和语义规则的应用。

语义分析可以捕捉到一些错误,在编译过程中对源程序进行修正。

此外,语义分析还对程序中的语义逻辑进行处理,包括类型检查、作用域检查等。

中间代码生成(Intermediate Code Generation)中间代码是一种介于高级语言和目标机器语言之间的中间形式。

中间代码生成是编译过程中的一个重要阶段,它将源程序翻译为一种中间表示形式。

中间代码的生成可以便于程序的优化和后续阶段的处理。

代码优化(Code Optimization)代码优化是编译过程中的一个关键环节,它旨在改进生成的目标代码的效率和质量。

代码优化技术包括常量传播、死代码消除、循环优化等。

通过代码优化,可以提高程序的执行效率和资源利用率,改善程序的性能。

目标代码生成(Code Generation)目标代码生成是编译过程中的最后一个阶段,它将中间代码转化为目标机器的机器指令。

目标代码生成需要考虑目标机器的硬件特性和指令集,将中间代码转化为可以被计算机直接执行的机器指令。

符号表(Symbol Table)符号表是编译器中非常重要的数据结构,用于存储程序中出现的所有标识符的信息。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

编译原理实验学号:姓名:班级:实验一:文件读入缓冲区,每次单字符输出源码:#include <iostream>#include <string>#include <fstream>using namespace std;string ad1,ad2,cache;int curPos;bool getIn(){cout<<"infile:";cin>>ad1;ifstream fin(ad1);if(fin.is_open()){string str((istreambuf_iterator<char>(fin)), istreambuf_iterator<char>());cache.swap(str);fin.close();curPos = 0;return true;}return false;}char getChar(){if(curPos < cache.size())return cache[curPos++];else return 0;}int main(){if(!getIn())return 1;char ch;while(ch = getChar()){cout<<ch;}}实验结果:实验二:词法分析#include <iostream>#include <cstdio>#include <ctype.h>#include <stdlib.h>#include <fstream>#include <string>#include <cstring>#include <queue>using namespace std;const int BUFFER_SIZE = 1024;char buffer[BUFFER_SIZE];enumDatatype{ RESERVE_WORD=1,IDENTIFIER=2,DIGIT=3,OPERATOR=4,SEPARATOR=5};//注意后面有分号const string Keyword[] = {"main","if","cout","int","return"};ifstream inFile;ofstream outFile;int error;char cur,nex,ch;typedef struct{Datatype type;string value;}Mytype;Mytype temp;queue<Mytype>que;inline void InputFile(){string inFilename;cout << "Input the name of SourceFile:" << endl;cin >> inFilename;inFile.open(inFilename.c_str());//string::c_str()返回的是const指针,String类中的一个函数if(!inFile){cout << "Cannot open the file!" << endl;system("pause");exit(1);}return;}inline void OutputFile(){string outFilename;cout << "Input the name of DestinationFile:" << endl;cin >> outFilename;outFile.open(outFilename.c_str());//string::c_str()返回的是const指针,String类中的一个函数if(!outFile){cout << "Cannot open the file!" << endl;exit(1);}//同时把信息导入到文件中if(error){cout << "The number of errors:" << error << endl;outFile << "The number of errors:" << error << endl;}while(que.size()){temp = que.front();que.pop();outFile << '(' << temp.type << ",\"" << temp.value << "\")"<< endl;cout << '(' << temp.type << ",\"" << temp.value << "\")"<< endl;}return;}bool IsKeyword(string &str){for(int i=0;i<5;i++){if(str == Keyword[i]) return true;}return false;}//注意有的运算符需要进行超前搜索才能确定bool IsOperator(char ch){if(ch=='='||ch=='+'||ch=='-'||ch=='*'||ch=='/'||ch=='!') return true;return false;}bool IsSeperator(char ch){if(ch==','||ch==';'||ch=='('||ch==')'||ch=='{'||ch=='}') return true;return false;}inline void Acquire_line(){//while(inFile.getline(buffer,BUFFER_SIZE,'\n')) cout << buffer << endl;while(inFile.getline(buffer,BUFFER_SIZE,'\n')){int i=0;for(i;i<strlen(buffer);i++){temp.value = "\0";//bug:因为定义的temp是全局变量,而temp.value 是字符串,所以每次使用都有“清0”ch = buffer[i];if(isspace(ch)) continue;if(IsOperator(ch)){//+,-,*,/,!temp.type = OPERATOR;temp.value += ch;if(i<(strlen(buffer)-1)){//需要读取下一个字符进行查验nex = buffer[++i];if(IsOperator(nex)){if(nex=='=') temp.value +=nex;else if((ch=='+'&&nex=='+')||(ch=='-'&&nex=='-')) temp.value+=nex;else cout << "error:" << temp.value << endl;}}if(buffer[i]!='=') --i;que.push(temp);}else if(IsSeperator(ch)){temp.type = SEPARATOR;temp.value += ch;que.push(temp);}else if(isdigit(ch)){//一旦查看到的是一个数字,需要继续往后搜索是否有后续的数字。

temp.type = DIGIT;temp.value += ch;do{//再嵌套一个循环让其找完数nex = buffer[++i];if(isdigit(nex)) temp.value += nex;}while(isdigit(nex)&&i<strlen(buffer));if(!isdigit(nex)) --i;que.push(temp);}else{if(isalpha(ch)){//是字符temp.value += ch;do{nex = buffer[++i];if(isalpha(nex)) temp.value += nex;}while(isalpha(nex)&&i<strlen(buffer));if(!isalpha(nex)) --i;//剩下的就是我们定义的字符,需要先判断关键字,然后判断标识符//const string Keyword[] = {"main","if","cout","int","return"};/**enumDatatype{ RESERVE_WORD=1,IDENTIFIER=2,DIGIT=3,OPERATOR=4,SEPARATOR=5};//注意后面有分号*/bool flag = true;for(int i=0;i<5;i++){if(temp.value==Keyword[i]){temp.type = RESERVE_WORD;flag = false;que.push(temp);break;}}if(flag){temp.type = IDENTIFIER;que.push(temp);}}}}}return ;}/**从文件中读入一行:ifstream ff;char ll[MAXLEN];ff.getline(ll,MAXLEN,'\n');*/void Initial(){error = 0;while(que.size()) que.pop();return ;}int main(){Initial();InputFile();Acquire_line();OutputFile();return 0;}实验结果:实验三:自顶向下的语法分析#include <iostream>#include <map>#include <vector>#include <stack>#include <queue>#include <string>#include <fstream>#include <iterator>#include <cctype>#include <cstdio>using namespace std;const string ID = "num",NUM = "num",ADD = "+",SUB = "-",MUL = "*",DIV = "/",NOTEND = "NOTEND",LEFTK="(",RIGHTK = ")";const string E = "E",E1 = "E'",T = "T",T1 = "T'",F = "F";const string ENDofFILE = "$",NOTHING = "NULL";class Element{public:string name, kind;Element(){}Element(string a,string b):name(a),kind(b){}};string cache;int curPos;vector<Element> vecWord;void fread(){ifstream fin("test.cpp");string tmp((istreambuf_iterator<char>(fin)), istreambuf_iterator<char>());tmp.swap(cache);curPos = 0;}char getChar(){if(curPos < cache.size())return cache[curPos++];else return 0;}void putBack(){curPos--;}Element getWord(char a){string str(1,a);while(a = getChar()){if(isalpha(a) || isdigit(a) || a == '_')str+=a;else{putBack();break;}}return Element(str,ID);}Element getNum(char a){string str(1,a);while(a = getChar()){if(isdigit(a))str +=a;else{putBack();break;}}//======w=====return Element(str,NUM);}void wordAnalysis(){vector<Element> v;char ch;while(ch = getChar()){if(ch == '+' ||ch == '-' ||ch == '*' ||ch == '/' ||ch == '(' ||ch == ')' ) v.push_back(Element(string(1,ch),string(1,ch)));else if(isalpha(ch) || ch == '_')v.push_back(getWord(ch));else if(isdigit(ch))v.push_back(getNum(ch));}v.push_back(Element(ENDofFILE,ENDofFILE));for(int i = 0;i<v.size();i++)cout<<"<'"<<v[i].name<<"',"<<v[i].kind<<">"<<endl;cout<<"====wordAnalysis END========"<<endl;v.swap(vecWord);}bool is_syntaxAnalysis_succeed = true;void error(int ip,int k){cout<<k<<" mistake ocurred at "<<ip<<endl;is_syntaxAnalysis_succeed = false;}void syntaxAnalysis(){string via[]={"ERROR!","E -> T E'","E' -> + T E'","E' -> - T E'","E' -> NULL","T -> F T'","T' -> * F T'","T' -> / F T'","T' -> NULL","F -> id","F -> ( E )",};vector<string> viaString[] = {{},//0{T,E1},//1{ADD,T,E1},//2{SUB,T,E1},//3{NOTHING},//4{F,T1},//5{MUL,F,T1},//6{DIV,F,T1},//7{NOTHING},//8{ID},//9{LEFTK,E,RIGHTK},//10};vector<Element> testViaString[] = {{},//0{Element(T,NOTEND),Element(E1,NOTEND)},//1{Element(ADD,ADD),Element(T,NOTEND),Element(E1,NOTEND)},//2{Element(SUB,SUB),Element(T,NOTEND),Element(E1,NOTEND)},//3{Element(NOTHING,NOTHING)},//4{Element(F,NOTEND),Element(T1,NOTEND)},//5{Element(MUL,MUL),Element(F,NOTEND),Element(T1,NOTEND)},//6{Element(DIV,DIV),Element(F,NOTEND),Element(T1,NOTEND)},//7{Element(NOTHING,NOTHING)},//8{Element(ID,ID)},//9{{Element(LEFTK,LEFTK)},{Element(E,NOTEND)},{Element(RIGHTK,RIGHTK)}},//10 };map<string,map<string,vector<Element> > > mp;mp[E][ID] = testViaString[1];mp[E][LEFTK]= testViaString[1];mp[E1][ADD] = testViaString[2];mp[E1][SUB] = testViaString[3];mp[E1][RIGHTK] = testViaString[4];mp[E1][ENDofFILE] = testViaString[4];mp[T][ID] = testViaString[5];mp[T][LEFTK] = testViaString[5];mp[T1][ADD] = testViaString[8];mp[T1][SUB] = testViaString[8];mp[T1][MUL] = testViaString[6];mp[T1][DIV] = testViaString[7];mp[T1][RIGHTK] = testViaString[8];mp[T1][ENDofFILE] = testViaString[8];mp[F][ID] = testViaString[9];mp[F][LEFTK] = testViaString[10];int ip = 0;Element tmpX(E,NOTEND);stack<Element> stk;stk.push(tmpX);while(stk.empty()==false){tmpX = stk.top();// cout<<"TMPX <'"<<<<"',"<<tmpX.kind<<">"<<endl;stk.pop();if (tmpX.kind == ENDofFILE);else if(tmpX.kind != NOTEND ){if(tmpX.kind == vecWord[ip].kind){cout<<"match("<<<<":"<<vecWord[ip].name<< ")"<<endl;ip++;}else {error(ip,0);break;}}else if(mp[ ][ vecWord[ip].kind ].empty()) //kind ?{error(ip,1);break;}else {auto &vec = mp[ ][ vecWord[ip].kind ];cout<< <<" => ";for(int i = 0;i<vec.size();i++)cout<<vec[i].name;cout<<endl;for(int i = vec.size()-1;i>=0;i--){// cout<<"add "<<vec[i].name<<" ";if(vec[i].kind!=NOTHING)stk.push(vec[i]);}}// cout<<"=====A loop END============="<<endl;}if(is_syntaxAnalysis_succeed)cout<<"syntaxAnalysis Succeed!!"<<endl;else cout<<"syntaxAnalysis Failed!!"<<endl;cout<<"=====syntaxAnalysis END====="<<endl;}int main(){fread();wordAnalysis();syntaxAnalysis();}<'1',num><'+',+><'2',num><'*',*><'(',(><'10',num><'+',+><'6',num><'*',*><'(',(><'7',num><'-',-><'5',num><')',)><'*',*><'8',num><')',)><'$',$>====wordAnalysis END======== E => TE'T => FT'F => nummatch(num:1)T' => NULLE' => +TE'match(+:+)T => FT'F => nummatch(num:2)T' => *FT'match(*:*)F => (E)match((:()E => TE'T => FT'F => nummatch(num:10)T' => NULLE' => +TE'match(+:+)T => FT'F => nummatch(num:6)T' => *FT'match(*:*)F => (E)match((:()E => TE'T => FT'F => nummatch(num:7)T' => NULLE' => -TE'match(-:-)T => FT'F => nummatch(num:5)T' => NULLE' => NULLmatch():))T' => *FT'match(*:*)F => nummatch(num:8)T' => NULLE' => NULLmatch():))T' => NULLE' => NULLsyntaxAnalysis Succeed!!=====syntaxAnalysis END=====。

相关文档
最新文档