词法分析的实验报告

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

《词法分析》实验报告

目录

目录错误!未定义书签。

1 实验目的错误!未定义书签。

2 实验内容错误!未定义书签。

TINY计算机语言描述错误!未定义书签。

实验要求错误!未定义书签。

3 此法分析器的程序实现错误!未定义书签。状态转换图错误!未定义书签。

程序源码错误!未定义书签。

实验运行效果截图错误!未定义书签。

4 实验体会错误!未定义书签。

实验目的

1、学会针对DFA转换图实现相应的高级语言源程序。

2、深刻领会状态转换图的含义,逐步理解有限自动机。

3、掌握手工生成词法分析器的方法,了解词法分析器的内部工作原理。

实验内容

TINY计算机语言描述

TINY计算机语言的编译程序的词法分析部分实现。

从左到右扫描每行该语言源程序的符号,拼成单词,换成统一的内部表示(token)送给语法分析程序。

为了简化程序的编写,有具体的要求如下:

1、数仅仅是整数。

2、空白符仅仅是空格、回车符、制表符。

3、代码是自由格式。

4、注释应放在花括号之内,并且不允许嵌套

TINY语言的单词

要求实现编译器的以下功能

1、按规则拼单词,并转换成二元式形式

2、删除注释行

3、删除空白符(空格、回车符、制表符)

4、列表打印源程序,按照源程序的行打印,在每行的前面加上行号,并且打印出每行包含的记号的二元形式

5、发现并定位错误

词法分析进行具体的要求

1、记号的二元式形式中种类采用枚举方法定义;其中保留字和特殊字符是每个都一个种类,标示符自己是一类,数字是一类;单词的属性就是表示的字符串值。

2、词法分析的具体功能实现是一个函数GetToken(),每次调用都对剩余的字符串分析得到一个单词或记号识别其种类,收集该记号的符号串属性,当识别一个单词完毕,采用返回值的形式返回符号的种类,同时采用程序变量的形式提供当前识别出记号的属性值。这样配合语法分析程序的分析需要的记号及其属性,生成一个语法树。

3、标示符和保留字的词法构成相同,为了更好的实现,把语言的保留字建立一个表格存储,这样可以把保留字的识别放在标示符之后,用识别出的标示符对比该表格,如果存在该表格中则是保留字,否则是一般标示符。

此法分析器的程序实现

状态转换图

图1 TINY语言的确定有限自动机(DFA)

程序源码

#include

using namespace std;

#include

#include

#include

class CA

{

public:

void getToken(); .:/.../...格式

cout<<"请输入源程序代码.cpp 文件的绝对路径:"<

cin>>filename;

ifstream infile(filename,ios::in);

if(!infile)

{

cerr<<"open error!"<

abort();

}

char ch;

int count1=1;count2=0;

cout<<"第"<

while(ch))

{

preDo(ch);

cout<

if(ch=='\n')

{

count1++;

cout<<"第"<

}

}

buffer1[count2+1]='\0';

cout<

//对buffer1中的字符进行扫描

getToken();

();

cout<

cout<<"符号表:";

for (int i=0;i

cout<

cout<

cout<<"数字表:";

for (int j=0;j

cout<

cout<

}

void CA::preDo(char c)

{

char *p=buffer1;

buffer1[0]='#'; //赋#给扫描缓冲区的第一个元素

count2++;

*(p+count2)=c;

if(buffer1[count2-1]=='{') //删除注释

{

if(c=='{') cout<<"注释不允许嵌套! "; //注释不允许嵌套

if(c!='}') count2--;

else count2=count2-2;

}

else if(buffer1[count2-1]==' '&&c==' ') count2--; //若干相继的空白符结合成一个if(c=='\r') count2--;

if(c=='\t') count2--;

}

void CA::getToken()

{

int n=1;

cout<<"第1行: ";

for(int i=1;i

{

if(buffer1[i]=='\n'){n++;cout<<"\n第"<

else if(isLetter(buffer1[i]))

{

string tok = "";

tok +=buffer1[i];

while(isLetter(buffer1[++i]))

tok +=buffer1[i];

int r=Search(K,(),8);

i--;

if(r!=-1)cout<<"(关键字"<

else

{

cout<<"(标识符,"<

r = InsertID((char *)());

}

}

else if(isDigit(buffer1[i]))

{

string tok = "";

tok +=buffer1[i];

相关文档
最新文档