文学研究助手数据结构报告
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
武汉理工大学华夏学院
课程设计
课程名称数据结构
题目文学研究助手
专业
班级
姓名 __ _ _____
成绩 ____________________
年月日
文学研究助手
设计目的
(1)使学生进一步理解和掌握课堂上所学各种基本抽象数据类型的逻辑结构、存储结构和操作实现算法,以及它们在程序中的使用方法。
(2)使学生掌握数据库设计的基本内容和设计方法,并培养学生进行规范化软件设计的能力。
(3)使学生学会使用各种计算机资料和有关参考资料,提高学生进行程序设计的基本能力。
问题描述
文学研究人员需要统计某篇英文小说中某些形容词的出现次数和位置。试写一个实现这一目标的文字统计系统,称为“文学研究助手”。
基本要求
英文小说存于一个文本文件中。待统计的词汇集合要一次输入完毕,即统计工作必须在程序的一次运行之后就全部完成。程序的输出结果是每个词的出现次数和出现位置所在行的行号,格式自行设计。
算法思想
本次课程设计使用的是串模式匹配的KMP算法,模式匹配算法KMP为普通模式匹配的改进,优点在与时间复杂度由原来的O(n*m)变为O(n+m),即是说统计时间大大缩短。当要统计的词汇量很大时,计算机统计所需时间将很漫长,如果使用者急需使用统计结果,这是又因为统计太慢导致研究受
阻,这样就得不偿失了。而本程序将大大改善这种状况,让计算机在短时间内统计出使用者想要的统计结果。本程序虽然精简,但是对模式匹配算法KMP 的使用极其灵活,需灵活调用模式匹配算法KMP的函数来快速解决问题。该算法的核心思想是:每当一趟匹配过程中出现字符比较不等时,不需要回测指针,而是利用已经得到的“部分匹配”的结果将模式向右滑动尽可能远的一段距离后,继续进行比较。
模块划分
本次课程设计所用到的程序主要包含四个模块,分别是主程序模块、有序表单元模块、单词单元模块和单词文本串文件单元模块。其中主程序模块需要实现的功能是,输入文本并统计文件中每个需要测试的单词出现的次数和位置,并输出结果。
源程序
#include
#include
#define MAXSTRLEN 255 //最大串长
typedef char SString[MAXSTRLEN+1];
int next[MAXSTRLEN]; //KMP算法中用到的next
int Index(SString S,SString T,int pos) //KMP算法
{
int i=pos,j=1;
while(i<=S[0]&&j<=T[0])
{
if(j==0||S[i]==T[j]) {++i;++j;}
else
j=next[j];
}
if (j>T[0]) return (i-T[0]);
else
return 0;
}
int lenth(SString str) //求串长
{
int i=1;
while(str[i]) i++;
return(i-1);
}
void find(char name[],SString keys) //查找函数
{
SString text; //用于存放从小说文件读取的一行字符串
int i=1,j=0,k,q=0; //i用于存放行号,j用于存放列号,k用于输出格式的控制,q用于统计出现次数
FILE *fp;
if (!(fp=(fopen(name,"r")))) //打开小说文件
{
printf("打开文件出错!\n");
exit(0);
}
keys[0]=lenth(keys); //求关键字的长度
printf("\n%s\n",&keys[1]); //打印关键字
while (!feof(fp)) //如果还没到小说文件末尾,则继续循环{
k=0;
fgets(&text[1],MAXSTRLEN,fp); //从小说文件中读取一行字符串,存入text串中
text[0]=lenth(text); //求读入的串的长度
j=Index(text,keys,j+1); //调用KMP算法,统计关键字在该行出现的位置,若匹配不成功则返回0
if (j!=0)
{printf("行=%d,列=%d",i,j); k++;} //若匹配成功则打印行号和列号
while(j!=0) //若该行找到了关键字,则继续寻找看是否还能匹配成功
{
j=Index(text,keys,j+1); //调用KMP算法从刚找到的列号后一字符起匹配
if (j!=0)
{printf(",%d",j);k++;} //若匹配成功,则打印列号
}
i++; //行号加1,在下一行中寻找
q+=k; //累加k以统计关键字出现次数
if (k) printf("\n"); //输出格式控制
}
printf("%s出现%d次。\n",&keys[1],q); //打印关键字出现次数}
void main()
{
char name[50]; //存储输入的小说路径字符串
SString words[10]; //定义字符串数组,用于存储输入的关键字
int m,n,i;
printf("----------------------欢迎使用文学研究助手