太原理工大学软件工程课程设计实验

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

文本文件单词的检索与计数
专业：软件工程班级： 1227 班姓名：王晓春学号：74同
组人：王晓春闫瑞娟张泽磊组长：王晓春完成日期：
一．【问题描述】
串是非数值处理中的主要对象，如在信息检索、文本编辑、符号处理等许多
领域，得到越来越广泛的应用。

在高级语言中也引入了串数据类型概念，并且串
变量与其他变量〔如整型、实型等〕一样，可以进行各种运算。

然而，在各种不同类型的应用中，所处理的串有不同的特点，要想有效地实现
串的处理，就必须熟悉串的存储结构及其根本运算。

本课程设计的目的就是熟悉
串类型的实现方法和文本模式匹配方法，熟悉如何利用模式匹配算法实现一般的
文本处理技术。

本课程设计分两步：首先，设计出串定位算法〔即模式匹配算法〕及其实现；然后，再利用串定位算法设计文本文件的检索及单词的计数等操作。

二．【设计需求及分析】
1.设计要求
串模式匹配算法的设计要求
在串的根本操作中，在主串中查找模式串的模式匹配算法——即求子串位置的
函数 Index(S,T)，是文本处理中最常用、最重要的操作之一。

所谓子串的定位就是求子串在主串中首次出现的位置，又称为模式匹配或串匹配。

模式匹配的算法很多，在这里只要求用最简单的朴素模式匹配算法。

该算法的
根本思路是将给定子串与主串从第一个字符开始比拟，找到首次与子串完全匹配的
子串为止，并记住该位置。

但为了实现统计子串出现的个数，不仅需要从主串的
第一个字符位置开始比拟，而且需要从主串的任一给定位置检索匹配字符串，所以，首先要给出两个算法：
1．标准的朴素模式匹配算法
2．给定位置的匹配算法
文本文件单词的检索与计数的设计要求
要求编程建立一个文本文件，每个单词不包含空格且不跨行，单词由字符序
列构成且区分大小写；统计给定单词在文本文件中出现的总次数；检索输出某个
单词出现在文本中的行号、在该行中出现的次数以及位置。

该设计要求可分为三个局部实现：其一，建立文本文件，文件名由用户用键
盘输入；其二，给定单词的计数，输入一个不含空格的单词，统计输出该单词在文
本中的出现次数；其三，检索给定单词，输入一个单词，检索并输出该单词所在的
行号、该行中出现的次数以及在该行中的相应位置。

1．建立文本文件
2．给定单词的计数
3．检索单词出现在文本文件中的行号、次数及其位置
4．主控菜单程序的结构
2.概要设计例如如下：
算法设计
朴素模式匹配算法
该算法的根本思想是：设有三个指针——i,j,k，用 i 指示主串 S 每次开始比拟的
位置；指针 j,k 分别指示主串 S 和模式串 T 中当前正在等待比拟的字符位置；一开始
从主串 S 的第一个字符〔 i=0;j=1〕和模式 T 的第一个字符〔 k=0〕比拟，假设相等，那么继续逐个比拟后续字符〔 j++,k++〕。

否那么从主串的下一个字符〔 i++〕
起再重新和模式串〔 j=0〕的字符开始比拟。

依此类推，直到模式 T 中的所有字符都
比拟完，而且一直相等，那么称匹配成功，并返回位置 i；否那么返回 -1，表示
匹配失败。

顺序串的模式匹配算法如下：
int index(SString S, SString T)
{
立文本文件
建立文件的实现思路是：
〔1〕定义一个串变量；
〔2〕定义文本文件；
〔3〕输入文件名，翻开该文件；
〔4〕循环读入文本行，写入文本文件，其过程如下：
While (不是文件输入结束 ) {
读入一文本行至串变量；
串变量写入文件；
输入是否结束输入标志；
}
〔5〕关闭文件。

2．给定单词的计数
该功能需要用到前一节中设计的模式匹配算法，逐行扫描文本文件。

匹配一个，计数器加 1，直到整个文件扫描结束；然后输出单词出现的次数。

其实现过程如下：
〔1〕输入要检索的文本文件名，翻开相应的文件；
〔2〕输入要检索统计的单词；
〔3〕循环读文本文件，读入一行，将其送入定义好的串中，并求该串的实
际长度，调用串匹配函数进行计数。

具体描述如下：
While (不是文件结束 ){
读入一行并到串中；
求出串长度；
模式匹配函数计数；
}
〔4〕关闭文件，输出统计结果。

3.检索单词出现在文本文件中的行号、次数及其位置
这个设计要求与上一个类似，但要相对复杂一些。

其实现过程描述如下：〔1〕输入要检索的文本文件名，翻开相应的文件；
〔2〕输入要检索统计的单词；
〔3〕行计数器置初值0；
〔4〕while (不是文件结束 ){
读入一行到指定串中；
求出串长度；
行单词计数器置 0；
调用模式匹配函数匹配单词定位、该行匹配单词计数；
行号计数器加 1；
If (行单词计数器 !=0)
输出行号、该行有匹配单词的个数以及相应的位置；
}
函数调用关系
主程序
CreatTextFile()
SubStrCount()SubStrInd()
PartPosition()
三．【设计功能的实现】
#include ""
#include<>
#include<>
#define MaxStrSize 256 立文本文件*\n");
printf("* 2.单词字符串的计数*\n");
printf("* 3.单词字符串的定位*\n");
printf("* 4.退出程序*\n");
printf("****************************************\n");
printf("请选择〔 1--4〕\n");
scanf("%d", &xz);
switch(xz)
{
case 1:CreatTextFile(); break;
case 2:SubStrCount(); break;
case 3:SubStrInd(); break;
case 4:return 0;
default: printf(" 选择错误，重新选 \n");
}
}while(1);
}
四．【实例测试及运行结果】
运行实例一：
未输入文件前的页面
输入文本文件，计数单词出现的次数
检索某单词的行号，出现次数，以及位置运行实例二：
未输入文件前的页面
输入文本文件，计数单词出现的次数
检索某单词的行号，出现次数，以及位置
5．课程总结
在此次的实验过程中，我对结构化的编程思想有了更深刻的理解。

在实验中，遇到过很多问题，比方对抽象数据结构线性表的实现方法不熟悉，对数组定义模糊等，后来经过思考并查阅资料解决了问题，使自己养成了独立思考、独立解决问题的能力。

通过这次设计，我学会了和别人配合工作，因为一个人所学的知识不可能面面俱到的，只有通过合作，发挥自己的优点，表达团队精神，才能使工作
做得更为出色。

通过这次设计，我学到了许多书本上学不到的知识，增强了自己的动手能力。

计算机技术的高速开展，使我深深地认识到只有不断的加强学习，才能在计算机技术方面不至于被淘汰，今后，我还要加强学习，努力使自己成为一位专业的计算机人员，为我自己所从事的工作效劳。

二．交通咨询系统设计
专业：软件工程同组人：张泽磊
班级： 1227 班
王晓春闫瑞娟
姓名：闫瑞娟
组长：张泽磊
学号： 79
完成日期：
一、问题描述
在交通网络非常兴旺,交通工具和交通方式不断更新的今天,人们在出差、旅游或做其他出行时，不仅关心节省交通费用，而且对里程和所需要的时间等问题也感兴趣。

对于这样一个人们关心的问题，可用一个图结构来表示交通网络系统，利用计算机建立一个交通咨询系统。

图中的顶点表示城市，边表示城市之间的交通关系。

这个交通系统可以答复出行旅客提出的各种路径选择问题。

例如，问题之一：“一位旅客要从 A 城到 B 城，他希望选择一条途中中转次数最少的路线。

〞假设图中每一站都需要换车，那么这个问题反映到图上就是要找
一条从顶点 A 到顶点 B 的所含边数目最少的路径。

我们只需要从顶点 A 出发对图作广度优先搜索，一旦遇到顶点 B 就终止。

由此所得广度优先生成树上，从根顶点A到顶点 B的路径就是中转次数最少的路径。

路径上 A 与 B 之间的顶点就是路径的中转站，但这只是一类
最简单的图的最短路径问题。

系统还可以答复诸如此类的等等的路径选择问题。

设计一个交通咨询系统，为出差、旅游或做其他出行的客人提供各种路径选择信息查询
效劳。

二、设计需求及分析
设计一个交通咨询系统，能让旅客咨询从任一个城市顶点到另一城市顶点之间的最短路
径〔里程〕或最低花费或最少时间等问题。

对于不同的咨询要求，可输入城市间的路程或所需时
间或所需费用。

本设计共分三局部，一是建立交通网络图的存储结构；二是解决单源最短路径问题；三是实现任两个城市顶点之间的最短路径问题。

3.2.1 建立图的存储结构
邻接矩阵是表示图形中顶点之间相邻关系的矩阵。

图的邻接矩阵是定义如下的n 阶方阵：
设 G=〔V， E〕是一个图，结点集为V v1 , v2 , , v n。

G 的邻接矩阵A (a ij)n n, a ij ( w i j ) n n，当〔 v i , v j〕或v i , v j E 0或，当〔 v i ,
v j〕或v i , v j
,
E
当邻接矩阵的行表头、列表头顺序一定时，一个图的邻接矩阵表示是唯一的。

图的邻接矩阵表示，除了需用一个二维数组存储顶点之间的相邻关系的邻接矩阵外，通常还需要使用一个具有n 个元素的一维数组来存储顶点信息，其中下标为i 的元素存储顶点i的信息。

因此，图的邻接矩阵的存储结构定义如下：
#definf MVNum 50
3.3.1 和队列的定义〔局部代码〕
typedef struct carqueue和队列的初始化〔局部代码〕
void InitQueue( LPTCARQUEUE &lpCarQueue )
{
lpCarQueue = ( LPTCARQUEUE ) malloc( sizeof( TCARQUEUE ) );
lpCarQueue->lpHead = ( LPTCARNODE) malloc( sizeof( TCARNODE ) );
lpCarQueue->lpHead->lpNext = NULL; lpCarQueue->lpRear =
lpCarQueue->lpHead;
lpCarQueue->nEffectiveSize = 0;
}
void InitStack( LPTCARSTACK &lpCarStack, int nSize )
{
lpCarStack = ( LPTCARSTACK ) malloc( sizeof ( TCARSTACK ) );
lpCarStack->lpCarInformation = ( LPTCARINFORMATION ) malloc(
nSize * sizeof ( TCARINFORMATION )
);
lpCarStack->nTop = -1;
lpCarStack->nStackSize = nSize;
}。