利用哈希技术统计C源程序关键字出现频度
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
:利用哈希技术统计C源程序关键字出现频度
目录一.需求分析说明 (3)
二.总体设计 (3)
三.详细设计 (4)
四.实现部分 (5)
五.程序测试 (10)
六.总结 (11)
一、需求分析说明
1.课程设计目的
本课程设计的目的就是要达到理论与实际应用相结合,使同学们能够根据数据对象的特性,学会数据组织的方法,能把现实世界中的实际问题在计算机内部表示出来,并培养基本的、良好的程序设计技能。
2.题目要求
1)题目内容:
利用Hash技术统计某个C源程序中的关键字出现的频度
2)基本要求:
扫描一个C源程序,用Hash表存储该程序中出现的关键字,并统计该程序中的关键字出现的频度。用线性探测法解决Hash冲突。设Hash函数为:
Hash(key)[(key的第一个字母序号)*100+(key的最后一个字母序号)] MOD 41
二、总体设计
一.算法思想描述
首先读取关键字文件以建立二叉排序树以供后续查询,每个树节点保存一个关键字字符串及指向左右子树的指针。同时创建一Hash表,每个节点除应保存关键字字符串外,还应保存关键字频数及该存储单元冲突次数。然后扫描一个C源程序,每次扫描一行,从中循环分离出每个单词,每次均查找其是否为关键字,若是,则按计算公式计算其KEY值并在Hash表中进行相应操作,若该节点为空则插入否者比较其是否与现有关键字相同,若相
同则增加其频数,否则增加其冲突次数并继续线性探测下一个存储单元,完了继续操作下一个分离出来的单词,如此循环运行直至扫描结束。编写本程序时,使用了二叉树创建、二叉树查找、Hash表的建立和操作及文件操作等基本算法。
二.三、详细设计
三.(程序结构
//Hash表存储结构
typedef struct node //定义
{ char s[20];
int num,time; //num为频数,time为冲突次数
}node;
//二叉排序树结构定义
typedef struct nod //定义
{ char s[20];
struct nod *left,*right;
}nod;
int max;//max为Hash表长度
函数说明:
nod *creat():
读关键字文件,按照关键字中字符字母先后顺序建立二叉排序树,每个节点中保存一个关键字;
void init(node *head):
初始化Hash表各节点数据域;
void deal(node *head,nod *parent,char filename[]):
扫描源文件,分离出每个单词,检验是否为关键字;并根据检验结果来决定是否调用strdeal函数,以对Hash做适当更改;
void strcp(node *head,char s[],int k):
将新查找到的关键字复制到Hash表中第k个节点存储单元;
void strdeal(node *head,char s[],int k):
判断Hash表中第k个单元中有无关键字,若无则将当前关键字存入该单元,返回;否则比较两关键字是否相等,相等则将该单元频数加一,返回;不相等则将该单元冲突数加一并循环线性探测下一个存储单元;
int strcmp(char t[],char s[]):
字符串比较;
void prin(nod *head):
以左根右的顺序将二叉排序树打印在屏幕上;
四、实现部分
#include
#include
#include
using namespace std;
const int TOTAL=39; //39个关键字
const int MAXLEN=10; //关键字长度
const int HASHLEN=41; //哈希表长度
int cont=0; //统计哈希表中的关键字个数
void jiemian();
void Show(int key);
void Select(int choice);
int Read(char *filename);
int Input();
int isLetter(char ch);
int isKeyWords(char *word);
int FindHX(char *keyword);
int CreatHX(char *keyword);
int GetFreePos(int key);
void ResetHX();
int GetKey(char *keyword);
char KeyWords[TOTAL][MAXLEN]= //构造二维数组存储39个关键字
{
"asm","auto","break","case","cdecl",
"char","const","continue","default","do",
"double","else","enum","extern","far",
"float","for","goto","huge","if",
"int","interrupt","long","near","pascal",
"register","return","short","signed","sizeof",
"static","struct","switch","typedef","union",
"unsigned","void","volatile","while",
};
/******************************************************************** ***