哈夫曼编码译码器实验报告
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
问题解析与解题方法
问题分析:
设计一个哈夫曼编码、译码系统。对一个ASCII编码的文本文件中的字符进行哈夫曼编码,生成编码文件;反过来,可将编码文件译码还原为一个文本文件。
(1)从文件中读入任意一篇英文短文(文件为ASCII编码,扩展名为txt);
(2)统计并输出不同字符在文章中出现的频率(空格、换行、标点等也按字符处理);(3)根据字符频率构造哈夫曼树,并给出每个字符的哈夫曼编码;
(4)将文本文件利用哈夫曼树进行编码,存储成压缩文件(编码文件后缀名.huf)(5)用哈夫曼编码来存储文件,并和输入文本文件大小进行比较,计算文件压缩率;(6)进行译码,将huf文件译码为ASCII编码的txt文件,与原txt文件进行比较。
根据上述过程可以知道该编码译码器的关键在于字符统计和哈夫曼树的创建以及解码。
哈夫曼树的理论创建过程如下:
一、构成初始集合
对给定的n个权值{W1,W2,W3,...,Wi,...,Wn}构成n棵二叉树的初始集合
F={T1,T2,T3,...,Ti,...,Tn},其中每棵二叉树Ti中只有一个权值为Wi的根结点,
它的左右子树均为空。
二、选取左右子树
在F中选取两棵根结点权值最小的树作为新构造的二叉树的左右子树,新二叉树
的根结点的权值为其左右子树的根结点的权值之和。
三、删除左右子树
从F中删除这两棵树,并把这棵新的二叉树同样以升序排列加入到集合F中。
四、重复二和三两步,
重复二和三两步,直到集合F中只有一棵二叉树为止。
因此,有如下分析:
1.我们需要一个功能函数对ASCII码的初始化并需要一个数组来保存它们;
2.定义代表森林的数组,在创建哈夫曼树的过程当中保存被选中的字符,即给定报文
中出现的字符,模拟哈夫曼树选取和删除左右子树的过程;
3.自底而上地创建哈夫曼树,保存根的地址和每个叶节点的地址,即字符的地址,然
后自底而上检索,首尾对换调整为哈夫曼树实现哈弗曼编码;
4.从哈弗曼编码文件当中读入字符,根据当前字符为0或者1的状况访问左子树或
者右孩子,实现解码;
5.使用文件读写操作哈夫曼编码和解码结果的写入;
解题方法:
结构体、数组、类的定义:
1.定义结构体类型的signode 作为哈夫曼树的节点,定义结构体类型的hufnode 作
为哈夫曼编码对照表的节点,定义HFM类实现对哈夫曼树的创建,利用其成员函
数完成哈夫曼编码译码的工作。
2.定义signode 类型的全局数组SN[256](为方便调用,之后的forest[256],
hufNode[256]均为全局数组), 保存ASCII编码的字符,是否在文章中出现(bool
类型)以及出现次数(int类型,权重),左右孩子节点位置,父节点位置信息;
3.为节省存储空间,定义signode * 类型的全局数组forest[256], 模拟森林,在创建
哈夫曼树的过程中保存出现字符的指针,模拟哈夫曼树选取和删除左右子树的过
程;
4.定义hufnode 类型的全局数组hufNode[256],在编码时最为哈夫曼编码对照表的
节点,char 型c保存字符,int code[100]保存其哈夫曼编码;
5.定义HFM类,主要保存哈夫曼树的根节点指针,但其丰富的功能函数将实现哈夫
曼编码译码的工作及其他功能;
函数介绍:
1.void init(signode * sig){……} 初始化数组SN[];
2.void compress(){……}输出压缩对比情况的信息;
3.void exchange(){……}用两层for循环实现hufNode[i]节点的成员哈夫曼编码数组
code[]前后元素的对换,因为在之前的编码过程中由于是从叶节点追溯至根节点,
存入code数组的哈夫曼编码与哈夫曼编码的概念反向,故而要调整;
4.signode * getroot(){……}返回哈夫曼树的根节点指针;
5.signode * HFM::creat(){……}创建哈夫曼树,首先用三个for循环查看forest数组,
找到权值最小的两个字符,以int型的min1,min2记录其下标,定义signode * 类
型指针pp指向新生成signode节点,用指针操作使pp指向的节点的权值为
min1,min2权值之和,pp做孩子指向forest[min1],右孩子指向forest[min2],
min1,min2的父指针指向pp,然后将pp存入min1的位置,min2之后的每一个
节点依次往前移一个位置,实现从forest数组中清除min1,min2并加入pp的操作;
6.void HFM::hufcode(){……}哈夫曼编码,用for循环控制查看hufNode 数组,其初
始化已在creat()的开始完成,对每一个字符实现编码,用while循环从叶节点
开始,如果该节点是其父节点的左孩子就将code[hufNode[i].size++]赋值0,否则
赋为1,直至当前节点的父节点为空,while循环结束;
7.void HFM::savewithhufcode(FILE * inf,FILE * outf){……}将读入的文章以哈夫曼
编码的形式存储,其中inf为读入文件的指针,outf为写入文件的指针,首先调用
rewind(inf)函数将光标放置在文章开头,防止文件未关闭导致的错误,每读一个字
符就用for循环在hufNode 数组中查找,因为hufNode 数组就是保存出现的字符
的,故一定可以找到,然后再用fputc函数将code[]数组的内容写入文件,直至读
入文件结束;
8.void HFM::inorder(signode * sig){……}迭代法遍历树,遍历到叶节点时执行
hufNode[count++].sig=sig语句实现hufNode 数组指向文章中出现的字符;
9.int HFM::maxc(){……} 计数变量,记录哈夫曼编码最大位数;
10.v oid HFM::hufdecode(FILE* ipf,FILE* opf){……}解码,从哈夫曼编码到字符,输
出到屏幕和指定的文件中;
11.v oid input(FILE * f){……}初始读入文章,保存出现的字符记录修改其权重;
数据结构选择与算法设计
数据结构选择:
signode: