哈夫曼树编码译码实验报告
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据结构课程设计设计题目:哈夫曼树编码译码
课题名称
院系
学号姓名哈夫曼树编码译码
年级专业
成绩
1、课题设计目的:
在当今信息爆炸时代,如何采用有效的数据压缩技术节省数据文件的存储空间和计算机网络的传送时间已越来越引起人们的重视,哈夫曼编码正是一种应用广泛且非常有效的数据压缩技术。哈夫曼编码是一种编码方式,以哈夫曼树—即最优二叉树,带权路径长度最小的二叉树,时常应用于数据压缩。哈弗曼编码使用一张特殊的编码表将源字符(例如某文件中的一个符号)进行编码。这张编码表的特殊之处在于,它是根据每一个源字符浮现的估算概率而建立起来的。
课题设计目的与设计意义2、课题设计意义:
哈夫曼编码的应用很广泛,利用哈夫曼树求得的用于通信的二进制编码称为哈夫曼编码。树中从根到每一个叶子都有一条路径,对路径上的各分支约定:指向左子树的分支表示“0”码,指向右子树的分支表示“1”码,取每条路径上的“0”或者“1”的序列作为和各个叶子对应的字符的编码,这就是哈夫曼编码。哈弗曼译码输入字符串可以把它编译成二进制代码,输入二进制代码时可以编译成字符
串。
指导教师:
年月日
第一章需求分析 (1)
第二章设计要求 (1)
第三章概要设计 (2)
(1)其主要流程图如图 1-1 所示。 (3)
(2)设计包含的几个方面 (4)
第四章详细设计 (4)
(1)①哈夫曼树的存储结构描述为: (4)
(2)哈弗曼编码 (5)
(3)哈弗曼译码 (7)
(4)主函数 (8)
(5)显示部份源程序: (8)
第五章调试结果 (10)
第六章心得体味 (12)
第七章参考文献 (12)
附录: (12)
在当今信息爆炸时代,如何采用有效的数据压缩技术节省数据文件的存储空
间和计算机网络的传送时间已越来越引起人们的重视,哈夫曼编码正是一种应用
广泛且非常有效的数据压缩技术。哈夫曼编码是一种编码方式,以哈夫曼树—即
最优二叉树,带权路径长度最小的二叉树,时常应用于数据压缩。哈弗曼编码使
用一张特殊的编码表将源字符 (例如某文件中的一个符号) 进行编码。这张编码
表的特殊之处在于,它是根据每一个源字符浮现的估算概率而建立起来的 (浮现
概率高的字符使用较短的编码,反之浮现概率低的则使用较长的编码,这便使编
码之后的字符串的平均期望长度降低,从而达到无损压缩数据的目的)。哈夫曼
编码的应用很广泛,利用哈夫曼树求得的用于通信的二进制编码称为哈夫曼编
码。树中从根到每一个叶子都有一条路径,对路径上的各分支约定:指向左子树的分支表示“0”码,指向右子树的分支表示“1”码,取每条路径上的“0”或者“1”的序列作为和各个叶子对应的字符的编码,这就是哈夫曼编码。哈弗曼译码输入
字符串可以把它编译成二进制代码,输入二进制代码时可以编译成字符串。
对输入的一串电文字符实现哈夫曼编码,再对哈夫曼编码生成的代码串进行
译码,输出电文字符串。通常我们把数据压缩的过程称为编码,解压缩的过程称
为解码。电报通信是传递文字的二进制码形式的字符串。但在信息传递时,总希
望总长度能尽可能短,即采用最短码。假设每种字符在电文中浮现的次数为Wi,
编码长度为 Li,电文中有 n 种字符,则电文编码总长度为∑WiLi。若将此对应
到二叉树上, Wi 为叶结点的权, Li 为根结点到叶结点的路径长度。那末,∑WiLi
恰好为二叉树上带权路径长度。因此,设计电文总长最短的二进制前缀编码,
就是以 n 种字符浮现的频率作权,构造一棵哈夫曼树,此构造过程称为哈夫曼编码。设计实现的功能: (1) 哈夫曼树的建立; (2) 哈夫曼编码的生成; (3) 编
码文件的译码。
哈夫曼编\译码器的主要功能是先建立哈夫曼树,然后利用建好的哈夫曼树生成哈夫曼编码后进行译码。
在数据通信中,时常需要将传送的文字转换成由二进制字符 0、1 组成的二进制串,称之为编码。构造一棵哈夫曼树,规定哈夫曼树中的左分之代表 0,右分支代表 1,则从根节点到每一个叶子节点所经过的路径分支组成的 0 和 1 的序列便为该节点对应字符的编码,称之为哈夫曼编码。
最简单的二进制编码方式是等长编码。若采用不等长编码,让浮现频率高的字符具有较短的编码,让浮现频率低的字符具有较长的编码,这样可能缩短传送电文的总长度。哈夫曼树课用于构造使电文的编码总长最短的编码方案。
(1)其主要流程图如图 1-1 所示。
否
否
否
开始
将data 和权值赋给ht
结点数是否大于1
是
输出根结点和权值
I<2*N?
是
I++
调用SELECT 函数计算根结点函数
双亲结点为两子结点之和
输出两子结点和已构造的结点
是否为根结点?
是
是
左子是否为空?
否
是
右子是否为空
否
编码为1
结束
此时编码为0
(2)设计包含的几个方面:① 哈夫曼树的建立
哈夫曼树的建立由哈夫曼算法的定义可知,初始森林中共有n 棵只含有根结点的二叉树。算法的第二步是:将当前森林中的两棵根结点权值最小的二叉树,合并成一棵新的二叉树;每合并一次,森林中就减少一棵树,产生一个新结点。显然要进行n-1 次合并,所以共产生n-1 个新结点,它们都是具有两个孩子的分支结点。由此可知,最终求得的哈夫曼树中一共有2n-1 个结点,其中n 个结点是初始森林的n 个孤立结点。并且哈夫曼树中没有度数为1 的分支结点。我们可以利用一个大小为2n--1 的一维数组来存储哈夫曼树中的结点。
② 哈夫曼编码
要求电文的哈夫曼编码,必须先定义哈夫曼编码类型,根据设计要求和实际需要定义的类型如下:
typedet struct {
char ch; // 存放编码的字符
char bits[N+1]; // 存放编码位串
int len; // 编码的长度
}CodeNode; // 编码结构体类型
③代码文件的译码
译码的基本思想是:读文件中编码,并与原先生成的哈夫曼编码表比较,遇到相等时,即取出其对应的字符存入一个新串中。
(1)①哈夫曼树的存储结构描述为:
#define N 50 // 叶子结点数
#define M 2*N- 1 // 哈夫曼树中结点总数
typedef struct {
int weight; // 叶子结点的权值
int lchild, rchild, parent; // 摆布孩子及双亲指针
}HTNode; // 树中结点类型
typedef HTNode HuffmanTree[M+1];
②哈弗曼树的算法
void CreateHT(HTNode ht[],int n)
//调用输入的数组ht[],和节点数n
{
int i,k,lnode,rnode;
int min1,min2;