数据结构实验三题目二_哈夫曼树

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

2008级数据结构实验报告

实验名称：实验三树

学生姓名：

班级：

班内序号：

学号：

日期： 20013年11月26日

1．实验要求

实验目的

通过选择下面两个题目之一进行实现，掌握如下内容：

掌握二叉树基本操作的实现方法

了解赫夫曼树的思想和相关概念

学习使用二叉树解决实际问题的能力

实验内容

利用二叉树结构实现赫夫曼编/解码器。

基本要求：

1.初始化(Init)：能够对输入的任意长度的字符串s进行统计，统计每个字符的频度，并

建立赫夫曼树

2.建立编码表(CreateTable)：利用已经建好的赫夫曼树进行编码，并将每个字符的编码

输出。

3.编码(Encoding)：根据编码表对输入的字符串进行编码，并将编码后的字符串输出。

4.译码(Decoding)：利用已经建好的赫夫曼树对编码后的字符串进行译码，并输出译码结

果。

5.打印(Print)：以直观的方式打印赫夫曼树（选作）

6.计算输入的字符串编码前和编码后的长度，并进行分析，讨论赫夫曼编码的压缩效果。

2. 程序分析

哈夫曼树结点的储存结构除了二叉树所有的双亲域parents，左子树域lchild，右子树域rchild。还需要有字符域word，权重域weight，编码域code。其中由于编码是一串由0和1组成的字符串，所以code是一个字符数组。

进行哈夫曼编码首先要对用户输入的信息进行统计，将每个字符作为哈夫曼树的叶子结点。统计每个字符出现的次数（频度）作为叶子的权重，统计次数可以根据每个字符不同的ASCII 码。并根据叶子结点的权重建立一个哈夫曼树。

建立每个叶子的编码从根结点开始，规定通往左子树路径记为0，通往右子树路径记为 1.由于编码要求从根结点开始，所以需要前序遍历哈夫曼树，故编码过程是以前序遍历二叉树

为基础的。同时注意递归函数中能否直接对结点的编码域进行操作。

编码信息只要遍历字符串中每个字符，从哈夫曼树中找到相应的叶子结点，取得相应的编码。最后再将所有找到的编码连接起来即可。

译码则是将编码串从左到右诸位判别，直到确定一个字符。这可以用生成哈夫曼树的逆过程实现。由于每个字符的编码各不相同，且编码也是个字符串，所以只要遍历编码串，从哈夫曼树中找到相应的叶子结点，取得相应的字符再将找到的字符连接起来即可。

2.1 存储结构

哈夫曼树顺序存储结构

2.2 关键算法分析

1、统计字符的频度

自然语言描述：

1)取出字符串中的一个字符

2)遍历所有初始化的哈夫曼树结点

3)如果结点中有记录代表的字符且字符等于取出的字符，说明该字符的叶子存在，则将该

结点的权加一。

4)如果所有结点均没有记录字符与取出字符一致，说明该字符的叶子不存在，则将结点的

字符记为取出字符，并将权重设为1.

5)重复（1）（2）（3）（4）步骤，如此遍历字符串中的所有字符。

伪代码：

1.for(int i=0;i<字符长度;i++)

1.1for (int j=0;j<字符长度;j++)

1.1.1 if (WordStr[i]==HuffTree[j].word)

1.1.1.1权重++

1.1.1.2 break;

1.1.2否则取字符域为空的结点

1.1.

2.1 HuffTree[j].word=WordStr[i];

1.1.

2.2 HuffTree[j].weight=1;

1.1.

2.3 叶子数++;

1.1.

2.4 break;

结束

时间复杂度O(n2),空间复杂度S(0)

2、构造哈夫曼树

自然语言描述：

1)将n个权值的叶子结点存放到数组huffTree的前n个分量中

2)通过统计字符频度的算法给n个结点赋权值

3)将数组huffTree中出叶子结点外的结点初始化：左右子树、双亲域为-1；权值为0；

字符编号域为\0。

4)不断将两棵子树合并为一棵子树，并将新子树的根节点顺序存放到数组huffTree的前

n个分量的后面。

伪代码描述：

1.数组huffTree初始化，除叶子节点外，所有元素结点左右子树、双亲域为-1；权值为0；字符编号域为\0。

2.进行n-1次合并

2.1在二叉树集合中选取两个权值最小的根结点，其下标分别即为j1和j2

2.2将二叉树j1和j2合并为一棵新的二叉树结点k

时间复杂度O(n)，空间复杂度S(2)

3、为每个叶子结点编码

自然语言描述：

1)初始化一个字符数组Code暂存每个叶子结点的编码。

2)从叶子结点开始，如果是哈夫曼树的左孩子，则将编码表中的code值赋为0，否则为1

3)将指针层层上移，重复2）直到根结点

4)将所得编码逆置，并将编码最后一位赋为’\0’

5)进行下一叶子结点的编码

算法时间复杂度O(n2)，空间复杂度S(60)

4、为信息编码

自然语言描述：

1)定义字符串str1储存编码

2)遍历信息字符串中的每一个字符

3)对每一个字符，将其与huffTree前n个叶子结点的word域逐个比较，发现相同的则将

该结点的编码串code连接到str1串的末尾。

4)遍历信息字符串结束，输出str1

算法时间复杂度O(n2) ，空间复杂度S(2)

5、译码

自然语言描述：

1)从编码串str1第一个字符开始和数组huffTree第一个结点的编码域第一个字符进行比

较。

2)若相等，则继续比较两者的后续字符

3)否则，从str1第一个字符与huffTree第二个节点的编码域第一个字符进行比较。

4)重复上述过程，当huffTree结点中的字符全部比较完毕则说明本趟匹配成功，输出

huffTree结点的word域值。

5)重复上述过程，当str1中的字符全部比较完毕，译码结束。