北邮数据结构实验—Huffman编码解码器

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

数据结构

实验名称:____Huffman编码/解码器_____ 学生姓名:__________________

班级:__________________

班内序号:__________________

学号:__________________

日期:___________________

1.实验要求

利用二叉树结构实现哈夫曼编/解码器。

基本要求:

1.初始化(Init):能够对输入的任意长度的字符串s进行统计,统计每个字符的频度,并建立哈夫曼树

2.建立编码表(CreateTable):利用已经建好的哈夫曼树进行编码,并将每个字符的编码输出。

3.编码(Encoding):根据编码表对输入的字符串进行编码,并将编码后的字符串输出。

4.译码(Decoding):利用已经建好的哈夫曼树对编码后的字符串进行译码,并输出译码结果。

5.计算输入的字符串编码前和编码后的长度,并进行分析,讨论赫夫曼编码的压缩效果。

2. 程序分析

2.1 存储结构

静态三叉链表

2.2 程序流程(或程序结构、或类关系图等表明程序构成的内容,一般为流程图等)

2.2.1.流程图

2.2.1.伪代码

1.输入进行编码的字符串

2.遍历字符串,并为叶子节点权重赋值

3.依次对各字符进行哈弗曼编码,自下往上,若是双亲节点左孩子则编码前插入‘0’,若是双亲节点右孩子则编码钱插入‘1’。

4.显示各字符的哈弗曼编码。

5.对字符串进行编码,挨个遍历字符,找到相应的编码,复制到总的编码里,最后输出字符串的编码。

6.对字符串的哈弗曼码进行译码。自上往下,若是‘0’,则递归到左孩子,若是‘1’,则递归到右孩子,知道叶子节点,输出该叶子节点代表字符,再继续遍历。

7.分析内存占用情况。若用ASCII编码,每个字符占1个字节,即8bit,该情况下占用内存就是(字符长度)*8。若用哈弗曼编码,占用内存是各(字符频度)*(每个字符占用位数)之和。

2.3 关键算法分析

该程序关键算法即哈弗曼编码,语句如下:

void CHTree::huffmancode()

{

int i;

if(n<=1)return;

m=2*n-1;

for(i=1;i<=n;i++)//叶子节点的初始化

{ ht[i].parent=0;

ht[i].lchild=0;

ht[i].rchild=0;}

for(;i<=m;i++) //非叶子节点的初始化

{

ht[i].weight=0;

ht[i].parent=0;

ht[i].lchild=0;

ht[i].rchild=0;}

for(i=n+1;i<=m;++i)//构造哈夫曼树

{

s1=select(i-1);//函数在ht[1]到ht[i-1]中选择parent为0且weight最小的结点,并将结点序号返s,并将ht[s1].parent设为-1

s2=select(i-1);

ht[s1].parent=i;

ht[s2].parent=i;

ht[i].lchild=s1;

ht[i].rchild=s2;

ht[i].weight=ht[s1].weight+ht[s2].weight;

}

int c,f;

for(i=1;i<=n;++i) {

for(c=i,f=ht[i].parent;f!=0;c=f,f=ht[f].parent)//逆向求叶子结点的哈夫曼编码

if(ht[f].lchild==c){

str[i].insert(0,"0",0,1);} //在字符串str[i]的第0位置插入字符“0”

else{

str[i].insert(0,"1",0,1);} //在字符串str[i]的第0位置插入字符“1”

}

}

分析:这段语句实现的功能是根据统计出来的各字符的频度,建立哈弗曼。建立哈弗曼树的过程如程序所展示,每次选取权重最小且无双亲节点的节点组合,并将其权重之和赋给其双亲节点,加入到总结中进行下次判断。哈弗曼树建立完全以后,开始对各字符进行编码,从下往上,以叶子节点为起始点,若它是双亲节点的左孩子,其编码前插入‘0’,若是右孩子则插入‘1’。再判断双亲节点使其双亲节点的左孩子还是右孩子,以此类推直到根节点。依次对每个字符进行上述过程编码。

算法复杂度:

最好情况为只有根结点和叶子节点:O(n)

最坏情况为满二叉树情况:O(n*logn/2)

3.程序运行结果分析

首先,要求用户输入进行编码的字符串,遍历字符串,并为叶子节点权重赋值。然后,依次对各字符进行哈弗曼编码,自下往上,若是双亲节点左孩子则编码前插入‘0’,若是双亲节点右孩子则编码钱插入‘1’。屏幕上显示各字符的哈弗曼编码。接下来对字符串进行编码,挨个遍历字符,找到相应的编码,复制到总的编码里,最后输出字符串的编码。对字符串的哈弗曼码进行译码。自上往下,若是‘0’,则递归到左孩子,若是‘1’,则递归到右孩子,知道叶子节点,输出该叶子节点代表字符,再继续遍历。最后分析内存占用情况。若用ASCII 编码,每个字符占1个字节,即8bit,该情况下占用内存就是(字符长度)*8。若用哈弗曼编码,占用内存是各(字符频度)*(每个字符占用位数)之和。

3.总结

4.1实验的难点和关键点

本实验的难点和关键点是进行哈弗曼的编码与译码。编码之前先要遍历字符串,并统计各字符出现的频度。这里就要区分目前的字符是否出现过,若出现过则字符权重加一,若没有出现则在结构体数组的当前末尾添加该元素。统计完频度以后开始编码。根据哈弗曼树的特点,每次选取结点里权重最小,且双亲不为0的节点结合,依次添加直至根节点。编码过程是从下往上。对于某字符所在叶子节点,若是双亲节点左孩子则编码前插入‘0’,若是双亲节点右孩子则编码钱插入‘1’。直到双亲节点移动到根节点,所得到的编码即为该字符的编码。译码过程是编码的逆过程。依次读取哈弗曼码,自上往下,若是‘0’,则递归到左孩

相关文档
最新文档