北邮信通院数据结构实验报告三哈夫曼编码器.docx
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
北京邮电大学电信工程学院
数据结构实验报告
实验名称:实验三树——哈夫曼编/解码器
学生姓名:
班级:
班内序号:
学号:
日期: 2014 年 12 月 11 日
1.实验要求
利用二叉树结构实现赫夫曼编/解码器。
基本要求:
1、初始化 (Init) :能够对输入的任意长度的字符串s 进行统计,统计每个
字符的频度,并建立赫夫曼树
2、建立编码表 (CreateTable):利用已经建好的赫夫曼树进行编码,并将每
个字符的编码输出。
3、编码 (Encoding):根据编码表对输入的字符串进行编码,并将编码后的
字符串输出。
4、译码 (Decoding):利用已经建好的赫夫曼树对编码后的字符串进行译
码,并输出译码结果。
5、打印 (Print):以直观的方式打印赫夫曼树(选作)
6、计算输入的字符串编码前和编码后的长度,并进行分析,讨论赫夫
曼编码的压缩效果。
测试数据:
I love data Structure, I love Computer。 I will try my best to study data Structure.
提示:
1、用户界面可以设计为“菜单”方式:能够进行交互。
2、根据输入的字符串中每个字符出现的次数统计频度,对没有出现的
字符一律不用编码。
-2.程序分析
2.1 存储结构
Huffman 树
给定一组具有确定权值的叶子结点,可以构造出不同的二叉树,其中带权路径
长度最小的二叉树称为Huffman树,也叫做最优二叉树。weight lchild rchild parent
2-1-1-1
5-1-1-1
6-1-1-1
7-1-1-1
9-1-1-1
weight lchild rchild parent 2-1-15 5-1-15 6-1-16 7-1-16 9-1-17 7017
13238
16548
2967-1
2.2 关键算法分析
(1)计算出现字符的权值
利用 ASCII 码统计出现字符的次数,再将未出现的字符进行筛选,将出现的字符及頻数存储在数组a[] 中。
void Huffman::Init()
{
int nNum[256]= {0};//记录每一个字符出现的次数
int ch = cin.get();
int i=0;
while((ch!='\r') && (ch!='\n'))
{
nNum[ch]++;//统计字符出现的次数
str[i++] = ch;//记录原始字符串
ch = cin.get();//读取下一个字符
}
str[i]='\0';
n = 0;
-for ( i=0;i<256;i++)
{
if (nNum[i]>0)//若nNum[i]==0,字符未出现
{
l[n] = (char)i;
a[n] = nNum[i];
n++;
}
}
}
时间复杂度为O( 1);
(2)创建哈夫曼树:
算法过程:
Huffman 树采用顺序存储--- 数组;
数组的前n 个结点存储叶子结点,然后是分支结点,最后是根结点;
首先初始化叶子结点元素—循环实现;
以循环结构,实现分支结点的合成,合成规则按照huffman 树构成规则进行。
关键点:选择最小和次小结点合成。
void Huffman::CreateHTree()
{
HTree = new HNode [2*n-1]; //根据权重数组a[0..n-1]初始化Huffman树
for (int j = 0; j < n; j++)
-{
HTree[j].weight = a[j];
HTree[j].LChild = HTree[j].RChild = HTree[j].parent = -1;
}
int x,y;
for (int i = n; i < 2*n-1; i++) //开始建Huffman树
{
SelectMin( HTree, i, x, y);//从1~i中选出两个权值最小的结点
HTree[x].parent = HTree[y].parent = i;
HTree[i].weight = HTree[x].weight+ HTree[y].weight;
HTree[i].LChild = x;
HTree[i].RChild = y;
HTree[i].parent = -1;
}
}
2
时间复杂度为O(n )
void Huffman::SelectMin( HNode *hTree,int n, int &i1, int &i2 )
{
int i;
//找一个比较值的起始值
for(i=0; i {if(hTree[i].parent==-1 ) -{ i1=i;break;} } i++; for( ; i {if(hTree[i].parent==-1 ) { i2=i;break;} } if(hTree[i1].weight>hTree[i2].weight) //i1指向最小的 { int j=i2;i2=i1;i1 = j;} //开始找最小的两个 i++; for( ; i { if(hTree[i].parent==-1 && hTree[i].weight < hTree[i1].weight ) { i2=i1;i1 = i;} else if( hTree[i].parent==-1 &&hTree[i].weight < hTree[i2].weight) { i2=i; } } } 时间复杂度为O(n) (3)创建编码表