哈夫曼编码实验报告

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

实验报告与总结

一、实验目的

1、掌握哈夫曼编码原理;

2、熟练掌握哈夫曼树的生成方法;

3、理解数据编码压缩和译码输出编码的实现。

二、实验要求

实现哈夫曼编码和译码的生成算法。

三、实验内容

先统计要压缩编码的文件中的字符字母出现的次数,按字符字母和空格出现的概率对其进行哈夫曼编码,然后读入要编码的文件,编码后存入另一个文件;接着再调出编码后的文件,并对其进行译码输出,最后存入另一个文件中。

五、实验原理

1、哈夫曼树的定义:假设有n个权值,试构造一颗有n个叶子节点的二叉树,每个叶子带权值为wi,其中树带权路径最小的二叉树成为哈夫曼树或者最优二叉树;

2、哈夫曼树的构造:

weight为输入的频率数组,把其中的值赋给依次建立的HT Node对象中的data属性,即每一个HT Node对应一个输入的频率。然后根据data属性按从小到大顺序排序,每次从data取出两个最小和此次小的HT Node,将他们的data相加,构造出新的HTNode作为他们的父节点,指针parent,leftchild,rightchild赋相应值。在把这个新的节点插入最小堆。按此步骤可以构造构造出一棵哈夫曼树。

通过已经构造出的哈夫曼树,自底向上,由频率节点开始向上寻找parent,直到parent 为树的顶点为止。这样,根据每次向上搜索后,原节点为父节点的左孩子还是右孩子,来记录1或0,这样,每个频率都会有一个01编码与之唯一对应,并且任何编码没有前部分是同其他完整编码一样的。

六、实验流程

①初始化,统计文本文件中各字符的个数作为权值,生成哈夫曼树;

②根据符号概率的大小按由大到小顺序对符号进行排序;

③把概率最小的两个符号组成一个节点;

④重复步骤(2)(3),直到概率和为1;

⑤从根节点开始到相应于每个符号的“树叶”,概率大的标“0”,概率小的标“1”;

⑥从根节点开始,对符号进行编码;

⑦译码时流程逆向进行,从文件中读出哈夫曼树,并利用哈夫曼树将编码序列解码。

七、实验程序

#include

#include

#include

#include

using namespace std;

typedef struct //节点结构

{

char data; //记录字符值

long int weight; //记录字符权重

unsigned int parent,lchild,rchild;

}HTNode,*HuffmanTree; //动态分配数组存储哈夫曼树

typedef char * *HuffmanCode; //动态分配数组存储哈夫曼编码表

void Select(HuffmanTree &HT,int i,int &s1,int &s2) //在HT[1...t]中选择parent不为0且权值最小的两个结点,其序号分别为s1和s2

{

s1=0;s2=0;

int n1=30000,n2=30000;

for(int k=1;k<=i;k++)

{

if(HT[k].parent==0)

{

if(HT[k].weight

{

n2=n1; n1=HT[k].weight;

s2=s1; s1=k;

}

else

if(HT[k].weight

{

n2=HT[k].weight;

s2=k;

}

}

}

}

void HuffmanCoding(HuffmanTree &HT,HuffmanCode &HC,int n)//将要编码的字符串存入空树中

{

ifstream fin1("zifu.txt");

ifstream fin2("weight.txt");

if(n<=1)return;

int m=2*n-1;

int i;

HT=new HTNode[m+1];

char *zifu;

int *weight;

zifu= new char[n+1];

weight=new int[n+1];

for(i=1;i<=n;i++)//将待编码的字符放在zifu数组中

{

char ch;

ch=fin1.get();

zifu[i]=ch;

}

for(i=1;i<=n;i++)//将带编码字符对应的权值放在weight数组中

{

fin2>>weight[i];

}

for( i=1;i<=n;i++)

{

HT[i].data=zifu[i];

HT[i].weight=weight[i];

}

for(i=n+1;i<=m;i++)

{

HT[i].data='@';

}

for(i=1;i<=m;i++)

{

HT[i].parent=HT[i].lchild=HT[i].rchild=0;

}

for(i=n+1;i<=m;++i)

{

int s1,s2;

Select(HT,i-1,s1,s2);

HT[s1].parent=i; HT[s2].parent=i;

HT[i].lchild=s1; HT[i].rchild=s2;

HT[i].weight=HT[s1].weight+HT[s2].weight;

}

HC=(HuffmanCode)malloc((n+1)*sizeof(char*));开辟一个求编码的工作空间char *cd;

cd=(char *)malloc(n*sizeof(char));//开辟空间存放权值

cd[n-1]='\0';

for(i=1;i<=n;i++)

{

int start=n-1;

int c,f;

for( c=i, f=HT[i].parent;f!=0;c=f,f=HT[f].parent)//从叶子到根逆向求编码{

if(HT[f].lchild==c)

cd[--start]='0';//若是左孩子编为'0'

else

相关文档
最新文档