数据结构 用哈夫曼编码实现文件压缩

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

《用哈夫曼编码实现文件压缩》

实验报告

课程名称数据结构B

实验学期201 至201 学年第学期学生所在系部计算机学院

年级专业班级

学生姓名学号

任课教师

实验成绩

用哈夫曼编码实现文件压缩

1、了解文件的概念。

2、掌握线性链表的插入、删除等算法。

3、掌握Huffman树的概念及构造方法。

4、掌握二叉树的存储结构及遍历算法。

5、利用Huffman树及Huffman编码,掌握实现文件压缩的一般原理。

微型计算机、Windows 系列操作系统、Visual C++6.0软件

根据ascii码文件中各ascii字符出现的频率情况创建Haffman树,再将各字符对应的哈夫曼编码写入文件中,实现文件压缩。

(1)构造Hufffman树的方法—Hufffman算法

构造Huffman树步骤:

I.根据给定的n个权值{w1,w2,……wn},构造n棵只有根结点的二叉树,

令起权值为wj。

II.在森林中选取两棵根结点权值最小的树作左右子树,构造一棵新的二叉树,置新二叉树根结点权值为其左右子树根结点权值之和。

III.在森林中删除这两棵树,同时将新得到的二叉树加入森林中。

IV.重复上述两步,直到只含一棵树为止,这棵树即哈夫曼树。

(2)Huffman编码:数据通信用的二进制编码

思想:根据字符出现频率编码,使电文总长最短

编码:根据字符出现频率构造Huffman树,然后将树中结点引向其左孩子的分支标“0”,引向其右孩子的分支标“1”;每个字符的编码即为从根到每个叶子的路径上得到的0、1序列。

(3) 解压

根据存放在文件中的编码表和文件压缩后的编码,进行一对一的翻译过程。

压缩的代码

#include

#include

#include

#include

typedef struct

{unsigned int weight;

unsigned int parent,lchild,rchild;

}HTNode,*HuffmanTree;

typedef char **HuffmanCode;

void Select(HuffmanTree HT,int n,int *s1,int *s2){

int i;

unsigned int t;

t=10000;

for(i=1;i<=n;i++)

if(HT[i].parent==0&&HT[i].weight

t=HT[i].weight;

*s1=i;

}

t=10000;

for(i=1;i<=n;i++)

if(HT[i].parent==0&&HT[i].weight

t=HT[i].weight;

*s2=i;

}

}

void HuffmanCoding(HuffmanTree &HT,HuffmanCode &HC,int *w,int n) {

int m,i,s1,s2;

HTNode *p;

char *cd;

unsigned int c,f;

int start;

if(n<=1) return;

m=2*n-1;

HT=(HuffmanTree)malloc((m+1)*sizeof(HTNode));

for(p=HT+1,i=1;i<=n;++i,++p,++w)

{

(*p).weight=*(w+1);

(*p).parent=0;

(*p).lchild=0;

(*p).rchild=0;

}

for(;i<=m;++i,++p)

{(*p).weight=0;

(*p).parent=0;

(*p).lchild=0;

(*p).rchild=0;

}

for(i=n+1;i<=m;++i)

{

Select(HT,i-1,&s1,&s2);

HT[s1].parent=i;

HT[s2].parent=i;

HT[i].lchild=s1;

HT[i].rchild=s2;

HT[i].weight=HT[s1].weight+HT[s2].weight;

}

HC=(HuffmanCode)malloc((n+1)*sizeof(char *)); cd=(char *)malloc(n*sizeof(char));

cd[n-1]='\0';

for(i=1;i<=n;i++)

{ start=n-1;

for(c=i,f=HT[i].parent;f!=0;c=f,f=HT[f].parent)

if(HT[f].lchild==c)

cd[--start]='0';

else

cd[--start]='1';

HC[i]=(char *)malloc((n-start)*sizeof(char));

strcpy(HC[i],&cd[start]);

}

free(cd);

}

void main()

{int *w;

int i,n,m;

HuffmanTree HT=NULL;

HuffmanCode HC=NULL;

printf("请输入赫夫曼树的结点个数:");

scanf("%d",&n);

w=(int *)malloc((n+1)*sizeof(int));

m=2*n-1;

printf("请输入结点的权值为:\n");

for(i=1;i<=n;i++)

scanf("%d",w+i);

printf("赫夫曼编码:\n");

HuffmanCoding(HT,HC,w,n);

for(i=1;i<=n;i++)

{

printf("%s\n",HC[i]);

}

}

相关文档
最新文档