用哈夫曼编码C语言实现文件压缩
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《用哈夫曼编码实现文件压缩》
实验报告
课程名称数据结构B
实验学期2012 至2013 学年第一学期
学生所在系部计算机学院
年级2011 专业班级信管B111
学生姓名学号
任课教师兰芸
实验成绩
用哈夫曼编码实现文件压缩
1、了解文件的概念。
2、掌握线性链表的插入、删除等算法。
3、掌握Huffman树的概念及构造方法。
4、掌握二叉树的存储结构及遍历算法。
5、利用Huffman树及Huffman编码,掌握实现文件压缩的一般原理。
微型计算机、Windows 系列操作系统、Visual C++6.0软件
根据ascii码文件中各ascii字符出现的频率情况创建Haffman树,再将各字符对应的哈夫曼编码写入文件中,实现文件压缩。
(1)构造Hufffman树的方法—Hufffman算法
构造Huffman树步骤:
I.根据给定的n个权值{w1,w2,……wn},构造n棵只有根结点的二叉树,
令起权值为wj。
II.在森林中选取两棵根结点权值最小的树作左右子树,构造一棵新的二叉树,置新二叉树根结点权值为其左右子树根结点权值之和。
III.在森林中删除这两棵树,同时将新得到的二叉树加入森林中。
IV.重复上述两步,直到只含一棵树为止,这棵树即哈夫曼树。
(2)Huffman编码:数据通信用的二进制编码
思想:根据字符出现频率编码,使电文总长最短
编码:根据字符出现频率构造Huffman树,然后将树中结点引向其左孩子的分支标“0”,引向其右孩子的分支标“1”;每个字符的编码即为从根到每个叶子的路径上得到的0、1序列。
(3) 解压
根据存放在文件中的编码表和文件压缩后的编码,进行一对一的翻译过程。
压缩的代码
#include
#include
#include
#include
struct head
{
unsigned char b; /*the charactor*/
long count; /*the frequency*/
long parent,lch,rch; /*make a tree*/
char bits[256]; /*the haffuman code*/
}
header[512],tmp;
void yasuo() /*压缩*/
{
char filename[255],outputfile[255],buf[512];
unsigned char c; char wenjianming[255];
long i,j,m,n,f;
long min1,pt1,flength;
FILE *ifp,*ofp;
printf("输入文件地址及文件名:");
gets(filename);
ifp=fopen(filename,"rb"); /*打开源文件*/
while(ifp==NULL)
{ printf("打开文件出错\n");
printf("重新输入文件地址及文件名");
gets(filename);
ifp=fopen(filename,"rb");
}
printf("输入压缩后的文件地址和文件名及后缀:");
gets(wenjianming);
ofp=fopen(wenjianming,"wb"); /*创建并打开目的文件*/ while(ofp==NULL)
{printf("重新输入压缩后的文件地址和文件名及后缀:");
ofp=fopen(wenjianming,"wb");
}
flength=0;
while(!feof(ifp)) /*读取ifp文件*/
{
fread(&c,1,1,ifp); /*按位读取*/
header[c].count++;
flength++;
}
flength-1;
header[c].count-1; /*读取文件结束*/
for(i=0;i<512;i++) /*构造哈弗曼树*/
{
if(header[i].count!=0)
header[i].b=(unsigned char)i;
else
header[i].b=0;
header[i].parent=-1;
header[i].lch=header[i].rch=-1;
}
for(i=0;i<256;i++)
{
for(j=i+1;j<256;j++)
{
if(header[i].count { tmp=header[i]; header[i]=header[j]; header[j]=tmp; } } } for(i=0;i<256;i++) if(header[i].count==0) break; n=i; m=2*n-1; for(i=n;i