Huffman编码对英文文本的压缩和解压缩
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Huffman编码对英文文本的压缩和解压缩中国地质大学计算机学院信息安全专业
信息论实验报告
#include
#include
#include
struct head {
unsigned char b; //记录字符在数组中的位置
long count; //字符出现频率(权值)
long parent,lch,rch; //定义哈夫曼树指针变量char bits[256]; //定义存储哈夫曼编码的数组}header[512],tmp;
void compress()
{
char filename[255],outputfile[255],buf[512];
unsigned char c;
long n,m,i,j,f; //作计数或暂时存储数据用
long min1,pt1,flength=0,length1,length2; //记录最小结点、文件长度
double div; //计算压缩比用
FILE *ifp,*ofp; //分别为输入、输出文件指针printf("\t请您输入需要压缩的文件(需要路径):");
gets(filename);
ifp=fopen(filename,"rb");
if(ifp==NULL){
printf("\n\t文件打开失败!\n ");
system("pause");
return;
}
printf("\t请您输入压缩后的文件名(如无路径则默认为桌面文件):");
gets(outputfile);
ofp=fopen(outputfile,"wb");
if(ofp==NULL){
printf("\n\t压缩文件失败!\n ");
system("pause");
return;
}
flength=0;
while(!feof(ifp)){
fread(&c,1,1,ifp);
header[c].count++; //字符重复出现频率+1
flength++; //字符出现原文件长度+1 }
flength--;
length1=flength; //原文件长度用作求压缩率的分母
header[c].count--;
for(i=0;i<512;i++){
if(header[i].count!=0)
header[i].b=(unsigned char)i;
/*将每个哈夫曼码值及其对应的ASCII码
存放在一维数组header[i]中,且编码表
中的下标和ASCII码满足顺序存放关系*/
else
header[i].b=0;
header[i].parent=-1;header[i].lch=header[i].rch=-1; //对结点进行初始化
}
for(i=0;i<256;i++){ //按出现权值从大到小排序for(j=i+1;j<256;j++){
if(header[i].count tmp=header[i]; header[i]=header[j]; header[j]=tmp; } } } for(i=0;i<256;i++) //找到第一个空的header结点if(header[i].count==0) break; n=i; m=2*n-1; for(i=n;i min1=999999999; //预设的最大权值,即结点出现的最大次数 for(j=0;j if(header[j].parent!=-1) continue; /*parent!=-1说明该结点已存在哈夫曼 树中,跳出循环重新选择新结点*/ if(min1>header[j].count){ pt1=j; min1=header[j].count; continue; } } header[i].count=header[pt1].count; header[pt1].parent=i; header[i].lch=pt1; min1=999999999; for(j=0;j if(header[j].parent!=-1) continue; if(min1>header[j].count){ pt1=j; min1=header[j].count; continue; } } header[i].count+=header[pt1].count; header[i].rch=pt1; header[pt1].parent=i; //哈夫曼无重复前缀编码} for(i=0;i f=i; header[i].bits[0]=0; //根结点编码0 while(header[f].parent!=-1){ j=f; f=header[f].parent; if(header[f].lch==j){ //置左分支编码0 j=strlen(header[i].bits); memmove(header[i].bits+1,header[i].bits,j+1); //依次存储连接"0""1"编码,此处语句为网络借鉴 header[i].bits[0]='0'; } else{ //置右分支编码1 j=strlen(header[i].bits); memmove(header[i].bits+1,header[i].bits,j+1); header[i].bits[0]='1'; } } } fseek(ifp,0,SEEK_SET); //从文件开始位置向前移动0字节,即定位到文件开始位置 fwrite(&flength,sizeof(int),1,ofp); /*用来将数据写入文件流中,参数flength 指向欲写入的数据地址,总共写入的字符数 以参数size*int来决定,返回实际写入的int数目*/