信息论大作业
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
信息论大作业
电子工程学院
班
号
1.Huffman编码
1. Huffman 编码原理:
①将信源符号按概率从大到小的顺序排列,令p(x1)≥ p(x2)≥…≥ p(xn)
②给两个概率最小的信源符号p(xn-1)和p(xn)各分配一个码位“0”和“1”,将这两个信源符号合并成一个新符号,并用这两个最小的概率之和作为新符号的概率,结果得到一个只包含(n-1)个信源符号的新信源。称为信源的第一次缩减信源,用S1表示。
③将缩减信源S1的符号仍按概率从大到小顺序排列,重复步骤2,得到只含(n -2)个符号的缩减信源S2。
④重复上述步骤,直至缩减信源只剩两个符号为止,此时所剩两个符号的概率之和必为1。然后从最后一级缩减信源开始,依编码路径向前返回,就得到各信源符号所对应的码字。
2. 霍夫曼编码优缺点:
1)编出来的码都是异字头码,保证了码的唯一可译性。
2) 由于编码长度可变。因此译码时间较长,使得霍夫曼编码的压缩与还原相当费时。
3) 编码长度不统一,硬件实现有难度。
4) 对不同信号源的编码效率不同,当信号源的符号概率为2的负幂次方时,达到100%的编码效率;若信号源符号的概率相等,则编码效率最低。
5) 由于0与1的指定是任意的,故由上述过程编出的最佳码不是唯一的,但其平均码长是一样的,故不影响编码效率与数据压缩性能。
3.编码流程:
读入一幅图像的灰度值;
1.将矩阵的不同数统计在数组c的第一列中;
2.将相同的数占站整个数组总数的比例统计在数组p中;
3.找到最小的概率,相加直到等于1,把最小概率的序号存在tree第一列中,次
小放在第二列,和放在p像素比例之后;
4.C数组第一维表示值,第二维表示代码数值大小,第三维表示代码的位数;
5.把概率小的值为1标识,概率大的值为0标识;
6.计算信源的熵;
7.计算平均码长;
8.计算编码效率';
9.计算冗余度。
源程序:
p=input('请输入数据:');
n=length(p);
for i=1:n
if p(i)<0
fprintf('\n 提示:概率值不能小于0!\n');
p=input('请重新输入数据:');
end
end
if abs(sum(p))>1
fprintf('\n 哈弗曼码中概率总和不能大于1!\n');
p=input('请重新输入数据:');
end
q=p;
a=zeros(n-1,n); %生成一个n-1 行n 列的数组
for i=1:n-1
[q,l]=sort(q);
a(i,:)=[l(1:n-i+1),zeros(1,i-1)];
q=[q(1)+q(2),q(3:n),1];
end
for i=1:n-1
c(i,1:n*n)=blanks(n*n);
end
c(n-1,n)='0'; c(n-1,2*n)='1';
for i=2:n-1
c(n-i,1:n-1)=c(n-i+1,n*(find(a(n-i+1,:)==1))-(n-2):n*(find(a(n-i+1,:)==1))) ;
c(n-i,n)='0' ;
c(n-i,n+1:2*n-1)=c(n-i,1:n-1) ;
c(n-i,2*n)='1' ;
for j=1:i-1
c(n-i,(j+1)*n+1:(j+2)*n)=c(n-i+1,n*(find(a(n-i+1,:)==j+1)-1)+1:n*find(a(n-i+1,:)==j+1));
end
end %完成huffman 码字的分配
for i=1:n
h(i,1:n)=c(1,n*(find(a(1,:)==i)-1)+1:find(a(1,:)==i)*n);
ll(i)=length(find(abs(h(i,:))~=32)); %计算每一个huffman 编码的长度
end
l=sum(p.*ll); %计算平均码长
fprintf('\n Huffman编码结果为:\n'); h
fprintf('\n 编码的平均码长为:\n'); l
hh=sum(p.*(-log2(p))); %计算信源熵
fprintf('\n 信源熵为:\n'); hh
fprintf('\n 编码效率为:\n'); t=hh/l
%计算编码效率
运行结果为:
请输入数据:[0.1,0.1,0.1,0.2,0.1,0.1,0.2,0.1]
Huffman编码结果为:
h =
1100
1101
010
111
011
000
10
001
编码的平均码长为:
l =
3
信源熵为:
hh =
2.9219
编码效率为:
t =
0.9740
2.fano编码:
Fano码:
费诺编码属于概率匹配编码,但它不是最佳的编码方法。不过有时也可以得到紧致码的性能。信源符号以概率递减的次序排列进来,将排列好的信源符号划分为两大组,使第组的概率和近于相同,并各赋于一个二元码符号”0”和”1”.然后,将每一大组的信源符号再分成两组,使同一组的两个小组的概率和近于相同,并又分别赋予一个二元码符号.依次下去,直至每一个小组只剩下一个信源符号为止.这样,信源符号所对应的码符号序列则为编得的码字。
费诺码编码的一般步骤如下:
(1)将信源消息符号按其出现的概率大小依次排列排列: