信息论大作业

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

信息论大作业

电子工程学院

1.Huffman编码

1. Huffman 编码原理:

①将信源符号按概率从大到小的顺序排列,令p(x1)≥ p(x2)≥…≥ p(xn)

②给两个概率最小的信源符号p(xn-1)和p(xn)各分配一个码位“0”和“1”,将这两个信源符号合并成一个新符号,并用这两个最小的概率之和作为新符号的概率,结果得到一个只包含(n-1)个信源符号的新信源。称为信源的第一次缩减信源,用S1表示。

③将缩减信源S1的符号仍按概率从大到小顺序排列,重复步骤2,得到只含(n -2)个符号的缩减信源S2。

④重复上述步骤,直至缩减信源只剩两个符号为止,此时所剩两个符号的概率之和必为1。然后从最后一级缩减信源开始,依编码路径向前返回,就得到各信源符号所对应的码字。

2. 霍夫曼编码优缺点:

1)编出来的码都是异字头码,保证了码的唯一可译性。

2) 由于编码长度可变。因此译码时间较长,使得霍夫曼编码的压缩与还原相当费时。

3) 编码长度不统一,硬件实现有难度。

4) 对不同信号源的编码效率不同,当信号源的符号概率为2的负幂次方时,达到100%的编码效率;若信号源符号的概率相等,则编码效率最低。

5) 由于0与1的指定是任意的,故由上述过程编出的最佳码不是唯一的,但其平均码长是一样的,故不影响编码效率与数据压缩性能。

3.编码流程:

读入一幅图像的灰度值;

1.将矩阵的不同数统计在数组c的第一列中;

2.将相同的数占站整个数组总数的比例统计在数组p中;

3.找到最小的概率,相加直到等于1,把最小概率的序号存在tree第一列中,次

小放在第二列,和放在p像素比例之后;

4.C数组第一维表示值,第二维表示代码数值大小,第三维表示代码的位数;

5.把概率小的值为1标识,概率大的值为0标识;

6.计算信源的熵;

7.计算平均码长;

8.计算编码效率';

9.计算冗余度。

源程序:

p=input('请输入数据:');

n=length(p);

for i=1:n

if p(i)<0

fprintf('\n 提示:概率值不能小于0!\n');

p=input('请重新输入数据:');

end

end

if abs(sum(p))>1

fprintf('\n 哈弗曼码中概率总和不能大于1!\n');

p=input('请重新输入数据:');

end

q=p;

a=zeros(n-1,n); %生成一个n-1 行n 列的数组

for i=1:n-1

[q,l]=sort(q);

a(i,:)=[l(1:n-i+1),zeros(1,i-1)];

q=[q(1)+q(2),q(3:n),1];

end

for i=1:n-1

c(i,1:n*n)=blanks(n*n);

end

c(n-1,n)='0'; c(n-1,2*n)='1';

for i=2:n-1

c(n-i,1:n-1)=c(n-i+1,n*(find(a(n-i+1,:)==1))-(n-2):n*(find(a(n-i+1,:)==1))) ;

c(n-i,n)='0' ;

c(n-i,n+1:2*n-1)=c(n-i,1:n-1) ;

c(n-i,2*n)='1' ;

for j=1:i-1

c(n-i,(j+1)*n+1:(j+2)*n)=c(n-i+1,n*(find(a(n-i+1,:)==j+1)-1)+1:n*find(a(n-i+1,:)==j+1));

end

end %完成huffman 码字的分配

for i=1:n

h(i,1:n)=c(1,n*(find(a(1,:)==i)-1)+1:find(a(1,:)==i)*n);

ll(i)=length(find(abs(h(i,:))~=32)); %计算每一个huffman 编码的长度

end

l=sum(p.*ll); %计算平均码长

fprintf('\n Huffman编码结果为:\n'); h

fprintf('\n 编码的平均码长为:\n'); l

hh=sum(p.*(-log2(p))); %计算信源熵

fprintf('\n 信源熵为:\n'); hh

fprintf('\n 编码效率为:\n'); t=hh/l

%计算编码效率

运行结果为:

请输入数据:[0.1,0.1,0.1,0.2,0.1,0.1,0.2,0.1]

Huffman编码结果为:

h =

1100

1101

010

111

011

000

10

001

编码的平均码长为:

l =

3

信源熵为:

hh =

2.9219

编码效率为:

t =

0.9740

2.fano编码:

Fano码:

费诺编码属于概率匹配编码,但它不是最佳的编码方法。不过有时也可以得到紧致码的性能。信源符号以概率递减的次序排列进来,将排列好的信源符号划分为两大组,使第组的概率和近于相同,并各赋于一个二元码符号”0”和”1”.然后,将每一大组的信源符号再分成两组,使同一组的两个小组的概率和近于相同,并又分别赋予一个二元码符号.依次下去,直至每一个小组只剩下一个信源符号为止.这样,信源符号所对应的码符号序列则为编得的码字。

费诺码编码的一般步骤如下:

(1)将信源消息符号按其出现的概率大小依次排列排列:

相关文档
最新文档