信息论与编码论文

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

通信工程2班高炜 10021340208

霍夫曼编码的matlab实现

用Matlab语言编程实现霍夫曼编码的程序实现与应用探讨(英文26个字母概率分布)

一、实验原理及编码思想:

1、二进制Huffman编码的基本原理及算法

(1) 把信源符号集中的所有符号按概率从大到小排队。

(2) 取概率最小的两个符号作为两片叶子合并(缩减)到一个节点。

(3) 视此节点为新符号,其概率等于被合并(缩减)的两个概率之和,参与概率排队。

(4) 重复(2)(3)两步骤,直至全部符号都被合并(缩减)到根。

(5) 从根出发,对各分枝标记0和1。从根到叶的路径就给出了各个码字的编码和码长。

2、程序设计的原理

(1)程序的输入:以一维数组的形式输入要进行huffman编码的信源符号的概率,在运行该程序前,显示文字提示信息,提示所要输入的概率矢量;然后对输入的概率矢量进行合法性判断,原则为:如果概率矢量中存在小于0的项,则输入不合法,提示重新输入;如果概率矢量的求和大于1,则输入也不合法,提示重新输入。

(2)huffman编码具体实现原理:

1>在输入的概率矩阵p正确的前提条件下,对p进行排序,并用矩阵L

记录p排序之前各元素的顺序,然后将排序后的概率数组p的前两项,

即概率最小的两个数加和,得到新的一组概率序列,重复以上过程,最后得到一个记录概率加和过程的矩阵p以及每次排序之前概率顺序的矩阵a。

2>新生成一个n-1行n列,并且每个元素含有n个字符的空白矩阵,然后进行huffman编码:将c矩阵的第n-1行的第一和第二个元素分别令为0和1(表示在编码时,根节点之下的概率较小的元素后补0,概率较大的元素后补1,后面的编码都遵守这个原则)然后对n-i-1的第一、二个元素进行编码,首先在矩阵a中第n-i行找到值为1所在的位置,然后在c矩阵中第n-i行中找到对应位置的编码(该编码即为第n-i-1行第一、二个元素的根节点),则矩阵c的第n-i行的第一、二个元素的n-1的字符为以上求得的编码值,根据之前的规则,第一个元素最后补0,第二个元素最后补1,则完成该行的第一二个元素的编码,最后将该行的其他元素按照“矩阵c中第n-i行第j+1列的值等于对应于a 矩阵中第n-i+1行中值为j+1的前面一个元素的位置在c矩阵中的编码值”的原则进行赋值,重复以上过程即可完成huffman编码。

3>计算信源熵和平均码长,其比值即为编码密码效率。

二、程序代码:

%取得信源概率矩阵,并进行合法性判断

clear;

A = 0.0819;

B =0.0147;

C = 0.0383;

D = 0.0391;

E = 0.1225;

F = 0.0226;

G = 0.0171; H = 0.0457; I = 0.0710;

J = 0.0014; K = 0.0041; L = 0.0377;

M = 0.0334; N = 0.0706; O = 0.0726;

P = 0.0289; Q = 0.0009; R = 0.0685;

S = 0.0636; T = 0.0941; U = 0.0258;

V = 0.0109; W = 0.0159; X = 0.0021;

Y = 0.0158; Z = 0.0008;

p = [A B C D E F G H I J K L M N O P Q R S T U V W X Y Z]; n=length(p);

for component=1:1:n

if(p(component)<0)

error('信源概率不能小于0');

end

end

if((sum(p)-1)>0.0001)

error('信源概率之和必须为1');

end

%建立各概率符号的位置索引矩阵Index,利于编码后从树根进行回溯,从而得出对应的编码

q=p

Index=zeros(n-1,n); %初始化Index

for i=1:n-1

[q,l]=sort(q);

Index(i,:)=[l(1:n-i+1),zeros(1,i-1)];

g(i,:)=q;

q=[q(1)+q(2),q(3:n),1]; %将Q中概率最小的两个元素合并,元素不足的地方补1

end

%根据以上建立的Index矩阵,进行回溯,获取信源编码

for i=1:n-1

Char(i,:)=blanks(n*n);%初始化一个由空格符组成的字符矩阵n*n,用于存放编码

end

%从码树的树根向树叶回溯,即从G矩阵的最后一行按与Index中的索引位置的对应关系向其第一行进行编码

Char(n-1,n)='0';%G中的N-1行即最后一行第一个元素赋为0,存到Char中n-1行的n列位置

Char(n-1,2*n)='1';%G中的N-1行即最后一行第二个元素赋为1,存到Char中n-1行的2*n列位置

%以下从G的倒数第二行开始向前编码

for i=2:n-1

Char(n-i,1:n-1)=Char(n-i+1,n*(find(Index(n-i+1,:)==1)) -(n-2):n*(find(Index(n-i+1,:)==1)));

%将Index后一行中索引为1的编码码字填入到当前行的第一个编码位置

Char(n-i,n)='0'; %然后在当前行的第一个编码位置末尾填入

'0'

Char(n-i,n+1:2*n-1)=Char(n-i,1:n-1); %将G后一行中索引为1的编码码字填入到当前行的第二个编码位置

Char(n-i,2*n)='1'; %然后在当前行的第二个编码位置末尾填入'1'

for j=1:i-1

%内循环作用:将Index后一行中索引不为1处的编码按照左右顺序填入当前行的第3个位置开始的地方,最后计算到Index的首行为止

Char(n-i,(j+1)*n+1:(j+2)*n)=Char(n-i+1,n*(find(Index(n-i+1, :)==j+1)-1)+1:n*find(Index(n-i+1,:)==j+1));

end

end

%Char中第一行的编码结果就是所需的Huffman 编码输出,通过Index中第一行索引将编码对应到相应概率的信源符号上。

for i=1:n

Result(i,1:n)=Char(1,n*(find(Index(1,:)==i)-1)+1:find(Index (1,:)==i)*n);

end

%打印编码结果

相关文档
最新文档