信息论与编码论文
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
通信工程2班高炜 10021340208
霍夫曼编码的matlab实现
用Matlab语言编程实现霍夫曼编码的程序实现与应用探讨(英文26个字母概率分布)
一、实验原理及编码思想:
1、二进制Huffman编码的基本原理及算法
(1) 把信源符号集中的所有符号按概率从大到小排队。
(2) 取概率最小的两个符号作为两片叶子合并(缩减)到一个节点。
(3) 视此节点为新符号,其概率等于被合并(缩减)的两个概率之和,参与概率排队。
(4) 重复(2)(3)两步骤,直至全部符号都被合并(缩减)到根。
(5) 从根出发,对各分枝标记0和1。从根到叶的路径就给出了各个码字的编码和码长。
2、程序设计的原理
(1)程序的输入:以一维数组的形式输入要进行huffman编码的信源符号的概率,在运行该程序前,显示文字提示信息,提示所要输入的概率矢量;然后对输入的概率矢量进行合法性判断,原则为:如果概率矢量中存在小于0的项,则输入不合法,提示重新输入;如果概率矢量的求和大于1,则输入也不合法,提示重新输入。
(2)huffman编码具体实现原理:
1>在输入的概率矩阵p正确的前提条件下,对p进行排序,并用矩阵L
记录p排序之前各元素的顺序,然后将排序后的概率数组p的前两项,
即概率最小的两个数加和,得到新的一组概率序列,重复以上过程,最后得到一个记录概率加和过程的矩阵p以及每次排序之前概率顺序的矩阵a。
2>新生成一个n-1行n列,并且每个元素含有n个字符的空白矩阵,然后进行huffman编码:将c矩阵的第n-1行的第一和第二个元素分别令为0和1(表示在编码时,根节点之下的概率较小的元素后补0,概率较大的元素后补1,后面的编码都遵守这个原则)然后对n-i-1的第一、二个元素进行编码,首先在矩阵a中第n-i行找到值为1所在的位置,然后在c矩阵中第n-i行中找到对应位置的编码(该编码即为第n-i-1行第一、二个元素的根节点),则矩阵c的第n-i行的第一、二个元素的n-1的字符为以上求得的编码值,根据之前的规则,第一个元素最后补0,第二个元素最后补1,则完成该行的第一二个元素的编码,最后将该行的其他元素按照“矩阵c中第n-i行第j+1列的值等于对应于a 矩阵中第n-i+1行中值为j+1的前面一个元素的位置在c矩阵中的编码值”的原则进行赋值,重复以上过程即可完成huffman编码。
3>计算信源熵和平均码长,其比值即为编码密码效率。
二、程序代码:
%取得信源概率矩阵,并进行合法性判断
clear;
A = 0.0819;
B =0.0147;
C = 0.0383;
D = 0.0391;
E = 0.1225;
F = 0.0226;
G = 0.0171; H = 0.0457; I = 0.0710;
J = 0.0014; K = 0.0041; L = 0.0377;
M = 0.0334; N = 0.0706; O = 0.0726;
P = 0.0289; Q = 0.0009; R = 0.0685;
S = 0.0636; T = 0.0941; U = 0.0258;
V = 0.0109; W = 0.0159; X = 0.0021;
Y = 0.0158; Z = 0.0008;
p = [A B C D E F G H I J K L M N O P Q R S T U V W X Y Z]; n=length(p);
for component=1:1:n
if(p(component)<0)
error('信源概率不能小于0');
end
end
if((sum(p)-1)>0.0001)
error('信源概率之和必须为1');
end
%建立各概率符号的位置索引矩阵Index,利于编码后从树根进行回溯,从而得出对应的编码
q=p
Index=zeros(n-1,n); %初始化Index
for i=1:n-1
[q,l]=sort(q);
Index(i,:)=[l(1:n-i+1),zeros(1,i-1)];
g(i,:)=q;
q=[q(1)+q(2),q(3:n),1]; %将Q中概率最小的两个元素合并,元素不足的地方补1
end
%根据以上建立的Index矩阵,进行回溯,获取信源编码
for i=1:n-1
Char(i,:)=blanks(n*n);%初始化一个由空格符组成的字符矩阵n*n,用于存放编码
end
%从码树的树根向树叶回溯,即从G矩阵的最后一行按与Index中的索引位置的对应关系向其第一行进行编码
Char(n-1,n)='0';%G中的N-1行即最后一行第一个元素赋为0,存到Char中n-1行的n列位置
Char(n-1,2*n)='1';%G中的N-1行即最后一行第二个元素赋为1,存到Char中n-1行的2*n列位置
%以下从G的倒数第二行开始向前编码
for i=2:n-1
Char(n-i,1:n-1)=Char(n-i+1,n*(find(Index(n-i+1,:)==1)) -(n-2):n*(find(Index(n-i+1,:)==1)));
%将Index后一行中索引为1的编码码字填入到当前行的第一个编码位置
Char(n-i,n)='0'; %然后在当前行的第一个编码位置末尾填入
'0'
Char(n-i,n+1:2*n-1)=Char(n-i,1:n-1); %将G后一行中索引为1的编码码字填入到当前行的第二个编码位置
Char(n-i,2*n)='1'; %然后在当前行的第二个编码位置末尾填入'1'
for j=1:i-1
%内循环作用:将Index后一行中索引不为1处的编码按照左右顺序填入当前行的第3个位置开始的地方,最后计算到Index的首行为止
Char(n-i,(j+1)*n+1:(j+2)*n)=Char(n-i+1,n*(find(Index(n-i+1, :)==j+1)-1)+1:n*find(Index(n-i+1,:)==j+1));
end
end
%Char中第一行的编码结果就是所需的Huffman 编码输出,通过Index中第一行索引将编码对应到相应概率的信源符号上。
for i=1:n
Result(i,1:n)=Char(1,n*(find(Index(1,:)==i)-1)+1:find(Index (1,:)==i)*n);
end
%打印编码结果