压缩技术实验编码
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
实验一统计编码
一、实验目的
1.熟悉统计编码的原理
2.掌握r元Huffman编码的方法;
3.了解Huffman编码效率及冗余度的计算;
二、实验原理
霍夫曼编码, 又称最佳编码,根据字符出现概率来构造平均长度最短的变长编码。
Huffman编码步骤:
(1)把信源符号x i(i=1,2,…,N)按出现概率的值由大到小的顺序排列;
(2)对两个概率最小的符号分别分配以“0”和“1”,然后把这两个概率相加作为一个新的辅助符号的概
(3)
(4)跳到第2步,直到出现概率相加为1
(5)用线将符号连接起来,从而得到一个码树,树的N个端点对应N个信源符号;
(6)从最后一个概率为1的节点开始,沿着到达信源的每个符号,将一路遇到的二进制码“0”或“1”顺序排列起来,就是端点所对应的信源符号的码字。
以上是二元霍夫曼编码。如果是r元霍夫曼编码,则应该如何做呢?
在HUFFMAN编码方案中,为出现概率较小的信源输出分配较长的码字,而对那些出现可能性较大的信源输出分配较短的码字。为此,首先将r个最小可能的信源输出合并成为一个新的输出,该输出的概率就是上述的r个输出的概率之和。重复进行该过程直到只剩下一个输出为止。信源符号的个数q与r必须满足如下的关系式:
q = (r-1) n + r n为整数
如果不满足上述关系式,可通过添加概率为零的信源符号来满足。这样就生成了一个树,从该树的根节点出发并将0、1……分别分配给任何r个来自于相同节点的分支,生成编码。可以证明用这种方法产生的编码在前向树类编码中具有最小的平均长度。
举例:对于取值为u={u1,u2,u3,u4,u5,u6}其相应的概率为p={0.1,0.3,0.05,0.09,0.21,0.25}的信源,试设计一个3元HUFFMAN码,求出码子的平均长度与编码效率。
注:因为是3元编码,所以每次3个概率值相加。
码字的平均长度
L=2×0.1+1×0.3+3×0.05+3×0.09+2×0.21+1×0.25=1.59
信源的熵
H(u)= (0.1×log2(0.1)+ 0.3×log2(0.3)+ 0.05×log2(0.05)+ 0.09×log2(0.09)+
0.21×log2(0.21)+ 0.25×log2(0.25)=2.3549
编码效率Q=0.9345
用MA TLAB实现该编码的方法可用下面的矩阵来说明:
20 u1 0.1①0.3 ②0.3 ⑤0.3⑤0.3③0.45① 1
1 u
2 0.3②0.25⑥0.25④0.25④0.25②0.3③
211 u3 0.05③0.21⑤0.21③0.21③0.45①0.25②
212 u4 0.09④0.1①0.1②0.14①
22 u50.21⑤0.09④0.14 ①0.1②
0 u6 0.25⑥0.05③
0. ⑦0 ⑦
注:每次3个数加完后,重新按序分配编号,在按概率值重新排序,再进行下次加数。
7 3 4 1 5 6 2
m= 2 1 3 4 5 0 0
2 3 1 0 0 0 0
注:m中每一行为按概率值重新排序后的编号列,一共三次概率值排序;单箭头表示两次排序中的概率值并未参加加数,未改变;多箭头表示箭头所指向的多项概率值相加后得到箭头源的概率值。
210 211 212 20 22 0 1
c= 20 21 22 0 1
0 1 2
注:c为编码矩阵,从最后一行开始,因为是3元编码,故按0、1、2开始编码。根据m中的箭头,单箭头不变,多箭头根据箭头源每上一层则箭头源编码后再加一位,同一层中加的位数按0、1、2顺序添加。
m矩阵第I(I>1)行中的‘1’记录了合并后的信源符号在新信源中的位置。
三、实验步骤
1.输入初始概率分布p和码元数r;
2.检查是否满足q = (n-1)r + r (q为输入信源的个数),如果不满足则补零使之满足;
3.排序得m矩阵
4.根据m矩阵获得c矩阵
5.从c矩阵中取出最后的码字矩阵h并计算平均码长和编码效率。
四、实验仪器
1计算机;
2 MA TLAB程序;
3移动式存储器(软盘、U盘等);
4记录用的笔、纸。
五、实验报告内容
1、实验目的
2、实验要求
3、实验环境
4、实验内容(叙述操作过程,提交主要程序段)
5、实验结论
6、实验总结
六、思考题
1什么是霍夫曼编码?在Matlab中如何实现?
2 r元霍夫曼编码的原理和过程?
实验二量化与变换编码
一、实验目的
1.理解有损压缩和无损压缩的概念;
2.理解图像压缩的主要原则和目的;
3. 掌握DCT编码的原理
4. 了解游程编码的原理
二、实验原理
1.图像压缩原理
图像压缩主要目的是为了节省存储空间,增加传输速度。图像压缩的理想标准是信息丢失最少,压缩比例最大。不损失图像质量的压缩称为无损压缩,无损压缩不可能达到很高的压缩比;损失图像质量的压缩称为有损压缩,高的压缩比是以牺牲图像质量为代价的。压缩的实现方法是对图像重新进行编码,希望用更少的数据表示图像。
信息的冗余量有许多种,如空间冗余,时间冗余,结构冗余,知识冗余,视觉冗余等,数据压缩实质上是减少这些冗余量。高效编码的主要方法是尽可能去除图像中的冗余成分,从而以最小的码元包含最大的图像信息。
编码压缩方法有许多种,从不同的角度出发有不同的分类方法,从信息论角度出发可分为两大类。
(1)冗余度压缩方法,也称无损压缩、信息保持编码或嫡编码。具体说就是解码图像和压缩编码前的图像严格相同,没有失真,从数学上讲是一种可逆运算。
(2)信息量压缩方法,也称有损压缩、失真度编码或烟压缩编码。也就是说解码图像和原始图像是有差别的,允许有一定的失真。
应用在多媒体中的图像压缩编码方法,从压缩编码算法原理上可以分为以下3类:
(1)无损压缩编码种类
哈夫曼(Huffman)编码,算术编码,游程(RLE)编码,Lempel zev编码。
(2)有损压缩编码种类
预测编码,DPCM,运动补偿;
频率域方法:正交变换编码(如DCT),子带编码;
空间域方法:统计分块编码;
模型方法:分形编码,模型基编码;
基于重要性:滤波,子采样,比特分配,向量量化;
(3)混合编码。
有JBIG,H261,JPEG,MPEG等技术标准。
本实验主要利用MA TLAB程序进行离散余弦变换(DCT)压缩和游程编码(Run Length Encoding,RLE)。
1)离散余弦变换(DCT)图像压缩原理