无损压缩技术

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

数据压缩的方法
基本原理和方法
统计编码预测编码变换编码混合编码分析合成编码
常用数据压缩方法的基本原理
●
香农-范诺与霍夫曼编码
熵是信息量的度量方法 1. 某个事件的信息量用表示，
其中
为第个I个事件的概率。 2. 信源S的熵的定义
常用数据压缩方法的基本原理
●
基本原理和方法
统计编码根据消息出现概率的分布特性而进行的压缩编码。 Huffman编码行程编码词典编码算术编码
●时间冗余
序列图像（如电视图像和运动图像）和语音数据的前后有着很强的相关性，经常包含着冗余。在播出该序列图像时，时间发生了推移，但若干幅画面的同一部位没有变化，变化的只是其中某些地方，这就形成了时间冗余。
数据冗余的类型与压缩方法分类
●统ห้องสมุดไป่ตู้冗余
基本原理和方法
空间冗余和时间冗余是把图像信号看作概率信号时反应出的统计特性，因此，这两种冗余也被称为统计冗余。 ●信息熵冗余
数据压缩技术的性能指标
硬软件系统
基本原理和方法
有些压缩解压工作可用软件实现。设计系统时必须充分考
虑：算法复杂－压缩解压过程长算法简单－压缩效果差目前有些特殊硬件可用于加速压缩 / 解压。硬件系统速度快，但各种选择在初始设计时已确定，一般不能更改。因此在设计硬接线压缩/解压系统时必须先将算法标准化。
数据压缩技术的性能指标
基本原理和方法
图像质量
压缩方法：无损压缩
有损压缩
有损压缩：失真情况很难量化，只
能对测试的图像进行估计。
数据压缩技术的性能指标
压缩解压速度
基本原理和方法
在许多应用中，压缩和解压可能不同时用，在不同的位置不同的系统中。所以，压缩、解压速度分别估计。静态图像中，压缩速度没有解压速度严格；动态图像中，压缩、解压速度都有要求，因为需实时地从摄像机或其他设备中抓取动态视频。
信息熵实际情况又称编码冗余。信息熵是指一组数所携带的信息量。
●结构冗余
数字化图像中的物体表面纹理等结构往往存在着冗余
数据冗余的类型与压缩方法分类
●知识冗余
基本原理和方法
由图像的记录方式与人对图像的知识差异所产生的冗余称为知识冗余。 ●视觉冗余人类的视觉系统对于图像场的注意在非均匀和非线性的，视觉系统并不是对图像的任何变化都能感知。 ●听觉冗余人耳对不同频率的声音的敏感性是不同的，并不能察觉所有频率的变化，对某些频率不必特别关注，因此存在听觉冗余。
360B
480KB
数据冗余的类型与压缩方法分类
基本原理和方法
数据冗余的类别
空间冗余时间冗余统计冗余信息熵冗余结构冗余知识冗余视觉冗余听觉冗余
数据冗余的类型与压缩方法分类
●空间冗余
基本原理和方法
规则物体和规则背景的表面物理特性都具有相关性，数字化后表现为数据冗余。
统计编码
基本原理和方法
Huffman编码它是统计独立信源能达到最小平均码长的编码方法。编码效率高。
统计编码
基本原理和方法
Huffman编码
编码步骤： (1) 初始化，根据符号概率的大小按由大到小顺序对符号进行排序。 (2) 把概率最小的两个符号组成一个节点。 (3) 重复步骤2。 (4) 从根节点开始到相应于每个符号的“树叶”，从上到下标上“0”(上枝)或者“1”(下枝)，至于哪个为“1”哪个为“0”则无关紧要，最后的结果仅仅是分配的代码不同，而代码的平均长度是相同的。 (5) 从根节点开始顺着树枝到每个叶子分别写出每个符号的代码，
数据冗余的类型与压缩方法分类
数据压缩技术分类
●
基本原理和方法
无损压缩
指使压缩后的数据进行重构(或者叫做还原，解压缩)，重构后的数据与原来的数据完全相同；无损压缩用于要求重构的信号与原始信号完全一致的场合。典型的算法有： Huffman编码，算术编码，行程编码等。特点：压缩比较低，为2:1---5:1，一般用来压缩文本，数据。
数据压缩技术的性能指标
基本原理和方法
压缩的必要性
音频、视频的数据量很大，如果不进行处理，计算机系统几乎无法对它进行存取和交换。例如：
一幅中等分辨率（640×480）的真彩色图像（24b/像素），它的数据量约为0.9MB/帧，若要达到每秒25帧的全动态显示要求，每秒所需的数据量约为22MB。对于声音也是如此，CD音质的声音每秒将有约为172KB的数据量。
数据压缩技术的性能指标
从哪些方面评价一个压缩系统？
●
基本原理和方法
压缩比
图像质量
●
●压缩解压速度 ● 硬件和软件
数据压缩技术的性能指标
压缩比
输入数据和输出数据比例如：图像 512×480， 24位
基本原理和方法
输入＝(512×480×24)/8=737280B
输出15000B 压缩比＝737280/15000＝49
冗余的基本概念
基本原理和方法
指信息存在的各种性质的多余度举例：（1）广播员读文稿时每分钟约读180字，一个汉字占两个字节；文本数据量为360B；（2）如果对语音录音，由于人说话的音频范围为20Hz到 4kHz，即语音的带宽为4kHz，若设量化位数为8bit,则一秒钟的数据量为： 4×2×8=64kbit/s= 8KB/s 则一分钟的数据是480KB。
数据冗余的类型与压缩方法分类
●
基本原理和方法
有损压缩是指使用压缩后的数据进行重构，重构后的数据与原来的数据有所不同，但不影响人对原始资料表达的信息造成误解。典型的算法有：混合编码的JPEG标准，MPEG标准等。特点：压缩比高，为几十到几百倍一般用于图像，声音，视频压缩。
常用数据压缩方法的基本原理
数据压缩技术的性能指标
基本原理和方法
视频、图像、声音有很大的压缩潜力信息论认为：若信源编码的熵大于信源的实际熵，该信源中一定存在冗余度（信息熵冗余）。原始信源的数据存在着很多冗余度：空间冗余、时间冗余、视觉冗余、听觉冗余、统计冗余、结构冗余、知识冗余、信息熵冗余等。
数据冗余的类型与压缩方法分类
Huffman编码过程
a1 0.20 a2 0.19 a3 0.18 a4 0.17 1 0 1 0 0.35 1 1 0 0 0.11 0 0.26 1 1 0.61 1.00 0.39 0