无损压缩技术
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据压缩的方法
基本原理和方法
统计编码 预测编码 变换编码 混合编码 分析合成编码
常用数据压缩方法的基本原理
●
香农-范诺与霍夫曼编码
熵是信息量的度量方法 1. 某个事件的信息量用表示 ,
其中
为第个I个事件的概率。 2. 信源S的熵的定义
常用数据压缩方法的基本原理
●
基本原理和方法
统计编码 根据消息出现概率的分布特性而进行的压缩 编码。 Huffman编码 行程编码 词典编码 算术编码
●时间冗余
序列图像(如电视图像和运动图像)和语音数据的前 后有着很强的相关性,经常包含着冗余。在播出该序 列图像时,时间发生了推移,但若干幅画面的同一部 位没有变化,变化的只是其中某些地方,这就形成了 时间冗余。
数据冗余的类型与压缩方法分类
●统ห้องสมุดไป่ตู้冗余
基本原理和方法
空间冗余和时间冗余是把图像信号看作概率信号时反应 出的统计特性,因此,这两种冗余也被称为统计冗余。 ●信息熵冗余
数据压缩技术的性能指标
硬软件系统
基本原理和方法
有些压缩解压工作可用软件实现。设计系统时必须充分考
虑: 算法复杂 - 压缩解压过程长 算法简单 - 压缩效果差 目前有些特殊硬件可用于加速压缩 / 解压。 硬件系统速度 快,但各种选择在初始设计时已确定,一般不能更改。因此在 设计硬接线压缩/解压系统时必须先将算法标准化。
数据压缩技术的性能指标
基本原理和方法
图像质量
压缩方法: 无损压缩
有损压缩
有损压缩:失真情况很难量化,只
能对测试的图像进行估计。
数据压缩技术的性能指标
压缩解压速度
基本原理和方法
在许多应用中,压缩和解压可能不同时用,在 不同的位置不同的系统中。所以,压缩、解压速度 分别估计。 静态图像中,压缩速度没有解压速度严格;动 态图像中,压缩、解压速度都有要求,因为需实时 地从摄像机或其他设备中抓取动态视频。
信息熵实际情况又称编码冗余。信息熵是指一组数所 携带的信息量。
●结构冗余
数字化图像中的物体表面纹理等结构往往存在着冗余
数据冗余的类型与压缩方法分类
●知识冗余
基本原理和方法
由图像的记录方式与人对图像的知识差异所产生的冗 余称为知识冗余。 ●视觉冗余 人类的视觉系统对于图像场的注意在非均匀和非线性 的,视觉系统并不是对图像的任何变化都能感知。 ●听觉冗余 人耳对不同频率的声音的敏感性是不同的,并不能察觉 所有频率的变化,对某些频率不必特别关注,因此存在 听觉冗余。
360B
480KB
数据冗余的类型与压缩方法分类
基本原理和方法
数据冗余的类别
空间冗余 时间冗余 统计冗余 信息熵冗余 结构冗余 知识冗余 视觉冗余 听觉冗余
数据冗余的类型与压缩方法分类
●空间冗余
基本原理和方法
规则物体和规则背景的表面物理特性都具有相关性, 数字化后表现为数据冗余。
统计编码
基本原理和方法
Huffman编码 它是统计独立信源能达到最小平均码长 的编码方法。编码效率高。
统计编码
基本原理和方法
Huffman编码
编码步骤: (1) 初始化,根据符号概率的大小按由大到 小顺序对符号进行排序。 (2) 把概率最小的两个符号组成一个节点。 (3) 重复步骤2。 (4) 从根节点开始到相应于每个符号的“树 叶”,从上到下标上“0”(上枝)或者“1”(下枝), 至于哪个为“1”哪个为“0”则无关紧要,最后的 结果仅仅是分配的代码不同,而代码的平均长度 是相同的。 (5) 从根节点开始顺着树枝到每个叶子分别 写出每个符号的代码,
数据冗余的类型与压缩方法分类
数据压缩技术分类
●
基本原理和方法
无损压缩
指使压缩后的数据进行重构(或者叫做还原,解压缩), 重构后的数据与原来的数据完全相同;无损压缩用于要 求重构的信号与原始信号完全一致的场合。 典型的算法有: Huffman编码,算术编码,行程编码等。 特点:压缩比较低,为2:1---5:1, 一般用来压缩文本,数据。
数据压缩技术的性能指标
基本原理和方法
压缩的必要性
音频、视频的数据量很大,如果不进行 处理,计算机系统几乎无法对它进行存取和交 换。例如:
一幅中等分辨率(640×480)的真彩色图像(24b/像素) ,它的数据量约为0.9MB/帧,若要达到每秒25帧的全动 态显示要求,每秒所需的数据量约为22MB。对于声音也 是如此,CD音质的声音每秒将有约为172KB的数据量。
数据压缩技术的性能指标
从哪些方面评价一个压缩系统?
●
基本原理和方法
压缩比
图像质量
●
●压缩解压速度 ● 硬件和软件
数据压缩技术的性能指标
压缩比
输入数据和输出数据比 例如:图像 512×480, 24位
基本原理和方法
输入=(512×480×24)/8=737280B
输出15000B 压缩比=737280/15000=49
冗余的基本概念
基本原理和方法
指信息存在的各种性质的多余度 举例: (1)广播员读文稿时每分钟约读180字,一个汉字占两个 字节;文本数据量为360B; (2)如果对语音录音,由于人说话的音频范围为20Hz到 4kHz,即语音的带宽为4kHz,若设量化位数为8bit,则一秒钟 的数据量为: 4×2×8=64kbit/s= 8KB/s 则一分钟的数据是480KB。
数据冗余的类型与压缩方法分类
●
基本原理和方法
有损压缩 是指使用压缩后的数据进行重构,重构后的数据与 原来的数据有所不同,但不影响人对原始资料表达 的信息造成误解。 典型的算法有: 混合编码的JPEG标准,MPEG标准等。 特点:压缩比高,为几十到几百倍 一般用于图像,声音,视频压缩。
常用数据压缩方法的基本原理
数据压缩技术的性能指标
基本原理和方法
视频、图像、声音有很大的压缩潜力 信息论认为:若信源编码的熵大于 信源的实际熵,该信源中一定存在冗余 度(信息熵冗余)。 原始信源的数据存在着很多冗余度: 空间冗余、时间冗余、视觉冗余、听觉 冗余、统计冗余、结构冗余、知识冗余、 信息熵冗余等。
数据冗余的类型与压缩方法分类
Huffman编码过程
a1 0.20 a2 0.19 a3 0.18 a4 0.17 1 0 1 0 0.35 1 1 0 0 0.11 0 0.26 1 1 0.61 1.00 0.39 0
基本原理和方法
统计编码 预测编码 变换编码 混合编码 分析合成编码
常用数据压缩方法的基本原理
●
香农-范诺与霍夫曼编码
熵是信息量的度量方法 1. 某个事件的信息量用表示 ,
其中
为第个I个事件的概率。 2. 信源S的熵的定义
常用数据压缩方法的基本原理
●
基本原理和方法
统计编码 根据消息出现概率的分布特性而进行的压缩 编码。 Huffman编码 行程编码 词典编码 算术编码
●时间冗余
序列图像(如电视图像和运动图像)和语音数据的前 后有着很强的相关性,经常包含着冗余。在播出该序 列图像时,时间发生了推移,但若干幅画面的同一部 位没有变化,变化的只是其中某些地方,这就形成了 时间冗余。
数据冗余的类型与压缩方法分类
●统ห้องสมุดไป่ตู้冗余
基本原理和方法
空间冗余和时间冗余是把图像信号看作概率信号时反应 出的统计特性,因此,这两种冗余也被称为统计冗余。 ●信息熵冗余
数据压缩技术的性能指标
硬软件系统
基本原理和方法
有些压缩解压工作可用软件实现。设计系统时必须充分考
虑: 算法复杂 - 压缩解压过程长 算法简单 - 压缩效果差 目前有些特殊硬件可用于加速压缩 / 解压。 硬件系统速度 快,但各种选择在初始设计时已确定,一般不能更改。因此在 设计硬接线压缩/解压系统时必须先将算法标准化。
数据压缩技术的性能指标
基本原理和方法
图像质量
压缩方法: 无损压缩
有损压缩
有损压缩:失真情况很难量化,只
能对测试的图像进行估计。
数据压缩技术的性能指标
压缩解压速度
基本原理和方法
在许多应用中,压缩和解压可能不同时用,在 不同的位置不同的系统中。所以,压缩、解压速度 分别估计。 静态图像中,压缩速度没有解压速度严格;动 态图像中,压缩、解压速度都有要求,因为需实时 地从摄像机或其他设备中抓取动态视频。
信息熵实际情况又称编码冗余。信息熵是指一组数所 携带的信息量。
●结构冗余
数字化图像中的物体表面纹理等结构往往存在着冗余
数据冗余的类型与压缩方法分类
●知识冗余
基本原理和方法
由图像的记录方式与人对图像的知识差异所产生的冗 余称为知识冗余。 ●视觉冗余 人类的视觉系统对于图像场的注意在非均匀和非线性 的,视觉系统并不是对图像的任何变化都能感知。 ●听觉冗余 人耳对不同频率的声音的敏感性是不同的,并不能察觉 所有频率的变化,对某些频率不必特别关注,因此存在 听觉冗余。
360B
480KB
数据冗余的类型与压缩方法分类
基本原理和方法
数据冗余的类别
空间冗余 时间冗余 统计冗余 信息熵冗余 结构冗余 知识冗余 视觉冗余 听觉冗余
数据冗余的类型与压缩方法分类
●空间冗余
基本原理和方法
规则物体和规则背景的表面物理特性都具有相关性, 数字化后表现为数据冗余。
统计编码
基本原理和方法
Huffman编码 它是统计独立信源能达到最小平均码长 的编码方法。编码效率高。
统计编码
基本原理和方法
Huffman编码
编码步骤: (1) 初始化,根据符号概率的大小按由大到 小顺序对符号进行排序。 (2) 把概率最小的两个符号组成一个节点。 (3) 重复步骤2。 (4) 从根节点开始到相应于每个符号的“树 叶”,从上到下标上“0”(上枝)或者“1”(下枝), 至于哪个为“1”哪个为“0”则无关紧要,最后的 结果仅仅是分配的代码不同,而代码的平均长度 是相同的。 (5) 从根节点开始顺着树枝到每个叶子分别 写出每个符号的代码,
数据冗余的类型与压缩方法分类
数据压缩技术分类
●
基本原理和方法
无损压缩
指使压缩后的数据进行重构(或者叫做还原,解压缩), 重构后的数据与原来的数据完全相同;无损压缩用于要 求重构的信号与原始信号完全一致的场合。 典型的算法有: Huffman编码,算术编码,行程编码等。 特点:压缩比较低,为2:1---5:1, 一般用来压缩文本,数据。
数据压缩技术的性能指标
基本原理和方法
压缩的必要性
音频、视频的数据量很大,如果不进行 处理,计算机系统几乎无法对它进行存取和交 换。例如:
一幅中等分辨率(640×480)的真彩色图像(24b/像素) ,它的数据量约为0.9MB/帧,若要达到每秒25帧的全动 态显示要求,每秒所需的数据量约为22MB。对于声音也 是如此,CD音质的声音每秒将有约为172KB的数据量。
数据压缩技术的性能指标
从哪些方面评价一个压缩系统?
●
基本原理和方法
压缩比
图像质量
●
●压缩解压速度 ● 硬件和软件
数据压缩技术的性能指标
压缩比
输入数据和输出数据比 例如:图像 512×480, 24位
基本原理和方法
输入=(512×480×24)/8=737280B
输出15000B 压缩比=737280/15000=49
冗余的基本概念
基本原理和方法
指信息存在的各种性质的多余度 举例: (1)广播员读文稿时每分钟约读180字,一个汉字占两个 字节;文本数据量为360B; (2)如果对语音录音,由于人说话的音频范围为20Hz到 4kHz,即语音的带宽为4kHz,若设量化位数为8bit,则一秒钟 的数据量为: 4×2×8=64kbit/s= 8KB/s 则一分钟的数据是480KB。
数据冗余的类型与压缩方法分类
●
基本原理和方法
有损压缩 是指使用压缩后的数据进行重构,重构后的数据与 原来的数据有所不同,但不影响人对原始资料表达 的信息造成误解。 典型的算法有: 混合编码的JPEG标准,MPEG标准等。 特点:压缩比高,为几十到几百倍 一般用于图像,声音,视频压缩。
常用数据压缩方法的基本原理
数据压缩技术的性能指标
基本原理和方法
视频、图像、声音有很大的压缩潜力 信息论认为:若信源编码的熵大于 信源的实际熵,该信源中一定存在冗余 度(信息熵冗余)。 原始信源的数据存在着很多冗余度: 空间冗余、时间冗余、视觉冗余、听觉 冗余、统计冗余、结构冗余、知识冗余、 信息熵冗余等。
数据冗余的类型与压缩方法分类
Huffman编码过程
a1 0.20 a2 0.19 a3 0.18 a4 0.17 1 0 1 0 0.35 1 1 0 0 0.11 0 0.26 1 1 0.61 1.00 0.39 0