第二章 多媒体数据压缩编码技术

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二章 多媒体数据压缩编码技术
第一节 多媒体数据压缩编码概述
一、数据压缩与多媒体压缩 二、医学数据压缩
一、数据压缩与多媒体压缩
• 数据压缩 就是以最少的数码表示信源所发的信号,以
减少容纳给定消息集合或数据采样集合的信号空 间,通过减少计算机中所存储数据或者通信传播 中数据的冗余度,达到增大数据密度,最终使数 据的存储空间减少的技术。
• 数字图像压缩的出现
二十世纪末,人类社会开始进入到数字化时 代,数字图像技术作为数字技术的重要组成部分, 将人们带入了崭新的多媒体世界。随着科学的发 展和社会的进步,人们对图像信息的需求也越来 越大。在多媒体计算机系统、电子出版、视频会 议、数字化图书馆等许多领域,数字图像都有着 广泛的应用。
• 图像的压缩与解码
图像数据一般的都存在各种信息的冗余, 如空间冗余、信息熵冗余、视觉冗余、结构冗余 等。想办法去掉各种冗余,保留真正有用的信息, 就是图像压缩。把信号进行压缩的过程常称为图 像编码,恢复原图像的过程常称为解码。
• 图像压缩领域常用的编码有:
1. 信息保持编码:主要应用于图像数字存储方 面。要求:无失真编码。
2. 保真度编码 :主要应用于数字电视技术和 静止图像通信方面。要求:在保证保真度的条 件下允许一定的失真。
3. 特征提取 :主要应用于一些图像识别和分 析技术中,要求:对需要的特征信息进行编码, 就可以压缩图像数据。
二、医学数据压缩
• 医学图像压缩得以实施的两个主要依据: 医学图像的统计特性和人类视觉特性
1. 利用图像本身固有的统计特性来减少原始医学 图像数据中的冗余信息,采用某种编码方法减小 原始图像文件的大小。
2.由于人类的视觉系统能从极为杂乱的图像中抽 象出有意义的信息,并以非常精炼的信息形式传 到大脑,而且视觉系统对图像中的不同部分的敏 感程度是不同的,可以利用人类的视觉特性去除 医学图像中对信息传输和整合影响小的部分,获 取较大的压缩比。
• 医学图像存在的冗余
1. 空间冗余: 取决于医学图像中图案粗细程 度的冗余。 2. 时间冗余: 取决于医学图像随时间变化程 度的冗余。 3. 结构冗余: 把医学图像看作是区域集时产 生的冗余。
4. 知识冗余: 与收发端所共有的知识相关 联的冗余。
5. 熵冗余: 像素灰度值出现概率不均匀 产生的冗余。
6. 视觉冗余: 由于人的视觉分辨有限性产 生的冗余。
7. 其他冗余: 由于医学图像非平稳性产生 的冗余。
• 可以把医学图像信号看成有用信息和冗余信息的结 合,其压缩通过编码器实现
ct工作站
信息提取
无损
有损 、
无损压
量化

有损
重复压缩 比特分配 否

医学图 像数据 库
第二节 数据压缩编码的基本原理
一、图像的可压缩理论 二、图像压缩性能评价 三、图像冗余度和编码效率
一、图像的可压缩理论
• 数据压缩的理论研究始于香农的信息论。1948年香 农在其经典论文《通信的数学原理》中首次提到信 息率——失真函数概念,1959年又进一步确立了失 真率理论,从而奠定了信源编码的理论基础。
• 压缩编码的理论基础是信息论。从信息论的角度看, 信息定义为“用来消除不确定性的东西”。压缩是 去掉信息中的冗余部分,也就是确定的或可推知的 部分,用一种更接近信息本质的描述来代替原有冗 余的描述。
二、图像压缩性能评价
• 在图像压缩编码中,解码图像与原始图像 可能会有差异,因此,需要评价压缩后图 像的质量。描述解码图像相对原始图像偏 离程度的测度一般称为保真度(逼真度) 准则。常用的准则可分为两大类:客观保 真度准则和主观保真度准则。
1. 客观保真度准则
• 最常用的客观保真度准则是解码图像和原始图像
之间的均方误差和均方根信噪比。f ( x, y ) 代表大
^
小为M*N的原始图像,f ( x , y ) 代表解压缩后的图
^
像,对任意x和y,f ( x, y ) 和 f ( x , y ) 之间的误
差定义为:
^
e(x,y)f(x,y)f(x,y)
• 则均方根误差
erm s M 1NM x 0 1N y 0 1[f^(x,y)f(x,y)]2

如果将
^
f (x, y)
看作原始图像
f ( x , y ) 和e(x,y)的和,那
么解压图像的均方根信噪比为:
M1N1 ^
f(x,y)2
SNRms x0 y0
M1N1 ^
[f(x,y)f(x,y)]2
x0 y0
f • 如果令 m ax m ax [f(x,y)],x 0 ,1 ...,M 1 ,y 0 ,1 ,...,N 1 ,
则可得到峰值信噪比
PSNR10lgM1N1 ^
f2 max
[f(x,y)f(x,y)]2
x0 y0
2. 主观保真度准则
尽管客观保真度准则提供了一种简单、方 便的评估信息损失的方法,但很多解压图像最 终是供人观看的。对具有相同客观保真度的不 同图像,人的视觉可能产生不同的视觉效果。 这是因为客观保真度是一种统计平均意义下的 度量准则,对于图像中的细节无法反映出来, 而人的视觉能够觉察出来。这种情况下,用主 观的方法来评价图像的质量更为合适。
三、图像冗余度和编码效率
• 根据香农信息保持编码定理,假设某无干扰信
息源的熵值为H(x),如果能找到一种编码方法,
其编码平均长度 存B在 一个下限,这个下限
是信源信息熵H(x),即最佳信息保持编码的平
均码长无限接近信源熵值。若原始图像平均码
长为 ,B则
L 1
B i pi i0
• i 为灰度级i对应的码长, p i 为灰度级i出现

的概率。图像的冗余度可定义为: r=
B
1
H (x)
• 编码效率则定义为:
H(x)
B
1 1 r
第三节 常用数据压缩编码算法
一、统计编码 二、预测编码 三、变换编码
一、统计编码
• 统计编码原理 根据信息论的观点,信元的冗余度是由于信
源本身所具有的相关性和和信源内事件概率分布 的不均匀性产生的。因此,图像的统计编码方法 就是利用信源的统计特性,去除其内在的相关性 和改变概率分布的不均匀性,从而实现图像信息 的压缩。
• 哈夫曼编码
哈夫曼编码是50年代提出的一种基于统计 的无损编码方法,哈夫曼于1952年提出了一种不 等长编码方法,这种编码的码字长度的排列与符 号的概率大小的排列是严格逆序的,理论上已经 证明其平均码字最短,因此被称为最佳码。静态 哈夫曼编码使用一棵依据字符出现的概率事先生 成好的编码树进行编码。而动态哈夫曼编码需要 在编码的过程中建立编码树。由于哈夫曼编码所 得到的平均码字长度可以接近信源的熵,故也称 为熵编码。
二、预测编码
• 预测编码(predictive coding)实际上是基于图像数 据的空间冗余特性的,用相邻的已知像素(或像素块) 来预测当前像素(或像素块)的值,然后再对预测误差 进行量化和编码,这些相邻像素或像素块可以是同行 的,也可以是前几行的,相应的预测编码分别称为一 维和二维预测。
• 预测编码的关键在于预测算法的选取,这与图像信号 的概率分布很有关系。实际中常根据大量的统计结果 来设计最佳的预测器,有时还使用自适应预测器以刻 画图像信号的局部特性,从而提高编码效率。
三、变换编码
• 变换编码((Transform coding)是通过信号 变换来消除图像数据空间相关性的一种有效 方法。尽管图像变换本身不能对数据进行压 缩,但由于变换后系数之间的相关性明显降 低,图像的大部分能量只集中在少数变换系 数上,采用适当的量化和熵编码方法就可以 有效地压缩图像的数据量。而且图像经过某 些变换后,系数的空间分布和频率分布特性 与人眼的视觉特性相符合,因此可以利用人 类视觉系统的生理和心理特点来得到较好的 编码系统。
• 变换编码将给定的图像变换到另一个数据域(如频域) 上,使得大量的信息能用较少的数据来表示,从而 达到压缩的目的。变换编码有很多,如:
①离散傅立叶变换(Discrete Fourier Transform, 简称DFT)
②离散余弦变换 (Discrete Cosine Transform, 简 称DCT)
③离散哈达玛变换(Discrete Hadamard Transfor m, 简称DHT)
④特征向量变换(Karhunen-Loeve,简称K-L)
第四节 数据压缩编码的国际标准
一、静态图像压缩编码标准——JPEG 二、运动图像压缩编码标准——MPEG
一、静态图像压缩编码标准——JPEG
(一)JPEG • JPEG(Joint Photographic Expert Grout)标
准是由IS0的联合摄影专家组制定的,1986年 成立专家组,1992年完成的标准,简称JPEG 标准,用于静止图像压缩编码标准。该标准适 用于各种分辨率和格式的连续色调图像的压缩, 可将24位单帧彩色图像,压缩到2位而仍然具 有较好的图像质量。
• JPEG主体压缩技术采用3种编码系统 :
1. 基于DCT(Discrete Cosine Transform)的有损压 缩基本编码系统,可适用于绝大多数压缩应用场合。 2. 用于高压缩、高精确度渐进重建应用的扩展编码 系统。 3. 独立的无损压缩系统,应用于失真场合。
• JPEG算法共有四种运行模式,其中一种是基 于空间预测(DPCM)的无损压缩算法,另外三 种是基于DCT的有损压缩算法。
1. 无损压缩算法,可以保证无失真的重构原始图像。
2. 基于DCT的顺序模式,按从上到下,从左到右的 顺序对图像进行编码,称为基本系统。
3. 基于DCT的渐进模式,指对一幅图像按由无损到 有损进行编码。
4. 分层模式,以各种分辨率对图像进行编码,可以 根据不同的要求,获得不同分辨率的图像。
(二)JPEG2000
与JPEG标准相比,JPEG2000有了一个很大的飞跃, 它有许多原来的标准所不可比拟的优点。JPEG2000与传 统的JPEG最大的不同,在于它放弃了JPEG所采用的以D CT变换为主的分块编码方式,而改为以小波变换为主的 多分辨率编码方式。JPEG2000标准还充分考虑了人眼视 觉特性,增加了视觉权重和掩膜,这样在不损害视觉效果 的情况下,可以大大提高压缩效率。
二、运动图像压缩编码标准——MPEG
MPEG(Moving Picture Experts Group)是活 动图像专家组的缩写,是ISO为制定数字视频和音 频压缩标准而建立的一个工作小组,其正式名称是 ISO/IEC JTCI SC29 WG11。自1988年成立以来, 该小组已经制定出了MPEG-1, MPEG-2, MPEG-4, MPEG-7等不同应用目的的标准。
谢谢
相关文档
最新文档