数据压缩第1章 绪论

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

右的冗余数据寻找出来并压缩掉, 这样就可以节省出
2 MB

图1-1 空间冗余
1. 空间冗余
空间冗余是在图像数据中经常存在的一种冗余。 在任何一幅图像中, 均有许多灰度或颜色都相同的邻 近像素组成的局部区域, 它们形成了一个性质相同的 集合块, 即它们之间具有空间(或空域)上的强相关 性, 在图像中就表现为空间冗余。 例如, 图1-1 一张俯视图, 图中央的黑色是一块表面均匀的积木块, 在图中, 黑色区域所有点的光强和色彩以及饱和度都 是相同的, 因而黑色区域的数据表达有很大的冗余。
表1-1列出了支持语音、 图像、 视频等多媒体 信号高质量存储和传输所必需的未压缩速率以及信 号特性。
表1-1 各种信号的特性和未压缩速率
显然, 对于多媒体处理系统所要求的语音与音频、 图像、 视频、 文本、 数据的结合, 信号进行有效的 存储和传输之前, 必须进行处理, 而最关键的处理方 法是进行数据压缩。 多媒体信息压缩技术的对象主要 是视频、 音频和文本信息这三大类。 例如, 现代数 字压缩技术可以对多数图像实现大于100∶1的压缩比, 而质量没有重大损失。
k 1
H Pi IbPi
i0
(1-2)
式中, Pi为任意一个数i的概率, k为数据类数或 码元的个数。 设单位数据量d为
k 1
d Pib( yi )
i0
(1-3)
图1-3 结构冗余示意图
5. 知识冗余 人们通过认识世界而得到某些图像所具有的先验 知识和背景知识, 由此带来的冗余称为知识冗余。 例 如, 人脸的图像有固定的结构, 嘴的上方有鼻子, 鼻子的上方有眼睛, 鼻子位于正脸图像的中线上等等。 这类规律的结构可由先验知识和背景知识得到, 因此 这类信息对一般人来说是冗余信息。
所谓信息熵, 是指数据所带的信息量。 信息量
是指从N个相等可能事件中选出一个事件所需要的信息 度量或含量, 即在N个事件中辨识一个特定事件的过 程中需要提问“是”或“否”的最少次数。 将信源所
有可能事件的信息量进行平均, 就得到信息的“熵”
(Entropy
熵就是平均信息量。 通常, 信息熵
的数学表达式为
⑷ 矢量量化编码:多段式,分离式,全搜索式 ⑸ 子带编码:分频带法,块切割法 ⑹ 模型编码(参数编码):结构编码,基于知识 的编码,分析/识别合成编码,分形(Fractal) 编码 ⑺ 混合编码:JPEG编码,MPEG编码,P×64编码
标准简称
1.4 数据压缩的标准和应用
标准化组织
标准主要用途
标准通过时间
⑴ 信息熵编码:Huffman编码,行程编码, 算术编码, LZW编码
⑵ 预测编码:差分线性预测DPCM,自适应线性预测 ADPCM,
运动补偿帧间线性预测;非线性预测
⑶ 变换编码:最优正交变换(KLT),离散傅立叶变 换(DFT) 离散余弦变换(DCT), WHT变换, wavelet变换
1.3 数据压缩技术的分类
只是小车向前行驶了一段路程。 此时, F1和F2是时 间相关的, 后一幅图像F2在参照图像F1的基础上只需 很少数据量即可表示出来, 从而减少了存储空间, 实 现了数据压缩。 这种压缩对运动图像往往能得到很高 的压缩比, 这也称为时间压缩或帧间压缩。
P
F1
P
F2
T
图1-2 时间冗余
3. 信息熵冗余(编码冗余)
第1章 绪论
1.1 数据压缩的必要性 1.2 数据压缩的可行性 1.3 数据压缩技术的分类 1.4 数据压缩的标准和应用
1.1 数据压缩的必要性
例1. 以一般彩色电视信号为例, 设代表光 强、 色彩和色饱和度的YIQ空间中各分量的带 宽分别为4 MHz、 1.3 MHz和0.5 MHz。 根据 采样定理, 仅当采样频率大于或等于2倍的原 始信号的频率时, 才能保证采样后的信号可被 保真地恢复为原始信号。
对空间冗余的压缩方法就是把这种集合块当作一 个整体, 用极少的数据量来表示它, 从而节省了存 储空间。 这种压缩方法叫空间压缩或帧内压缩, 它 的基本点就在于减少邻近像素之间的空间(或空域) 相关性。
2. 时间冗余
时间冗余是活动图像和语音数据中经常包含的冗 余。 活动图像中的两幅相邻的图像有较大的相关性, 这反映为时间冗余。 同理, 在语音中, 由于人在说 话时其发出的音频是一个连续和渐变的过程, 而不是 一个完全的时间上独立的过程, 因而存在着时间冗余。 图1-2 F1帧中有一辆汽车和一个路标P, 在经过时 间T后的图像F2仍包含以上两个物体,
1.2 数据压缩的可行性
数据中通常包含很大的冗余, 数据的大小与所携 带的信息量的关系由下式给出:
I=D-r
(1-1)
其中, I、 D、 r分别为信息量、 数据量与冗余量。
以存储一本200万字的中文百科全书为例, 每个汉字
以2字节计算, 该书的数据量为4 MB。 我们只要使用
后面介绍的Huffman算法, 就可简单地将大约2 MB左
1.1 数据压缩的必要性
例2. 我们再来看看语音信号的数据量, 人在正常说 话时的音频一般在200 Hz~3.4 kHz, 即人类语音的 带宽为3.4 kHz。 同样依据采样定理, 并设数字化 精度为8 bit, 则每秒的数据量为
3.4 kHz×2×8=54.4 kbit 在上述采样条件下讲一分钟话的数据量约为400 kbit。
ISO/IEC 13813
MPEG-4
ISO/IEC
甚低速率视频业务
99年12月
ISO/IEC 14496
习题与思考题
1.如何理解信号的时域、空域和频域的相互关联? 2.以数字电视信号为例说明压缩的必要性和可行性。 3.多媒体数据存在哪些类型的冗余? 去掉这些冗余的方
法所对应的技术有哪些?
7. 其他冗余 多媒体数据除了具有上面所说的各种冗余外, 还存 在一些其他的冗余类型。 例如, 图像的空间非定常特性 所带来的冗余等。
空间冗余和时间冗余是将图像信号看作为随机信号 时所反映出的统计特征, 因此有时把这两种冗余称为统 计冗余。 它们也是多媒体图像数据处理中两种最主要的 数据冗余。
1.3 数据压缩技术的分类
标准编号
H.261
ITU-T
电视电话、会议电视
90年12月 ITU-T Rec. H.261
JPEG MPEG-1
ISO/IEC
静止图像(灰度和彩 色)
ISO/IEC
数字ISO/IEC 10918 ISO/IEC 11172
MPEG-2
ISO/IEC
常规电视和HDTV
93年11月
1.1 数据压缩的必要性
再设各样点均被数字化为8 bit, 从而1秒钟的 电视信号的数据量为
(4+1.3+0.5)× 2 × 8 bit = 92.8 Mbit 因而一张640 MB容量的CD[CD*2]ROM能够 存放的原始电视数据(每字节附有2位校验位)为
640×8/[92.8×(1+0.25)]=44 s 也就是说, 一张普通光盘只能存放44 s的原始数 据。
6. 视觉冗余 在多媒体技术的应用领域中, 人的眼睛是图像信息 的接收端。 而人类的视觉系统并不能对图像画面的任何 变化都能感觉到, 视觉系统对于图像场的注意是非均匀 和非线性的, 即注意主要部分质量, 同时取画面的整体 效果, 不拘泥每一个细节。
例如, 人的视觉对于图像边缘的急剧变化不敏感, 对图像的亮度信息敏感, 对颜色的分辨率较弱等。 因此, 如果图像经压缩或量化发生的变化(或称引入了噪声)不 能被视觉所感觉, 则认为图像质量是完好的或是够好的, 即图像压缩并恢复后仍有满意的主观图像质量。
相关文档
最新文档