【大学课件】图像压缩编码标准

合集下载

图像压缩编码原理ppt-课件

× DCT
在图像的运动处理中主要有两个过程。
对于函数Ψ(x)∈L2(R)，当且仅当其傅立叶变换Φ(ω)满足条件
DCT 第一个过程为运动估计(Motion Estimation，ME)。视觉阈值是指干扰或失真刚好可以被察觉的门限值，低于它就察觉不出来，高于它才看得出来，这是一个统计值。
8 的
把图像分成若干子块，设子块图像是由N×N个像素组成的像块，并假设一个像块内的所有像素作一致的平移运动。图像数据的压缩机理来自两个方面：一是利用图像中存在大量冗余度可供压缩；
p(xi ) 1，
则符号xi所携带的信息量定义为i1
I(xi)=log2(1/p(xi))
2．信息“熵”
如果将信源所有可能时间的信息量进行平均，就得到了信源中每个符号的平均信息量，又称为信息的熵，可表示为
N
N
H (X )p (x i)lo 2 ( 1 /g p (x i) )p (x i)lo 2p (x g i)
f(x,y)2F(u,v)2
x0y0
u0v0
2 ．能量集中性 ( Energy
Compaction)
大部分正交变换趋向将图像的大部分能量集中到相对少数几个系数上，由于整个能量守恒，因此这意味着许多变换系数只含有很少的能量。
3．去相关性(Decorrelation)
当输入的像素高度相关时，变换系数趋向于不相关。
图像压缩编码原理
3.1 压缩编码基础 3.2 预测编码 3.3 正交变换编码 3.4 统计编码 3.5 子带编码 3.6 小波变换编码
3.1 压缩编码基础
图像数据的压缩机理来自两个方面：一是利用图像中存在大量冗余度可供压缩；二是利用人眼的视觉特性。

图像压缩编码ppt课件

11
7.1.3、图像压缩编码分类 (Coding methods of Image Compression
数字图像压缩编码分类方法有很多，但从不同的角度，可以有不同的划分。从信息论角度分，可以将图像的压缩编码方法分为无失真压缩编码和有限失真编码。
无失真图像压缩编码利用图像信源概率分布的不均匀性，通过变长编码来减少信源数据冗余，使编码后的图像数据接近其信息熵而不产生失真，因而也通常被称为熵编码。
图7.3 时间冗余
8
7.1.2、图像数据冗余 (Image data redundancy)
3. 信息熵冗余
信息熵冗余是针对数据的信息量而言的。设某种编码的平均码长为
k 1
L p(si )l(si ) i0
式中，l(si )为分配给第符号 si 的比特数，p(si为) 符号出现的概率。
这种压缩的目的就是要使L接近 H X
随着人们认识的深入，某些图像所具有的先验知识，如人脸图像的固有结构（包括眼、耳、鼻、口等）为人们所熟悉。这些由先验知识得到的规律结构就是知识冗余。
6. 视觉冗余
由于人眼的视觉特性所限，人眼不能完全感觉到图像画面的所有细小的变化。例如人眼的视觉对图像边缘的剧烈变化不敏感，而对图像的亮度信息非常敏感，因此经过图像压缩后，虽然丢了一些信息，但从人眼的视觉上并未感到其中的变化，而仍认为图像具有良好的质量。
有限失真编码则是根据人眼视觉特性，在允许图像产生一定失真的情况下（尽管这种失真常常不为人眼所觉察），利用图像信源在空间和时间上具有较大的相关性这一特点，通过某一种信号变换来消除信源的相关性、减少信号方差，达到压缩编码的目的。
12
7.1.4、压缩技术的性能指标(Evaluation Index of Image Compression approaches)

课件：第14章图像编码与压缩

Huffman编码示意图
• 左图所示为建立码的过程
• 右图所示为从根开始，经各中间节点到叶节点的路径采用二进制编码的情况
3．Huffman编码的性能
• 优点：
– 实现Huffman编码的基础是统计源数据集中各信号的概率分布。
– Huffman编码在无失真的编码方法中效率优于其他编码方法，是一种最佳变长码，其平均码长接近于熵值。
• 图像的尺寸为w·h。
典型图像的数据量
图像种类
图像参数
二值传真图像灰度图像
A4（210 297 mm）大小、1728 2376 2色分辨率
512512，8 bit灰度等级
VGA图像 CIF视频图像 HDTV亮度信号
640 480 256色
352 288 256色，亮度取样率为3 MHz，亮度和两色差按4∶1∶1取样，亮色量化位数共12 bit，帧频 29.97，按1 s计算
• 编码效率
n H (x) R(x)
压缩比
• 定义为压缩前图像每像素码长的平均值与
压缩后每像素码长的平均值之比
MN
rb(i, j)
Cr
i 1 M
j 1 N
rc(i,
j)
rb rc
i1 j1
客观评价SNR
• SNR（信噪比）指压缩前的图像信号方差与
解压缩后重建信号误差方差的比值
S
NR
1
0lo
g
2 x 2 e
图像质量的主观评价等级
评分 5 4
3
2
评价优秀良好
中等
差
说明图像质量非常好图像质量高,有很小的干扰但不影响观看图像质量可接受,但有一些干扰,对观看稍有妨碍

图像压缩编码数字图像处理PPT课件

2
好的
3 可通过的
是可供观赏的高质量的图像，干扰并不令人讨厌图像质量可以接受，干扰不讨厌
4 边缘的图像质量较低，希望能加以改善，干扰有些讨厌
5 劣等的图像质量很差，尚能观看，干扰显著地令人讨厌
6 不能用图像质量非常之差，无法观看
第24页/共107页
8.信息理论
（一）、信源空间概述 1、信息：事物运动状态或存在方式的不确定性的描述； 2、信源空间：随机符号及其出现概率的空间； 3、信源的分类：（1）连续信源—离散信源—混合信源；（2）无记忆信源—有记忆信源（相关信源）—有限长度记忆信源（Markov信源）
第12页/共107页
类似还有：图像彩色光谱空间的冗余；视频图像信号在时间上的冗余；
第13页/共107页
• (3)视觉心理冗余：
一些信息在一般视觉处理中比其它信息的相对重要程
度要小，这种信息就被称为视觉心理冗余。
33K
15K
第14页/共107页
4.图像压缩的目的
图像数据压缩的目的是在满足一定图像质量条件下，用尽可能少的比特数来表示原始图像，以提高图像传输的效率和减少图像存储的容量。在信息论中称为信源编码。
出关于X中事件ai的互信息I(ai:bk)定义为：
I (ai
: bk
)
I (ai )
I (ai
|
bk )
log
p(ai | bk p(ai )
)
其中，p(ai|bk)表示信源编码输出为bk，估计信源输入为ai的条件概率。I(ai|bk)称为条件自信息量，表示在发现信源编码输出为bk，对信源输入为ai的不确定性的猜测或知道bk后ai还保留的信息量。I(ai)表示a 的不确定性。两者值差即为第b34页解/共除107的页a 不确定性

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

素*288行
ppt课件
5
视频编码图像格式一览表
ppt课件
6
图像帧
I帧 P帧 B帧 D帧
ppt课件
7
图像的传输顺序和显示顺序不同
ppt课件
8
二、H.26x建议
1、H.261建议
H.261又称为P*64，其中P为64kb/s的取值范围，是1到30的可变参数，它最初是针对在ISDN上实现电信会议应用特别是面对面的可视电话和视频会议而设计的，色度采用4:2:0采样。
欧洲、我国：720像素*576行美国、日本：720像素*480行
像素减半丢掉一场
MPEG-1 SIF：360像素*288行
ppt课件
3
宏块： 16*16像
素
SIF左右各
360不能被16整除舍4像素
SIF：360 像素
SIF有效像素区362像素*288行
ppt课件
4
SIF有效像素区362像 H.261 公用中间格式 CIF（common intermedia format）
H.264/MPEG-4 AVC是一种面向块的基于运动补偿的编解码器标准。由ITUT视频编码专家组与ISO/IEC联合工作组——即动态图像专家组（MPEG）— —联合组成的联合视频组（JVT，Joint Video Team）开发。因ITU-T H.264 标准和 ISO/IEC MPEG-4 AVC标准（正式名称是ISO/IEC 14496-10 — MPEG-4 第十部分，高级视频编码）有相同的技术内容，故被共同管理。 H.264因其是蓝光盘的一种编解码标准而著名，所有蓝光盘播放器都必须能解码H.264。它也被广泛用于网络流数据源如Vimeo、YouTube、以及 iTunes Store，网络软件如Adobe Flash Player和Microsoft Silverlight，以及各种HDTV陆基广播（ATSC，ISDB-T，DVB-T或DVB-T2），线缆（DVB-C）以及卫星（DVB-S和DVB-S2）。 H.264/AVC项目意图创建一种视频标准。与旧标准相比，它能够在更低带宽下提供优质视频（换言之，只有MPEG-2，H.263或MPEG-4第2部分的一半带宽或更少），也不增加太多设计复杂度使得无法实现或实现成本过高。另一目的是提供足够的灵活性以在各种应用、网络及系统中使用，包括高、低带宽，高、低视频分辨率，广播，DVD存储，RTP/IP网络，以及ITU-T多媒体电话系统。
图像压缩编码标准
ppt课件
1
分类：
图像压缩编码标准
静止
JPEG JPEG2000
运动
ITU制定：H.26X（H.261、 H.263 、 H.264 ） ISO、IEC制定：MPEG-x（ MPEG-1、 2、4、7）
ppt课件
2
一、图像尺寸的规定及帧类型定义
亮度：Y
720像素
色差:CB、CR 360像素
编码模式：
ppt课件
14
ppt课件
15
ppt课件
16
ppt课件
17
ppt课件
18
3、H.263+、H.263++
H.263v2（通常也叫做H.263+或者1998年版H.263）是ITU-T H.263 视频编码标准第二版的非正式名称。它保持了原先版本H.263的所有技术，但是通过增加了几个附录显著的提高了编码效率并提供了其它的一些能力，例如增强了抵抗传输信道的数据丢失的能力（Robustness）。 H.263+ 项目于1998年2月在ITU正式通过。接下来一个被称为"H.263++" 的项目被随即推出，在H.263+的基础上增加了更多的新的功能。H.263++（亦称H.263v3或 2000版H.263）于2000年底完成。
码；(5)采用事先预测和与 MPEG中的P-B帧一样的帧预测方法；(6)H.263支持5种分辨率，即除了支持H.261中所支持的 QCIF和CIF外，还支持SQCIF、 4CIF和16CIF，SQCIF相当于 QCIF一半的分辨率，而4CIF和 16CIF分别为CIF的4倍和16倍。
ppt课件
13
ppt课件
22
H.264 的主要优点包括: 1. 在相同的重建图像质量下，H.264 比H.263+和MPEG-4(SP)减小50%码率。 2. 对信道时延的适应性较强，既可工作于低时延模式以满足实时业务，如会议电视等；又可工作于无时延限制的场合，如视频存储等。 3. 提高网络适应性，采用“网络友好”的结构和语法，加强对误码和丢包的处理，提高解码器的差错恢复能力。 4. 在编/解码器中采用复杂度可分级设计，在图像质量和编码处理之间可分级，以适应不同复杂度的应用。相对于先期的视频压缩标准，H.264 引入了很多先进的技术，包括4×4 整数变换、空域内的帧内预测、1/4 象素精度的运动估计、多参考帧与多种大小块的帧间预测技术等。新技术带来了较高的压缩比，同时大大提高了算法的复杂度。
ppt课件
12
：(1)H.263的运动补偿使用半象素精度，而H.261则用全象素精度和循环滤波；(2)数据流层次结构的某些部分在
H.263中是可选的，使得编解码可以配置成更低的数据率或
更好的纠错能力；(3)H.263包含四个可协商的选项以改善性
能；(4)H.263采用无限制的运动向量以及基于语法的算术编
H.261规定图象输入格式有两种：CIF和QCIF。 1、2 CIF
当P= >=6 CIF、QCIF
ppt课件
9
结构组成：
图像层P (Picture layer)
块组层GOB
(group of block layer)
宏块层MB
(macro block layer)
块层
H.263+新增几种编码模式用于提高压缩比
增强的PB帧高级帧内编码模式块效应消除滤波器分级编码模式分片结构模式附加增强信息模式参考帧重取样
ppt课件
20
H.263++在H.263+基础上新增三种编码模式主要用于增强抗误码性能及增强编码效率
ppt课件
21
4、H.264
ppt课件
10
H.261数据结构图：
ppt课件
11
2、H.263建议
H.263是由ITU-T制定的视频会议用的低码率视频编码标准，属于视频编解码器基于之前的视频编码国际标准（H.261，MPEG-1和H.262／MPEG-2）， H.263的性能有了革命性的提高。它的第一版于1995年完成，在所有码率下都优于之前的H.261。 H.263是基于运动补偿的DPCM的混合编码，在运动补偿的DPCM混合编码，在运动搜索的基础上进行运动补偿，然后运用DCT变换和“之” 字形扫描编码，从而得到输出码流。H.263在H.261建议的基础上，将运动矢量的搜索增加为半象素点搜索；同时又增加了无限制运动矢量、基于语法的算术编码、高级预测技术和PB帧编码等四个高级选项；从而达到了进一步降低码速率和提高编码质量的目的。