视频压缩技术

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

图 6-2 霍夫曼(Huffman)编码
第6章视频压缩技术
2. 算术编码霍夫曼编码的每个代码都要使用一个整数位，如果一个符号只需要用2.5位就能表示，但在霍夫曼编码中却必须用3个符号来表示，因此它的效率较低。与其相比，算术编码并不是为每个符号产生一个单独的
代码，而是使整条信息共用一个代码，增加到信息上
记录各像素的值。矢量量化方法就是针对这种冗余图
像的压缩方法。
第6章视频压缩技术
7. 纹理的统计冗余有些图像纹理尽管不严格服从某一分布规律，但
是在统计的意义上服从该规律，利用这种性质也可以
减少表示图像的数据量，称为纹理的统计冗余。电视图像信号数据存在的信息冗余为视频压缩编码
提供了可能。
细量化，也就是采用非均匀量化(或称非线性量化)。
第6章视频压缩技术
非均匀量化有两种方分，编、解码仍采用均匀量化，在均匀量化编码器之前，对输入信号进行压
缩，这样等效于对大信号进行粗量化，小信号进行细
量化；在均匀量化解码器之后，再进行扩张，以恢复原信号。另一种方法是直接采用非均匀量化器，输入信号大时进行粗量化(量化间距大) ，输入信号小时细量化(量化间距小)。也有采用若干个量化间距不等的均匀量化器，当输入信号超过某一电平时进入粗间距均匀量化器，低于某一电平时进入细间距量化器，称为准瞬时压扩方式。
号的码率为nfs(比特／s)。 PCM编码既可以对彩色全电视信号直接进行，也可以对亮度信号和两个色差信号
分别进行，前者称为全信号编码，后者称为分量编码。
第6章视频压缩技术
PCM信号经解码和插入滤波恢复为模拟信号，如图6-1(b)所示，解码是编码的逆过程，插入滤波是把解码后的信号插补为平滑、连续的模拟信号。这两个步骤合称为数模变换（D／A变换）或PCM解码。
误差刚好处于可觉察门限之下，这样能实现较高的数据压缩率而主观评价不变。
第6章视频压缩技术
6. 图像区域的相同性冗余在图像中的两个或多个区域所对应的所有像素值
相同或相近，从而产生的数据重复性存储，这就是图
像区域的相似性冗余。在这种情况下，记录了一个区域中各像素的颜色值，与其相同或相近的区域就不再
的每个新符号都递增地修改输出代码。
第6章视频压缩技术
假设信源由4个符号S1、 S2、 S3和S4组成，其概
率模型如表6-1所示。把各符号出现的概率表示在如图 6-3所示的单位概率区间之中，区间的宽度代表概率值的大小，各符号所对应的子区间的边界值，实际上是从左到右各符号的累积概率。在算术编码中通常采用二进制的小数来表示概率，每个符号所对应的概率区间都是半开区间，如S1对应［0， 0.001)， S2对应［0.001， 0.011)。算术编码所产生的码字实际上是一个二进制小数值的指针，该指针指向所编的符号所对应的概率区间。
(2) 将两处最小概率的符号相加合成为一个新概率，再按出现概率的大小排序。 (3) 重复步骤(2)，直至最终只剩两个概率。 (4) 编码从最后一步出发逐步向前进行，概率大的符号赋予“0”码，另一个概率赋予“1”码，直至到达最初的概率排列为止。
第6章视频压缩技术
输入电平 L1 L2 L3 L4 L5 L6
第6章视频压缩技术
根据这个特点，可以采用边缘检测自适应技术，对于图像的平缓区或正交变换后代表图像低频成分的系数细量化，对图像轮廓附近或正交变换后代表图像高频成分的系数粗量化；当由于景物的快速运动而使帧间预测编码码率高于正常值时进行粗量化，反之则进行
细量化。在量化中，尽量使每种情况下所产生的幅度
数字视频信号是将模拟视频信号经过取样、量化和编码后形成的。模拟电视有PAL、 NTSC等制式，必然会形成不同制式的数字视频信号，不便于国际数字视频信号的互通。 1982年10月, 国际无线电咨询委员会(CCIR， Consultative Committee for International Radio)通过了第一个关于演播室彩色电视信号数字编码的建议， 1993年变更为ITU-R(国际电联无线电通信部
第6章视频压缩技术
6.1.2 视频信号的数字化和压缩模拟电视信号(包括视频和音频)通过取样、量化
后编码为二进制数字信号的过程称为模数变换(A／D
变换)或脉冲编码调制(PCM， Pulse Coding Modulation)，所得到的信号也称为PCM信号，其过程可用图6-1(a)
表示。若取样频率等于fs、用n比特量化，则PCM信
第6章视频压缩技术
第6章视频压缩技术
6.1 视频压缩的基本原理 6.2 静止图像压缩 6.3 活动图像编码 6.4 音频压缩的原理和标准思考题和习题
第6章视频压缩技术
6.1 视频压缩的基本原理
6.1.1 视频信号压缩的可能性视频数据中存在着大量的冗余，即图像的各像素数据之间存在极强的相关性。利用这些相关性，一部分像素的数据可以由另一部分像素的数据推导出来，结果视频数据量能极大地压缩，有利于传输和存储。
色度信号的取样率是亮度信号取样率的一半，常
称作4∶2∶2格式，可以理解为每一行里的Y、 U、 V 的样点数之比为4∶2∶2。
第6章视频压缩技术
6.1.4 熵编码熵编码(Entropy Coding)是一类无损编码，因编码后的平均码长接近信源的熵而得名。熵编码多用可变字长编码(VLC， Variable Length Coding)实现。其基本原理是对信源中出现概率大的符号赋以短码，对出现
结构可由先验知识得到，此类冗余称为知识冗余。
第6章视频压缩技术
5. 视觉冗余人眼具有视觉非均匀特性，对视觉不敏感的信息可以适当地舍弃。在记录原始的图像数据时，通常假定视觉系统是线性的和均匀的，对视觉敏感和不敏感的部分同等对待，从而产生了比理想编码(即把视觉敏
感和不敏感的部分区分开来编码)更多的数据，这就是
第6章视频压缩技术
模拟电视信号
取样
量化
编码
PCM信号
PCM信号
解码
插入滤波
模拟电视信号
取样脉冲 (a) (b)
图 6-1 电视信号的数字化和复原 (a) A/D变换； (b) D/A变换
第6章视频压缩技术
1. 奈奎斯特取样定理
理想取样时，只要取样频率大于或等于模拟信号中最高频率的两倍，就可以不失真地恢复模拟信号，称为奈奎斯特取样定理。模拟信号中最高频率的两倍称为折叠频率。 2. 亚奈奎斯特取样按取样定理，若取样频率fs小于模拟信号最高频率 fmax的2倍会产生混叠失真，但若巧妙地选择取样频率，
令取样后频谱中的混叠分量落在色度分量和亮度分量
之间，就可用梳状滤波器去掉混叠成分。
第6章视频压缩技术
3. 均匀量化和非均匀量化
在输入信号的动态范围内，量化间隔幅度都相等的量化称为均匀量化或线性量化。对于量化间距固定的均匀量化，信噪比随输入信号幅度的增加而增加，在强信号时固然可把噪波淹没掉，在弱信号时，噪波的干扰就十分显著。为改善弱信号时的信噪比，量化间距应随输入信号幅度而变化，大信号时进行粗量化，小信号时进行
视频数据主要存在以下形式的冗余。
第6章视频压缩技术
1. 空间冗余视频图像在水平方向相邻像素之间、垂直方向相
邻像素之间的变化一般都很小，存在着极强的空间相
关性。特别是同一景物各点的灰度和颜色之间往往存在着空间连贯性，从而产生了空间冗余，常称为帧内
相关性。
第6章视频压缩技术
2. 时间冗余
第6章视频压缩技术
另外，人眼视觉对图像的空间、时间分解力的要求与对幅度分解力的要求也具有交换性，对图像的幅度误差存在一个随图像内容而变的可觉察门限，低于门限的幅度误差不被察觉，在图像的空间边缘(轮廓)或时间边缘(景物突变瞬间)附近，可觉察门限比远离边缘处增大3～4倍，这就是视觉掩盖效应。
概率小的符号赋以长码，从而在统计上获得较短的平
均码长。所编的码应是即时可译码，某一个码不会是另一个码的前缀，各个码之间无需附加信息便可自然
分开。
第6章视频压缩技术
1. 霍夫曼(Huffman)编码
霍夫曼（Huffman）编码是一种可变长编码, 编码方法如图6-2所示。
(1) 将输入信号符号以出现概率由大至小为序排成一列。
量化过程则在解码端完成。
第6章视频压缩技术
对量化区间标号(量化值)的编码一般采用等长编码
方法。当量化分层总数为K时，经过量化压缩后的二进制数码率为lbK比特／量值。在一些要求较高的场合，可采用可变字长编码如哈夫曼编码或算术编码来进一步提高编码效率。
第6章视频压缩技术
6.1.3 ITU-R BT.601分量数字系统
第6章视频压缩技术
通常用Q表示量化，用Q-1表示反量化。量化过程相当于由输入值找到它所在的区间号，反量化过程相当于由量化区间号得到对应的量化电平值。量化区间总数远远少于输入值的总数，所以量化能实现数据压缩。很明显，反量化后并不能保证得到原来的值，因此量化过程是一个不可逆过程，用量化的方法来进行压缩编码是一种非信息保持型编码。通常这两个过程均可用查表方法实现，量化过程在编码端完成，而反
第6章视频压缩技术
这几个参数对525行、 60场／秒和625行50场／秒的制式都是相同的。有效取样点是指只有行、场扫描正程的样点有效，逆程的样点不在PCM编码的范围内。因为在数字化的视频信号中，不再需要行、场同步信号和消隐信号，只要有行、场(帧)的起始位置即可。例如，对于PAL制，传输所有的样点数据，大约需要 200 Mb／s的传输速率，传输有效样点只需要160 Mb ／s左右的速率。
视觉冗余。人眼对图像细节、幅度变化和图像的运动并非同时具有最高的分辨能力。
第6章视频压缩技术
人眼视觉对图像的空间分解力和时间分解力的要求具
有交换性，当对一方要求较高时，对另一方的要求就较低。根据这个特点，可以采用运动检测自适应技术，对静止图像或慢运动图像降低其时间轴抽样频率，例如每两帧传送一帧；对快速运动图像降低其空间抽样频率。
在相邻场或相邻帧的对应像素之间，亮度和色度信息存在着极强的相关性。当前帧图像往往具有与前、后两帧图像相同的背景和移动物体，只不过移动物体所在的空间位置略有不同，对大多数像素来说，亮度和色度信息是基本相同的，称为帧间相关性或时间相关性。
第6章视频压缩技术
3. 结构冗余
在有些图像的纹理区，图像的像素值存在着明显的分布模式。如方格状的地板图案等。已知分布模式，可以通过某一过程生成图像，称为结构冗余。 4. 知识冗余有些图像与某些知识有相当大的相关性。如人脸的图像有固定的结构，嘴的上方有鼻子，鼻子的上方有眼睛，鼻子位于脸部图像的中线上。这类规律性的
分， International Telecommunications Union-Radio
communications Sector)BT.601分量数字系统建议。
第6章视频压缩技术
BT.601建议采用了对亮度信号和两个色差信号分
别编码的分量编码方式，对不同制式的信号采用相同的取样频率13.5 MHz，与任何制式的彩色副载波频率无关，对亮度信号Y的取样频率为13.5 MHz。由于色度信号的带宽远比亮度信号的带宽窄，对色度信号U 和V的取样频率为6.75 MHz。每个数字有效行分别有 720个亮度取样点和360×2个色差信号取样点。对每个分量的取样点都是均匀量化，对每个取样进行8比特精度的PCM编码。
概率 0 .4 0 .3 0 .1 0 .1 “0” 0 .0 6 “1” 0 .0 4
0 .4 0 .3 0 .1 0 .1 “0” 0 .1 “1”
0 .4 0 .3 “0” 0 .2 “1” 0 .1
0 .4 “0” 0 .3 “1” 0 .3
0 .6 “0” 0 .4 “1”
编码 1 00 0 11 0 10 0 0 10 10 0 10 11