几种视频压缩技术概述
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
几种视频压缩技术概述
(返回)
(一)、JPEG——静止图像压缩标准
1、 JPEG
国际标准化组织(ID)和国际电报电话咨询委员会(CCITT)联合成立的专家组织JPEG (Joint Photographic experts group经过五年艰苦细致地工作后,于是1991年3月提出了ISO CDIO918号建议草案:多灰度静止图像的数字压缩编码(简称JPEG标准)。这是一个适用于彩色和单多多灰度或连续色调静止数字图像的压缩标准。它包括基于DPCM(差分脉冲编码调制)、DCT(离散余弦变换)和Huffman编码的有损压缩算法两个部分。前者不会产生失真,但压缩比很小;后一种算法进行图像压缩住处虽有损失但压缩比可以很大,压缩20倍左右时,人眼基本上看不出失真。JPEG标准有三个范畴:A、基本顺序过程Baseline sequential processes实现有损图像压缩。重建图像质量达到人眼难以实现图像质量达到人眼难以观察出损失的要求。采用8*8像素自适应DCT算法、量化及H uffman型的熵编码器。
B、基于DCT的扩展过程(Extended DCT Based Process)使用累进行工作方式,采用自适应算术的编码过程。
C、无失真过程(Lossless Process)采用预测编码及Huffman(或算术编码),可保证重建图像数据与原始图像数据完全相同。
基中的基本顺序过程是JPEG最基本的压缩过程:符合JPEG标准的硬软件编码/解码器都必须支持和实现这个过程。另两个过程是可选扩展,对一些特定的应用项目有很大实用价值。
(1)、JPEG算法
基本JPEG算法操作可分成以下三个步骤:通过离散余弦变换(DCT)去除数据冗余;使用量化表对DCT系数进行量化,量化表是根据人类礼堂系统和压缩图像类型的特点进行优化的量化系数矩阵;对量化后的DCT系数时行编码使其熵达到最小,熵编码采用Huffman可变字长编码
(2)、离散余弦变换
JPEG采用8*8子块的二维离散余弦变换算法。在编者按码器的输入端,把原始图像(对彩色图像是每个颜色成分)顺序地分割成一系列8*8的子块,在8*8图像块中,像素什
一般变化较平缓,因此具有较低的空间频率。实施三维8*8离散余弦变换可以将图像块的能量集中在极少数儿个系数上,其它系数的值与这些系数相比,绝对值要小得多。与Fourier 变换类似,对于高度相关的图像数据进行这样变换的效果使能量高度集中,便于后续的压缩处理。
(3)、量化
为了达到压缩数据的目的,对DCT系数需作量化处理,量化的作用是在保持一定质量前提下,丢弃图像中对视觉效果影响不大的信息。量化是多对一映射,是造成DCT编码信息损失的根源。JPEG标准中采用线性均匀量化器,量化过程为对岸64个DCT系数除以量化步长并四舍五入取整,量化步长由量化表决定。量化表元素因DCT系数位旰和彩色分量的不同而取不同值。量化表为8*8矩阵,与DCT变化系数——对应。量化表一般由用户规定,JPEG标准中给出了参考值,并作为编码器的一个输入。量化表中元素为1到达255之间的任意整数,其值规定了其所对应DCT系数的量化步长。
(4)、游程编码
64个变换数经量化后,左上角系数是直流分量(DC系数),即空间域中64个图像采样值的均值。相邻8*8块之间的DC系数一般有很强的相关性,JPEG标准对DC系数采用DPCM 编码(差分编码)方法,即对相邻像素块之间的L系数的差值进行编码。其
余63个交流分量(AC系数)使用游程编码,从左上角开始沿对角线方向,以Z字形(Z Ig-Zag)进行扫描直至结束。
量化后的AC系数通常会有许多零值,以Z字形路径进行游程编码有效地增加了连续出现的零值个数。
2、PEG/MJPEG在DVR系统中应用
极少数DVR厂商采用JPEG压缩技术,大多采用MJPEG(Motion JPED)压缩技术,它主要特点是基本不考虑视频流中不同帧之间的变化,只单独对某一帧进行压缩。目前的基于该技术的视频卡也主要是完成数字视频捕获(Capture)功能,在后台由CPU或专门的JPEG芯片完成压缩工作。
JPEG/MJPEG压缩技术可以获取清晰度很高的视频图像、而且可以灵活设置每路视频清晰度、压缩帧数,但付出的代价是在保证每路都高清晰度的情况下,受处理速度限制,无法完成实压缩,有很强的丢帧现象,同时由于没有考虑到帧间变化,造成大量冗余信息被重复存储,因此单帧视频的占用窨较大,目前流行的MJPEG技术最好的也只能做到3K/
帧,通常要8˜20K!简单计算可以发现即使是丢帧录像,也将耗费大量的硬盘空间,尤其在保安监控领域,由于监控摄像机较多(16路通常),同时进行高清晰度录像,保证一个月的录像存储量是十分惊人的,甚至远远超过条用MPEG1实的录像技术产品,想念使用过该技术产品的用户对此有深刻印象。
(二)、MPEG——运动图像压缩标准
1、 MPEG
MPEG是Movyig pictures experts group(运动图像专家组)的英文缩写,这个专家组始建于1988年,专门负责为CD建立视频和音频标准,其成员均为视频、音频及系统领域的技术专家。MPEG是ISO/IEC/JTC/SC2/WG11的一个小组。它的工作兼顾了JPEG标准和CCITT专家组的H261标准,于1990年形成了一个标准草案。
MPEG标准分成两个阶段:第一阶段(MPEG—1)是针对传输速度为1MP/s到1.5Mb的普通电视质量的视频信号的压缩;第二个阶段(MPEG-2)目标则是对每秒30帧的720*576分辨率的视频信号进行压缩,在扩展模式下,MPEG-2可以对分辨率达成1440*1152高清晰度电视(HDTV)的信号进行压缩。总体来说,MPEG在三方面优于其他压缩/解压缩方案。首先,在一开始它就是作为一个国际化的标准来研究制定,所以MPEG具有很好的兼容性;其次,MPEG能够比其他算法提供更好的压缩比,最高可达200:1;更重要的是,MPEG在提供高压缩比的同时,对数据的损失很小。
MPEG-1制定于1992年,为工业级标准的设计,可适合于不同带宽的设备,如CD-ROM、Video-CD、CD-I。它可针对SIF标准分辨(对于NTSC制为325*240;对于PAL制为325*288)的图像进行压缩,传输速率为1.5Mbits/sec,每秒播放30(25)帧,具有CD(指激光唱盘)音质,图像质量级别基本与VHS相当。MPEG 的编码速率最高可达4-5Mbits/sec,但随着速率的提高,其解码后的图像质量有所降低。MPEG-1也被用于数字电话网络上的视频传输,如非对称数字用户线路(ADSL),视频点播(VOD),以及教育网络等。同时,MPEG-1也可被用做记录媒体或是在INTERNET上传输音频。
MPEG-2制定于1994年,设计目标是高级工业标准的图像质量以及更高的传输率。MPEG-2所能提供的传输率在3-10Mbits/sec间,其在NTSC制式下的分辨率可达720*480,MPEG-2也可以提供广播级的视像和CD级的音质。MPEG-2R 的音频编可提供左右中及两个环绕声道,以及一个加重低音声道,和多达个伴音声道。由于MPEG-2在设计时的巧妙处理,使得大多数MPEG-2解码器也播放MPEG-1格式的数据,如VCD。同时,由于MPEG-2的出色性能表现,已能适用于HDTV,使得原打算为HDTV设计的MPEG-3,还没出世就被抛弃了。