图像视频处理技术论文
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一章绪论
1.1 引言
最近的几十年里,通信技术的发展日新月异,技术更新也非常快速。图像和视频处理技术作为信号处理技术发展的产物,已经越来越引起国际社会的关注。一个产业的发展离不开标准化,正是基于此国际学术会议以及相关组织所提出的标准化建议或协议就相当重要了。近些年,一系列国际图像和视频压缩编码标准的制定和更新,使得编码压缩技术技术和相关产业日趋成熟,极大的促进了图像视频信号处理技术在社会生活中的应用。尤其是在最近几年,第三代移动通信技术正在蓬勃发展,它将无线通信与国际互联网等各种多媒体通信结合,是当今社会极具发展潜力和价值的新一代移动通信系统。面对巨大的移动终端市场,进行视频压缩也更有利于通信交互,这将会极大地促进通信技术的推广和发展。因此,科技的更新和用户的要求对各种信号的处理技术有了更高的标准。为了适应各种现代通信和信息传输网络的技术要求,除了继续使用与传统的信号处理技术相同的技术外,在此基础上,还应该提出一个新的信号处理技术,算法,模型,以满足应用的需求。
2003年,ITU和ISO联合制定出H.264/AVC,该标准也是至今最新、最先进的的视频压缩编码标准。H.264/AVC以先前制定的视频编码标准为基础,集合了其中的一些已经得到足够发展技术也很成熟的算法,同时吸收了视频编码和图像处理领域里的一些为提高编码性能所提出的最新最有效地研究成果。H.264极大地提高了编码效率,在增强网络适应性方面也有很大的飞跃,它的最终目标是适应人们对基于网络应用的视频多媒体信号的个性要求。
联合视频小组(joint video team,JVT)所提出的新视频编码标准——H.264,与以往标准相比在编码效率方面具有显著的优势;但为了提高压缩效率,它所带来的的高计算复杂度是实际应用领域所承受不了的。在H.264的参考软件JM中,运动估计和模式决策占了大部分的时间。所以,研究简单快速的算法对提高H.264/AVC在实时领域中的应用有着极其重大的意义。
对H.264的一些主要算法进行改进,需要完成的主要工作集中在不对编码质量造成过大影响的前提下减少其编码时间提高编码效率,因此,大部分的研究工作都是为了寻求更合适更快速的算法。
1.2 视频编码标准发展历程介绍
从1984年CCITT研究组发布的第一个视频领域编码标准H.120开始,迄今为止已相继提出了众多国际标准。视频编码标准发展至今也有近三十年的历史,这段历史的一个转折点就是1988年CCITT所提出的H.261建议,从这个转折点开始,国际标准组织ITU-T、ISO 等开始公布了一系列的以H.261为基础的视频编码标准,从此视频编码标准的编码方法统一采用了基于波形的混合编码方法。
一些国际标准组织有联合图像专家组(JPEG,Joint Photographic Experts Group),它是于1986年由ISO和CCITT 联合成立的。此外还有活动图像专家组(MPEG,Moving Picture Expert Group),它于1988年由ISO/IEC信息技术联合委员会组成;并分别在1991 年和1994年公布了MPEG-1 视频编码标准以及MPEG-2 视频编码标准。
新一代视频编码标准H.264 于2003年3月由ITU-T 和ISO/IEC 正式提出,该标准实现了良好的压缩效率,同时对网络具备了良好的亲和性和兼容性,对实时系统的应用及其有帮助。不久的将来,国际视频组织即将推出HIVC,即H.265,可想而知的是该标准的发布将会带来新一轮的研究热潮,对视频的发展和应用也会产生巨大的影响。
1.2.1 视频编码原理
图像(image)的定义是自然景物中物体反射的可见光的强度,也可以是其它的各类电磁波反射后的强度反映。在图像信息处理的过程中用数字来描述图像中的像素点、强度和颜色等信息。在显示的时候,它是通过数字化的方式将呈现对象用一定的分辨率加以分辨后对得到的色彩信息进行呈现,如此可以快速显示在屏幕上[1]。在显示的过程中分辨率和灰度是主要影响参数。图像适用于表现那些含有大量细节(如亮度变化、场景变换、轮廓明显、色彩丰富)的对象,如:影片、绘画等。图像软件可以对复杂图像进行处理,从而得到质量更高的图像,比如提高清晰度或者产生符合个性要求的特殊效果。
运动视频数据本质上就是时间顺序的图片序列,而相机通常每秒产生约24,25,或30帧。这就导致需要处理大量的数据,因此需要使用到压缩技术。例如:假设每个图片都有一个相对较低的QCIF,即176*144样本,每个样本用8个比特表示,我们每三个图片跳过两个以削减比特率。对于彩色图片,三色组成样本对于为每个像素表现足够的色彩空间是必要的。即使是传输这种相对低的高保真的图片序列,原始数据源速率仍然超过6Mbit/s。然而,今天低成本的传输通道经常工作在低得多的数据率,从而视频信号的数据率需要进一步压缩。例如,使用V.34调制解调器在拨号模拟电话线上传输率最多为33.4 Kbit/s,我们仍然需要进一步压缩视频码率至200倍左右(如果音频同一通道耗时6 Kbit/s或电话线实现太吵以至于不能实现V.34的全比特率,压缩率将会更高)。
视频中的每幅图像被称为一帧(flame),当连续的图像以每秒超过24帧画面以上的速度进行变化时,根据视觉暂留原理可知,人眼是无法辨别单幅的静态画面的;看上去则近似于平滑连续的视觉效果,这样在人眼中形成的连续的画面叫做视频。视频其实就是在时间轴上的一组图像序列的组合,通常也被称为视频图像、视频序列等。视频技术最早是为了电视系统而发展,但现在已经扩展成了多种广泛应用的格式,这样极大地方便了消费者将视频记录下来。
从自然世界所获取的视频场景属于模拟视频信号,通常可以表示为时间与空间上的连续函数[1]。计算机内部是以数字形式来描述信息的,为了更方便地用计算机对最终得到的视频进行一些基本操作,如:处理,传输、存储和加工等;需要对需要处理的模拟信号进行时间空间域的转换,即是讲视频进行数字化处理,最终将模拟视频转换为数字视频。为把模拟视频它转换成数字视频,需要对坐标和幅度分别进行采样操作。数字化坐标值称为采样,包括空间采样和时间采样;而幅度值的数字化则称为量化过程。
最终得到的数字视频信号包含了大量的数据信息,需要对其进行一定的压缩编码才能在实时通信系统中得到实际的应用,也即满足对网络带宽的要求进行实时传输。
数据作为信息的载体,但是数据和信息是两个不同的概念,终归不能完全等价。要想对数字视频进行压缩,就要了解数字视频的特点。数字视频的一个独特特点就是其具有相关性。如果能够利用这些相关性,对数字视频里的各种信息冗余进行去除便能实现对视频信号的压缩。一般将数字视频信号中的冗余归为下面几类[2]:
A:空间冗余。数字图像是视频的基本元素,数字图像的得到要通过对模拟视频信号进行空间采样。这些构成图像的相近像素之间是紧密相关的,即他们之间的像素值一般是没有太大的相差的。当需要预测当前像素的数值时,可以通过分析其相邻像素的数值进而通过一