计算机图形学毕业论文视频流中反向预测MPEG帧的新方法

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

分类号：学校代号：11845

UDC：密级：学号：2110704305

广东工业大学论文

（工学）

一种在视频流中反向预测M P E G帧的新方法

A N e w M e t h o d f o r R e v e r s e P r e d i c t i o n o f M P E G

f r a m e s i n Vi d e o St r e a m i n g

张海峰

指导教师姓名、职称：----教授

企业导师姓名、职称：无

专业或领域名称：控制理论与控制工程

学生所属学院：自动化学院

论文答辩日期：2013年5月

一种在视频流中反向预测MPEG帧的新方法A New Method for Reverse Prediction of MPEG frames in Video Streaming

摘要——最近基于向后播放的MPEG视频流的技术的宏模块正在被讨论，讨论其网络带宽和缓冲要求更小。在这个理论中，基于它们的运动特性，宏模块被分为两种类别，后向宏模块（BMB）和前向宏模块（FBMB）。在这篇论文中，我们提出一种新的方法，它要求网络带宽需求更少而不增加其缓冲区的负担。我们通过当前解码帧预测需求的I或P-帧，其中当前的解码帧属于在服务器的缓冲区中。当前帧的运动矢量信息被用来寻找之前帧的各种像素的位置和当前帧的预测误差被用来寻找它们的精确值。我们在许多视频上做各种慢速的，多媒体的，和高速运动特性的仿真。实验结果显示，在之前的I或P-帧的像素值的百分之93.4%能够被反向预测从当前的P-帧中。在网络带宽需求中服务器要求要求保存更少的像素。

关键字：逆向播放后向播放视频流逆向转动

1.介绍

视频对于传播是一个有效的媒体。由于电脑和通信技术的出现，视频应用已经对研究者产生兴趣。在最近一些年中，几个视频编码标准已经被提出由一些国际标准组织如ITU-T和ISO。几个网站像Veoh，Rajshri，YouTube和Google Video 提供各种视频服务和那些服务被进一步增强。通过文献[14]的研究，YouTube网站的流每天大约有4千万个视频流和200TB的数据。数字视频由许多大型的信息组成。为了减少它们的规模，各种各样的视频压缩技术已经发展。MPEG就是一种广泛接受的视频压缩标准。视频要求技术是一种刚出现的应用，既当使用者无论何时何地需要时视频被交付。视频被发送时既可通过文件下载也可通过视频流系统。在视频传送通过视频流系统时，视频被分割为更小的部分，当一个部分接收时，交付和显示给一个客服。这项技术是非常有用的，因为使用者他/她在在观看视频时可以不用完全下载它。在这项技术里，所有的视频流的各部分必须及时的传送个使用者。一帧的任何一个部分如果在显示之前不能接收，将会影响其视频的连续性。在视频要求的VCR函数性的结合性中对于研究者来说是一个挑战。因为有效的编码和VCR函数性是不能共处的。例如，随机接入的促进作用要求编码的顺序上更I-帧，它导致比特需求数量增加。逆向播放在执行起来是一个挑战性的任务。运用在MPEG编码方案的预测技术使MPEG视频的逆向播放更加复杂。如果这个视频通过视频流系统发送这个问题将会变得更加复杂。一个简单的IP帧序列的前向和逆向的处理过程如图.1所示。

图.1 前向和后向播放

前向播放的过程是非常简单的，它很容易的从I1预测P2，P3预测P2,P4预测P3, P5预测P4.但是逆向播放不是一样，因为P9不能从P10里预测。最简单的途径就是先下载完所有的图片组（GOP）在服务器上，然后播放它们以相反的顺序。这种方式要求在客服端有大的缓

存区来存储GOP。如果GOP大小变得更大，问题将变得更加复杂。另外一种方法就是传输和解码所有GOP的帧，使其达到当前帧的播放速度。这种途径要求大的带宽，依靠当前帧和I-帧的距离。我们的目标是逆向播放MPEG视频以最小的缓冲区和最小的网络带宽。

论文的余下部分由五个部分组成。第二部分讲叙现有的成果与MPEG-2视频逆向播放的关系。在第三部分中，我们提出一个新的像素，它基于MPEG-2视频逆向播放的技术。第四部分中，我们讨论仿真和详细的结果，讨论所获得的更进一步的结果。第五部分中，我们提出结论，讨论研究的更进一步的范围。

II 现有的工作

在现有的论文中，对于这种MPEG视频的逆向播放已有一些重要的技术讨论过。在文献[6]中，逆向播放的自动译码算子已经讨论过，这种算子创造了一个新的MPEG数据流，从现有的数据流中，当编码时，视频帧逆序显示。在这个算子中，P帧是第一个转换成I-帧的，通过使用逆向动态补偿算子。对于B-帧，前向和逆向的动态向量域一起被交换的。文献[7]中提出了另外一种算子，其工作方式以相同的方式。在这个算子中，原来的IBP序列正被转换为IB序列通过将P帧转换为I帧。合成的IB序列被逆向播放通过利用其B-帧的对应序列。在文献8中，这个问题通过尝试估计逆向运动向量从已给出的前向运动向量和它的运动补偿误差。这篇论文就是讨论各种方法来计算逆向运动向量。他们的性能通过使用估计的逆向运动向量的剩余结果的能量来测量。Wee和Vasudv在文献[9]中描叙了三种不同的逆向自动译码方案。第一种方法是基本线方法，其中视频流的整个GOP是被编码的，储存在帧缓冲区内，在颠倒次序后被重新排序，然后重新编码。这种途径要求大的帧缓冲区来存储整个GOP和在编码相位运动估计时是集中处理的。第二种方法是利用B-帧的对称特性.I和P 帧是在基本方法中以同样的方式对待，对于B帧前向和后向运动向量需要交换。第三种方法减少计算机的需求，通过估计逆向运动向量在文献[8]中。对于MPEG视频的逆向播放的二重比特流方法已经在文献[10]中讨论。这种服务主持前向和后向的比特流。在两种比特流中，I帧的位置是交错的。这种技术是有效的，要求存储的视频加倍。

最近，文献[11]已经提出了一种基于宏模块算子，他能提供支持MPEG视频的逆向播放，在一个网络上，对网络带宽和解码复杂性以最小的复杂性。它使用当前的显示帧，它属于帧缓冲区里，来预测前面的帧。他把宏模块划分到被请求的帧里面，例如前面帧划分到逆向宏模块和前向/逆向宏模块（FBMB）基于当前帧的他们相应的宏模块的运动向。以零运动向量的宏模块（例如没有运动）是被划分为BMB何其他的非零运动向量（例如展现一些运动）是被划分为FBMB。FBMB进一步被划分两个区域后向区域(BR)和前向区域(FR).在当前帧的运动补偿宏模块和被请求帧的相应的宏模块的重叠区域是落后区域，其余的区域是前向区域。在图.2中可以显示。原始比特流的压缩领域的数据处理被运到服务器上。对于BMB和FBMB-BR，其处理过程在VLC领域被处理，对于FBMB-FR，数据处理是在量化DCT范围里完成。

在文献十一中讨论的方法是对于MPEG视频流逆向播放的最新研究结果。在文献[6]-[10]中讨论的方法中，能够把它划分为基于其他方法的结构，当这种方法在文献[11]中被讨论时，能够把它列入其他种类的宏模块中。我们处理一种逆向播放的问题在微观领域例如在像素水平上。我们提出一种新的基于方法的像素。