视频流的分组传输技术报告
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
视频流的分组传输技术报告在传统的通信系统中,连续的媒体信息(模拟或者数字的语音和电视信号)是通过电路交换的网络传输的,数据则通过分组交换的网路传输。而在当前的通信系统中,分组交换的网络,特别是IP网,将在多媒体通信中占据主导的地位。以语音数据分组传输为基础的IP电话已经得到越来越广泛的应用,视频分组传输的应用也在不断的发展中。
1、视频分组传输中的关键技术
视频分组传输中首先遇到的问题就是视频编码率,其有两种方式,一种是变比特编码,一种是恒定比特编码。
编码器所产生的码流数据率一般是变化的,为了适应恒定速率信道的要求,在编码器和信道之间需要设置一个缓存器,并且应考虑缓冲区大小,保证不空不溢。当数据过分剧烈变化时要跳帧。这样就形成了恒定码率编码器(CBR)。同理,变速率编码器,则不需要缓冲区,当数据超出容限时,根据网络情况改变编码中参数调整压缩比,这样的优点是不用缓冲,减少延时。
VBR与CBR的编码算法除了在速度控制部分以为,都是一样的。在CBR编码中,重建图像的信噪比是随着图像活动性的变化而变化的,而在VBR中则是恒定的。从速率-失真函数的角度表示出CBR和VBR编码的不同之处在于CBR编码中,由于速率保持为固定值,失真随着图像特性的变化在一定范围内变化;而在VBR编码中,由于失真固定,速率则随着图像的活动性的变化而在一定的范围内变化。
在使用相同的编码算法和让CBR恒定速率等于VBR编码的平均速率时,CBR编码的重建图像的平均信噪比要低于VBR重建图像的信噪比,而且重建图像质量的主观评价也较差。另一方面,若当CBR和VBR 编码给出相似的重建图像质量时,VBR编码给出较低的平均码率和较少的数据总量。这些表明,VBR编码无论对于视频数据的传输,还是存储都具有优越性。此外,在分组网络中,VBR编码的码流可以获得更高的统计复用增益。在VBR编码器中省去了用于速率平滑的缓存器,从而降低了编码的延时,也就降低了端到端的传输延时,这对于实时多媒体应用是有利的。
在视频分组传输的研究中,QoS保障技术是十分重要的。QoS保障不只是涉及传输网络的问题,而且是一个端到端的问题。完整的QoS保障机制应该包括QoS规范和QoS机制两大部分。QoS规范申明应用所需要的服务质量,而如何在运行过程中达到所要求的质量则由QoS机制来完成。
QoS协商就是QoS预制机制中重要部分。在通信建立时,处理要将用户提出的QoS参数映射到系统的各个层次之外,通信路径上的各个部分之间还需要对QoS参数惊醒协商,以达到各自的资源都允许接受统一的QoS参数值。协商一般是双方的,可分为呼叫者和被呼叫者之间和服务用户和服务提供者之间的两种协议,分别被称为对等型协商和层间协商。协商方式有7种,分别为双向对等,双向层间,单向协商(接受,不接受)、混合协商、三方协商、限定目标三方协商、寻求契约值的三方协商。
图1双向对等协商
图2 三方协商
此外,如果在通信过程中,由于某种原因使QoS下降,而且通过QoS维护机制也无法将其调整到所要求的水平,则向用户发出一个指示,让用户选择是通过重新协商转到较低的服务级别等级上,还是自适应地转到系统当前的QoS上继续通信。这种在通信过程中QoS动态地变更称为QoS缩放。实现QoS缩放的方法主要有:(1)重新协商。重新协商意味着从端到端的系统的各部分都需要进行资源的再分配。当发送端提出重新协商的要求之后,发送端的资源管理器必须首先检查本地可利用的资源是否满足要求,例如用户要求图像帧率从30帧/秒降低到10帧/秒时,则必须看本地的编码器是否可以提供10帧/秒的输出,然后通过有关的资源管理协议检查网络资源的情况,并根据要求进行网络资源预留和分配。如果重新协商是由接收端提出的,接收端153IP网络视频会议的QoS技术工程硕士学位论文资源管理器检查并预留本地资源,然后通过资源管理协议通知发送者,执行上述与由发动者启动时相同的过程。最后通知接收端改变本地的资源配置。
在许多的媒体应用中,发送端需要向具有不同的QoS要求的多个用户提供同一种服务,此时,如何有效地向这些用户提供不同质量的视频码流是十分重要的问题。
首先,由于视频在一个异构的网络环境中,即某部分子网的速度高,某部分子网的速度低。发送端很可能同时向两个接入速率不同的终端传送同一节目,这种情况下,服务器必须提供多种质量的视频流才能满足用户的要求。除了网络条件不同之外,造成接收端QoS要求不同的原因还有终端处理能力和显示能力的不同,以及应用的需求不同和愿意承担的通信费用不同等。
提供多种质量的视频流的一种解决方法是对视频序列进行可伸缩性编码。可伸缩性编码有三种基本类型:时域可伸缩性,空域可伸缩性和SNR 可伸缩性。其中SNR 可伸缩性又称为质量可伸缩性,因为视频质量通常用峰值信噪比(PSNR)来衡量。这三种可伸缩性分别对应了视频的帧率、分辨率、PSNR 等几个基本参数,它们都能在基本层外提供一个或几个增强层,实现初步的可伸缩性。
其中空域可伸缩性是通过为视频中每帧图像都提供多个分辨率表示来实现。其做法是先对原始视频中的每帧图像进行下采样得到低分辨率图像,编码得到空域基本层码流;然后编码原始图像和低分辨率图像上采样恢复图像的差值信息,生成空域增强层码流。空域可伸缩性主要是应用于接收端设备显示屏幕分辨率不同的情况下。作为一个视频流服务器,其发送视频信息的目标可
能是不同种类的设备,可能是WLAN 中的一台台式机或一部能接收视频的手机。对每种设备都单独编码显然是非常浪费资源也不合理,所以由视频流服务器提供统一的具有可伸缩性的视频码流顺理成章的成为此问题的解决方案。
图3 分层编码系统
图4 空间分辨率不同的图像
图5 空间域可伸缩性编码原理方框图
视频在传输的过程中,往往会碰到同步的问题。影响多媒体同步的因素包括时延抖动、时钟偏差、数据丢失和网络条件变化等。收、发时钟之间如果存在固定的时间偏差是不会对多媒体同步造成破坏的。如果二者之间存在频率偏差,则会产生媒体播放不连续的现象。一个多媒体系统所能容忍的收发时钟频率偏差由具体应用而定。在收发时钟频率偏差不能忽略的情况下,可以设计一个合适的起始时刻偏移量和缓存器容量,以避免出现数据尚未到达或者缓存溢出的情况。同时,缓存器的存在能够减少延时抖动所造成的不良影响。
在需要收发时钟频率精确同步的时候,锁相是一种通常采用的方法,它能够消除收发时钟之间的频率偏差和频率漂移。锁相的基本过程是将发送端时钟频率与接收端本地时钟频率在相位比较器中进行相位比较,两端时钟频率的偏差将反映为相位之差;相位比较器的输出参量经环路滤波器滤除高频分量以后,控制VCO的振荡频率,使之与输入频率相等。锁相环路可以是模拟的,也可以是数字的,数字锁相环路简称为D-PLL。
在分组传输中,接收端可能获得发送时钟信息的途径有两个:(1)包的到达频率;(2)包头携带率到达缓存器,而以接收时钟速率被取出,那么缓存器的充满程度就反映了收、发时钟的频率差异。但是其他原因,如网络传输的延时抖动和包丢失等也会影响缓存器的充满程度,从而干扰锁相环的工作。比较好的获得发送时钟信息的途径是检测时间戳。基于时间戳的锁相环路如图所示:
图6 基于时间戳的时钟同步