视频格式之间的相互转换
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
视频格式之间的相互转换
从20世纪初发明的黑白电视到50时年代出现的彩色电视,以及从模拟时代跨入到数字时代,从标清电视过渡到高清电视,伴随着信息高速公路以及国际互联网的飞速发展,广播电视在不同时期不同领域出现了多种格式。这其中有早期彩色电视领域的PAL制,NTSC制,SCREAM制;近期数字电视领域内的DVB欧洲、ATSC美国、日本的ISDB;以及根据数字电视图像清晰度不同而出现的SDTV和HDTV,这些格式多样化的存在为电视台的系统搭建提出了一个新课题,那就是如何结决电视信号格式间的转换。
尽管电视信号有多种格式,各种格式有不尽相同,但归结起来相异之处主要在这三个方面:隔行或逐行不同,帧频或场频不同,显示宽高比不同。在数字化普及之前,这些不同制式与格式相互变换所涉及到的时域压缩和扩张实现起来十分困难,但数字领域这些模拟领域棘手的问题已迎刃而解。所以对模拟电视信号进行格式转换,若先进行数字化,在数字域进行将会方便很多。
一信号的数字化
对于模拟分量电视信号,应按ITU-R BT.601 标准进行数字化,取样结构为4:2:2,亮度信号Y抽样频率选为525/60和625/50三大制式行频的公倍数2.25MHz的6倍即13.5MHz。接口标准为 SMPTE259M串行数字接口SDI格式(D1格式),输出码率为270MHz(4:3)或360MHz(16:9)。对于模拟复合电视信号,从抽样所形成的样点结构图考虑,抽样频率取彩色副载波的4倍更为合适,量化后输出码率为142MHz(8BIT PAL 制)和114MHz(8BIT NTSC制)。对于高清信号,数字化后变换成HDSDI信号,传输率为1.5GMHz(SMPTE292M)。
电视信号经过数字化,从时域的电视图像变换成一个三维的时空取样点结构。对于电视信号,无论是场频的变换,行频的变换,还是隔行扫描与逐行扫描的转换,宽高比的转换等,均可看成三维取样结构的转换。这些取样结构的转换主要借助于数字信号的内插来实现。下面先简单介绍数字内插算法。
二制式转换的基本原理
在保持原视频基带信号频谱时,为提高数字信号的取样频率,可对原数字信号进行内插。针对不同的目的,信号内插可分为行内插与场内插,行内插主要针对于不同行频格式之间的变化,场内插主要针对于不同场频格式之间变化。
1 行内插
所谓行内插是指在原数字取样点之间插入新的取样值,它可以是相邻两值的平均值,也可以是零值,也可以用多项式内插方法得到。由于内插必然会引起垂直分辨率的变化,不管是增加还是减少,本来连续的两条扫描行之间多出一行或少掉一行,都会引起原图像的不连续,出现锯齿失真,如果采用非运动内插的简单重复或简单删减某些行数据的方法,这种数据将会很明显。如下图:
通常所说的行内插都是指运动行内插,即行内插的数据不是靠简单重复某些
行内插可分为场内行内插和场间行内插。用同一场的相邻行通过内插系数的运算得到内插行图像数据的方法就是场内行内插。参与一次内插运算的相邻行可以是2行、4行,只要硬件运算量足够大,相邻行可以更多(这里有个性价比的关系)。场内行内插利用了同场相邻行的相关性,对于运动图像的内插效果要比静止图像的内插效果要好。
如果将前一场的图像数据存储起来,留待下一场作行内插时用场间相邻两行依据内插系数得到内插行的图像数据,这就是场间行内插。它认为场间相邻两行数据的相关性大于同一场内相邻两行的相关性。这种行内插方式使得行内插数据在很大程度上由前一场对应行决定,因此对于静止图像的内插效果要比运动图像的内插效果要好。
为了判别出何种情况用场内行内插或场间行内插,只须对图像进行运动检测,根据待处理图像的运动情况,即图像帧差信号(如亮度Y信号幅值的差别)的大小选择使用场内行内插或场间行内插,这就是自适应场内和场间的行内插方法。根据图像运动检测电路的判断,待处理图像相对于前一场而言是静止图像还是运动图像,运动图像采用带数字滤波器的场内行内插,静止图像采用场间行内插。数字滤波器的作用在于滤除图像的高频成分,避免高频分量在行内插后产生失真。这样可以同时减少两者做内插处理所带来的清晰度劣化。
2 场内插
对于场频的变换,例如从PAL到NTSC;不仅要实现525行到625行的变换,还要实现场频从50Hz到60Hz的变换,如果简单的采用每6场舍弃1场,针对静止图像还可以,但对于运动图像,必然会造成图像信息的丢失,会出现运动图像的不连续性和跳跃型。因此,如何通过采用各种不同的运动场内插方法,尽可能减少内插处理后对图像连续性的影响,就成为一个相当重要的课题。
相邻两场参与内插运算的的场内插不仅不能完全消除运动图像的不连续性,而且还会产生不连续动作的爬行现象,但这种不连续动作的幅度显然比简单重复某些场数据时的运动不连续性幅度要小。
为了进一步减小这种不连续性,可以采用运动估算和运动补偿技术对场内插数据进行校正,运动估算通过检测运动图象在时域的变化幅度来计算图像的运动,精确的算出图像中运动单元的运动方向和速度,决定内插数据和运动补偿时的时间─空间方向;在实际中,由于运动检测得到的移动矢量值有时并不能真正反映相邻两场内图像运动变化后的实际矢量数据,毕竟它只是一个估值,为了减少这种由于估值所带来的图像内插失真,可采用运动补偿技术在运动估算的基础上进一步减少图像失真。见图:
两种不同格式的电视信号相互转换,首先要进行数字化,由于格式不同其数字化时的抽样频率也不尽相同,利用两者抽样频率求出最小公倍频率,作为内插的抽样频率,可以顺利实现两种不同格式之间的相互转换。例如两种不同格式的电视信号的抽样率为:F1=3f? F2=4f,最小公倍频率为12f,先以3f抽样率对F1进行抽样,然或通过内插变换形成总数为12f的抽样频率,再进行3选1的抽选取样,就可把 F1格式转换
为F2格式。这里的抽选是指根据要求对取样频率进行N选一的选取,取样频率为f/N,f为最小公倍频率。按奈奎斯特抽样定律,为使抽选后的信号不产生混迭失真,必须在抽选之前经过一个数字滤波器,限制视频信号的最高频率。抽选与内插相结合可转换不同格式。
三下面讨论几种具体的格式转换。
1. 去隔行技术
去隔行技术实际上就是把隔行扫描转换成逐行扫描,去隔行时可以先对隔行信号的每一场进行2倍的行内插,原奇数行内插偶数行,原偶数行内插奇数行。内插可采用行复制,行平均或非线性内插。简单的行复制,就是将奇偶场合并实现,即该场需要内插行的地方由前一场相同位置的行信号复制而来,对于静止图像这种方法效果较好,但对于运动图像会产生锯齿边缘失真。行平均算法,是指在该场需要内插行的地方由本场相邻上下位置的行信号复制而来,运算限制在本场内,这种算法虽会减少简单行复制所引起的锯齿边缘失真,却要付出图像细节模糊的代价,往往利用改进的自适应空间场间插入法,减少细节模糊。
为了使去隔行技术在静止与运动图像时都能达到较好的效果,可以采用场间自适应内插方法,在静止图像时采用场间复制,在运动图像时采用场内复制,并用运动检测函数来控制切换点,对于快速运动物体时,须采用运动估算与运动补偿相结合的方法求出内插像素点的运动轨迹,运动轨迹的精度是决定内插效果的关键因素。
2. 变频技术
在对电视信号的帧频或场频进行相互变换时,涉及到变频技术。
我们以常见的50Hz场频向60Hz场频转换为例,结合场内插技术简单描述变换过程。见下图
变换前的视频信号,水平像素,垂直像素都没有增加,也无法增加,有可能视频信号带宽有所增加倍,却是由于存储器高速读出所至,对图像清