视频信号基本原理
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
视音频技术基本原理及会议电视终端简介深圳迪威视讯技术有限公司
视频信号的组成
●三基色原理:任何颜色均由红(R)、绿(G)、兰(B)
三种颜色分量组成;
●在电视原理里,用亮度(Y)、蓝色差(U)、红色差
(V)三个分量表示。两种方法相互之间的转换:
●Y=0.3R+0.59G+0.11B
●U=B–Y
●V=R–Y
●R=Y+V
●G=Y–0.19U–0.51V
●B=Y+U
电视扫描与同步●隔行扫描与逐行扫描
●场与帧
●PAL制式的扫描特性
625行/帧,25帧/秒
宽高比4∶3
隔行扫描
数字视频处理的色度空间
亮度色度空间采样
ITU-R601建议(4:2:2)
●每行采样亮度信号样点数为864,取样频率13.5MHz,正程有效样点数为720。
●每行采样每个色差信号样点数为432,取样频率13.5MHz,有效样点数为360。
共220量化级,黑电平对应于量化级16,峰值白电平对应于量化级235
在量化等级中间部,共分224级,零电平相应于128级
数字分量视频接口(SDI)被ITU-R合并为Rec.656。在传输上以8比特样值为单位,以CB、Y、CR、Y、CB….顺序将视频数据传输出去,有行起始标志(SAV)和行结束标志(EAV)。整个数字有效行包括720个亮度数据和720个色度数据(CB、CR各360个)。
时基校正
●视频切换
●视频源时间不稳,如录像机信号。
●模拟图像扭曲,翻滚。
●采样时钟与行同步锁定,行同步不稳导致采用时钟不稳,另外场同步不稳会影响PTS等时间戳。
●数字图像抖动、跳帧。
音频信号特性
在安静地环境下,当声音弱到人的耳朵刚刚可以听见时,我们称此时的声音强度为“静听阈”,实验表明,静听阈是随频率变化的,而且各人的听觉阈值也不同。一个人是否能听到声音取决于声音的频率,以及声音的幅度是否高于这种频率下的听觉阈值。可以看出,人耳对2KHz~5KHz的声音比较敏感,很小的声音都可听见,但对于频率较低或较高的声音,声强要较大才能听见。
声音频阈掩蔽效应
20
40
6080
20100100010000声强(dB )
频率(Hz )
同听阈
声音的时域掩蔽
除了同时发出的声音之间有掩蔽现象之外,在时间上相邻的声音之间也有掩蔽现象,我们称为时域掩蔽。时域掩蔽又分为超前掩蔽(pre-masking)和滞后掩蔽(post-masking)。产生时域掩蔽的主要原因是人的大脑处理信息需要花费一定的时间,也就是说,一个强音发生时,除了提高同一时刻的听觉阈值外,还会提高强音发生前和发生后一段时期的听觉阈值。一般来说,超前掩蔽很短,只有大约5~20 ms,而滞后掩蔽可以持续50~200 ms。
声音的压缩编码
由于人耳对声音的感知存在这些掩蔽效应,我们可以利用人耳心理模型对声音进行分析,将被掩蔽的信号去除,或用少量比特进行量化,只要保证量化噪声低于听觉阈值,则人耳听不出还原后的声音与原始声音的差别。子带编码技术就是利用这种掩蔽效应来实现的。
MPEG1音频编码多相滤波器组量化/编码成帧器
心理声学模型
PCM 音频信号音频编码信号
回声抑制
回声抑制
●xk为近端的声音
●rk为回声
●Sout = xk + rk –r’k
●如果r’k与rk相近,则
●Sout = xk
会议电视终端
FOCUS3100:专线高清会议电视终端FOCUS2200:IP高清会议电视终端
FOCUS3600:专线/IP一体化高清会议电视终端FOCUS2100:窄带IP会议电视终端