多媒体通信复习指南_2014

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

多媒体通信复习指南2014版

1.多媒体通信概述

(1)举例论述对“Multimedia =Variety + Integration + Interaction”的理解。

要点:Variety:多种媒体(声、像、图、文…)

Integration: 将多种不同类型媒体集成为一体

Interactivity: 用户与系统之间交互、通信

比如:数字电视这种多媒体系统,将电视节目、电影、文字信息等多种信息(Variety),通过MPEG-2流的方式整合(Integration),利用DVB网络与用户交互(Interaction)。

(2)分析多媒体通信中的“Synchronization”和“Network offerings”特征。

Network offerings:网络承载

Synchronization:同步

承载层起到承上启下的作用,对它的基本要求是:按照业务层的要求把每个业务信息流从源端引导到目的端;按照每种业务的属性要求调度网络资源确保业务的功能和性能;实现多媒体业务对通信形态的特殊要求;它将适应各种类型数据流的非固定速率特性,并提供统计复用功能;通过在承载层组建不同的承载VPN,可以为不同类型和性质的通信提供其所需要的QoS 保证和网络安全保证。

多媒体信息本身具有一定的时效性,因此在通信过程中, 终端显示的多媒体信息必须问步、且能与其它媒体同步, 这也是多媒体通信的一个重要特点。

2.多媒体数据压缩国际标准

(3)爱迪生的留声机、磁带录音机、CD-DA、MP3对声音进行记录和存储的方式有何区别,试分析音频存储技术变化的趋势。

1、爱迪生的留声机用机械刻纹的方式记录,以音槽形式存储模拟声音信号。磁带录音机,利用磁记录原理直接记录和存储模拟声音信号。CD-DA(Compact Disc-Digital Audio)采用数字方式记录声音信息,通过对模拟声音信号进行采样、量化、编码,将声音信息以0、1数字信号的形式通过激光刻录存储在光盘上。MP3(Moving Picture Experts Group Audio Layer III)除了对模拟音频信号做AD转换外,根据声音信号的时间冗余和人耳的听觉特点还对转换后的数字音频信号进行压缩、编码,从而既降低了存储成本,又保证了声音质量。

2、以数字技术主导的现代信息技术中,对声音的记录和存储方式由模拟到数字方式转变推动了音频信息技术的发展。随着多媒体技术和互联网技术的普及,人们对声音的记录、存储、传输变得频繁。高质量、小体积是音频存储技术的发展目标。实现的技术从单纯的对音频数据去除本身的冗余,到重视人们的听觉特点和体验,音频数据的压缩方式变得更加综合。

(4)JPEG压缩标准中为何选择DCT变换?MP3压缩中为何选择MDCT变换?

因为JPEG压缩对象为静止图像,而图像是空间信号,采用2D-DCT变换能够很好地去除空间信号的相关性,从而去除图像的空间冗余;其次DCT变换具有快速算法来实现,借此可以得到较高的算法效率;MP3压缩对象为音频信号,即一维时间信号。在MP3压缩算法中,由于心理声学模型的引入,当一段语音信号的连续两帧波动差别较大时,波动较小的帧将被当做噪声,而对之选用较大的量化步长,进而造成严重失真。MDCT变换通过对相邻两帧的语音信号进行加窗,然后做DCT变换,起到了平滑作用,可以很好地解决这个问题。

(5)JPEG系列的各图像压缩标准(JPEG、JPEG-LS、JPEG2000、JPEG XR)实现压缩的技术手段中各自体现了哪些思想?

JPEG:1、色彩空间由RGB转换到YUV,通过选取不同的缩减采样方式可以对图像做不同压缩程度的压缩,该方法利用了人眼对亮度差异的敏感度高于色彩变化的视觉特点。2、通过对图像作DCT变换,该方法去除了图像的空间冗余。3、通过对DCT变换系数做有区别的量化,

降低了数据量又保证了图像的视觉效果,该方法利用了人眼对高频亮度变动的分辨较弱的特点。4、Z字形扫描DCT系数,采用熵编码方式对图像编码,该方法结合了DCT系数在空间上的分布特点。

JPEG-LS:利用图像在空间上的相关性,采用了适应预测、上下文建模和Colomb编码的方法来压缩冗余。

JPEG2000:基于小波变换、标量量化、上下文建模、算术编码以及后压缩率配置;不会产生基于DCT变换的JPEG标准产生的块状模糊问题。

JPEG XR:使用可逆的色彩空间变换、可逆的重叠双正交变换,非算数熵编码机制,从而可以高效地保存高频率的图像数据,在高压缩率的情况下保持很好的图像质量。

(6)采用滤波的方法能否滤出量化噪声?为什么?

不能。因为量化噪声实际上是量化误差,并不是真正的噪声;量化处理将输入归总到与其相近的输出级别,该过程必然带来信息的丢失,从而产生量化误差(量化噪声),而且该过程不可逆,采用滤波方法是无法滤出量化噪声的。

(7)采用分块方式的变换编码存在哪些缺点?说明在MP3中如何克服该问题。

分块方式的变换编码会存在块效应现象,在MP3中使用MDCT代替DCT,MDCT连续帧之间使用“时域交叠取样”技术,可以很好地消除不同帧由于量化差异造成的块效应现象。(8)K-L变换为何被称为最佳变换?为何它在数据压缩领域没有得到广泛应用?

K-L变换是建立在统计特性基础上的一种变换,实质上是作坐标系的转换,尽量让向量落在最少的坐标轴上或其范围,从而只用较少的变换系数就可以恢复出质量不错的图像,压缩效率比较高,均方误差小。K-L变换是均方误差意义下的最优变换。但是一旦图像变化后,就要重新找到一个变换的坐标系才能使其投影最稀疏,即变换核矩阵要重新计算,计算过程比较复杂,所以在数据压缩领域没有得到广泛应用。

(9)采用Wavelet、Ridgelet、Curvelet、Contourlets等不同变换有何差异?

Wavelet即小波变换,对于一维信号中的点奇异特征具有优良的表示能力;

Ridgelet即脊波变换,能够更有效地表征信号内具有方向性的奇异特征;

Curvelet是对脊波变换的改进,能够较好地表现曲线的奇异特征;

Contourlet即轮廓波变换,也可以较好地表现曲线的奇异特征,其方法与Curvelet不同。(10)什么是压缩感知?其要素有哪些?

压缩感知通过开发信号的稀疏特性,在远小于Nyquist 采样率的条件下,用随机采样获取信号的离散样本,然后通过非线性重建算法完美的重建信号。

信号的稀疏性是压缩感知理论的一个重要前提,并且直接影响着信号感知的效率。

压缩感知的关键是观测矩阵的构造。

非线性优化是CS重建信号的手段,也是从低分辨观测中恢复出高分辨信号所必须付出的软件代价。

(11)定性讨论采用DCT变换的时候,对变换前的样本做量化和对变换后的系数做量化所产生的结果有何差异。

DCT将原始样本转换成代表不同频率分量的系数集,对系数量化后的数据直流分量相对于交流分量来说要大,而且交流分量中含有大量的0。这样便于对量化后的数据进行简化,从而提高压缩比。而DCT变换前对样本的量化并不能减少频率成分,不能达到较高的压缩比。量化会带来原始数据的部分丢失,精度下降。在DCT变换之前对样本做量化,会将两个量化级内的数据变换成相同的,之后将该样本数据变换到频域后就会影响数据频域特性,造成误差累积到频域中,进一步降低数据精度。

(12)相比于MPEG2,H.264引入了哪些措施提高压缩比?

①运动补偿(减少时间冗余):1⁄4像素精度的运动估计、7种大小不同的块匹配、前向与后向多个参考帧。

②帧内预测(减少空间冗余):9种4×4亮度块、4种16×16亮度块和4种色度块的预测

相关文档
最新文档