09级数字音视频技术期末考试答案

合集下载

相关主题

数字音频广播测试

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

声波基本要素：振幅、频率、频谱
彩色三要素：亮度、色调、饱和度
音视频输入有设备哪些？话筒、摄像机等，音视频模/数（A/D）数/模（D/A）转换的设备有哪些？非线性编辑卡、数字录像机等。

数字音视频节目存储介质：磁带、光盘、磁盘等
模拟音频信号波形的振幅反映了是什么、频率模拟音调的高低，音调高，信号的频率就高。

模拟信号具有直观、形象的特点。

频率反映了是什么？用信号的幅度值来模拟音量的高低，音量高，信号的幅度值就大。

用信号的
视频分量YUV的意义及数字化格式（比例）？
用Y:U:V来表示YUV三分量的采样比例,则数字视频的采样格式分别有4:2:0 ,4:1:1、4:2:2和4:4:4多种
音频信号的冗余度有哪些？
1、时域冗余:(1)、幅度分布的非均匀性(2)、样值间的相关性(3)、周期之间的相关性(4)、基音之间的相关性(5)、静止系数(6)、长时自相关函数
2、频域冗余：(1)、长时功率谱密度的非均匀性。

(2)、语音特有的短时功率谱密度。

3、听觉冗余：①人的听觉具有掩蔽效应。

②人耳对不同频段的声音的敏感程度不同，通常对低频段较之高频段更敏感。

③人耳对音频信号的相位变化不敏感
视频信号具有的特点：
1、直观性：人眼视觉所获得的视频信息具有直观的特点，与语音信息相比，由于视频信息给人的印象更生动、更深刻、更具体、更直接，所以视频信息交流的效果也就更好。

这是视频通信的魅力所在，例如电视、电影。

2、确定性：“百闻不如一见”，即视频信息是确定无疑的，是什么就是什么，不易与其他内容相混淆，能保证信息传递的准确性。

而语音则由于方言、多义等原因可能会导致不同的含义。

3、高效性：由于人眼视觉是一个高度复杂的并行信息处理系统，它能并行快速地观察一幅幅图像的细节，因此，它获取视频信息的效率要比语音信息高得多。

4、广泛性：人类接受的信息，约80%来自视觉，即人们每天获得的信息大部分是视觉信息。

通常将人眼感觉到的客观世界称为景物。

5、高带宽性：视频信息的信息量大，视频信号的带宽高，使得对它的产生、处理、传输、存储和显示都提出了更高的要求。

例如，一路PCM数字电话所需的带宽为64kbit/s，一路压缩后的VCD质量的数字电视要求1.5Mbit/s，而一路高清晰度电视未压缩的信息传输速率约为1Gbit/s，压缩后也要20Mbit/s。

显然，这是为了获得视频信息的直观性、确定性和高效性所需要付出的代价。

音频压缩编码算法有哪些：统计编码、混合编码、波形编码、感知编码、参数编码
数字音视频存储格式有哪些？WA V MIDI MP3 WMA MP4 DVD A VI NA VI ASF RM MOV
用来描述人听觉的量如：响度、音调、音色等
数字音视频广播传输采用的途径有：微波通信网、有线网、卫星通信网。

✓现实生活中的声音是通过空气的振动来传送的，但这些声音不能存储，范围也有限，模拟音频技术的发展使声音的存储和远距离传送为可能。

✓数字音频是一种利用数字化手段对声音进行录制、存放、编辑、压缩或播放的技术，它是随着数字信号处理技术、计算机技术多媒体技术的发展而形成的一种全新的声音处理手段。

数字音频指的也是一个用来表示声音强弱的数据序列，通过对模拟音频进行取样、量化、编码过程，实现对音频信号的模/数（A/D转换），形成数字音频信号。

✓视频数据之所以能被压缩，是因为在视频数据中存在着大量的冗余信息。

✓数字音频信号可进行存储、传送，也可经再生电路进行数/模转换，还原成模拟音频。

✓把模拟的音频信号转化为数字音频信号的过程，称为音频的数字化，这是一个模/数（A/D）转换的过程，一般包括3个阶段，取样、量化和编码。

✓采样率就是通过波形采样的方法记录1秒钟长度的声音，需要多少个数据。

44KHz 采样率的声音就是要花费44000个数据来描述1秒钟的声音波形，原则上采样率越高，声音的质量越好。

✓数字音视频压缩率通常指音视频文件压缩前和压缩后大小的比值，用来简单描述数字音视频的压缩效率。

✓音频量化级是描述声音波形的数据是多少位的二进制数据，通常用bit做单位，量化级也是数字声音质量的重要指标。

✓数字语音信息处理系统的构成与数字视频/图像信息处理系统相似，是指把语音信号数字化并在数字状态下进行记录、传输、重放以及其他加工处理等一整套技术。

✓对10分钟的模拟立体声信号进行PCM编码，采样频率为22.05KHz，量化位数采用8bit，则其数据速率是多少？其存储容量为多少？
✓PCM （脉冲编码调制技术）是“数字化”最基本的技术，模拟信号正是通过这种技术而变换成数字信号的。

✓按能量转换的物理效应可分为动圈式与电容式话筒，按指向性的不同可分为无指向性、双指向性、心形指向性及锐心形指向性话筒。

✓视频是由许多幅按时间序列构成的连续图像，每一幅图像称为一帧（Frame）。

✓视频信息是多媒体信息中最重要的一种信息，当视频信息与语音信息、图像信息、文本等有机结合在一起时构成了多媒体信息。

✓“百闻不如一见”，描述了视频信息的确定性性质特征。

✓数字视频有很多优点，它不仅可直接进行随机存储，而且而且检索方便，在复制和传输过程中都不会造成质量下降，很容易进行非线性编辑。

✓视频信号的数字化过程与音频信号数字化过程类似、包括图像中像素位置的采样、所得值的量化以及PCM编码3个过程。

✓彩色视频数据压缩编码处理既要恰当地编码，将原始数据通过编码进行压缩，以便于存储与传输，又要恰当地对编码数据进行解码，还原为可以使用的数据。

✓预测编码是基于图像数据的时间和空间冗余特性，用相邻的已知像素（或图像块）来预测当前像素（或图像块）的取值，然后再对预测误差进行量化和编码。

✓预测编码旨在去除相邻像素之间的冗余度，可以在一幅图像内进行称为帧内预测编码，也可以在多幅图像之间进行称为帧间预测编码。

✓
数字音视频技术特点是什么？传输效率较高信息传输存储灵活方便、可靠性高
抗干扰能力强、有效地保护信息和进行版权管理、具有可扩展性、便于与其他数字设备融合、易于集成化和大规模生产，其性能一致性好，且成本低。

数字音视频技术的应用在哪些方面？消费电子领域、广播电视领域、多媒体计算机领域及多媒体通信领域的实际应用
按压缩编码算法不同分类，数字音频压缩编码算法有哪些？(1)、统计编码
如霍夫曼编码、算术编码以及行程长度编码等
(2)、波形编码
全频带编码如P C M、瞬时/准瞬时压扩P C M、自适应差分P C M等；子带编码如自适
应变换编码A T C、心理学模型等，以及向量量化等在音频中均常采用。

(3)、参数编码
参数编码的方法是将音频信号以某种模型表示，再抽出合适的模型参数和参考激励信号进行编码；声音重放时，再根据这些参数重建即可，这就是通常讲的声码器。

(4)、混合编码
音频中采用的混合编码包括多脉冲线性预测(M P-L P C)、向量和激励线性预测(V S E L P)、码本激励线性预测(C E L P)、短时延码本激励线性预测(L D-C E L P)以及规划码激励长时预测(R P E-L T P)等。

(5)、感知编码
感知编码利用心理学分析原理来实现音频压缩。

如M P E G A u d i o L a y e r3采用的算法A S P E C(高质量音乐信号自适应谱感知熵编码)，将原始音频数据压缩到10：1甚至12：1。

当然这是一种有损压缩，但是人耳却基本不能分辨出失真来。

传声器的性能指标有哪些？(1)、灵敏度。

(2)、最大输入声压级。

(3)、最大输出电平。

(4)、频率响应。

(5)、输出阻抗。

(6)、方向性。

视频数据主要存在哪些冗余？视频数据主要存在下列冗余。

(1)空间冗余，同一帧图像中相邻的饮水具有很强的相关性。

(2)时间冗余，图像序列中相邻帧的对应像素具有很强的相关性。

(3)结构冗余，在视频图像的纹理区，像素的亮、色度信息存在着明显的分布模式，如果知道了分布模式，就可以通过某种算法来生成图像，即存在结构冗余。

(4)视觉冗余，研究发现人眼的视觉特性E均匀和非线性的。

例如，人眼对视频图像色度的敏感性远低于对亮度的敏感性，对低频信息的敏感度高于对高频信息的敏感度等等。

在很多场合，人眼是视频信息的最终接收者，因此，可以对人眼不敏感的信息少编码甚至不编码以压缩数据量。

（5）知识冗余，指视频图像中所包含的某些信息与人们的一些先验知识有关。

例如在头肩图像中，头、眼、鼻和嘴的相对位置等信息就是人类的共性知识。

衡量一个音视频信息系统优劣最重要的性能指标是什么？
视频压缩编码的有哪些类型？1、脉码调制(PCM)2、量化法3、空间和时间子抽样编码4、预测编码5、变换编码6、熵编码7、矢量量化（V Q）8、子带编码（S B C）9、塔型编码
常见的录音设备有哪些？1、磁带式数字录音设备2、磁光盘类数字录音设备3、硬盘类数字录音设备4、录音笔5、声卡
请给方框图论述数字视频处理系统的构成。

请结合实例说明音视频资源的设计和编辑过程。