09级数字音视频技术期末考试答案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
声波基本要素:振幅、频率、频谱
彩色三要素:亮度、色调、饱和度
音视频输入有设备哪些?话筒、摄像机等,音视频模/数(A/D)数/模(D/A)转换的设备有哪些?非线性编辑卡、数字录像机等。
数字音视频节目存储介质:磁带、光盘、磁盘等
模拟音频信号波形的振幅反映了是什么、频率模拟音调的高低,音调高,信号的频率就高。
模拟信号具有直观、形象的特点。
频率反映了是什么?用信号的幅度值来模拟音量的高低,音量高,信号的幅度值就大。
用信号的
视频分量YUV的意义及数字化格式(比例)?
用Y:U:V来表示YUV三分量的采样比例,则数字视频的采样格式分别有4:2:0 ,4:1:1、4:2:2和4:4:4多种
音频信号的冗余度有哪些?
1、时域冗余:(1)、幅度分布的非均匀性(2)、样值间的相关性(3)、周期之间的相关性(4)、基音之间的相关性(5)、静止系数(6)、长时自相关函数
2、频域冗余:(1)、长时功率谱密度的非均匀性。
(2)、语音特有的短时功率谱密度。
3、听觉冗余:①人的听觉具有掩蔽效应。
②人耳对不同频段的声音的敏感程度不同,通常对低频段较之高频段更敏感。
③人耳对音频信号的相位变化不敏感
视频信号具有的特点:
1、直观性:人眼视觉所获得的视频信息具有直观的特点,与语音信息相比,由于视频信息给人的印象更生动、更深刻、更具体、更直接,所以视频信息交流的效果也就更好。
这是视频通信的魅力所在,例如电视、电影。
2、确定性:“百闻不如一见”,即视频信息是确定无疑的,是什么就是什么,不易与其他内容相混淆,能保证信息传递的准确性。
而语音则由于方言、多义等原因可能会导致不同的含义。
3、高效性:由于人眼视觉是一个高度复杂的并行信息处理系统,它能并行快速地观察一幅幅图像的细节,因此,它获取视频信息的效率要比语音信息高得多。
4、广泛性:人类接受的信息,约80%来自视觉,即人们每天获得的信息大部分是视觉信息。
通常将人眼感觉到的客观世界称为景物。
5、高带宽性:视频信息的信息量大,视频信号的带宽高,使得对它的产生、处理、传输、存储和显示都提出了更高的要求。
例如,一路PCM数字电话所需的带宽为64kbit/s,一路压缩后的VCD质量的数字电视要求1.5Mbit/s,而一路高清晰度电视未压缩的信息传输速率约为1Gbit/s,压缩后也要20Mbit/s。
显然,这是为了获得视频信息的直观性、确定性和高效性所需要付出的代价。
音频压缩编码算法有哪些:统计编码、混合编码、波形编码、感知编码、参数编码
数字音视频存储格式有哪些?WA V MIDI MP3 WMA MP4 DVD A VI NA VI ASF RM MOV
用来描述人听觉的量如:响度、音调、音色等
数字音视频广播传输采用的途径有:微波通信网、有线网、卫星通信网。
✓现实生活中的声音是通过空气的振动来传送的,但这些声音不能存储,范围也有限,模拟音频技术的发展使声音的存储和远距离传送为可能。
✓数字音频是一种利用数字化手段对声音进行录制、存放、编辑、压缩或播放的技术,它是随着数字信号处理技术、计算机技术多媒体技术的发展而形成的一种全新的声音处理手段。
数字音频指的也是一个用来表示声音强弱的数据序列,通过对模拟音频进行取样、量化、编码过程,实现对音频信号的模/数(A/D转换),形成数字音频信号。
✓视频数据之所以能被压缩,是因为在视频数据中存在着大量的冗余信息。
✓数字音频信号可进行存储、传送,也可经再生电路进行数/模转换,还原成模拟音频。
✓把模拟的音频信号转化为数字音频信号的过程,称为音频的数字化,这是一个模/数(A/D)转换的过程,一般包括3个阶段,取样、量化和编码。
✓采样率就是通过波形采样的方法记录1秒钟长度的声音,需要多少个数据。
44KHz 采样率的声音就是要花费44000个数据来描述1秒钟的声音波形,原则上采样率越高,声音的质量越好。
✓数字音视频压缩率通常指音视频文件压缩前和压缩后大小的比值,用来简单描述数字音视频的压缩效率。
✓音频量化级是描述声音波形的数据是多少位的二进制数据,通常用bit做单位,量化级也是数字声音质量的重要指标。
✓数字语音信息处理系统的构成与数字视频/图像信息处理系统相似,是指把语音信号数字化并在数字状态下进行记录、传输、重放以及其他加工处理等一整套技术。
✓对10分钟的模拟立体声信号进行PCM编码,采样频率为22.05KHz,量化位数采用8bit,则其数据速率是多少?其存储容量为多少?
✓PCM (脉冲编码调制技术)是“数字化”最基本的技术,模拟信号正是通过这种技术而变换成数字信号的。
✓按能量转换的物理效应可分为动圈式与电容式话筒,按指向性的不同可分为无指向性、双指向性、心形指向性及锐心形指向性话筒。
✓视频是由许多幅按时间序列构成的连续图像,每一幅图像称为一帧(Frame)。
✓视频信息是多媒体信息中最重要的一种信息,当视频信息与语音信息、图像信息、文本等有机结合在一起时构成了多媒体信息。
✓“百闻不如一见”,描述了视频信息的确定性性质特征。
✓数字视频有很多优点,它不仅可直接进行随机存储,而且而且检索方便,在复制和传输过程中都不会造成质量下降,很容易进行非线性编辑。
✓视频信号的数字化过程与音频信号数字化过程类似、包括图像中像素位置的采样、所得值的量化以及PCM编码3个过程。
✓彩色视频数据压缩编码处理既要恰当地编码,将原始数据通过编码进行压缩,以便于存储与传输,又要恰当地对编码数据进行解码,还原为可以使用的数据。
✓预测编码是基于图像数据的时间和空间冗余特性,用相邻的已知像素(或图像块)来预测当前像素(或图像块)的取值,然后再对预测误差进行量化和编码。
✓预测编码旨在去除相邻像素之间的冗余度,可以在一幅图像内进行称为帧内预测编码,也可以在多幅图像之间进行称为帧间预测编码。
✓
数字音视频技术特点是什么?传输效率较高信息传输存储灵活方便、可靠性高
抗干扰能力强、有效地保护信息和进行版权管理、具有可扩展性、便于与其他数字设备融合、易于集成化和大规模生产,其性能一致性好,且成本低。
数字音视频技术的应用在哪些方面?消费电子领域、广播电视领域、多媒体计算机领域及多媒体通信领域的实际应用
按压缩编码算法不同分类,数字音频压缩编码算法有哪些?(1)、统计编码
如霍夫曼编码、算术编码以及行程长度编码等
(2)、波形编码
全频带编码如P C M、瞬时/准瞬时压扩P C M、自适应差分P C M等;子带编码如自适
应变换编码A T C、心理学模型等,以及向量量化等在音频中均常采用。
(3)、参数编码
参数编码的方法是将音频信号以某种模型表示,再抽出合适的模型参数和参考激励信号进行编码;声音重放时,再根据这些参数重建即可,这就是通常讲的声码器。
(4)、混合编码
音频中采用的混合编码包括多脉冲线性预测(M P-L P C)、向量和激励线性预测(V S E L P)、码本激励线性预测(C E L P)、短时延码本激励线性预测(L D-C E L P)以及规划码激励长时预测(R P E-L T P)等。
(5)、感知编码
感知编码利用心理学分析原理来实现音频压缩。
如M P E G A u d i o L a y e r3采用的算法A S P E C(高质量音乐信号自适应谱感知熵编码),将原始音频数据压缩到10:1甚至12:1。
当然这是一种有损压缩,但是人耳却基本不能分辨出失真来。
传声器的性能指标有哪些?(1)、灵敏度。
(2)、最大输入声压级。
(3)、最大输出电平。
(4)、频率响应。
(5)、输出阻抗。
(6)、方向性。
视频数据主要存在哪些冗余?视频数据主要存在下列冗余。
(1)空间冗余,同一帧图像中相邻的饮水具有很强的相关性。
(2)时间冗余,图像序列中相邻帧的对应像素具有很强的相关性。
(3)结构冗余,在视频图像的纹理区,像素的亮、色度信息存在着明显的分布模式,如果知道了分布模式,就可以通过某种算法来生成图像,即存在结构冗余。
(4)视觉冗余,研究发现人眼的视觉特性E均匀和非线性的。
例如,人眼对视频图像色度的敏感性远低于对亮度的敏感性,对低频信息的敏感度高于对高频信息的敏感度等等。
在很多场合,人眼是视频信息的最终接收者,因此,可以对人眼不敏感的信息少编码甚至不编码以压缩数据量。
(5)知识冗余,指视频图像中所包含的某些信息与人们的一些先验知识有关。
例如在头肩图像中,头、眼、鼻和嘴的相对位置等信息就是人类的共性知识。
衡量一个音视频信息系统优劣最重要的性能指标是什么?
视频压缩编码的有哪些类型?1、脉码调制(PCM)2、量化法3、空间和时间子抽样编码4、预测编码5、变换编码6、熵编码7、矢量量化(V Q)8、子带编码(S B C)9、塔型编码
常见的录音设备有哪些?1、磁带式数字录音设备2、磁光盘类数字录音设备3、硬盘类数字录音设备4、录音笔5、声卡
请给方框图论述数字视频处理系统的构成。
请结合实例说明音视频资源的设计和编辑过程。