数字音频作业及其答案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一次作业:
1:、声音可分为两种:纯音和复合音,平常人们说话的声音属于哪一种语音的频率范围是多少音频通常包括哪几种声音信号其频率范围是多少
2、请说明音频信号数字化的三个步骤
3、如何理解“量化是信号数字化过程中重要的一步,而这一过程又是引入噪声的主要根源”这句话的含义通过哪些途径可以减小量化误差
4对双极性信号若采用均匀量化,则量化信噪比SNR与量化比特数之间的关系为:SNR=+,试分析此式对实际量化与编码的指导意义
5:、A/D、D/A转换器的技术指标有哪些
答:1:人们说话的声音为复合音,语言的频率范围为300HZ-3000HZ。音频暴多语音、音乐、效果声等声音信号,频率范围为20HZ-20KHZ。
2:1取样:对连续信号按一定的时间间隔取样。奈奎斯特取样定理认为,只要取样频率大于等于信号中所包含的最高频率的两倍,则可以根据其取样完全恢复出原始信号,这相当于当信号是最高频率时,每一周期至少要采取两个点。但这只是理论上的定理,在实际操作中,人们用混叠波形,从而使取得的信号更接近原始信号。2量化:取样的离散音频要转化为计算机能够表示的数据范围,这个过程称为量化。量化的等级取决于量化精度,也就是用多少位二进制数来表示一个音频数据。一般有8位,12位或16位。量化精度越高,声音的保真度越高。以8位的举例稍微说明一下其中的原理。若一台计算机能够接收八位二进制数据,则相当于能够接受256个十进制的数,即有256个电平数,用这些数来代表模拟信号的电平,可以有256种,但是实际上采样后的某一时刻信号的电平不一定和256个电平某一个相等,此时只能用最接近的数字代码表示取样信号电平。3编码:对音频信号取样并量化成二进制,但实际上就是对音频信号进行编码,但用不同的取样频率和不同的量化位数记录声音,在单位时间中,所需存贮空间是不一样的。波形声音的主要参数包括:取样频率.量化位数.声道数.压缩编码方案和数码率等,未压缩前,波形声音的码率计算公式为:波形声音的码率=取样频率*量化位数*声道数/8。波形声音的码率一般比较大,所以必需对转换后的数据进行压缩。
3:量化是按四舍五入对采样的样本值进行计量的,这个过程会产生误差可对噪声进行整形,提高采样频率等方法减小量化误差
4:量化比特数增加一位,则信噪比提高6dB,信噪比提高意味着声音动态范围的加宽,若采用量化比特N=16的A/D变换器的数字声记录在磁带上可以扩展到98dB,接近于交响乐动态范围,若将量化比特提高到N=20,可扩至人儿的122dB动态范围。
5:A/D的技术指标有:分辨率、转换速率、量化误差、偏移误差、满刻度误差和线性度误差等。D/A转换器的技术指标有:分辨率和建立时间。
第二次作业:
1.什么叫最小可闻阈什么叫掩蔽阈什么叫频域掩蔽什么叫时域掩蔽掩蔽效应的一般规律是什么
2.何谓临界频带简述它在音频编码中的应用。
3.音频编码通常分为哪几类它们各有什么优缺点
4.声音压缩的依据是什么MPEG-1音频编码利用了听觉系统的什么特性
5.子带编码的基本思想是什么进行子带编码的好处是什么
6 .在MUSICAM的MPEG Layer I编码器的比特分配中,请读/写出32位“标题”:1111 1111 1111 0010 1101 0001 0101 1101 所表示的信息。
7.什么叫做声道环绕立体声
8.MUSICAM音频比特流数据帧中的比例因子起什么作用
9 .简述杜比AC-3的音频编码原理,并比较AC-3与MPEG2(AAC)音频编码的异同。
10 .怎样理解AC-3的音频编码中的“指数”、“尾数”、“指数策略”
11 . MPEG-4音频编码有何特点MPEG-4音频编码标准具有良好的发展前景,主要体现在哪些方面
答:
1、最小可闻阈:等响度曲线中的0方曲线以下区域为不可闻区,他表示虽然人耳处存在一
定的声压,却感觉不到,因此把0方等响度曲线命名为最小可闻阈;掩蔽阈:当出现一个强度高于原频率的另一个频率声音时的最小可闻阈;频域掩蔽:强纯音掩蔽在其附近同时发生的弱纯音的特性;强音压弱音,低频音压高频音
2、当噪声掩蔽纯音是起作用的是以纯音频率为中心频率的一定频带宽度内噪音频率。如果
频带内的噪声功率等于在噪声中刚能响到该纯音的功率所对应的频率。临界频率表征了人类的主要听觉特性,他是研究纯音对窄带噪声掩蔽时被发现的,在家款噪声带宽时,最初是掩蔽量大增,但带宽超过一定值后,掩蔽量是不同增加;这种音频编码中的主要作用在于去掉大量的冗余,压缩数码率。
3、(1)波形编码,包括自适应变换编码和子带编码:适应性强,算法复杂度低,编解码
延时短,重建音频信号质量一般较高,但压缩比不高。(2)参数编码:优点压缩比高,但计算量大,重建音频信号的质量差,自然度低,不适合高保真度要求的场合。(3)混合编码:在较低的数码率上得到较高的音质。:
4、压缩编码结合人的听觉特性将对听觉无关的信号删除,充分利用声音冗余度以进一步节
约数码率而对恢复后的声音质量无影响。MPEG-1利用了掩蔽效应的心理声学模型
5、子带编码的基本思想:利用声音信号频谱分布的不均匀,将其分割成许多子频带,就每
一个子带分别进行编码。好处:(1)减少了各子带信号能量分布不均匀的程度,减少了动态范围。(2)可根据每个子带信号在感知上的重要性(即利用人对声音信号的感知模型),对每个子带内的采样值分配不同的比特数。
6、同步字,算法为其他算法,layerIII,加入冗余度信息列音频数据内,比特率为
256kbit/s,采样频率,它含有附加信道。个人专用,开启强度立体声,关闭MS立体声,有片反权比特流为整体,
7、声道环绕立体声:三个前方的左声道、右声道和中置声道以及两个后方的左、右环绕声
道,这五个声道皆为全频带的(20HZ~20KHZ),另一个超低音声道,其频带范围只有(20~120HZ)将此超低音称为声道,加上前面的五个声道,就构成了杜比数字的声道。
8、1充分利用量化器的量化范围,通过比特分配和比例因子相结合,可以表示动态范围超
过120db;2若一个给定的子带中的量化噪声超过了心理声学模型所提供的掩蔽阈值,那么该子带的比例因子就该将调整减少量化噪声
9、原理:采用知压缩编码技术,将每一声道的音频数据通过时域混迭消除(TDAC)技术滤
波后,根据人耳听觉特性划分为许多最优的狭窄频段,对于每个频段,频段内噪声信号的频率与有用信号的频率非常接近,可以使遮蔽效应发挥最大作用,频段以外的所有信号可以全部被滤除掉而不会损伤有用信号,进行由时域变换到频域的指数变换,变换系数的指数部分经编码后构成了整个信号大致的频谱包络,利用 512个采样值点和 256 个采样值点两种长度组成块的切换,得到较好的频率分辨力,同时也能得到较高的编码效率
比较:杜比AC-3和MPEG-2(AAC)都是利用人耳听觉系统在频域时域中的掩蔽效应以及心理声学模型,但那不同的是MPEG-2(AAC)比AC-3有更大的灵活性,做到了极低的数据比特率下声音达到了广播级。
10、时域的PCM取样信号从时域变换到频域,得到一系列的频率系统,每个频率以二进制指