数据压缩与信源编码第四章

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

第四章

1、详细解释下面概念：（a）绝对掩蔽门限；（b）临界频带；（c）听觉门限；（d）掩蔽效应。（a）绝对掩蔽门限:被掩蔽音单独存在时的听阈分贝值，或者说在安静环境中能被人耳听到的纯

音的最小值称为绝对掩蔽门限。

（b）临界频带:当噪声掩蔽纯音时，起作用的是以纯音频率为中心频率的一定频带宽度内的噪声

频率。如这频带内的噪声功率等于在噪声中刚能听到的该纯音的功率，则这频带就称为听觉临界

频带。

（c）听觉门限:刚刚能引起感觉的最小刺激量，称为感觉阈下限；能产生正常感觉的最大刺激量

，称为感觉阈上限。刺激强度不允许超过上限，否则，不但无效而且还会引起相应听觉器官的损

伤。

（d）掩蔽效应:一个较弱的声音(被掩蔽音)的听觉感受被另一个较强的声音(掩蔽音)影响的现象

称为人耳的“掩蔽效应”。

2、详细说明：（a）什么是心理声学模型，它的输入和输出分别是什么？

心理声学模型是对人听感的统计性质的数学表述模型，它解释人各种听感的生理原理。输入是声

音信号，输出是编码数据流。

（b）心理声学模型在音频编码中的作用？

心理声学原理应用到音频压缩技术中，使获得低比特传输速率和透明音质成为可能。

3、（a）MPEG-1音频编码分几层，各层在编码效率、算法复杂度和算法延迟上有和区别？三层，MPEG-1 Layer1采用每声道192kbit/s，每帧384个样本，32个等宽子带，固定分割数据块。

MPEG-1 Layer2采用每声道128kbit/s，每帧1152个样本，32个子带，属不同分帧方式。MPEG-1

Layer3采用每声道64kbit/s，用混合滤波器组提高频率分辨率，按信号分辨率分成6X32或18X32个

子带，克服平均32个子带的Layer1，Layer2在中低频段分辨率偏低的缺点。

（b）画出mp3音频编码编解码算法框图，并详细说明其工作原理。

4、（a）什么是预回声（pre-echo）？

在变换编码中，频域中的量化误差经解码后会扩散至整个食欲音频帧内，这样就会在原本没有声音的时刻出现可闻的声音，即预回声。

（b）音频编码中为何要进行预回声处理?

在音频编码中，特别当比特率较低时，预回声引起失真是比较严重的问题。

（c）MP3和AAC等音频编码算法中是如何进行预回声处理的?

MP3：子带编码

AAC：基于动态分块的自适应窗口切换算法

5、查阅资料，然后说明MPEG-4 Audio中包括那些内容，详细说明之。

MPEG-4 Audio Object Types:

∙0: Null

∙1: AAC Main

∙2: AAC LC (Low Complexity)

∙3: AAC SSR (Scalable Sample Rate)

∙4: AAC LTP (Long Term Prediction)

∙5: SBR (Spectral Band Replication)

∙6: AAC Scalable

∙7: TwinVQ

∙8: CELP (Code Excited Linear Prediction)

∙9: HXVC (Harmonic Vector eXcitation Coding)

∙10: Reserved

∙11: Reserved

∙12: TTSI (Text-To-Speech Interface)

∙13: Main Synthesis

∙14: Wavetable Synthesis

∙15: General MIDI

∙16: Algorithmic Synthesis and Audio Effects

∙17: ER (Error Resilient) AAC LC

∙18: Reserved

∙19: ER AAC LTP

∙20: ER AAC Scalable

∙21: ER TwinVQ

∙22: ER BSAC (Bit-Sliced Arithmetic Coding)

∙23: ER AAC LD (Low Delay)

∙24: ER CELP

∙25: ER HVXC

∙26: ER HILN (Harmonic and Individual Lines plus Noise) ∙27: ER Parametric

∙28: SSC (SinuSoidal Coding)

∙29: PS (Parametric Stereo)

∙30: MPEG Surround

∙31: (Escape value)

∙32: Layer-1

∙33: Layer-2

∙34: Layer-3

∙35: DST (Direct Stream Transfer)

∙36: ALS (Audio Lossless)

∙37: SLS (Scalable LosslesS)

∙38: SLS non-core

∙39: ER AAC ELD (Enhanced Low Delay)

∙40: SMR (Symbolic Music Representation) Simple

∙41: SMR Main

∙42: USAC (Unified Speech and Audio Coding) (no SBR) ∙43: SAOC (Spatial Audio Object Coding)

∙44: LD MPEG Surround

∙45: USAC