数据压缩与信源编码第四章

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第四章

1、详细解释下面概念:(a)绝对掩蔽门限;(b)临界频带;(c)听觉门限;(d)掩蔽效应。(a)绝对掩蔽门限:被掩蔽音单独存在时的听阈分贝值,或者说在安静环境中能被人耳听到的纯

音的最小值称为绝对掩蔽门限。

(b)临界频带:当噪声掩蔽纯音时,起作用的是以纯音频率为中心频率的一定频带宽度内的噪声

频率。如这频带内的噪声功率等于在噪声中刚能听到的该纯音的功率,则这频带就称为听觉临界

频带。

(c)听觉门限:刚刚能引起感觉的最小刺激量,称为感觉阈下限;能产生正常感觉的最大刺激量

,称为感觉阈上限。刺激强度不允许超过上限,否则,不但无效而且还会引起相应听觉器官的损

伤。

(d)掩蔽效应:一个较弱的声音(被掩蔽音)的听觉感受被另一个较强的声音(掩蔽音)影响的现象

称为人耳的“掩蔽效应”。

2、详细说明:(a)什么是心理声学模型,它的输入和输出分别是什么?

心理声学模型是对人听感的统计性质的数学表述模型,它解释人各种听感的生理原理。输入是声

音信号,输出是编码数据流。

(b)心理声学模型在音频编码中的作用?

心理声学原理应用到音频压缩技术中,使获得低比特传输速率和透明音质成为可能。

3、(a)MPEG-1音频编码分几层,各层在编码效率、算法复杂度和算法延迟上有和区别?三层,MPEG-1 Layer1采用每声道192kbit/s,每帧384个样本,32个等宽子带,固定分割数据块。

MPEG-1 Layer2采用每声道128kbit/s,每帧1152个样本,32个子带,属不同分帧方式。MPEG-1

Layer3采用每声道64kbit/s,用混合滤波器组提高频率分辨率,按信号分辨率分成6X32或18X32个

子带,克服平均32个子带的Layer1,Layer2在中低频段分辨率偏低的缺点。

(b)画出mp3音频编码编解码算法框图,并详细说明其工作原理。

4、(a)什么是预回声(pre-echo)?

在变换编码中,频域中的量化误差经解码后会扩散至整个食欲音频帧内,这样就会在原本没有声音的时刻出现可闻的声音,即预回声。

(b)音频编码中为何要进行预回声处理?

在音频编码中,特别当比特率较低时,预回声引起失真是比较严重的问题。

(c)MP3和AAC等音频编码算法中是如何进行预回声处理的?

MP3:子带编码

AAC:基于动态分块的自适应窗口切换算法

5、查阅资料,然后说明MPEG-4 Audio中包括那些内容,详细说明之。

MPEG-4 Audio Object Types:

∙0: Null

∙1: AAC Main

∙2: AAC LC (Low Complexity)

∙3: AAC SSR (Scalable Sample Rate)

∙4: AAC LTP (Long Term Prediction)

∙5: SBR (Spectral Band Replication)

∙6: AAC Scalable

∙7: TwinVQ

∙8: CELP (Code Excited Linear Prediction)

∙9: HXVC (Harmonic Vector eXcitation Coding)

∙10: Reserved

∙11: Reserved

∙12: TTSI (Text-To-Speech Interface)

∙13: Main Synthesis

∙14: Wavetable Synthesis

∙15: General MIDI

∙16: Algorithmic Synthesis and Audio Effects

∙17: ER (Error Resilient) AAC LC

∙18: Reserved

∙19: ER AAC LTP

∙20: ER AAC Scalable

∙21: ER TwinVQ

∙22: ER BSAC (Bit-Sliced Arithmetic Coding)

∙23: ER AAC LD (Low Delay)

∙24: ER CELP

∙25: ER HVXC

∙26: ER HILN (Harmonic and Individual Lines plus Noise) ∙27: ER Parametric

∙28: SSC (SinuSoidal Coding)

∙29: PS (Parametric Stereo)

∙30: MPEG Surround

∙31: (Escape value)

∙32: Layer-1

∙33: Layer-2

∙34: Layer-3

∙35: DST (Direct Stream Transfer)

∙36: ALS (Audio Lossless)

∙37: SLS (Scalable LosslesS)

∙38: SLS non-core

∙39: ER AAC ELD (Enhanced Low Delay)

∙40: SMR (Symbolic Music Representation) Simple

∙41: SMR Main

∙42: USAC (Unified Speech and Audio Coding) (no SBR) ∙43: SAOC (Spatial Audio Object Coding)

∙44: LD MPEG Surround

∙45: USAC

相关文档
最新文档