数据压缩与信源编码第四章
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第四章
1、详细解释下面概念:(a)绝对掩蔽门限;(b)临界频带;(c)听觉门限;(d)掩蔽效应。(a)绝对掩蔽门限:被掩蔽音单独存在时的听阈分贝值,或者说在安静环境中能被人耳听到的纯
音的最小值称为绝对掩蔽门限。
(b)临界频带:当噪声掩蔽纯音时,起作用的是以纯音频率为中心频率的一定频带宽度内的噪声
频率。如这频带内的噪声功率等于在噪声中刚能听到的该纯音的功率,则这频带就称为听觉临界
频带。
(c)听觉门限:刚刚能引起感觉的最小刺激量,称为感觉阈下限;能产生正常感觉的最大刺激量
,称为感觉阈上限。刺激强度不允许超过上限,否则,不但无效而且还会引起相应听觉器官的损
伤。
(d)掩蔽效应:一个较弱的声音(被掩蔽音)的听觉感受被另一个较强的声音(掩蔽音)影响的现象
称为人耳的“掩蔽效应”。
2、详细说明:(a)什么是心理声学模型,它的输入和输出分别是什么?
心理声学模型是对人听感的统计性质的数学表述模型,它解释人各种听感的生理原理。输入是声
音信号,输出是编码数据流。
(b)心理声学模型在音频编码中的作用?
心理声学原理应用到音频压缩技术中,使获得低比特传输速率和透明音质成为可能。
3、(a)MPEG-1音频编码分几层,各层在编码效率、算法复杂度和算法延迟上有和区别?三层,MPEG-1 Layer1采用每声道192kbit/s,每帧384个样本,32个等宽子带,固定分割数据块。
MPEG-1 Layer2采用每声道128kbit/s,每帧1152个样本,32个子带,属不同分帧方式。MPEG-1
Layer3采用每声道64kbit/s,用混合滤波器组提高频率分辨率,按信号分辨率分成6X32或18X32个
子带,克服平均32个子带的Layer1,Layer2在中低频段分辨率偏低的缺点。
(b)画出mp3音频编码编解码算法框图,并详细说明其工作原理。
4、(a)什么是预回声(pre-echo)?
在变换编码中,频域中的量化误差经解码后会扩散至整个食欲音频帧内,这样就会在原本没有声音的时刻出现可闻的声音,即预回声。
(b)音频编码中为何要进行预回声处理?
在音频编码中,特别当比特率较低时,预回声引起失真是比较严重的问题。
(c)MP3和AAC等音频编码算法中是如何进行预回声处理的?
MP3:子带编码
AAC:基于动态分块的自适应窗口切换算法
5、查阅资料,然后说明MPEG-4 Audio中包括那些内容,详细说明之。
MPEG-4 Audio Object Types:
∙0: Null
∙1: AAC Main
∙2: AAC LC (Low Complexity)
∙3: AAC SSR (Scalable Sample Rate)
∙4: AAC LTP (Long Term Prediction)
∙5: SBR (Spectral Band Replication)
∙6: AAC Scalable
∙7: TwinVQ
∙8: CELP (Code Excited Linear Prediction)
∙9: HXVC (Harmonic Vector eXcitation Coding)
∙10: Reserved
∙11: Reserved
∙12: TTSI (Text-To-Speech Interface)
∙13: Main Synthesis
∙14: Wavetable Synthesis
∙15: General MIDI
∙16: Algorithmic Synthesis and Audio Effects
∙17: ER (Error Resilient) AAC LC
∙18: Reserved
∙19: ER AAC LTP
∙20: ER AAC Scalable
∙21: ER TwinVQ
∙22: ER BSAC (Bit-Sliced Arithmetic Coding)
∙23: ER AAC LD (Low Delay)
∙24: ER CELP
∙25: ER HVXC
∙26: ER HILN (Harmonic and Individual Lines plus Noise) ∙27: ER Parametric
∙28: SSC (SinuSoidal Coding)
∙29: PS (Parametric Stereo)
∙30: MPEG Surround
∙31: (Escape value)
∙32: Layer-1
∙33: Layer-2
∙34: Layer-3
∙35: DST (Direct Stream Transfer)
∙36: ALS (Audio Lossless)
∙37: SLS (Scalable LosslesS)
∙38: SLS non-core
∙39: ER AAC ELD (Enhanced Low Delay)
∙40: SMR (Symbolic Music Representation) Simple
∙41: SMR Main
∙42: USAC (Unified Speech and Audio Coding) (no SBR) ∙43: SAOC (Spatial Audio Object Coding)
∙44: LD MPEG Surround
∙45: USAC