mel谱计算流程
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Mel谱的计算流程主要包括以下步骤:
1. 预加重:通过一个50Hz的抗混叠滤波器来减少语音信号中的形式化。
2. 分帧:对输入信号进行分帧处理,一般使用汉明窗作为帧窗。
3. 加窗:在分帧后,对每帧信号加窗,以减少频谱泄漏。
4. 快速傅里叶变换(FFT):对加窗后的信号进行快速傅里叶变换,将时域信号转换为频域信号。
5. 计算Mel频率分值:将频域信号转换为Mel频率分值,这是基于人耳对等距的音高变化的感官判断而定的非线性频率刻度。
6. 对数转换:将Mel频率分值转换为对数形式,以更好地反映人耳的听觉特性。
7. 归一化:对得到的Mel频率分值进行归一化处理,使得每个帧的能量在一定的范围内。
通过以上步骤,就可以得到Mel谱。
它是一种描述语音信号特征的表示方法,被广泛应用于语音识别、语音合成等领域。