特征提取

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
SCF/SCM: spectral centroid frequency/magnitude
该方法的提出,是考虑到MFCC子带中无法体现能量分布,而FM(frequency modulation)计算量太大。
FFV: fundamental frequency variation,该方法同时考虑到了MFCC和韵律(prosodic)信息.
MHEC:meanHilbertenvelope coefficients.此方法对抗汽车噪声很有用。
3、对抗回声较优的方法(reverberant robustness):
FDLP: frequency domain linear prediction
4、融合MFCC的方法(fusion with MFCC):
2、音素特征(phonetic features)
建模可以用N-gram,也可以用SVM建模。
3、语法特征(lexical features)
词一级的N-gram,建模的方法有LLR(log likelihood ration)和SVM.SVM的效Leabharlann Baidu应该更好一些。
4、cepstral-derived features
实现用最大似然线性回归MLLR(maximum likelihood linear regression)
一些特征:
MFCC
PLP感知线性预测
LPC线性预测系数
过零率
LSP
短时能量
子带流量比
亮度
基频
频谱峰值点
SDC
CEP
线谱对
频谱能量
Delt(MFCC)
HSCC: Harmonic structure cepstral coefficient,该方法体现了能量分布,实现用到了LDA。
二、high-level,主要是基于phone ,syllable ,word一级。
1、韵律特征(prosodic features)
目前研究的有pitch distribution和non-uniform extraction region features(NERFs)
特征提取
一、low-level,主要是MFCC,以及基于MFCC并对其优化的一些方法。
1、MFCC
2、抗噪声较优的方法:
WMVDR:warped minimum variance distortionless response
Multitaper MFCC:思想是用multiple windows(tapers)来代替汉明窗。
相关文档
最新文档