基于Fisher比的Bark倒谱系数混合特征参数提取方法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1 引言
随着社会的进步和科学技术的发展ꎬ人工智能 的一些技术已在现实生活中应用ꎬ急切需要安全快 捷的身份验证技术[1] ꎮ 语音信号具有易于获取ꎬ传 输和存储等优点[2] ꎬ因此ꎬ说话人识别技术变得越 来越重要ꎮ 在说话人识别中一个十分重要的环节 是特征参数提取ꎬ能否对说话人语音的个性特征参 数进行提取ꎬ直接影响说话人识别系统的性能[3] ꎮ
Parameter extraction method for Bark frequency cepstral coefficients based on Fisher criterion
NI Jiweiꎬ PENG Miaoyan ( School of mechanical and electrical engineeringꎬ Guangzhou Universityꎬ Guangzhou 510006ꎬ China) Abstract: In the application of speaker recognitionꎬ in view of the shortcomings of the traditional Bark scale feature parame ̄ ter extraction processꎬ this paper uses the Gaussian shaped filters ( GF) instead of the triangular filter banks to filter the in ̄ put energyꎬ which is smoother than the triangular filter. Due to the low accuracy of Bark Cepstrum Coefficient ( BFCC) in high frequencyꎬ a new hybrid characteristic parameter is constructed by combining BFCC with IBFCC using Fisher criterion. The experimental results show that in the pure speech and noise environmentꎬ the proposed BFCC using Gaussian shaped fil ̄ ters has higher recognition rate than MFCC using triangular filter banksꎬ and the new hybrid feature parameters have better recognition performance. Key words:Bark Frequency Cepstrum Cofficientꎻ MFCCꎻ Gaussian shaped filters(GF)ꎻ Fisher criterionꎻ speaker recognition
文献引用格式:倪纪伟ꎬ彭妙颜. 基于 Fisher 比的 Bark 倒谱系数混合特征参数提取方法[ J] . 电声技术ꎬ 2019ꎬ 43 ( 1 ) :30 - 33. NI J Wꎬ PENG M Y. Parameter extraction method for Bark frequency cepstral coefficients based on Fisher criterion [ J] . Audio engineeringꎬ 2019ꎬ 43(1) :30 - 33.
3 0
Cepstrum CofficientꎬMFCC) 和巴克倒谱系数[7] ( Bark Frequency Cepstrum Cofficientꎬ BFCC) 等ꎬ 其 中 基 于 语音产生原理的特征参数 LPC 和 LPCC 鲁棒性差ꎬ 易受噪声干扰ꎮ 目前使用较多的是基于人耳听觉 的特征参数 MFCC 和 BFCCꎮ 它们的核心部分是滤 波器组ꎬ描述的是语音在频率上的能量分布ꎮ 人耳 可听到声音的高低和声音的频率是非线性关系ꎬ常 用的非线性频率尺度有 Mel 频率尺度和 Bark 频率 尺度ꎬ 而 后 者 相 比 前 者 更 符 合 人 类 心 理 听 觉 特性[8] ꎮ
本文首先介绍 BFCC 的提取和高斯滤波器组ꎬ 然后计算采用高斯滤波器组的 BFCC 和 IBFCCꎬ最 后利用 Fisher 准则ꎬ选择其中分离程度较大的特征 向量ꎬ组成一种新的混合特征参数ꎮ 实验结果表
中图分类号:TN912. 34 文献标志码:A DOI:10. 16311 / j. audioe. 2019. 01. 009
基于 Fisher 比的 Bark 倒谱系数混合特征参数提取方法
Байду номын сангаас
倪纪伟ꎬ彭妙颜
( 广州大学 机械与电气工程学院ꎬ广东 广州 510006)
摘要:在说话人识别应用中ꎬ本文针对传统的 Bark 尺度特征参数提取过程中的不足ꎬ利用高斯滤波器组( Gaussian shaped filtersꎬGF) 代替三角滤波器组ꎬ对输入的能量进行滤波ꎬ其相比三角滤波器滤波结果更加平滑ꎮ 由于巴克倒 谱系数( BFCC) 在高频精度不足ꎬ再利用 Fisher 准则将 BFCC 与 IBFCC 相结合ꎬ构造了一种新的混合特征参数ꎮ 实 验结果表明ꎬ在纯净语音及噪声环境下ꎬ本文提出的使用高斯滤波器组的 BFCC 比使用三角滤波器组的 MFCC 识别 率高ꎬ而新的混合特征参数识别性能更优ꎮ 关键词: 巴克倒谱系数ꎻMFCCꎻ高斯滤波器组( GF) ꎻFisher 准则ꎻ说话人识别
许多学者研究表明ꎬ基于频域的特征对于说话 人识别是最有效的ꎮ 现今ꎬ常用的特征参数有线性 预测 系 数[4] ( Linear Prediction Coefficentꎬ LPC ) 、 线 性预测倒谱系数[5] ( Linear Prediction Cepstral Coeffi ̄ centꎬLPCC) 、梅尔频率倒谱系数[6] ( Mel Frequency
相关文档
最新文档