基于改进PNCC和i-vector的说话人识别鲁棒性

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

r e c o g n i t i o n a n d t e s t i n TI MI T s p e e c h d a t a b a s e . Ex p e r i me n t a l r e s u l t s s h o w t h a t f o r d i f f e r e n t n o i s e s a n d d i f f e r e n t s i g n a l n o i s e r a t i o s( S NR) ,t h e p r o p o s e d me t h o d h a s t h e l o we s t e q u a l e r r o r r a t e a n d t h e b e s t r o b u s t n e s s , a n d wh e n S NR i S 1 o we r t h a n 1 0 d B, i t h a s g r e a t e r a d v a n t a g e c o mp a r e d t o o t h e r a l g o r i t h ms .
2 0 1 7年 4月
计算机 工程与设计
COM PUTER ENGI NEERI NG AND DES I GN
Ap r .2 0 1 7
Vo L 3 8 Nห้องสมุดไป่ตู้ . 4
第 3 8卷
第 4 期
基于改进 P N C C和 i - v e c t o r 的说 话 人 识 别 鲁棒 性
Ab s t r a c t :Fo c u s e d o n t h e i s s u e t h a t t h e r o b u s t n e s s o f t r a d i t i o n a l Me l f r e q u e n c y c e p s t r a l c o e f f i c i e n t s( MF CC) f e a t u r e d e g r a d e s d r a s t i c a l l y i n s p e a k e r r e c o g n i t i o n s y s t e m ,a k i n d a l g o r i t h m b a s e d o n i mp r o v e d p o we r n o r ma l i z e d c e p s t r a l c o e f f i c i e n t s( P NC C)a n d
t r a l e n v e l o p e a n d a d o p t i n g M VA t o e n h a n c e i t s r o b u s t n e s s wa s p r o p o s e d . Th e i - v e c t o r wa s s e t a s t h e b a s e l i n e s y s t e m f o r s p e a k e r
ma t e b a c k g r o u n d n o i s e .On t h i s b a s i s ,o n e wa y t h a t u s i n g mu l t i p l e wi n d o ws s p e c t r a l e s t i ma t i o n ,s mo o t h i n g t h e a mp l i t u d e s p e c
i - v e c t o r mo d e l wa s p r o p o s e d .Th e d i f f e r e n c e b e t we e n t r a d i t i o n a l MF CC a n d P NC C wa s t h a t P NCC u s e d l o n g t e r m f r a me t o e s t i —
Ro b u s t s p e a k e r r e c o g n i t i o n b a s e d o n i mp r o v e d PNCC a n d i - v e c t o r
S HI Xi a o - y u a n,J I NG Xi n - x i n g,Z ENG Mi n,YANG Ha i — y a n +
( S c h o o l o f I n f o r ma t i o n a n d C o mm u n i c a t i o n ,Gu i l i n Un i v e r s i t y o f El e c t r o n i c Te c h n o l o g y,Gu i l i n 5 4 1 0 0 4 ,C h i n a )
史小元 ,景新幸 ,曾 敏 ,杨海燕+
( 桂 林 电子 科技 大 学 信 息与通 信 学 院,广 西 桂林 5 4 1 0 0 4 )
摘 要 :针对传统 的梅 尔频率倒谱 系数 ( MF C C )在说话人识别 系统 中鲁棒性 不足 的 问题 ,提 出一种基 于改进幂 率归一化 倒谱 系数 ( P NC C )特征 算法和身份 向量 ( i - v e c t o r )训练模型 的方法。与传统 的 MF C C不 同,P NC C利 用长时帧估计 背景 噪 声;在此基础上 ,通过 多窗谱估计 、平滑幅度谱 包络和均值 方差 归一化 ( MV A)等技 术进 一步提升 其鲁棒性 。以 i - v e c — t o r 为基 准模型 ,在 TI MI T语音库上进行说话人识 别实验 ,实验 结果表 明,在 不 同噪声 、不 同信噪 比下 ,所提 算 法相 比其 它特征有 最低 的等错误 率,鲁棒性最 强,在信噪 比低 于 1 0 d B的噪声环境 中具有更 大优 势。 关键词 :幂率 归一化倒谱 系数 ;身份 向量 ;均值方差归一化 ;多窗谱 估计 ;鲁棒 性 ;说话人识 别
中 图法 分 类 号 :T P 3 9 1 . 4 文 献 标 识 号 :A 文章编号 : 1 0 0 0 7 0 2 4( 2 0 1 7 )0 4 — 1 0 7 1 — 0 5
d 0 i :1 0 . 1 6 2 0 8 / j . i s s n l 0 0 0 — 7 0 2 4 . 2 0 1 7 . 0 4 . 0 4 2
相关文档
最新文档