中文连续语音识别系统音素建模单元集的构建
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
建模单元集的构建是连续语音识别中声学建模 需要面临的首要问题之一 , 它的合理与否将会直接 影响到识 别 系 统 最 终 的 性 能。 通 常 情 况 下, 构建
1] : 恰当的建模单元集需要 遵 守 以 下 几 点[ 1)代 表
性, 即在不 同 的 上 下 文 中 都 要 具 备 准 确 而 有 代 表 性的描述 力; 即有足够的数据用来 2)可 训 练 性 , 可靠地估 计 出 建 模 单 元 的 参 数; 即利 3)推 广 性 , 用预先 定 义 的 建 模 单 元 能 够 比 较 容 易 地 表 达 出 新词。 过去的几十年里 , 在中文语音识别系统中 , 研究 人员分别考虑用过 不 同 粒 度 的 建 模 单 元 , 这其中包 、音 节 ( 、声 韵 母 ( / 括 :词 ( w o r d) s l l a b l e) i n i t i a l y , 、音素 ( ) 等。 f i n a l I F) h o n e m e p 以词或 者 音 节 为 粒 度 去 构 建 建 模 单 元 集, 往 往会造成 建 模 单 元 数 目 过 于 庞 大, 从而出现训练 导致模型参数得不到充分而准 数据稀疏 的 问 题, 确的估计, 而且还会使解码的搜索空间 增 大, 大大 因此一般只适合用在一些小词汇 降低解码 效 率, 量的中文识别 系 统 ( 如命令词或者数字串识别系 统) 中。
] 2 3 - , 以声韵母构建建模单元集 [ 在一定程度上反
P h o n e m e m o d e l i n u n i t s d e s i n f o r g g M a n d a r i n L V C S R s s t e m s y
1, 2, 2, 3, B A O Y e b o H U Y u L I U C o n J I A N G H u i g 1, 1, 2 D A I L i r o n I U Q i n f e n g L g g
摘 要 :在识别系统中 , 建模单元 能 够 勾 画 一 种 语 言 的 声 学 因此对系统性能起到至关重要的作 用 。 该 文 和语音学特性 , 参照一些已在大词汇量连 续 语 音 识 别 系 统 ( 中取得 L V C S R) 构建了新的音素建模单元集( 较好效果的建 模 单 元 集 , N e - ) 。 另外 , 根据 N w P S e w P S 中元音及其 变 体 对 前 后 接 音 素 协 同发音的影 响 , 提出了基于扩展的元音三角图设计问题集 ( ) 的 方 法 。 实 验 表 明 :N N e wQ S e w P S和 N e wQ S结合 的 识 并 且, 建模单元数 别性能超越了传统 的 声 韵 母 建 模 单 元 集 ; 目大幅度的减少给系统后续模块的处理带来了便利 。 关键词 :大词汇量连 续 语 音 识 别 ;建 模 单 元 ;元 音 三 角 图 ; 问题集 ;主元音准则 中图分类号 : TN 9 1 2. 3 4 ( ) 文章编号 : 1 0 0 0 0 0 5 4 2 0 1 1 0 9 1 2 8 8 0 5 - - - 文献标志码 :A
自然科学版 ) I S S N 1 0 0 0 0 0 5 4 清华大学学报 ( 2 0 1 1年 第5 1卷 第9期 - / ,2 C N 1 1 2 2 2 3 N J T s i n h u a U n i v( S c i &T e c h) 0 1 1,V o l . 5 1, N o . 9 - g
/ 3 3 2 7 , 1 2 8 8 1 2 9 2 1 2 9 7 -
中文连续语音识别系统音素建模单元集的构建
2 2 3 1 1, 2 包叶波1 , 胡 郁 , 刘 聪 , 江 辉 , 戴礼荣 , 刘庆峰
( 1.中国科学技术大学 电子工程与信息科学系 ,合肥 2 3 0 0 2 7; 2.安徽科大讯飞信息科技股份有限公司 ,合肥 2 3 0 0 8 8; 3.约克大学 计算机科学与工程系 ,多伦多 M 3 J1 P 3,加拿大 )
( , 1. D e a r t m e n t o f E l e c t r o n i c E n i n e e r i n a n d I n f o r m a t i o n S c i e n c e p g g , ; U n i v e r s i t o f S c i e n c e a n d T e c h n o l o o f C h i n a H e f e i 2 3 0 0 2 7, C h i n a y g y , ; 2. A n h u i U S T C i F L Y T E K C o m a n L t d H e f e i 2 3 0 0 8 8, C h i n a p y , 3. D e a r t m e n t o f C o m u t e r S c i e n c e a n d E n i n e e r i n p p g g , ) Y o r k U n i v e r s i t T o r o n t o M 3 J1 P 3, C a n a d a y :M A b s t r a c t o d e l i n u n i t s c a n b e u s e d t o d e s c r i b e t h e s a l i e n t a c o u s t i c g a n d h o n e t i c i n f o r m a t i o n f o r a l a n u a e i n s e e c h r e c o n i t i o n p g g p g , s s t e m s . T h u s t h e a v e r i m o r t a n t r o l e i n t h e s s t e m. T h i s l a y y y p y p y ,w d e s c r i b e s a s e t u s i n s e v e r a l m o d e l i n u n i t s h i c h a e r h o n e m e p p g g p h a s n a r e o c a b u l a r o n t i n u o u s e e c h o o d e r f o r m a n c e g p i l v s g y p c r e c o n i t i o n( L V C S R)s s t e m s .A s e t d e s i n m e t h o d i s u e s t i o n g y g q i v e n b a s e d o n t h e e x t e n d e ห้องสมุดไป่ตู้ v o w e l t r i a n l e .T e s t s s h o w t h a t t h e g g c o m b i n a t i o n o f t h e n e w h o n e m e s e t a n d t h e n e w u e s t i o n s e t p q / ,t s u r a s s e s t h e i n i t i a l f i n a l i n e r f o r m a n c e .A l s o h e n u m b e r o f p p m o d e l i n u n i t s i s r e a t l r e d u c e d w h i c h i s m o r e c o n v e n i e n t f o r g g y r o c e s s i n s u c c e e d i n s s t e m m o d u l e s . p g g y : K e w o r d s l a r e o c a b u l a r o n t i n u o u s e e c h e c o n i t i o n v s r g y p g y c ( ;m ;v ;q L V C S R) o d e l i n u n i t s o w e l t r i a n l e u e s t i o n g g ;m a i n v o w e l s e t r i n c i l e p p