基于连续状态HMM的汉语语音识别方法

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1引言
现在隐马尔可夫模型 M 己 语音信号处理的 担M ) 成为 重要方法被广泛 地应用到语音识别等领域【 2 1 ] , 0
然而由于传统的H MM在每个状态处理的各帧语音信号都与前后的时间顺序无关, 所以影响了H MM描述
语音信号时间相关等动态特性的能力,降低了 语音识别的性能【。 3 针对这个问 ] 题,本文提出了 连续状态
4结论
本文提出了一种适合于汉语语音识别的连续状态H M 的设想, M 并利用D 匹配算法实现了这一设想。 P 通过对不特定话者汉语孤立字词语音识别实验, 证明了这种方法能够较好地改善 H MM表述语音信号时间
相关等动态特性的能力, 提高语音信号的识别性能,是一种有效的汉语语音识别方法。
参考文献:
汇 L ho HSzk ad aaa aA m asn d o Poaiy cos M tog Soe Dg Rcgi n MIE T A S N 3 . a, uui S kgw , C pro S y r bi Fntn iH Ms uh kn i eoni , C , N . F ] Z . n . N " o i t f b l u i n u t h r p it t " o R I
ad S .oE 8 .o p. 9 7 ( 9) n S TV l 7- N . p 6- 5 5 Y . D 6 6 6 1 . 9
[新 康永 音声 识,共 版社( 8 . 4 美 厂 认 ’ 立出 1 ( 7 1 ) 9
ห้องสมุดไป่ตู้
IC P L 7 181319) C C O ' p . 8( 7. 9 p 7- 9
[ L . b e BHJagFna ets pe Rcgi n P R ncHl 1 3 2 .R i r .. n, udm n loSe h oni , T P te l 9 ) ] a n , u " R a f c e t " r i a. 9 o e (
() 4
川 g,( op"1 . ) 这里 l PSA g ( , P( 分别表示 下面三个状态转移 的转移概率 o P( l PS j l PS力 g , o P )o 3 2 g
q( 2j 1- j) ( 一, ) i ) ( 一, ) i )。 ( 一 , ) i ) q( 1 一 - j) ( 1 一 - j) i 一 > ( , i j 1> ( , i j 2> ( , , q ,
I 受教育部科学技术重点项目 ( o 002 N : 8 )和国家自 3 然基金 ( o 6425)资助; N : 708 0 基金项目:本项「 曹建林, 江苏职业信息技术学院副院长, 男, 副教授, 东南大学在职硕士研究生,F . 要从事语音信号 处理的研究。 m i E a: l 作者简介 :
表示。
Gi 一)l P ;} ( 2 1 o u_力 -, 十 g , j +op ; l ps1 l ( I o p( g y j+ g ,) ) Gi1 一) p , ( , 1 l (} 一 j +o y j g ) Gi ) m (j= a , + P( l PSj o 2 9 ) Gi1 一) p , ( , 2+ ( } 一j l y, o g ’ )
Co - e u w - n' H O , U -n Cio扩 aJni, o y g Z A L Z O ar il' a n , u a , G i H
(ag cl e frao tho g, s wr 101 Jns oe oio tn nlyJn u i 6 , J u g f m i e o ag u 24 ・ l n c 106 ' u e t eiRd Eg e i Dpr e , i , 9 S t a Uirt i ni en e t n N nn 20 ) o h s n s a o n rg am t a g v y j
识 时 于 语 信 序 , 入 音 号 列. 用() 和 个 型 行。_ 配 给以 大 分 模 所 应 别 对 输 利 4式 各 模 进 P 。 最 得 的 型 对 匹
的类别即为识别结果。
3识别实验和结果
为了 价 述识别 法, 们在实 环 录 评 上 方 我 验室 境下 取的1个 5 5 ) 语 其中 人说3个不 0 人(男、 女 的 音, 每 0
H MM 的设想。 它把语音信号样本的每一帧特征矢量都看作是 H MM 的一个状态, 这样就能较好地描述语 音特征矢量的帧间相关信息,改善了H MM 的动态特性。并且我们把 D P匹配算法引入到连续状态 H MM 的学习和识别中,较简便地实现了上述的设想。
2连续状态 HM的原理 M
对 参 样 信 = 2 . , 特 矢 的 间 列 一 马 可 过 。 果 每 考 本 号X 1 . .J 其 征 量 时 序 是 个 尔 夫 程 如 把 一 于 zz . . , 毛.C
同的字词, 每词说 6 遍共 10 个语音。采用 1 阶LC倒谱参数和差值倒谱系数的混合特征参数作为识 80 2 P
别的特征矢量集进行识别。 用每个字词的前 3 遍即90 0 个语音进行训练, 得到每个字词的模型参数。 然后
用每个字词的后 3 遍即90 0 个语音进行测试。实验结果表明1 人的平均识别率是9. 0 7 %" 3
[ L ho YKby h a Y i i e gi n Cis Cnnos e Bs o t Ie ao o Poec P s iIo ao, 1 . a, oa s n .i , c ni o h e o i u Se h e n n g tn hn i a ro c r tn ] Z . a i N m " o t f n e tu p c a d h t ri f t n o d n m i " d R o e d f
() 1
这里尸是一个状态序列的函数。
( 2 ) ( 3 )
对于 () 我们 用D 匹 算 1 式 可以 P 配 法找出 得PY 最大的 使 () 最佳路 数F 对于 对称型D 路径 径函 。 非 P [ 4 ]沿着最佳路径函 , (, 点到 ( j 点的 数F 从 1 1 ) i ) 最大累 1 积得分G j 的 ( ) 递推式可以 () i , 用 4 式来
PY 二 ()
I l Y) ,; (q j) Py PiI,,, x) ) o (,( ,PjI (I (q ,,( (x( ) 一 ) ; - ] q
F=c1 c2…cq …cQ ( , ) () () ( ) cq =(qIq) () i )() (

个特征矢量看作马尔可夫过程的一个状态,则对于输入信号时间序列
夕 ,. . 7在 刻一q i 推 时 状 毛( 毛)移 情 下 序 Y 概 二, Y. , 时 i1) ( 移 , 态 - 向 ( 的 况 , 列 的 率 vy ; , . 2 . Y (向 q ) I q q 转 )
PY 可以 () () 用 1 式所示的一般形式表示。
基于连续状态 H MM 的汉语语音识别方法
曹建林 ‘ 郭午阳 2 , 2 ,赵 力 2 ,邹采荣 2
( ’ 江苏信息 职业技术学院,江苏无锡 246; 东南大学无线电 1 1 0 工程系, 江苏南京 209) 1 6 0
R cgio Me o o cie sec B sd s i H eon i t n t d h s peh e o e a MM h f e n a n l r
相关文档
最新文档