第十讲 语音信号处理第5章分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

• 连续型HMM(Continuous HMM,简称为CHMM):在连续HMM中, 由于可以输出的是连续值,不是有限的,所以不能用矩阵表 [bij ( X )dX ] 示输出概率,而要改用概率密度函数来表示。即用 表示:在 X 和 X dX 之间观察矢量的输出概率。这里 bij ( X ) 称 为参数 X 的概率密度分布函数,输出X 的概率可以通过 bij ( X ) 计算出来。 bij ( X )一般用高斯概率密度函数,由于 X 是多维矢 量所以要用多元高斯概率密度函数
其他一些特殊的HMM的形式
• 空转移(Null Transitions):在这种类型的HMM中,系统的 输出是与转移弧相联系的,允许不产生输出的转移,即从一 个状态转移到其他状态时,无观察符号(或矢量)输出。这 样的转移称为空转移。在连续语音识别系统中,单词或语句 的HMM都是由基元HMM的连接形成的,一般在连接时,一个基 元HMM的终止状态和一个基元HMM的初始状态相连接,这种连 接产生的转移弧就是空转移,如图5-6所示。所以在大词汇 连续语音识别系统中大量使用了这种模型。
a11 0 0 0 a12 a 22 0 0 a13 a 23 a33 0 a14 a 24 a34 a 44
• 另外从状态转移结构上HMM还有 其他的一些变体,如由图5-5(c) 所示的由两条并行的从左到右模 型组成的HMM,又称为HMM网络。 它不是一般的情况,是由标准模 型组合的变体,用于特殊的应用 场合。这种模型较复杂,所以性
• 从左到右型HMM(Left-to-Right HMM):所谓的从左到右模 型,就是指随着时间的增加,状态的转移只能是从左到右进 行或停留在原来的状态,而不能出现返回到以前状态的情况, 即从编号高的状态(如第状态)到编号低的状态(如第n-1 或n-2等等状态)跳转的情况(这实际上是一个时序的问题, 因为按照时间顺序,总是从编号低的状态向编号高的状态转 移)。因此,其状态转移矩阵具有如下的形式,它是一个上 三角矩阵,而表示终止状态的最后一行除了最后一个元素外 全为零(当终止状态没有自转移时,则最后一行全为零)。
能一般要比单个左右模型要好。
按照HMM的输出概率分布(B参数)分类
• 离散HMM(DHMM):离散HMM就是上面一直在介绍的 HMM。在这种HMM中,每一个状态的输出概率是按观 察字符离散分布的,每一次转移时状态输出的字符, 是从一个有限的离散字符集中按照一定的离散概率 分布选出的。在语音信号处理中,经过特征分析后, 语音信号先被分割成若干帧,每帧求取一个特征参 数向量,即每帧是用一个特征参数向量表示的。此 时若要使用离散HMM,则需要将语音特征参数向量 的时间序列进行矢量量化,通过矢量量化使每一帧 语音信号由特征参数向量表示转变为用码字符号表 示的形式。
bij ( X ) wijmbijm ( X ) wijm
m 1 m 1 M M 1 ( 2 ) p
2
ijm
1/ 2
1 t exp{ 1 2 ( X ijm ) ijm ( X ijm ) }
• 连续混合密度HMM为多个正态分布线性相加的HMM系统,当M 值较大(如M为4或5)时,系统的识别率较高,但其运算量 较大。另一方面,每个模型中每个状态的概率密度由M个正 态分布函数叠加而成,它比前者有更多的自由度,因而逼近 实际分布的效果更好一些,这样识别效果也会更佳,随着词 汇量的增加,这一优点更加突出,因而,对一些大词汇量的 与说话人无关的语音识别系统,连续混合密度HMM受到重视。
回顾 5.5隐马尔科夫模型的各种结构类 型 5.6隐马尔科夫模型的一些实际问 题
5.5 隐马尔可夫模型的各种结构类 型
按照HMM的状态转移概率矩阵(参数)分类
• 各态历经型或遍历型HMM(Ergodic HMM) :严格的讲,所 谓的遍历模型就是经过有限步的转移后,系统能达到任何 一个状态。即系统从一个状态允许转移到任何一个状态。 在某些应用系统中,常遇到的是一步遍历模型,即经过一 步跳转,系统可达到任何一个状态。这样的HMM的状态转 移矩阵中的每一个元素均为大于零的数,没有零元素。显 然,各态历经型HMM不符合时间顺序的要求,因为它可以 回到以前到过的状态,所以只能用于不要求时间顺序的语 音信号处理,如:与文本无关的说话人识别等。
bij ( X ) P( X | i, j )
1 ( 2 ) p
2
ij
1/ 2
1 t exp{ 1 ( X ) ( X ) ij ij ij } 2
• 根据协方差矩阵是全协方差矩阵还是对角协方差矩阵,可以 把连续HMM分成全协方差矩阵CHMM和对角协方差矩阵CHMM。 • 另一方面,由于在实际的语音信号处理系统中,往往用一个 高斯概率密度函数不足以表示语音参数的输出概率分布,所 以一种常用于语音信号处理的概率密度函数,称之为“高斯 元混合密度”,即用多个高斯概率分布的加权组合来表示输 出概率密度函数。
bij ( X ) P(k | i, j ) N ( X , k , k ) wijk N ( X , k , k )
kຫໍສະໝຸດ Baidu1 k 1 J J
• 这样,对于离散HMM,半连续型HMM用多个正态分布线性相加 作为概率密度函数弥补了离散分布的误差;对于连续型HMM, 半连续型HMM用多个各状态共有的正态分布线性相加作为概 率密度函数弥补了参数数量多,计算量大的缺陷。
• 半连续型HMM(Semi-Continuous HMM:简称为SCHMM):离 散HMM的模型参数少,对训练数据量要求不高,而且离散HMM 的计算量较少,易于实时实现,但是离散HMM的缺点是识别 精度不高。连续型HMM虽然不使用离散概率分布不需要对输 入信号进行量化,从而提高了识别率,但这是以运算量的增 加为代价的,而且连续型HMM尤其是连续混合密度HMM的模型 参数教多,训练数据不够时训练的模型精度较低。为了结合 这两种模型的优点,弥补这两种模型的缺点。人们提出了半 连续型HMM,它的输出概率的形式如下式所示:
相关文档
最新文档