基于HMM和神经网络语音识别

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

基于HMM和神经网络的语音识别

摘要：随着计算机技术的不断发展和信息技术的不断进步，各类智能机器也逐步进入到人们的生活中。语音识别是一种前景广阔、社会效益广泛、经济效益明显的技术，在快速发展的同时也不可避免地产生了一些问题。本文主要针对基于hmm和神经网络的语音识别系统进行了细致的分析，期待能对我国语音识别系统的研究和实践提供有效的借鉴和参考。

关键词：语音识别；神经网络；隐马尔可夫

中图分类号：tn912.34 文献标识码：a 文章编号：1007-9599 （2012） 24-0110-02

语音识别简单来说，就是让机器听懂人类语言表达的意思。在人工智能的研究领域里，语音识别技术更是人机实现对话的的有效媒介。现今的语音识别技术主在语音拨号、语音控制及语音导航等方面有着普遍的应用。

1 基于hmm的语音识别研究

1.1 隐马尔可夫模型定义

hmm就是hidden markov model，即隐马尔可夫模型。hmm是统计分析模型的中的一马尔可夫链的一种，隐马尔可夫模型和传统的马尔可夫模型相比，最明显的不同是无法直接观察到它的状态。随着计算机技术的时步，现今的隐马尔可夫模型的应用除了语音识别研究领域外，在机器翻译、生物学及基因组学等相关领域也均有应用。

1.2 基于隐马尔可夫模型的语音识别

在开展基于hmm的语音识别系统研究之前，要先解决hmm模型的两个基本问题。

（1）隐马尔可夫模型型的两个基本问题

在 hmm 模型解决实际遇到的应用问题中，其中模型识别、状态转移有模型训练等两个基本问题一定要先行解决：

第一，模型识别问题。观察序列和模型属于已知，应该怎样计算由这个模型产生这个观察序列的概率？这个问题的根本就是必须选取合适的方法从多个模型中挑出和观察序列最为匹配的模型，针对该问题，可有用“前向”算法解决。

第二，状态转移问题观察序列和模型属于已知，怎样选出一个符合要求的状态序列，使之地产生，即选取合适的方法选出最佳的状态序列？这个问题的根本就是估计出模型出现观察序列时最可能的路径。现在用，解决viterbi 算法解决此问题。

（2）解决hmm模型问题的方案

问题 1：前向算法的具体计算过程如下：

初始化：

递归：

终结：

其中，为从状态到的概率，为从状态到转移时输出的概率。问题2：viterbi 算法，按照viterbi 算法可以得到最佳准则，则viterbi 算法的计算过程如下：初始化：

递归：

终止：

最佳路径为：

2 基于神经网络的语音识别

神经网络是模拟人类脑部结构及脑部功能的信息数据处理系统，它由无数的神经元节点相互根据特定方式彼此联结，形成网络。语音识别应用神经网络是个连续的过程，这个过程主要包括有语音输入、预处理、语音特征提取、时间规整网络及神经网络进行网络训练分类和网络识别后，最终给出识别结果。语音信号由预处理及特征提取处理之后，紧接着是由时间规整网络对其进行处理，把语音信号和数据提取至神经网络进行输入需要的特征矢量具有一致的

维数。由于语音识别在实际应用时，语音信号会因为人的发音速度、声音高低及强度的不同而有所差别，即使同一个人的发音也不可能在任何时间内都相同。所以基于神经网络模型的语音识别，因为神经网络对应的输入层一定要输入矢量的维数一致，因此必须借助于时间规整网络，把规整与合并不同的时间内，不同的声音产生的不同强度和语音信号的特征矢量，以便最后提取到的语音特征矢量序列与神经网络输入层要求的矢量维数一致。

3 基于hmm模型和神经网络的语音识别实验研究

（下转第127页）