【完整版】基于Matlab的语音识别系统的设计本科毕业论文设计
毕业设计基于MATLAB的语音信号分析和处置

基于MATLAB 的语音信号分析和处置【摘要】本设计用微软录音机收集了一段语音,对其进行了时域分析,频谱分析,分析语音信号的特性。
并应用matlab平台对语音信号加入了不同的噪声,进一步用双线性变换法设计了一个的巴特沃思低通滤波器,基于巴特沃斯模拟滤波器设计数字带通滤波器和用窗函数法设计了FIR低通滤波器,然后对加噪的语音信号进行滤波处置。
最后对比滤波前后的语音信号的时域和频域特性,回放加噪语音信号和去噪语音信号,对比研究了巴特沃思IIR滤波器和FIR滤波器在信号处置尤其是信号滤波去噪方面的特性和应用。
论文从理论和实践上比较不同数字滤波器的滤波效果。
【关键词】语音信号;频域特性; 时域特性; 滤波器1绪论课题的研究意义语言是咱们人类所特有的功能,它是传承和记载人类几千年文明史,没有语言就没有咱们今天人类的文明。
语音是语言最大体的表现形式,是彼此传递信息最重要的手腕,是人类最重要、最有效、最常常利用和最方便的互换信息的形式。
语音信号处置属于信息科学的一个重要分支,大规模集成技术的高度进展和运算机技术的飞速前进,推动了这一技术的进展;它是研究用数字信号处置技术对语音信号进行处置的一门新兴学科,同时又是综合性的多学科领域和涉及面很广的交叉学科,因此咱们进行语言信号处置具有时期的意义。
设计任务本设计先完成语音信号的收集,然后设计低通,高通,带通等滤波器对收集到的语音信号进行滤波处置,分析语音信号各频率段的特性。
并对所收集的语音信号加入不同的干扰噪声,对加入噪声的信号进行频谱分析,针对受干扰语音信号的特点设计不同的滤波器,对加噪信号进行滤波,恢恢复信号。
把原始语音信号、加噪语音信号和滤波后的信号进行时域变换和频域变换,画出它们的时域波形和频域波形图,从视觉角度比较分析滤波的效果。
也可将这3类信号进行播放从听觉角度感受滤波的效果。
2大体原理语音信号概述语言是人类创造的,是人类区别于其他地球生命的本质特征之一。
基于MATLAB的特定人语音识别算法设计毕业设计

本科毕业设计基于MATLAB的特定人语音识别算法设计摘要语言是人类交换信息最方便、最快捷的一种方式,在高度发达的信息社会中,用数字化的方法进行语音的传送、存储、识别、合成和增强等是整个数字化通信网中最重要、最基本的组成部分之一。
而在随着科技技术的发展的今天,除了人与人之间的自然语言通信之外,人与机或机器与机器之间也开始使用语言。
也就是因为如此,需要涉及到语音识别技术。
为了解决机器能“听懂”人类的语言,在科技如此迅猛发展的今天,语音识别技术一直受到各国科学界的关注,其对计算机发展和社会生活的重要性也日益凸显出来。
在孤立字语音识别中,如语音密码锁,汽车控制等领域,都运用到了特定人语音识别技术,也就是DTW算法,相对于HMM算法,DTW算法具有简单操作。
在相同环境下,两者识别效果相差不大,但是HMM算法要复杂得多,主要体现在HMM算法在训练阶段需要提供大量的语音数据,而DTW算法则不需要额外的计算。
所以在特定人语音识别当中,DTW算法被广泛使用。
在本次设计中,将运用到MATLAB平台来对语音信号进行处理及识别。
相对于C语言而言,MATLAB平台更能给用户提供一个简单易懂的代码分析窗口。
而且在个性化设计中,MATLAB可以为用户提供一个人性化界面--GUI。
所以,此次设计,通过MATLAB 平台建立一个GUI界面,接着对一组语音信号的输入进行预处理及端点检测,提取特征参数(MFCC),形成参考模块。
然后再对一组相同的语音信号输入进行同样的操作作为测试模块,与参考模块进行DTW算法进行匹配,输出匹配后的识别结果。
关键词:MATLAB GUI 端点检测MFCC DTWDesign of Speech Recognition Algorithm Based on Specific MATLABCai Jingzuo(College of Engineering, South China Agricultural University, Guangzhou 510642, China) Abstract:Language is a way of human exchange of information the most convenient, quick, highly developed in the information society, for voice transmission, by using the digital method of storage, recognition, synthesis and enhancement is one of the most important parts of the whole, the most basic digital communication network. While with the development of science and technology today, in addition to natural language communication between people, between people and machine or machine and machine are also starting to use the language. It is because of this, need to involve the speech recognition technology. In order to solve the machine can "hear" the human language, the technology is so rapid development today, the speech recognition technology has been the subject of scientific attention of all countries, the importance of computer development and social life is increasingly prominent.In the isolated word speech recognition, such as voice password lock, auto control field, are applied to the speech recognition technology, which is relative to the DTW algorithm, HMM algorithm, DTW algorithm has the advantages of simple operation. In the same environment, both the recognition effect is similar, but HMM algorithm is much more complex, mainly reflected in the HMM algorithm need to provide a large amount of speech data in the training phase, while the DTW algorithm does not need the extra computation. So in the speaker-independent recognition, DTW algorithm is widely used.In this design, will apply to the MATLAB platform to carry on the processing and recognition of speech signal. Compared with the C language, MATLAB platform can provide users with a simple code analysis window. But in the personalized design, MATLAB can provide a human user interface --GUI. So, the design, the establishment of a GUI interface through the MATLAB platform, and then a set of the input speech signal pretreatment, endpoint detection, feature parameter extraction (MFCC), the formation of the reference module. Then a group of the same speech signal input to the same operation as a test module, matching with reference to DTW algorithm module, output matching recognition results.Key words:DTW GUI Endpoint detection MFCC DTW目录1 前言 (1)1.1语音识别的历史背景 (1)1.1.1国外研究历史及现状 (2)1.1.2 国内研究历史及现状 (3)1.2 语音识别技术的应用及研究方向 (4)1.3语音识别系统的基本构成 (5)2 语音信号的数字模型及采集 (6)2.1概述 (6)2.2 语音的发音原理 (6)2.2.1 人的发声器官 (6)2.2.2 语音生成 (8)2.3 语音的听觉机理 (9)2.3.1 听觉器官 (9)2.3.2 耳蜗的信号处理原理 (10)2.4 MATLAB中的语音信号模型 (12)2.4.1 wavrecord函数 (12)2.4.2 wavplay函数 (13)3 语音信号的端点检测 (13)3.1 概述 (13)3.2 MATLAB的语音端点检测算法 (16)3.2.1 短时能量的计算 (16)3.2.2 过零率的计算 (17)3.2.3 端点检测的流程 (19)4语音信号非线性预测分析 (20)4.1 概述 (20)4.2 MFCC的基本原理 (20)4.3 实验结果 (21)5特定人语音识别算法-DTW算法 (22)5.1 DTW算法原理 (22)5.2 DTW算法流程及实验结果 (24)5.2.1 算法流程 (24)5.2.2实验结果 (25)6GUI设计 (26)6.1概述 (26)6.2 GUI界面的打开 (27)6.3作品演示 (29)7结论 (31)参考文献 (31)附录 (32)附录A语音识别主函数 (32)致谢 (38)本科生毕业设计成绩评定表1前言语言是人类交换信息最方便、最快捷的一种方式,在高度发达的信息社会中,用数字化的方法进行语音的传送、存储、识别、合成和增强等是整个数字化通信网中最重要、最基本的组成部分之一。
基于MATLAB的汉语数字语音识别系统

( 河南理工大学 电气学院 , 河南 焦作 440) 5 0 0
摘
要: 应用动 态时间规整 (T 为识别 算法, 用M C ( E 频率倒谱 系数) D W) 采 F CM L 为主要语音特 征参数 , 建立 了一 个汉
语数字语音识别 系统 , 中包括语音信号 的预 处理 、 其 特征 参数的提 取 、 别模板 的训练、 别匹配算 法; 识 识 同时 , 出利 提 用 MA L B图形用户界 面开发环境设计语音识 别 系统界 面 , TA 设计 简单 , 用方便 , 使 系统界 面友好 。
为 了体 现语 音 的动态 特性 及能 量对 语音 区分 的作 用 , 在 上述 语 音 特征 矢 量 中加 人 了一 阶差 分 MF C 还 C 及 其 一 阶能 量 和一 阶差分 能 量 , 中能量 参 数 用语 音 其
平 均能 量进 行 了归一 化 。
3 训 练 与识 别
路 径不 是 随 意选 择 的 , 因为任 何 一种 语 音 的发 音快 慢 都有 可 能变化 , 但是 其各 部分 的先后 次 序不 可能 改变 , 因此 所选 的路 径必 定是从 左 下角 出发 , 在右上 角结 束 ,
一
xk z ) / . (一 n (一 (e K. i ∑ )
尸 ) xkl (=l( 。 ).
。
( 1 )
( 2 )
其中 , 为 52 l 点。然后再求信号能量谱 , : 即 5 根据 ( ) ) 4 式进行频率弯折 , 在弯折后 的频率轴 上取等间隔滤波器组在频域对功率谱进行滤波.
4 对加窗后的语音信号进行 5 2 ) 1 点离散傅立叶变
换( F , : D T) 即
用过零率找到语音端点的相对精确位置 , 分解 出每一 个 语 音段 。 个实例见 图 2 其 中 5 , 表示无 声段 ,表示 有声 , 段 , 示 有 声 段 结束 后 的无 声 部 分 。从 图 中可 知 有 H表
基于matlab的语音识别

选取某一段短时域部分发音, 或者使用其内带的数字滤波器在频域中选取一段来发音, 通过 反复挑选发音段,可以发现人声与频率、音节长短、衰减快慢的定性关系。 (3)封装子模块 当需要对大量的声音信号作快速处理时(如不同人的同一发音或同一发音人的不同语 言) ,此时可以先在 simulink 中设计子模块:再利用子模块构建一个复杂系统,通过延迟线, 就可以使经过不同滤波处理的信号依次输出到耳机、音响等外设上。籍由这样连续的输出, 人耳就能更加清晰地便别出不同频率成分的影响。 可见,凭借 Matlab 强大的实时信号处理能力,只要在其中将程式模块组装完毕,就可 以将繁琐的仪器搭建、数模转换、信号分析等过程轻而易举地程序化,从而集中精力于研究 发声机理。
2.4 小波分析方法对语音识别的改进
在 matlab 中重写 DTW 等经典识别算法即可实现比较高精度的识别率。 但这些算法由于 物理例外使用傅立叶变换直接处理信号, 在其诞生之初本身即存缺陷。 傅立叶变换在实现将 信号转换至频域进行处理时,其缺点是只能对全时域信号作分析,而作为瞬变的语音信号, 其瞬时特征得不到反映。针对这种不足,前人提出了可以提高辨识精度的的改进方法,如通 过加窗实现“短时变换”等,但仍然存在缺陷,主要表现在: 1.时频局域化是一次性的,即窗函数的形状和大小是固定的,不能敏感的反应信号的 突变。而突变恰好是语音信号的特征之一。 2.由于信号分析中的“不确定性”原理,高频部分时域相对窄,即需较高的时域分辨 率而较低的频率分辨率;而低频部分,时域相对宽,即需较高的频率分辨率而较低的时域分 辨率。 [5] 而小波变换恰能满足这些要求。 它的窗宽随频率增高而减小, 符合高频信号高时域分辨 率的要求。故笔者考虑在算法中引入小波变换作为作为尝试作为改进。
根据发声原理低频部分标志着基音的特征所以当不同的人发同样的音时本实验中受试者都以正常方式发a音基频频谱峰值应大致相同而不同的人由于声带构造不同在基音大致相同的情况下都发同一个音高频谐波的衰减将会有很大不同体现在频谱上就是高频区频谱差异显著这是分辨不同人的特征之一
毕业设计(论文)-语音智能识别系统设计[管理资料]
![毕业设计(论文)-语音智能识别系统设计[管理资料]](https://img.taocdn.com/s3/m/3c7e9b3cda38376bae1fae0b.png)
目录1 绪论 (3) (3) (3) (4)DSP的应用前景 (4)2 方案论证与比较 (5)语音识别方案的论证 (5)语音的采集和处理方案论证 (6)控制部分方案论证 (6)显示部分方案论证 (7)接口部分方案论证 (7)3 硬件系统设计 (8)系统概述 (8)语音采集部分 (9)DSP处理部分 (9)控制——显示部分 (10)硬件电路设计 (11)DSP接口电路设计 (11)串行接口电路设计 (11)单片机串行通信接口设计 (12)LCD电路设计 (13)4 软件实现 (14)DSP的软件实现 (14)端点检测 (14)语音特征提取 (15)模式识别——动态时间规整(DTW) (16)FLASH引导的实现 (17) (18) (18) (18) (18)FLASH的烧写 (19)——显示板软件设计 (19) (19)LCD程序设计 (20)5 总结与展望 (22) (22) (22)致谢 (24)参考文献 (25)附录一 (26)附录二 (28)1 绪论语音识别技术发展到今天,特别是中小词汇量非特定人语音识别系统识别精度已经大于98%,对特定人语音识别系统的识别精度就更高。
这些技术已经能够满足通常应用的要求。
由于大规模集成电路技术的发展,这些复杂的语音识别系统已经完全可以制成专用芯片,大量生产。
在西方经济发达国家,大量的语音识别产品已经进入市场和服务领域。
一些用户交换机、电话机、手机已经包含了语音识别拨号功能、语音记事本、语音智能玩具等产品,同时也包括语音识别与语音合成功能。
人们可以通过电话网络用语音识别口语对话系统查询有关的机票、旅游、银行信息。
调查统计表明,多达85%以上的人对语音识别的信息查询服务系统的性能表示满意。
可以预测,在近5年内,语音识别系统的应用将更加广泛,各种各样的语音识别系统产品将不断出现在市场上。
语音识别技术在人工邮件分拣中的作用也日益显现,发展前景诱人。
一些发达国家的邮政部门已经使用了这一系统,语音识别技术逐渐成为邮件分拣的新技术。
基于MATLAB的特定人语音识别软件开发与设计

基于MATLAB的特定人语音识别软件开发与设计本文将详细介绍基于MATLAB的特定人语音识别软件的开发与设计,从数据采集、数据预处理、特征提取、训练模型以及测试评估等方面进行介绍。
同时,本文还会对该软件的实时性、准确性、稳定性进行分析并进行改进优化。
一、数据采集数据采集是语音识别系统开发的第一步,也是最为关键的一步。
采集到的数据质量将直接影响后续的预处理、特征提取以及模型训练。
在采集数据时,应该尽可能保证采集设备的统一性,以便后续的数据处理与模型训练。
同时,采集的语音数据应具有较高的覆盖率和多样性,以便让模型具有更好的泛化能力。
二、数据预处理在数据预处理阶段,需要对采集到的语音数据进行一系列的预处理操作,例如去除背景噪音、去除重复数据、平衡数据分布等。
这些操作有助于提高预处理的效果,从而提高后续的特征提取以及模型训练的准确度。
三、特征提取特征提取是语音识别系统中最为复杂的一步,其目的是将原始的语音信号转化为易于处理的数学特征。
在特征提取中,需要使用一些特征提取算法,例如短时傅里叶变换、梅尔倒谱系数、线性预测系数等。
这些算法可以大大减少语音信号的冗余信息,提取出信号的主要特征,从而提高模型的分类准确度。
四、训练模型在模型训练中,需要选择适当的模型算法以及调整算法的超参数。
在语音识别中,常用的模型算法有隐马尔可夫模型、深度神经网络、循环神经网络等。
训练模型的过程中,需要使用一些评估指标,例如准确率、召回率、F1值等,以评估模型的优劣。
同时,在训练过程中,需要使用一些技巧,例如交叉验证、正则化、学习率衰减等,以优化模型的泛化能力。
五、测试评估在模型训练完成后,需要使用测试数据对模型进行评估。
在测试评估中,需要使用一些评估指标,例如准确率、召回率、误判率等,以评估模型的性能。
同时,还需要针对测试结果进行分析,从而找出模型存在的问题并进行改进优化。
六、实时性、准确性、稳定性改进优化在实际应用中,需要保证语音识别系统的实时性、准确性以及稳定性,否则无法满足用户需求。
基于Matlab的语音识别系统的设计本科毕业设计

摘要语音识别主要是让机器听懂人说的话,即在各种情况下,准确地识别出语音的内容,从而根据其信息执行人的各种意图。
语音识别技术既是国际竞争的一项重要技术,也是每一个国家经济发展不可缺少的重要技术支撑。
本文基于语音信号产生的数学模型,从时域、频域出发对语音信号进行分析,论述了语音识别的基本理论。
在此基础上讨论了语音识别的五种算法:动态时间伸缩算法(Dynamic Time Warping,DTW)、基于规则的人工智能方法、人工神经网络(Artificial Neural Network,ANN)方法、隐马尔可夫(Hidden Markov Model,HMM)方法、HMM和ANN的混合模型。
重点是从理论上研究隐马尔可夫(HMM)模型算法,对经典的HMM模型算法进行改进。
语音识别算法有多种实现方案,本文采取的方法是利用Matlab强大的数学运算能力,实现孤立语音信号的识别。
Matlab 是一款功能强大的数学软件,它附带大量的信号处理工具箱为信号分析研究,特别是文中主要探讨的声波分析研究带来极大便利。
本文应用隐马尔科夫模型(HMM) 为识别算法,采用MFCC(MEL频率倒谱系数)为主要语音特征参数,建立了一个汉语数字语音识别系统,其中包括语音信号的预处理、特征参数的提取、识别模板的训练、识别匹配算法;同时,提出利用Matlab图形用户界面开发环境设计语音识别系统界面,设计简单,使用方便,系统界面友好。
经过统计,识别效果明显达到了预期目标。
关键词:语音识别算法;HMM模型;Matlab;GUIABSTRACTSpeech Recognition is designed to allow machines to understand what people say,and accurately identify the contents of voice to execute the intent of people.Speech recognition technology is not only an important internationally competed technology,but also an indispensable foundational technology for the national economic development.Based on the mathematical model from the speech signal,this paper analyze audio signal from the time domain,frequency domain proceeding,and discussed the basic theory of speech recognition technology.Five algorithm are discussed:Dynamic Time Warping(DTW)、Rule-based Artificial Intelligence,Artificial Neural Network(ANN),Hidden Markov Model(HMM),HMM combined with ANN.The focus is put in the theoretical studies of Hidden Markov(HMM) model algorithm,and the classical HMM algorithm is improved.Speech recognition algorithm is realized in various programs,this article taking the method is to use Matlab powerful mathematical operation ability to realize the recognition of speech signal isolation. Matlab is a powerful mathematic software with a mass of toolboxes dealing with signal processing. It gives a terrific shortcut to the research of signal processing,especially the wave analysis. We can characterize the sound with key parameters such as intensity, frequency etc. In this paper, hidden Markov model (HMM) recognition algorithm using MFCC (MELfrequency cepstral coefficients) as the main voice characteristic parameters, the establishment of a Chinese digital speech recognition system, including the preprocessing of the speech signal,the extraction of characteristic parameters the training of the recognition template,identifying matching algorithm;the same time,the use of Matlab graphical user interface development environment designed speech recognition system interface,is designed to be simple,easy to use,friendly interface. Besides,to have a simple exploration of the voice recognition is another target.After statistics,recognition result obviously is made out as the expected goal.Key words:Speech recognition algorithm;HMM model;Matlab;GUI目录一、前言 (1)1.1语音识别的发展历史 (1)1.2语音识别研究现状 (1)1.3语音识别系统的分类 (2)1.4语音识别系统的基本构成 (3)1.5语音识别技术难点 (3)1.6语音识别发展前景 (4)二、语音信号分析 (4)2.1语音学知识 (4)2.1.1音素和音节 (5)2.1.2汉语的声调 (5)2.1.3语音信号产生模型 (6)2.2语音信号数字化和预处理 (7)2.2.1数字化 (7)2.2.2预加重处理 (7)2.2.3防混叠滤波 (8)2.2.4加窗处理 (8)2.3语音信号的时域分析 (9)2.3.1短时能量分析 (9)2.3.2短时平均过零率 (11)2.3.3短时自相关函数和短时平均幅度差函数 (12)2.3.4语音端点检测 (13)2.4语音信号的频域分析 (14)2.4.1滤波器组法 (14)2.4.2傅立叶频谱分析 (14)2.5特征参数提取 (15)2.5.1 LPCC倒谱系数 (15)2.5.2 Mel频率倒谱系数 (16)三、语音识别主要算法 (17)3.1动态时间伸缩算法 (17)3.2基于规则的人工智能方法 (18)3.3人工神经网络方法 (19)3.4隐马尔可夫方法 (20)3.5 HMM和ANN的混合模型 (21)四、隐含马尔可夫模型算法 (23)4.1 HMM的基本理论和数学描述 (23)4.2 HMM的三个基本问题及解决算法 (24)4.3 HMM算法的改进 (31)4.4 HMM的结构和类型 (33)4.5 HMM算法实现的问题 (34)五、基于Matlab环境下的语音识别算法实现 (35)5.1识别系统平台介绍 (35)5.2在Matlab中HMM算法的实现 (36)5.2.1端点检测 (36)5.2.2特征参数提取 (36)5.2.3训练和识别 (37)5.3实验结论分析 (38)六、结束语 (39)6.1回顾 (39)6.2展望 (39)七、致谢 (40)参考文献 (40)一、前言1.1语音识别的发展历史作为智能计算机研究的主导方向和人机语音通信的关键技术,语音识别技术一直受到各国科学界的广泛关注。
基于MATLAB的语音识别DTW算法设计

目录1概述 (2)1.1研究的目的和意义 (2)1.2国内外发展状况 (2)1.2.1国外研究历史及现状 (3)1.2.3国内研究历史及现状 (4)2语音识别系统的概述 (4)3 MA TLAB中的语音信号的采集 (4)3.1 wavrecord函数 (4)3.2 wavplay函数 (6)4语音信号的端点检测 (6)4.1语音信号端点检测的流程 (6)4.1.1短时能量 (8)4.1.2过零率的计算 (9)4.1.3双门限端点检测 (11)5语音识别参数提取 (12)5.1 MFCC的基本原理 (12)6特定人语音识别算法-DTW算法 (13)6.1DTW算法原理 (13)6.2DTW算法流程及实验结果 (15)7 GUI界面的设计 (16)7.1图形用户界面设计工具的启动 (16)7.3测试与分析 (18)总结 (20)致谢 (21)参考文献 (22)附件 (23)基于MATLAB的特定人语音识别算法设计摘要在高度发达的社会,语言是一种人类交流最方便的,最速度的信息,在高度发达的社会中,用数字化的方式举行语音的保存、传递、判别、加强和合成等是全部数字化通信过程中最基础、最重要的组成的一部分。
由于人类进入信息社会节奏加快, 语音信号处理方面的知识被越来越多的地方需要。
本设计主要在MATLAB平台下先语音信号的端点检测、预处理,然后提取特征参数,建立两个模块,一个为参考模块,一个为测试模块,然后通过动态时间归整技术(DTW)算法进行匹配,算出匹配结果。
最后在用户开发界面(GUI界面)直观地呈现出来。
本次设计录制0~10的数字做为参考库(model),测试库(test)中为需要测试及识别的语音,0的序号为11,1~9的数字以相应数字做为文件名的命名。
关键词:端点检测; MFCC特征提取;语音识别;DTW算法1概述1.1研究的目的和意义随着计算机技术和科技成果的的飞速发展,人们早已不再满足于让计算机做一些简单的科学计算和运算,而是向它提出了更高的要求,即要求我们的计算机向智能化方向发展,于是人们便开始了第五代计算机(即智能计算机)的研究。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
摘要语音识别主要是让机器听懂人说的话,即在各种情况下,准确地识别出语音的内容,从而根据其信息执行人的各种意图。
语音识别技术既是国际竞争的一项重要技术,也是每一个国家经济发展不可缺少的重要技术支撑。
本文基于语音信号产生的数学模型,从时域、频域出发对语音信号进行分析,论述了语音识别的基本理论。
在此基础上讨论了语音识别的五种算法:动态时间伸缩算法(Dynamic Time Warping,DTW)、基于规则的人工智能方法、人工神经网络(Artificial Neural Network,ANN)方法、隐马尔可夫(Hidden Markov Model,HMM)方法、HMM和ANN的混合模型。
重点是从理论上研究隐马尔可夫(HMM)模型算法,对经典的HMM模型算法进行改进。
语音识别算法有多种实现方案,本文采取的方法是利用Matlab强大的数学运算能力,实现孤立语音信号的识别。
Matlab 是一款功能强大的数学软件,它附带大量的信号处理工具箱为信号分析研究,特别是文中主要探讨的声波分析研究带来极大便利。
本文应用隐马尔科夫模型(HMM) 为识别算法,采用MFCC(MEL频率倒谱系数)为主要语音特征参数,建立了一个汉语数字语音识别系统,其中包括语音信号的预处理、特征参数的提取、识别模板的训练、识别匹配算法;同时,提出利用Matlab图形用户界面开发环境设计语音识别系统界面,设计简单,使用方便,系统界面友好。
经过统计,识别效果明显达到了预期目标。
关键词:语音识别算法;HMM模型;Matlab;GUIABSTRACTSpeech Recognition is designed to allow machines to understand what people say,and accurately identify the contents of voice to execute the intent of people.Speech recognition technology is not only an important internationally competed technology,but also an indispensable foundational technology for the national economic development.Based on the mathematical model from the speech signal,this paper analyze audio signal from the timedomain,frequency domain proceeding,and discussed the basic theory of speech recognition technology.Five algorithm are discussed:Dynamic Time Warping(DTW)、Rule-based Artificial Intelligence,Artificial Neural Network(ANN),Hidden Markov Model(HMM),HMM combined with ANN.The focus is put in the theoretical studies of Hidden Markov(HMM) model algorithm,and the classical HMM algorithm is improved.Speech recognition algorithm is realized in various programs,this article taking the method is to use Matlab powerful mathematical operation ability to realize the recognition of speech signal isolation. Matlab is a powerful mathematic software with a mass of toolboxes dealing with signal processing. It gives a terrific shortcut to the research of signal processing,especially the wave analysis. We can characterize the sound with key parameters such as intensity, frequency etc. In this paper, Markov model (HMM) recognition algorithm using MFCC (MEL frequency cepstral coefficients) as the main voice characteristic parameters, the establishment of a Chinese digital speech recognition system, including the preprocessing of the speech signal,the extraction of characteristic parameters the training of the recognition template,identifying matching algorithm;the same time,the use of Matlab graphical user interface development environment designed speech recognition system interface,is designed to be simple,easy to use,friendly interface. Besides,to of the voice recognition is another target.After statistics,recognition result obviously is made out as the expected goal.Key words:Speech recognition algorithm;HMM model;Matlab;GUI目录一、前言 (1)1.1语音识别的发展历史 (1)1.2语音识别研究现状 (1)1.3语音识别系统的分类 (3)1.4语音识别系统的基本构成 (3)1.5语音识别技术难点 (4)1.6语音识别发展前景 (5)二、语音信号分析 (6)2.1语音学知识 (6)2.1.1音素和音节 (6)2.1.2汉语的声调 (7)2.1.3语音信号产生模型 (8)2.2语音信号数字化和预处理 (9)2.2.1数字化 (9)2.2.2预加重处理 (9)2.2.3防混叠滤波 (10)2.2.4加窗处理 (11)2.3语音信号的时域分析 (12)2.3.1短时能量分析 (12)2.3.2短时平均过零率 (14)2.3.3短时自相关函数和短时平均幅度差函数 (15)2.3.4语音端点检测 (17)2.4语音信号的频域分析 (17)2.4.1滤波器组法 (17)2.4.2傅立叶频谱分析 (18)2.5特征参数提取 (19)2.5.1 LPCC倒谱系数 (19)2.5.2 Mel频率倒谱系数 (20)三、语音识别主要算法 (21)3.1动态时间伸缩算法 (21)3.2基于规则的人工智能方法 (23)3.3人工神经网络方法 (24)3.4隐马尔可夫方法 (26)3.5 HMM和ANN的混合模型 (27)四、隐含马尔可夫模型算法 (29)4.1 HMM的基本理论和数学描述 (29)4.2 HMM的三个基本问题及解决算法 (31)4.3 HMM算法的改进 (38)4.4 HMM的结构和类型 (41)4.5 HMM算法实现的问题 (42)五、基于Matlab环境下的语音识别算法实现 (43)5.1识别系统平台介绍 (43)5.2在Matlab中HMM算法的实现 (45)5.2.1端点检测 (45)5.2.2特征参数提取 (45)5.2.3训练和识别 (46)5.3实验结论分析........................................................................... 错误!未定义书签。
六、结束语.............................................................................................. 错误!未定义书签。
6.1回顾............................................................................................ 错误!未定义书签。
6.2展望 (48)七、致谢 (49)参考文献 (49)一、前言1.1语音识别的发展历史作为智能计算机研究的主导方向和人机语音通信的关键技术,语音识别技术一直受到各国科学界的广泛关注。
以语音识别开发出的产品应用领域非常广泛,有声控电话交换、语音拨号系统、信息网络查询、家庭服务、宾馆服务、旅行社服务系统、订票系统、声控智能玩具、医疗服务、银行服务、股票查询服务、计算机控制、工业控制、语音通信系统、军事监听、信息检索、应急服务、翻译系统等,几乎深入到社会的每个行业、每个方面,其应用和经济社会效益前景非常广泛。
因此语音识别技术既是国际竞争的一项重要技术,也是每一个国家经济发展不可缺少的重要技术支撑。
研究语音识别,开发相应的产品有着广泛的社会意义和经济意义。
语音识别中的说话人辨认的研究始于20世纪30年代。
早期的工作主要集中在人耳听辨试验和探讨听音识别的可能性方面。
Bell实验室的L.G.Kesta目视观察语谱图进行识别,提出了“声纹(Voiceprint)”的概念。
Bell实验室的S.Pruzansky提出了模版匹配和概率统计方差分析的声纹识别方法,形成了声纹识别研究的一个高潮。
60年代末和70年代初语音识别最重要的发展是语音信号线性预测编码(LPC)技术和动态时间规整(DTW)技术,有效地解决了语音的特征提取和时间不等长匹配问题,对特定人的语音识别十分有效。
研究特点是以孤立字语音识别为主,通常把孤立字作为一个整体来建立模板。