语音控制 语音技术

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

语音控制

摘要:本文主要简要介绍了语音控制的发展与用途,特别讲诉了语音识别的理论分析,包括语音信号的预处理,特征矢量的选择与提取等等。再由短时能量分析,线性预测等理论知识,进行了语音控制理论分析的相关改进。将此刻前面的信号进行短时能量分析,得到一个值,来判断其幅度的大概发展趋势。最后再用线性预测的原理,得到另一个值。由此得到的两个值,我们可以进行简单的对未来幅度的预测,进行另外一个信号的幅度控制。

关键字:语音控制;语音识别;短时能量;线性预测;

青海民族大学学士学位论文

Abstract:

This paper briefly introduces the development of voice control with USES, especially telling about the speech recognition theory analysis.The analysis includs the speech signal pretreatment, the characteristic vector selection and extraction, and so on. Then by the short-term energy analysis and linear prediction theory knowledge, the theoretical analysis of voice controling improves. the signals now front short-time energy analysis, gets a value, to judge its amplitude is probably development trend. Finally by linear forecast of principle, gets another value. Thus gaining two value, we can conduct simple to predict future amplitude, controling another signal amplitude.

Keyword:

V oice control; Speech recognition; Short-term energy; Linear forecas

2

语音控制

目录

第一章.绪论 (4)

第二章.语音控制理论知识 (5)

2.1语音控制技术的发展 (5)

2.2语音识别原理 (5)

2.1.1 语音信号的预处理 (6)

2.1.2 特征矢量的选择与提取 (6)

2.1.3 动态时间归整算法 (7)

2.3语音合成技术 (8)

第三章.语音控制的改进 (8)

3.1短时能量及短时平均幅度分析 (9)

3.1.1幅度分析的依据: (9)

3.1.2短时能量函数和短时平均幅度函数 (9)

3.1.3短时平均幅度函数和能量函数的作用 (9)

3.2 线性预测分析的基本原理 (10)

3.2.1线性预测分析的基本思想: (10)

3.2.2求解线性预测系数ak (11)

3.2.3用e(n)和ak求x(n)(合成) (15)

3.3综合处理 (16)

第四章.具体语音信号实现 (17)

结论 (20)

参考文献: (21)

致谢语 (22)

3

青海民族大学学士学位论文

第一章.绪论

语音技术相对其它计算机技术而言,是一门还很年轻的计算机技术。语音技术研究在很早就有了,在1995年后个人计算机的计算和处理功能更加强大后逐步开始有一些应用。而今天语音技术在不知不觉中开始逐步走入了我们的生活,比如我们今天使用的中国移动电话客户服务系统实际上就是一个语音系统在我们生活中的应用。

本文主要分析了语音技术中语音控制的相关内容,即进行的相关改进。而在分析语音控制之前,说明了语音识别的理论原理。然后简要介绍了相关语音控制软件的应用。得出一般语音控制的应用都是发出语音命令,计算机等随着命令做出相应的操作。那么得出一个问题:是否可以进行语音对语音的控制?由此下文进行相关语音理论的分析,解决了这个问题。其中用到了语音的短时能量分析,线性预测等理论知识。

4

语音控制

第二章.语音控制理论知识

2.1语音控制技术的发展

人类作为唯一可以进行如此复杂语音交流的动物,得到了比别的动物更多的文化知识交流。可是人类的语言交流都是在人类间进行的,如何可以实现和别的动物,或者器械之间交流。比如控制计算机,控制机械,达到“君子动口不动手”的目的。这就是语音控制。而一般我们把这些相关的技术就叫语音技术。

语音技术在计算机领域中的关键技术有自动语音识别技术和语音合成技术。

让计算机能听、能看、能说、能感觉,是未来人机交互的发展方向,其中语音成为未来最被看好的人机交互方式,语音比其他的交互方式有更多的优势。

最早的语音技术因“自动翻译电话”计划而起,包含了语音识别、自然语言理解和语音合成三项非常主要的技术。语音识别的研究工作可以追溯到20世纪50年代AT&T贝尔实验室的Audry系统,此后研究者们逐步突破了大词汇量、连续语音和非特定人这三大障碍。

让计算机说话需要用到语音合成技术,其核心是文语转换技术(Text to Speech),语音合成甚至已经应用到汽车的信息系统上,车主可以将下载到系统电脑中的文本文件、电子邮件、网络新闻或小说,转换成语音在车内收听。

而在下面我们将分别对语音识别技术和语音合成技术进行简单的介绍:2.2语音识别原理

语音识别分为训练阶段和识别阶段:第一步是系统“训练”阶段,任务是建立识别基本单元的声学模型。第二步是“识别”阶段。根据识别系统的类型选择能够满足要求的识别方法,采用语音分析方法分析出这种方法所要求的语音特征参数,按照一定的准则和测度与系统模型进行比较,通过判决得出识别结果。通常在识别小词汇量的场合下,常采用如图1所示的模板匹配法。

5

相关文档
最新文档