基于arduino的语音控制系统

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于arduino的语音控制系统
(南京机电职业技术学院,林敏、李强,江苏南京210000)
摘要:随着科技的进步,家用电器逐步走向智能化,人性化。

不同的家用电器便利了我们的家庭。

但是随着人们对生活要求的提高,总会发现便中还有着不便,而面对着这些新的不便,创客们正在用自己的只会改造他们。

而我们就打算利用语音控制使我们的生活走向新的科技生活,让我们“靠嘴生活”。

本项目主要利用arduino结合语音控制模块以及相关的继电器等器件,实现语音控制电灯、插座等家用电器。

关键词:arduino、语音控制、家用电器
一、项目简介
(一)项目名称
基于Arduino的语音控制系统
(二)项目含义
随着科技的不断进步,语音识别与确认技术的也逐渐成熟,也越来越受到关注。

目前常见的语音控制是先录入语音段,进行声线对比的方式进行识别,这样一来,
不同的人说同样的话识别结果就会不一样,甚至同样的人说同样的话也可能发生识
别错误。

本项目采用专门的语音控制板,,只需设置相应的关键词,就可以进行识别,配合arduino控制器,从而进行相应的执行动作。

(三)项目产生的背景及原因
语音识别技术,也被称为自动语音识别(Automatic Speech Recognition, ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、
二进制编码或者字符序列。

与说话人识别及说话人确认不同,后者尝试识别或确认
发出语音的说话人而非其中所包含的词汇内容。

《天方夜谭》有一个著名的故事《阿里巴巴与四十大盗》,故事中有个神奇而富有的岩洞,而开启岩洞的方法就是采用的语音识别技术,与本项目相同的是:两
者的语音控制系统采用的都是关键词的识别,而并非语音对比。

可见人们对于语音
控制是向往已久。

(四)项目实施的必要性
语音识别一直是人类的梦想,故事“阿里巴巴和四十大盗”里面的“芝麻开门”
便反映了古人对语音产品的一个构想。

科技发展到今天,人类对语音识别的研究工
作始于20世纪50年代。

经过五十多年的努力和积淀,尤其进入90年代后,语音
识别技术进一步成熟,开始向市场提供商业化运作比较成熟的产品。

许多发达国家
如美国、日本、韩国以及IBM、Apple、 Nuance 、Microsoft等公司都为语音识别
系统的实用化开发研究投以巨资,但在生活中,语音识别似乎应用的不太多。

本项
目采用简单的结构,以语音识别模块为核心,实现了简单的语音控制应用,是语音
识别技术在生活中的一个应用实例。

现在,语音识别技术对于中小词汇的识别已经达到98%,如此高的精度,已经能够满足通常应用的要求。

再加集成电路技术的飞速发展,复杂的语音识别系统也
已经完全可以制成专用芯片并大量生产。

事实上,在西方经济发达的国家,大量的
语音识别产品已经进入市场且占据了一席之地。

随着2007年苹果手机助手siri的发布,语音控制系统开始进军手机市场,时至今日,智能手机的用户已经开始依赖语音的使用,可见,人们对于语音控制的使
用已经成为生活中的一部分。

可以预测在近五到十年内,语音识别系统的应用将更加广泛。

各种各样的语音识别系统产品将出现在市场上。

在短期内还不可能造出具有和人相比拟的语音识别
系统,要建成这样一个系统仍然是人类面临的一个大的挑战,我们只能一步步朝着
改进语音识别系统的方向一步步地前进。

至于什么时候可以建立一个像人一样完善
的语音识别系统则是很难预测的。

就像在60年代,谁又能预测今天超大规模集成
电路技术会对我们的社会产生这么大的影响。

二、项目实现的目标及实现方法
(一)项目目标
本项目实现的目标为:通过语音识别模块,识别人说话的意思,并发送信号给arduino,由arduino程序去控制相应的执行机构动作,例如:开灯,关灯,打开
或者关闭风扇,等等。

从而实现人机互动。

语音模块具备以下性能:
1、高准确度和实用的语音识别效果。

2、非特定人语音识别技术:不需要用户进行录音训练。

3、可动态编辑的识别关键词列表:只需要把识别的关键词以字符串的形式传送进
芯片,即可以在下次识别中立即生效。

比如,用户在51等MCU的编程中,简单地通过设置芯片的寄存器,把诸如"你好"这样的识别关键词的内容动态地传入芯片中,芯片就可以识别这样设定的关键词语了。

4、支持用户自由编辑50条关键词:在同一时刻,最多在50条关键词语中进行识
别,终端用户可以根据场景需要,随时编辑和更新这50条关键词语的内容。

(二)实现方法
本项目采用现成的语音控制模块,但是模块本身有局限性,就是只有2个控制引脚,只能控制2个外部器件。

大大限制了其实用性,好在其自带串口通信引脚,我们就用arduino(arduino本质上是一种AVR单片机,开发者对其进行了二次开发,大大降低了使用的难度)和其进行串口通信,arduino本身自带50多个控制引脚并且还可以扩展以获得更多引脚,这样,通过对语音控制模块编程,语音控制模块负责将声音转换为相应的代码(例如语音“打开电灯”对应“001”,“关闭电灯”
对应“002”),并通过串口发送给arduino,然后再对arduino编程,使其接受到相应的代码后,能执行相关操作(例如将arduino的13号输出脚通过继电器控制电灯,当arduino接受到“001”时候,使得13号输出脚输出高电平从而点亮电灯,接受到“002”时候,使得13号输出脚输出低电平从而关闭电灯)。

这样,需要控制多种电器的话,只需要依次对应在语音模块和arduino里增加程序即可!
三、结束语
本项目是南京机电职业技术学院2015年度三创大赛决赛的入围作品,通过近一个月的努力,我们最终调试完成,并在决赛中获得了二等奖的好成绩!
“车到山前必有路”并不是自我安慰,而是真实的心理现象。

每个人都有一些创意,但是当这些创意真的需要实现的时候,往往觉得无从下手。

其实,当你真的想完成这个项目的时候,通过查阅资料、请教他人、相互讨论等方式,是可以克服这些困难的。

当你敢想、敢做的时候,哪怕最终失败,你也是最优秀的创客!
参考文献
(1)simon monk ,创客电子电子制作DIY指南,人民邮电出版社,2014年
(2)simon monk ,arduino编程从零开始,科学出版社,2013年
(3)陈吕洲,arduino程序设计基础,北京航空航天大学出版社,2015。

相关文档
最新文档