LD3320语音识别模块开发说明SigmaTech_voice_V1.0
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
西格玛科技语音识别模块用户手册
硬件版本:Voice_V1.0
By hixusir
2014年8月21日
前言及声明
感谢您购置西格玛科技开发的SigmaTech_voice_V1.0非特定人语音识别模块(以下简称语音模块)。
本用户手册针对软、硬件应用开发工程师编写,包含硬件接口示意图、管脚定义、学习例程等内容。
为了确保应用开发顺利进行,在进行学习之前请仔细阅读手册。
我们已尽最大努力以保证本手册的准确性。
然而,如您有任何疑问或发现错误,可直接与我们联系,我们将十分感激。
本文件包含西格玛科技的私有信息,在没有西格玛科技书面许可的情况下,第三方不得使用或随意泄露;当然,任何在没有授权、特殊条件、限制或告知的情况下对此信息的复制和擅自修改都是侵权行为。
本店承接毕业设计、中小项目开发,价格公道。
目前已经有二十几个成功案例,擅长领域:zigebee无线传感网络,labview上位机开发,语音识别,GSM发短信打电话,单片机开发,matlab等。
本店另有大学生宿舍神器酷毙灯、智能插座、定时插座、蓝牙防丢器、智能家居红外控制器等成品在售。
技术支持: 阿里旺旺:xu12316;QQ交流群:371191587;邮箱:hixusir@,淘宝店地址是 本模块的供电电压是3.3V,切记!利用USB转TTL下载板下载程序时请选择3.3V档。
因上电烧毁,您需要支付材料费用和运费维修。
1.概述
非特定人语音识别模块以LD3320 语音识别芯片为核心。
LD3320 芯片是一款“语音识别”专用芯片。
该芯片高度集成化,外围只需要增加少量的器件就可以构成完整的语音识别方案。
该芯片是基于非特定人语音识别,任何人只要说出的正确的识别语句,都可被识别,而不需要事先进行训练。
识别语句以汉语拼音字符串的形式送入芯片进行识别。
每条识别语句可以由单字、词组、短句组成。
每条识别语句最多支持10 个汉
字或79 个字节的拼音串。
受不同的麦克风灵敏度的影响,使用不同的麦克风可能在识别率和识别距离方面会有不同。
但通常情况识别率能达到90%。
另外该芯
片支持MP3 语音播放功能,可满足设计时播放语音提示的需求。
该芯片支持并行和串行两种接口,串行方式可以简化与其他模块的连接。
本用户手册使用LD3320 语音模块搭载了单片机板,语音模块使用并
行口与单片机进行通信,下载程序需要使用USB转TTL电平。
本模块的特点是性价比高,功能简单实用,感谢您的使用。
2.硬件接口
本开发板保留了6个接口,实现串口通信功能的Vcc,RXD,TXD,GND; IO口P1.6,P1.7。
本模块的供电电压是3.3V,切记!因上电烧毁,您需要支付材料
费用维修。
3.例程修改
本节讲述的例程基于语音模块单片机。
程序中关于管脚定义
请参考原理图。
测试程序中的语音命令共有四条,分别是“打开”、“关闭”、“停止”、“恢复”。
测试程序实现的功能是上电后,LED点亮,稍等几秒后,这时如果用户说“打开”,则P1.7为低电平,P1.6为高电平,串口上会出现11,;如果用户说“关闭”,则P1.7为高电平,P1.6为低电平,串口上会出现22;如果用户说“停止”,则P1.7为低电平,P1.6为低电平,串口上会出现33;如果用户说“恢复”,则P1.7为高电平,P1.6为高电平,串口上会出现44。
程序流程图如下图所示。
下面讲述如何修改语音命令。
(1)在user.c 文件中修改控制命令。
控制命令也是以汉语拼音字符串的形式保存在一个字符串数组中,每个汉字之间应留有一
个空格字符。
例如“打开”的汉语拼音字符串为“da kai”。
注意保存字符串的数组为二维数组,下标1 为控制命令的个数,下标2 为控制命令最长的字符串的个数。
在测试程序中,定义
了5 条控制命令,分别为"","da kai","guan bi", "ting
zhi","hui fu"。
第一条为空字符串,第二、三、四、五条才
是真正需要识别的控制命令。
用户可根据自己的需求来修改字
符串和数量。
也可加入一些垃圾关键词用以提高抗误识别能力。
用户可根据自己的需求来修改字符串和数量。
(2)在user.h 文件中修改宏定义。
当一条语音命令被识别后,语音芯片将输出该命令的识别编号。
一条语音命令的识别编号可以简单地理解为该命令在二维数组中的存储顺序。
例如控制命令“打开”在数组的存储顺序为1,该命令的识别编号则为1。
又如控制命令“关闭”在数组的存储顺序为2,该命令的识别编号则为2。
所以为了更直观地
表示识别编号,作了宏定义,见下图。
程序中会看到以下的语句,
InitLT8900();
// delayMs(20); spiWriteReg(7, 0x00, 0x00);
// 2402 + 48 = 2.45GHz
spiWriteReg(52, 0x80, 0x00); // 清空发送缓存区
// 发送5个字节
spiWriteReg(50, 1, 0x61); spiWriteReg(7, 0x01, 0x30);
// 允许发射使能
// while (PKT == 0);
貌似这些跟语音识别没有关系,恭喜您!您猜对了,这个程序其实隐藏了无线数据传输功能,使用的LT8900无线模块,这些程序您可以忽略。
我们会在第二代模块中增加无线传输功能,方式主要有三种:LT8900,NRF2401,ZigBee,敬请期待,如果您急需使用无线功能可以跟我联系。
4.下载程序
本模块的单片机是3.3V供电的STC89LE52RC,
⑴准备好一个USB转TTL下载小板或STC单片机下载器。
一定要是
3.3V的,淘宝上这东西挺多的,也向我店索要购买链接,同样3.3V
供电模块也可以向我店索要购买链接。
RXD和TXD交叉相连。
⑵下载主控单片机ISP 烧写软件。
可到STC 官网下载最新版本的
ISP 烧写软件。
本手册以V4.83 为例。
运行STC-ISP-V4.83,软件界面如图所示。
(3)选择单片机型号“STC89LE52RC”,点击【打开程序文件】按钮,在弹出的“打开”对话框中选择需要下载的目标文件。
选择串口号,请注意应选择USB 转换的串口号。
(4)点击【Download/下载】按钮。
开始下载,再上电。
(STC单片机需要冷上电下载程序,可以百度)。
(5)等待软件下载进度条100%后,软件升级完成。
最后强调:
本模块的供电电压是3.3V,切记!利用USB转TTL下载板下载程序时请选择3.3V档。
因上电烧毁,您需要支付材料费用和运费维修。
技术支持: 阿里旺旺:xu12316;QQ交流群:371191587;邮箱:hixusir@,淘宝店地址是。