基于STM32的嵌入式语音识别模块设计

合集下载

相关主题

基于stm32的游戏设计

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

到特征矢量参数，通过特征建模建立训练语音的参考模型令，ＵＳＡＲＴ可用来扩展语音合成模块等外围串行设备。
库。在识别阶段，模块按照一定算法，将语音的特征矢量参数和模型
３．１主控制器芯片
库中的参考模型进行比较，相似度最高的输入特征矢量将被判定为
ＲｓＴＢ５’墅１２Ｉ
三２
ｊ１１ＥＳＴ４
Ｉ砑西ＳＴＭＣＬｋ￣Ｉ＿
Ｘ￣３Ｖ３ＡｖｅｒｙＶ３ＣＬＣ３Ｖ瓯３７
．
ｉ，醴Ｇ
ＥＩ ”
图３ＬＤ３３２０语音识别单元原理图
Ｆｌａｓｈ和ＲＡＭ，不用事先训练就能实现对非特定人的语音识别，而且识别准确率较高。
堡星童变量皇Ｉ
＼
／
ｌ是
设置寄存器设定芯片状态
设置寄存器准备开始识别
设置寄存器１ｃ开启ＡＤｃ
参考文献
［１］张丽娟。王申良．基于ＳＴＭ３２的语音识别系统的设计与实现［Ｊ］．黑龙江科技信息，２０１Ｏ（２）．［２］陈景帅，周风余．基于ＳｐｅｅｃｈＳＤＫ的机器人语音交互系统设计［Ｊ］．北京联合大学学报（自然科学版２Ｏ１Ｏ（１）．［３］祝常健，胡维平，叶佳宁．基于ＨＭＭ语音识别技术在ＡＲＭ平台的实现［Ｊ］．微计算机信息，２００９（５）．［４］鄢仁辉．嵌入式实时操作系统Ｃ／ＯＳ—ＩＩ的移植实例［Ｊ］．现代电子技术。２０１１（２）５．
过ｖＸＬＤ３３２０芯片为核心的硬件电路实现语音识别，使用嵌入式操作系统Ｃ／ＯＳ－Ⅱ实现任务调度和外围设备管理。
’
关键词：语音识别ＡＲＭＬＤ３３２０
中图分类号：ＴＮ９１２．３４
文献标识码：Ａ
文章编号：１００７—９４１６（２０１２）０６—０１５２—０２
行
Ｉ外暖—电—路Ｉ
制ＵＳＡＲ他设
器
鲁
图２硬件电路结构图
Ｐ０ｌ１ｒ１＝
￡３－ｃ
瞄ｄ＿‘ －ｌ＿【ＰＳ６＝
配ｌｃ＝￡Ｚ８）妇匦
。ｋ。ｆ。ｌ。—Ｖ— ＣＣ３Ｖ￣
ＢＷＱｌｔＨＢ蕊
Ｉ衄譬ｌＩ’
管理工作，每一个界面的应用都由专门的系统来实现，如果应用需和程序不发生作用，实现系统功用的伸缩。
求与应用形势发生了变化，不需要对整个系统做完全的修改，只需
６．６易维护性
要对与相应的功能对应的子系统和组件就可以实现应用的改变，而
应用系统的分层独立设计为系统的维护提供了便利，系统的任
音芯片”的模式。第一种方式计算相对复杂、开发周期长，第二种方
和基于ＰＣ的语音识别系统相比，嵌入式语音识别系统运算速法结构简单，微处理器计算量低，可靠性高、开发周期短。本文介绍
度、内存容量有限，但体积小、功耗低、可靠性高、安装灵活，在智能的语音识别模块以嵌入式微处理器为核心，外围是非特定人语音识
设计开发
赫ｌ数字技术五鬲栅
基于ＳＴＭ３２
贾晶
（江西农业大学江西南昌３３００３８）
摘要：本文介绍了￣；２ＡＲＭ为核心的嵌入式语音识别模块的设计和实现，模块选用ｓＴ公司３２位处理器ＳＴＭ３２Ｆ１０３Ｃ８Ｔ６为核心处理单元，通
量较小，启动识别功能需要较大的音量，但抗干扰性较好。经过对比还发现，在噪声较多的环境中模块的稳定性、实时陛均有所降低。
实验，本文介绍的模块中设定值为４３Ｈ。（４）响应中断。麦克风采集到声音时，就会产生中断信号，中断
程序会根据寄存器值分析结果，ｃ５寄存器中的答案是得分最高、最可能正确的答案。
（３）开始识别。图４是开始识别流程，ＡＤＣ是麦克风输入通道，功识别的比例。
ＡＤＣ增益是麦克风音量，建议在４０Ｈ－６ＦＨ间赋值，值大表示ＭＩＣ音
测试结果表明，模块在室内环境下对非特定人的语音识别率在
量较大，语音识别启动越敏感，误判的概率也较高；值小代表ＭＩＣ音９６％以上，噪声较多的医院环境下语音识别率在９２％左右。通过测试
家电、消费电子等领域具有优势，逐渐成为了研究的热点。
别芯片及相关电路，模块选用ＩＣＲｏｕｔｅ公司的ＬＤ３３２０￣片作为语音
识别芯片。
２、模块整体方案
语音识别包括训练、识别两个阶段，在这两个阶段中，都必须对３、硬件电路设计
输入的语音信号进行预处理和特征提取。语音识别的基本原理如图
１、引言
识别结果。根据识别对象，语音识别分为特定人识别和非特定人识
语音识别是将人类语音信号进行预处理、特征提取，然后和测别。特定人识别的识别对象是特定用户，非特定人识别的识别对象
试、训练后存储在计算机中的标准模型进行比较，得出判定和识别是普通用户，需要采集多人语音进行训练，才能达到较高的识别率。
采用Ｃ语言编写，执行效率高、占用空间小、可扩展性强，最小内核个候选识别语句，它们是１０个以内的汉字或７９个字节拼音串。本文
仅有２ＫＢ。Ｃ／ＯＳ－ＩＩ是可剥夺型内核，任务优先级划分非常重介绍模块的对话管理数组如表２所示。
要。从分层化、模块化的设计理念出发，主控系统任务优先级划分如
ＬＤ３３２０和ＳＴＭ３２Ｆ１０３Ｃ８Ｔ６通过并行方式相接，其控制信号
面、、面和复位信号丽、中断返回信号ＩＮＦＢ和ＳＴＭ３２Ｆｌ０３Ｃ８Ｔ＿６直接连接，使用１０ｋ上拉电阻提高系统稳定性。存图３中，ＭＢＳ（１２￣Ｊ脚）是麦克风的偏置，并接了ＲＣ电路，确保向麦克风提供稳定的电压。
结果。当前主流的语音识别技术多基于统计模式，模型训练过程中
现有的嵌入式语音识别系统主要有两种方式，…种是在嵌入式
算法复杂、运算量大，需要ＰＣ或工控机实现，在一定程度上制约了处理器中直接调用语音开发包，另一种则采取 “嵌入式处理器＋语
语音识别技术的发展。
表２对话管理数组设计
表１所示。除ＯＳＴａｓｋＳｔａｔ、ＯＳＴａｓｋＩｄｌｅ是系统自带任务外，其他任务由用
户创建。Ａｐｐ＿ＴａｓｋＳｔａｒｔ是系统首个任务，负责初始化时钟和底层设
名称识别数组行为数组
存储内容待识别语句行为编号
数组定义ＩＮＴ８Ｕ—Ｒｅｃｏ［５０］［７９］。ＩＮＴ８一Ａｃｔ［５０］［６】
本文介绍的语音识别模块主控制器选用ＳＴ公司的
ｓＴＭ３２Ｆ１０３Ｃ８Ｔ６芯片，该芯片基于ＡＲＭＣｏｒｔｅｘ－Ｍ３３２位ＲＩＳＣ
内核，工作频率可达７２ＭＨｚ，内置高速存储器，拥有丰富的增强型Ｉ／０端口，具有高性能、低功耗、低电压等优点，易丁集成和开发。
为验证语音识别模块的性能和可靠性，分别在安静的室内环
可重复，但数值应小于２５６。ＬＤ３３２嘬多支持５ｏ＋识别条目，每个识境、噪声较多的医院环境对语音识别模块进行测试。测试中，对８条
别条目是小写的汉语拼音，每２个字（拼音）间有一个空格。
语音命令循环ｌ０次，每个环境下对３名非特定人各测试８０次，计算成
４、系统软件设计
模块软件包括主控单元嵌入式操作系统Ｃ／ＯＳ— ＩＩ移植、ＬＤ３３２０语音识别程序、对话管理程序等三部分。
表１主控系统任务优先级划分
任务名Ａｐｐ＿ＴａｓｋＳｔａｒｔＡｐｐ＿＿ＴａｓｋＳＲＡｐｐ＿ＴａｓｋＣｍｄＡｐｐ＿ＴａｓｋＣｏｍＡｐｐ＿ＴａｓｋＵｐｄａｔｅＡｐｐ＿ＴａｓｋＰＢ
３．２语音识别电路
图１语音识别的基本原理
语音识别电路参考了ＩＣＲｏｕｔｅ发布的ＬＤ３３２０数据于册，其原理图如图３所示。ＬＤ３３２０内部集成了语音识别优化算法，无需外接
非
特定人语音
输入
生ＵＳＡｌｌＴ１富
并口控
设置寄存器开中断
图４开始识别流程
基金项目江西省教育厅科技项目：ＧＪＪ１０４１９
… … 上接第ｌ５１页
统管理用户可以根据要实现的系统功能和系统的规模等因素来确
６．３可适应性
定应用服务器的配置与数量，在系统功能和系统应用要增加和扩张
待识别的行为编号储存在行为数组中，和５０＋语音识别语句对应。模块共有５０组指令，每组指令可包含６个行为，能并行执行的行为可以归为一步，在该模式下，多个行为进行组合可完成复杂任务。
５、验证和测试
（２）写入识别列表。每个识别条目对应ｌ字节的特定编号，编号
Ａｐｐ＿ＴａｓｋＬｅｄＯｓＴａｓｋＳｔａｔＯＳＴａｓｋｌｄｌｅ
任务优先级５６８９ｌ０１ｌ
ｌ３３０３ｌ
堆栈字节６４ｌ２８ｌ２８６４ｌ２８６４
６４６４１２８
实现功能系统初始化语音识别命令解析和执行串口命令发送更新对话集按键检测和处理
模块硬件电路结构如图２所示，包括主控制器和语音识别电路。
１所示。
模块正常工作时，语音识别电路通过并口将处理后的数据传输给主
在训练阶段，用户多次输入训练语音，模块预处理后进行特征控制器，主控制器根据语音识别的结果，向ＵＳＡＲＴ发送相应的命
ＬＥＤ显示统计任务空闲任务
醣羲●Ｊ十＿● 一
设计开发
一术嘶
４～～．１嵌入式操作
系统移植
对话管理单元用来存储等待识别的语音、等待执行的命令，在
Ｃ／ＯＳ－ＩＩ是一个开源的实时多任务操作系统，大部分代码主控制器中通过二维数组完成。每进行一次识别，ＬＤ３３２０可设置５０
４．２对话管理程序设计
向寄存器３５写入＾ＤＣ增益
６、结语
本文介绍了基于ＳＴＭ３２的嵌入式语音识别模块的设计和实现，对模块软、硬件组成及原理进行了较为详细的说明。实验表明，本文介绍的语音识别模块具有稳定性好、识别率高、使用方便等优点，可应用在智能家电、服务机器人、消费电子等领域，具有一定的理论价值和应用前景。
应用系统的三个结构层次的设计，就是为了保障每一个子系统时，则可以通过配置的增加或是布线的延伸来实现应用服务器的升
能独立完成其任务和工作，应用服务器主要负责用户的应用界面和级，在系统某些功能不需要时，则可以通过系统锁定功能使些组织
备，创建事件及其他用户任务，并对系统状态进行监测。４．２语音识别程序设计本文介绍模块的语音识别程序采用中断方式，其工作流程为：
初始化、写入识别列表、开始识别、响应中断。（１）初始化。进行软复位、模式设定、ＦＩＦＯ设定、时钟频率设定。