用单片机实现语音控制机器人
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
用单片机实现语音控制机器人
制作人:潘磊pb02023035
卢恒pb02006088
题目:用凌阳单片机实现语音识别功能并传递给PIC单片机信号,由PIC单片机控制机器人实现动作
关键字:PIC单片机,凌阳单片机,语音控制
单片机在现今生活中占有越来越重要的地位,用语音控制单片机实现控制更具有
广泛的应用价值。用语音控制舞蹈机器人做一些动作是我们这次实现的功能,虽然这
在语音控制方面仍处于起步阶段,但他体现了语音控制的原理和基本实现,也为更高
级的运用打下了基础。
原理:
1.语音识别原理
语音识别电路基本结构如上图所示:语音识别分为特定发音人识别(Speaker Dependent)和非特定发音人识别(Speaker Independent)两种方式。
特定发音人识别是指语音样板由单个人训练,对训练人的语音命令识别准确率较高,而其他人的语音命令识别准确率较低或不识别。非特定发音人识别:是指语音样板由不同年龄、不同性别、不同口音的人进行训练,可以识别一群人的命令。语音样板的提取非常重要。我们将标准模式的存储空间称之为“词库”,而把标准模式称之为“词条”或“样板”。所谓建立词库,就是将待识别的命令进行频谱分析,提取特征参数作为识别的标准模式。
识别过程首先要滤除输入语音信号的噪音和进行预加重处理,提升高频分量,然后用线性预测系数等方法进行频谱分析,找出语音的特征参数作为未知模式,接着与预先存储的标准模式进行比较,当输入的未知模式与标准模式的特征相一致时,便被机器识别,产生识别结果输出。如果输入的语音与标准模式的特征完全一致固然好,但是语音含有不确定因素,完全一致的条件往往不存在,事实上没有人能以绝对相同的语调把一个词说两遍,因此,预先制定好计算输入语音的特征模式与各特征模式的类似程度,或距离度的算法规则固化在ROM
中,把该距离最小,即最类似的模式作为识别相应语音的手段。当然,影响识别率的因素还有一些,如连续发音(如英语)与断续发音(如汉语)的不同(二者区别在于单词间隔有200ms 以上的空隙时间)。
本程序采用特定人识别方式,将训练的标准样板存于内部RAM中(掉电丢失),每次上电复位后都要进行训练,
2.硬件电路
硬件电路比较简单,MIC选用驻极体电容话筒,这种话筒具有灵敏度高、无方向性、重量轻、体积小、频率响应宽、保真度好等优点,驻极体话筒的偏压由SPCE061A的VMIC管脚提供。其硬件电路如下图所示。
SPCE061A的A/D转换器有8个通道,其中有1个通道是MIC-IN输入,它专门用于对语音信号进行采样。语音信号经MIC转换成电信号,由隔直电容隔掉直流成分,然后输入至SPCE061A内部前置放大器。SPCE061A内部自动增益控制电路AGC能随时跟踪、监视前置放大器输出的音频信号电平,当输入信号增大时,AGC电路自动减小放大器的增益;当输入信号减小时,AGC电路自动增大放大器的增益,可使进入A/D的信号保持在最佳电平,又可使削波减至最小,A/D转换器对输入的音频信号进行8kHz采样,并按照凌阳音频编码格式进行编码,每秒将占用16kBits的存储器空间。
2.机器人的控制。
我们控制的机器人是“小强”,他总共有三个电机需要控制。行走由一个直流电机控制,手部有两个步进电机控制。对每一个电机规定固定的端口,由PIC控制电机驱动电路H桥的使能端从而实现各种动作的控制。在这里,PIC单片机时刻监视凌阳单片机的信号位,不同的电平组合进行不同的动作,实现语音控制。
程序设计
1.语音识别程序。
程序包括三部分:训练样本、识别和语音提示。
由于语音样本是存在内部RAM中,掉电将丢失,所以在每次上电复位时都必须重新训练,训练过程主要是靠调用库函数 BSR_Train 来完成,为了防止误命令,每条语音命令训练2遍,只有2次命令相同时才成功,BSR_Train函数有8种可能的返回值:0------训练成功;
-1------没有检测到命令;
-2------需要再训练一次,每条命令训练2次,第一次训练成功则返回-2;
-3------环境太吵;
-4------存储器满;
-5------两次命令不一样;
-6------命令序号超出范围;
-7------命令已存在;
训练成功则训练下一条,否则继续训练。
语音识别程序包括识别程序和中断服务程序。识别程序完成选取词库、初始化A/D 和定时器TimerA、识别运算及识别结果处理,整个流程图如图。
中断服务程序定时读取A/D转换结果,并存入缓冲区,A/D的输入为MIC通道的语音信号。语音识别和放音分时复用TimerA FIQ 中断,由标志位判断是语音识别处理还是放音处理。中断服务程序的流程图如图所示。
识别程序如下:
//================================================================================== ======
// 工程名称: Guard_SD.spj
// 功能描述: 语音识别DEMO程
// 每次上电复位后请训练3条命令,第一条为触发命令
// 后两条为控制命令,
//
// 涉及的库:CMacro.lib
//
// 组成文件: main.c
// FIQ.asm/hardware.asm/InitIO.asm
// hardware.inc/hardware.h
//================================================================================== =========
#include "bsrsd.h"
#define NAME_ID 0x100
#define COMMAND_ONE_ID 0x101
#define COMMAND_TWO_ID 0x102
#define RSP_INTRO 0 //0. I am your body guard.
#define RSP_NAME 1 //1. Please give me your name.
#define RSP_FIRE 2 //2. Say Fire.
#define RSP_GUARD 3 //3. Say Guard.
#define RSP_AGAIN 4 //4. Say again.
#define RSP_NOVOICE 5 //5. No voice detected.
#define RSP_NAMEDIFF 6 //6. Two given names are different. #define RSP_HERE 7 //10. I'm here
#define RSP_STANDBY 8 //8. Iam standing by.
#define RSP_GUNSHOT 9 //11. Gun sound.
#define RSP_READY 10 //13. I'm ready!
int gActivated = 0;
//..................global variables.....................
//1---触发命令识别成功
//0---无触发命令
//*************** 播放提示语音 ***********************//
//input:播放序号
//output:NO
//*****************************************************//
void PlayRespond(int Result)
{
BSR_StopRecognizer(); //关闭识别器
SACM_A2000_Initial(1); //初始化播放器
SACM_A2000_Play(Result, 3, 3); //播放提示语音
while((SACM_A2000_Status()&0x0001) != 0)
{