河北工业大学本科毕业设计(论文)前期报告

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

2 工作启示及其感想
工作过程中遇到了一些难处，工作过程中遇到了一些难处，以前没有接触过语音识别的模块和算法，通过查找相关资料，的模块和算法，通过查找相关资料，对语音信号的预处特征提取，模型训练，模式匹配有了了解，理，特征提取，模型训练，模式匹配有了了解，并且学习了提取线性预测倒谱系数（习了提取线性预测倒谱系数（LPCC）的方法，动态时）的方法，间规整（间规整（DTW）和隐马尔可夫模型（HMM）及其相关）和隐马尔可夫模型（）算法，模式匹配技术。算法，模式匹配技术。在前期的设计过程中，深感自己理论知识的不足，在前期的设计过程中，深感自己理论知识的不足，甚至连很多学过的知识都不能灵活运用，至连很多学过的知识都不能灵活运用，为了能顺利的完成毕业设计，必须认真的去学习其中涉及的各个方面。成毕业设计，必须认真的去学习其中涉及的各个方面。在学习方法上要充分利用各种图书和文献资料，在学习方法上要充分利用各种图书和文献资料，不能忽视所遇到的每一个问题。视所遇到的每一个问题。
•
• • •
2.2 关键问题
1. 预处理：预处理包括噪音去除以及端点检测。使其提升清音部分能量，减少系统的处理时间帧预处理：预处理包括噪音去除以及端点检测。使其提升清音部分能量，减少系统的处理时间(帧数最少)，排除无声段的噪声干扰。数最少，排除无声段的噪声干扰。 2、语音特征的提取：线性预测编码的倒谱编码(CC)推求算法及推求算法及LPC模型的阶数的选择，应模型的阶数P的选择、语音特征的提取：线性预测编码(LPC)的倒谱编码的倒谱编码推求算法及模型的阶数的选择，该从频谱估计精度、计算量、存储量等多方面综合进行考虑。该从频谱估计精度、计算量、存储量等多方面综合进行考虑。 3、模型训练和模式匹配：熟练、模型训练和模式匹配：熟练DTW算法并采用其进行模式匹配算法并采用其进行模式匹配
语音特征的提取
拟采用基音周期和线性预测倒谱编码(LPCC) 共同作为特定人识别的特征参数。 (1)基于线性预测编码 (LPC)的倒谱编码(CC) 推求算法。 (2)拟采用基音估计方法
模型训练和模式匹配
• 语音识别所应用的模式匹配和模型训练技术主要有动态时间归整技术 (DTW)、隐马尔可夫模型(HMM)和人工神经元网络(ANN)。本设计拟选取DTW算法。
2 文献综述
•
•
2.1课题研究的目的，意义及应用前景课题研究的目的，课题研究的目的
随着计算机技术的发展和在控制系统中的广泛应用，以及设备向小型化、智能化发展，随着计算机技术的发展和在控制系统中的广泛应用，以及设备向小型化、智能化发展，作为高新技单片机以其体积小术之一的单片机以其体积小、功能强、价格低廉、使用灵活等优势，显示出了很强的生命力。术之一的单片机以其体积小、功能强、价格低廉、使用灵活等优势，显示出了很强的生命力。进入 21世纪以来，开发推出单片机的公司很多，各种高性能单片机芯片市场也异常活跃，新技术的不断世纪以来，世纪以来开发推出单片机的公司很多，各种高性能单片机芯片市场也异常活跃，采用，更加使单片机的种类、性能以及应用领域不断扩大和提高。采用，更加使单片机的种类、性能以及应用领域不断扩大和提高。凌阳科技公司最近推出了一种新位单片机SPCE061A。该单片机的问世，使得位单片机的科技含量及应用跃上一个新的台型16位单片机位单片机。该单片机的问世，使得16位单片机的科技含量及应用跃上一个新的台阶。
2.1课题研究的目的，意义课题研究的目的，课题研究的目的及应用前景
（一）SPCE061A 性能简介（二）SPCE061A特点特点
目的，目的，意义及应用前景
（三）语音识别基本原理（四）SPCE061A的在语音识别技术中的应用的在语音识别技术中的应用（五）语音识别技术应用前景
•
•
（一）SPCE061A 性能简介
•
•
•
1.5中断中断 SPCE061A具有种中断方式：快速中断请求具有2种中断方式中断和中断请求IRQ中断。中断控中断。具有种中断方式：快速中断请求FIQ中断和中断请求中断和中断请求中断制器可处理3种中断和14种中断，个由指令BREAK控制的软中断。控制的软中断。制器可处理种FIQ中断和种IRQ中断，以及个由指令中断和中断以及1个由指令控制的软中断 1.6输入输出端口（I/O）输入/输出端口输入输出端口（） I/O是系统与其他设备进行数据交换的接口。SPCE061A具有个可编程口：A口和是系统与其他设备进行数据交换的接口。具有2个可编程口口和B 是系统与其他设备进行数据交换的接口具有个可编程口：口和口既是具有可编程唤醒功能的普通I/O口又可与ADC的多路的多路LINE IN输入共用，输入共用，口。A口既是具有可编程唤醒功能的普通口，又可与口既是具有可编程唤醒功能的普通的多路输入共用 B口除了具有普通口的功能外，在特定的管脚上还可以完成一些特殊的功能。口除了具有普通I/O口的功能外口除了具有普通口的功能外，在特定的管脚上还可以完成一些特殊的功能。 1.7定时器计数器定时器/计数器定时器 SPCE061A提供了个16位的定时器计数器：TimerA和TimerB。TimerA为通用计提供了2个位的定时器计数器：位的定时器/计数器提供了和。为通用计数器；为多功能计数器。的时钟源由时钟源A（高速时钟源）数器；TimerB为多功能计数器。TimerA的时钟源由时钟源（高速时钟源）和时钟源为多功能计数器的时钟源由时钟源 B（实时时钟 768Hz）进行“与”操作而形成，TimerB的时钟源仅为时钟源。操作而形成，的时钟源仅为时钟源A。（实时时钟32 ）进行“ 的时钟源仅为时钟源 1.8时基时基时间基准信号，简称时基信号，来自于32 实时时钟，时间基准信号，简称时基信号，来自于 768 Hz实时时钟，通过频率选择组合而实时时钟时基信号发生器的2个选频逻辑个选频逻辑TMB1和TMB2为TimerA的时钟源提供各种频率的时钟源B提供各种频率成。时基信号发生器的个选频逻辑和为的时钟源选择信号并为中断系统提供中断源（选择信号并为中断系统提供中断源（IRQ6）信号。此外，时基信号发生器还可以直接）信号。此外，生成2 以及4 的时基信号，生成 Hz，4 Hz，1 024 Hz，2 048 Hz以及 096 Hz的时基信号，为中断系统提供各，，，以及的时基信号种实时中断源（种实时中断源（IRQ4和IRQ5）信号。和）信号。 1.9模数转换器（ADC）和数模转换器（DAC）模数转换器（模数转换器）和数模转换器（） SPCE061A有8个10位模数转换通道，其中个通道用于将模拟量信号转换为数字量位模数转换通道，有个位模数转换通道其中7个通道用于将模拟量信号转换为数字量信号，可能直接通过引线（］）输入信号，可能直接通过引线（IOA［0～6］）输入。另外有一个通道只作为语音输入通［～］）输入。通过内置有自动增益控制放大器的麦克风通道（道，通过内置有自动增益控制放大器的麦克风通道（MIC IN）输入。实际上可以把）输入。 ADC看作是一个实现模数信号转换的编码器。看作是一个实现模数信号转换的编码器。看作是一个实现模数信号转换的编码器 SPCE061A为音频输出提供了个10位的数模转换器，即DAC1和DAC2。DAC1，为音频输出提供了2个位的数模转换器位的数模转换器，为音频输出提供了和。， DAC2转换输出的模拟量电流信号分别通过转换输出的模拟量电流信号分别通过AUD1和AUD2管脚输出。管脚输出。转换输出的模拟量电流信号分别通过和管脚输出 1.10串行设备接口串行设备接口串行输入输出端口SIO提供了个1位的串行接口，用于与其他设备进行数据通讯。提供了1个位的串行接口用于与其他设备进行数据通讯。位的串行接口，串行输入输出端口提供了内通过IOB0和IOB1这2个端口实现与设备进行串行数据交换功能。个端口实现与设备进行串行数据交换功能。在SPCE061A内通过内通过和这个端口实现与设备进行串行数据交换功能
学号：学号：082154 姓名：姓名：胡玥班级：电技班级：电技081
1 2 3 4
课题简介
文献综述
设计方案
参考文献
1.课题简介课题简介
1.1 课题研究的主要内容语音识别技术是实现人机通信的一种重要的技术手段,语音识别与语音合成技术的结合使人们能够摆脱键盘,通过语音命令实现控制功能。 1.2 拟采用的研究方法拟采用基音周期和线性预测倒谱编码(LPCC)共同作为特定人识别的特征参数。 1.3 任务书要求进度完成情况对基于语音的处理及识别系统的各个模块有了初步的了解，并完成了前期报告
1.1 课题研究的主要内容
•语音识别技术是实现人机通信的一种重要的技术手段,语音识别与语音合成技术的结合使人们能够摆脱键盘,通过语音命令实现控制功能。语音技术的应用已经成为一个具有竞争性的新兴高技术产业,语音识别产品在人机交互应用是采用DSP 芯片来实现的,但DSP 芯片一般价格较贵不易于推广和应用,本文所研究的是基于凌阳SPCE061A 单片机的嵌入式语音识别系统。使系统大大简化。现在语音特征的提取和识别方法很多, 如隐。马尔可夫法对非特定人连续语音有很高的识别率, 但过程繁琐。
1.1CPU SPCE061A配备了凌阳科技开发的最新的位微处理器，其内部含有个寄存器，4 配备了凌阳科技开发的最新的16位微处理器个寄存器，配备了凌阳科技开发的最新的位微处理器，其内部含有8个寄存器个通用寄存器R1～，个程序计数器个程序计数器PC，个堆栈指针个堆栈指针SP，个基址指针个基址指针BP，个个通用寄存器～R4，1个程序计数器，1个堆栈指针，1个基址指针，1个段寄存器SR，通用寄存器R3和结合组成一个位寄存器MR，MR可以作为乘法运结合组成一个32位寄存器段寄存器，通用寄存器和R4结合组成一个位寄存器，可以作为乘法运算和内积运算的目标寄存器。此外，中断和14个中断，个算和内积运算的目标寄存器。此外，SPCE061A有3个FIQ中断和个IRQ中断，1个有个中断和中断由指令控制的软中断。由指令控制的软中断。 1.2存储器存储器 SPCE061A拥有 kb的SRAM，还有 kb闪存拥有2 的闪存FLASH ROM，可在拥有，还有32 闪存，可在ICE工作方式下工作方式下被编程写入或被擦除。对闪存设置保密设定后，其内容将不能再通过ICE被读写，从被读写，被编程写入或被擦除。对闪存设置保密设定后，其内容将不能再通过被读写而将程序保密。而将程序保密。 1.3时钟时钟 (1)锁相环（PLL）振荡器PLL的作用为系统提供一个实时时钟的基频（32 768 Hz），锁相环（）振荡器的作用为系统提供一个实时时钟的基频（），锁相环的作用为系统提供一个实时时钟的基频然后将基基频进行倍频，调整至49.152 MHz，40.96 MHz，32.768 MHz，24.576 然后将基基频进行倍频，调整至，，， MHz或20.480 MHz。系统默认的自激振荡频率为24.576 MHz。或。系统默认的PLL自激振荡频率为自激振荡频率为 (2)系统时钟其信号源为系统时钟其信号源为PLL振荡器。系统时钟频率（Fosc）和CPU时钟频率振荡器。系统时钟其信号源为振荡器系统时钟频率（）时钟频率分别为（CPUCLK）可通过编程来控制。默认的）可通过编程来控制。默认的Fosc、CPUCLK分别为24576 MHz和、分别为 Fosc/8。。 (3)实时时钟 768 Hz实时时钟通常用于钟表、实时时钟延时以及其他与时间相关实时时钟32 实时时钟通常用于钟表、实时时钟实时时钟通常用于钟表类产品。通过对32 实时时钟源分频而提供了多种实时时钟中断源。类产品。SPCE061A通过对 768 Hz实时时钟源分频而提供了多种实时时钟中断源。通过对实时时钟源分频而提供了多种实时时钟中断源 1.4低电压监测和低电压复位低电压监测和低电压复位低电压监测功能可以提供系统内电源电压的使用情况。级电压监测低限级电压监测低限：低电压监测功能可以提供系统内电源电压的使用情况。4级电压监测低限：2.4 V，， 2.8 V，3.2 V和3.6 V。可通过编程来控制，系统默认的电压监测低限为2.4 V。，和可通过编程来控制，系统默认的电压监测低限为。低电压复位当电源电压低于2.4 V时，系统会变得不稳定且易出故障，导致电源电压低电压复位当电源电压低于时系统会变得不稳定且易出故障，过低的原因很多，如电压的反跳、负载过重、电池能量不足等。过低的原因很多，如电压的反跳、负载过重、电池能量不足等。如果系统设置了低电压复位（压复位（LVR）功能。当电源电压低于该值时，会在个时钟周期之后产生一个复位信）功能。当电源电压低于该值时，会在4个时钟周期之后产生一个复位信使系统复位。号，使系统复位。
河北工业大学本科毕业设计（论文）前期报告论文）
专业：电子科学与技术专业：指导教师信息：教师号：姓名：指导教师信息：教师号：02109 姓名：职称：武一职称：教授报告提交日期：报告提交日期：2012年3月3日年月日
基于SPCE061A单片机的语音识别单片机的语音识别基于系统设计
1.3 任务书要求进度完成情况
1 任务书完成进度情况通过三周的时间，查阅有关语音识别技术和通过三周的时间，查阅有关语音识别技术和SPCE061A 单片机等相关资料，对本课题已经基本熟悉，单片机等相关资料，对本课题已经基本熟悉，对基于语音的处理及识别系统的各个模块有了初步的了解，音的处理及识别系统的各个模块有了初步的了解，用软件完成初步的电路设计，件完成初步的电路设计，并完成了前期报告
2
人们在现实生活中还常常用到一些短小的命令来控制被控对象的行为, 针对这种特定人的孤立词的汉语识别, 本设计以语音的线性预测系数为语音特征, 基于时序的特征值差的分段线性匹配法为识别方法, 识别率高, 且运算简单, 能很好地满足设计要求。
3
1.2 拟采用的研究方法
预处理
1.1噪音去除噪音去除将通过麦克风输入的一段模拟语音信号进行量化和采样，拟语音信号进行量化和采样，字语音信号；转换成数字语音信号；去噪，得到干净的数字语音信号，再通过预加重技术滤除低频干扰(尤其是尤其是50Hz或低频干扰尤其是或 60Hz的工频干扰提升语音的工频干扰)提升语音的工频干扰信号的高频部分。信号的高频部分。 1.2 端点检测采用当前帧与前帧的过零率和能量值的差作为检验端点的标准能很好地解决背景噪声的问题。声的问题。