河北工业大学本科毕业设计(论文)前期报告

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2 工作启示及 其感想
工作过程中遇到了一些难处, 工作过程中遇到了一些难处,以前没有接触过语音识别 的模块和算法,通过查找相关资料, 的模块和算法,通过查找相关资料,对语音信号的预处 特征提取,模型训练,模式匹配有了了解, 理,特征提取,模型训练,模式匹配有了了解,并且学 习了提取线性预测倒谱系数( 习了提取线性预测倒谱系数(LPCC)的方法,动态时 )的方法, 间规整( 间规整(DTW)和隐马尔可夫模型(HMM)及其相关 )和隐马尔可夫模型( ) 算法,模式匹配技术。 算法,模式匹配技术。 在前期的设计过程中, 深感自己理论知识的不足, 在前期的设计过程中, 深感自己理论知识的不足,甚 至连很多学过的知识都不能灵活运用, 至连很多学过的知识都不能灵活运用,为了能顺利的完 成毕业设计,必须认真的去学习其中涉及的各个方面。 成毕业设计,必须认真的去学习其中涉及的各个方面。 在学习方法上要充分利用各种图书和文献资料, 在学习方法上要充分利用各种图书和文献资料,不能忽 视所遇到的每一个问题。 视所遇到的每一个问题。

• • •
2.2 关键问题
1. 预处理:预处理包括噪音去除以及端点检测。使其提升清音部分能量,减少系统的处理时间 帧 预处理:预处理包括噪音去除以及端点检测。使其提升清音部分能量,减少系统的处理时间(帧 数最少),排除无声段的噪声干扰。 数最少 ,排除无声段的噪声干扰。 2、语音特征的提取:线性预测编码 的倒谱编码(CC)推求算法及 推求算法及LPC模型的阶数 的选择,应 模型的阶数P的选择 、语音特征的提取:线性预测编码(LPC)的倒谱编码 的倒谱编码 推求算法及 模型的阶数 的选择, 该从频谱估计精度、计算量、存储量等多方面综合进行考虑。 该从频谱估计精度、计算量、存储量等多方面综合进行考虑。 3、模型训练和模式匹配:熟练 、模型训练和模式匹配:熟练DTW算法并采用其进行模式匹配 算法并采用其进行模式匹配
语音特征的提取
拟采用基音周期和线性 预测倒谱编码(LPCC) 共同作为特定人识别的 特征参数。 (1)基于线性预测编码 (LPC)的倒谱编码(CC) 推求算法。 (2)拟采用基音估计方 法
模型训练和模式匹配
• 语音识别所应用的模式 匹配和模型训练技术主 要有动态时间归整技术 (DTW)、隐马尔可夫模 型(HMM)和人工神经元 网络(ANN)。本设计拟 选取DTW算法。
2 文献综述


2.1课题研究的目的,意义及应用前景 课题研究的目的, 课题研究的目的
随着计算机技术的发展和在控制系统中的广泛应用,以及设备向小型化、智能化发展, 随着计算机技术的发展和在控制系统中的广泛应用,以及设备向小型化、智能化发展,作为高新技 单片机以其体积小 术之一的单片机以其体积小、功能强、价格低廉、使用灵活等优势,显示出了很强的生命力。 术之一的单片机以其体积小、功能强、价格低廉、使用灵活等优势,显示出了很强的生命力。进入 21世纪以来,开发推出单片机的公司很多,各种高性能单片机芯片市场也异常活跃,新技术的不断 世纪以来, 世纪以来 开发推出单片机的公司很多,各种高性能单片机芯片市场也异常活跃, 采用,更加使单片机的种类、性能以及应用领域不断扩大和提高。 采用,更加使单片机的种类、性能以及应用领域不断扩大和提高。凌阳科技公司最近推出了一种新 位单片机SPCE061A。该单片机的问世,使得 位单片机的科技含量及应用跃上一个新的台 型16位单片机 位单片机 。该单片机的问世,使得16位单片机的科技含量及应用跃上一个新的台 阶。
2.1课题研究的目的,意义 课题研究的目的, 课题研究的目的 及应用前景
(一)SPCE061A 性能简介 (二)SPCE061A特点 特点
目的, 目的,意义 及应用前景
(三)语音识别基本原理 (四)SPCE061A的在语音识别技术中的应用 的在语音识别技术中的应用 (五)语音识别技术应用前景


(一)SPCE061A 性能简介



1.5中断 中断 SPCE061A具有 种中断方式:快速中断请求 具有2种中断方式 中断和中断请求IRQ中断。中断控 中断。 具有 种中断方式:快速中断请求FIQ中断和中断请求 中断和中断请求 中断 制器可处理3种 中断和14种 中断, 个由指令BREAK控制的软中断。 控制的软中断。 制器可处理 种FIQ中断和 种IRQ中断,以及 个由指令 中断和 中断 以及1个由指令 控制的软中断 1.6输入 输出端口(I/O) 输入/输出端口 输入 输出端口( ) I/O是系统与其他设备进行数据交换的接口。SPCE061A具有 个可编程口:A口和 是系统与其他设备进行数据交换的接口。 具有2个可编程口 口和B 是系统与其他设备进行数据交换的接口 具有 个可编程口: 口和 口既是具有可编程唤醒功能的普通I/O口 又可与ADC的多路 的多路LINE IN输入共用, 输入共用, 口。A口既是具有可编程唤醒功能的普通 口,又可与 口既是具有可编程唤醒功能的普通 的多路 输入共用 B口除了具有普通 口的功能外,在特定的管脚上还可以完成一些特殊的功能。 口除了具有普通I/O口的功能外 口除了具有普通 口的功能外,在特定的管脚上还可以完成一些特殊的功能。 1.7定时器 计数器 定时器/计数器 定时器 SPCE061A提供了 个16位的定时器 计数器:TimerA和TimerB。TimerA为通用计 提供了2个 位的定时器 计数器: 位的定时器/计数器 提供了 和 。 为通用计 数器; 为多功能计数器。 的时钟源由时钟源A(高速时钟源) 数器;TimerB为多功能计数器。TimerA的时钟源由时钟源 (高速时钟源)和时钟源 为多功能计数器 的时钟源由时钟源 B(实时时钟 768Hz)进行“与”操作而形成,TimerB的时钟源仅为时钟源 。 操作而形成, 的时钟源仅为时钟源A。 (实时时钟32 )进行“ 的时钟源仅为时钟源 1.8时基 时基 时间基准信号,简称时基信号,来自于32 实时时钟, 时间基准信号,简称时基信号,来自于 768 Hz实时时钟,通过频率选择组合而 实时时钟 时基信号发生器的2个选频逻辑 个选频逻辑TMB1和TMB2为TimerA的时钟源 提供各种频率 的时钟源B提供各种频率 成。时基信号发生器的 个选频逻辑 和 为 的时钟源 选择信号并为中断系统提供中断源( 选择信号并为中断系统提供中断源(IRQ6)信号。此外,时基信号发生器还可以直接 )信号。此外, 生成2 以及4 的时基信号, 生成 Hz,4 Hz,1 024 Hz,2 048 Hz以及 096 Hz的时基信号,为中断系统提供各 , , , 以及 的时基信号 种实时中断源( 种实时中断源(IRQ4和IRQ5)信号。 和 )信号。 1.9模数转换器(ADC)和数模转换器(DAC) 模数转换器( 模数转换器 )和数模转换器( ) SPCE061A有8个10位模数转换通道,其中 个通道用于将模拟量信号转换为数字量 位模数转换通道, 有 个 位模数转换通道 其中7个通道用于将模拟量信号转换为数字量 信号,可能直接通过引线( ])输入 信号,可能直接通过引线(IOA[0~6])输入。另外有一个通道只作为语音输入通 [ ~ ])输入。 通过内置有自动增益控制放大器的麦克风通道( 道,通过内置有自动增益控制放大器的麦克风通道(MIC IN)输入。实际上可以把 )输入。 ADC看作是一个实现模数信号转换的编码器。 看作是一个实现模数信号转换的编码器。 看作是一个实现模数信号转换的编码器 SPCE061A为音频输出提供了 个10位的数模转换器,即DAC1和DAC2。DAC1, 为音频输出提供了2个 位的数模转换器 位的数模转换器, 为音频输出提供了 和 。 , DAC2转换输出的模拟量电流信号分别通过 转换输出的模拟量电流信号分别通过AUD1和AUD2管脚输出。 管脚输出。 转换输出的模拟量电流信号分别通过 和 管脚输出 1.10串行设备接口 串行设备接口 串行输入输出端口SIO提供了 个1位的串行接口,用于与其他设备进行数据通讯。 提供了1个 位的串行接口 用于与其他设备进行数据通讯。 位的串行接口, 串行输入输出端口 提供了 内通过IOB0和IOB1这2个端口实现与设备进行串行数据交换功能。 个端口实现与设备进行串行数据交换功能。 在SPCE061A内通过 内通过 和 这 个端口实现与设备进行串行数据交换功能
学号: 学号:082154 姓名: 姓名:胡玥 班级:电技 班级:电技081
1 2 3 4
课题简介
文献综述
设计方案
参考文献
1.课题简介 课题简介
1.1 课题研究的主要内容 语音识别技术是实现人机通信的一种重要的技术手段,语音 识别与语音合成技术的结合使人们能够摆脱键盘,通过语音 命令实现控制功能。 1.2 拟采用的研究方法 拟采用基音周期和线性预测倒谱编码(LPCC)共同作为特定 人识别的特征参数。 1.3 任务书要求进度完成情况 对基于语音的处理及识别系统的各个模块有了初 步的了解,并完成了前期报告
1.1 课题研究的主要内容
•语音识别技术是实现人机通信的一种重要的技术手段,语音识别与语 音合成技术的结合使人们能够摆脱键盘,通过语音命令实现控制功能。 语音技术的应用已经成为一个具有竞争性的新兴高技术产业,语音识 别产品在人机交互应用是采用DSP 芯片来实现的,但DSP 芯片一般 价格较贵不易于推广和应用,本文所研究的是基于凌阳SPCE061A 单片机的嵌入 式语音识别系统。使系统大大简化。现在语音特征的提取和识别方法很多, 如隐 。 马尔可夫法对非特定人连续语音有很高的识别率, 但过程繁琐。
1.1CPU SPCE061A配备了凌阳科技开发的最新的 位微处理器,其内部含有 个寄存器,4 配备了凌阳科技开发的最新的16位微处理器 个寄存器, 配备了凌阳科技开发的最新的 位微处理器,其内部含有8个寄存器 个通用寄存器R1~ , 个程序计数器 个程序计数器PC, 个堆栈指针 个堆栈指针SP, 个基址指针 个基址指针BP, 个 个通用寄存器 ~R4,1个程序计数器 ,1个堆栈指针 ,1个基址指针 ,1个 段寄存器SR,通用寄存器R3和 结合组成一个 位寄存器MR,MR可以作为乘法运 结合组成一个32位寄存器 段寄存器 ,通用寄存器 和R4结合组成一个 位寄存器 , 可以作为乘法运 算和内积运算的目标寄存器。此外, 中断和14个 中断, 个 算和内积运算的目标寄存器。此外,SPCE061A有3个FIQ中断和 个IRQ中断,1个 有 个 中断和 中断 由指令控制的软中断。 由指令控制的软中断。 1.2存储器 存储器 SPCE061A拥有 kb的SRAM,还有 kb闪存 拥有2 的 闪存FLASH ROM,可在 拥有 ,还有32 闪存 ,可在ICE工作方式下 工作方式下 被编程写入或被擦除。对闪存设置保密设定后,其内容将不能再通过ICE被读写,从 被读写, 被编程写入或被擦除。对闪存设置保密设定后,其内容将不能再通过 被读写 而将程序保密。 而将程序保密。 1.3时钟 时钟 (1)锁相环(PLL)振荡器PLL的作用为系统提供一个实时时钟的基频(32 768 Hz), 锁相环( )振荡器 的作用为系统提供一个实时时钟的基频( ), 锁相环 的作用为系统提供一个实时时钟的基频 然后将基基频进行倍频,调整至49.152 MHz,40.96 MHz,32.768 MHz,24.576 然后将基基频进行倍频,调整至 , , , MHz或20.480 MHz。系统默认的 自激振荡频率为24.576 MHz。 或 。系统默认的PLL自激振荡频率为 自激振荡频率为 (2)系统时钟其信号源为 系统时钟其信号源为PLL振荡器。系统时钟频率(Fosc)和CPU时钟频率 振荡器。 系统时钟其信号源为 振荡器 系统时钟频率( ) 时钟频率 分别为 (CPUCLK)可通过编程来控制。默认的 )可通过编程来控制。默认的Fosc、CPUCLK分别为24576 MHz和 、 分别为 Fosc/8。 。 (3)实时时钟 768 Hz实时时钟通常用于钟表、实时时钟延时以及其他与时间相关 实时时钟32 实时时钟通常用于钟表、 实时时钟 实时时钟通常用于钟表 类产品。 通过对32 实时时钟源分频而提供了多种实时时钟中断源。 类产品。SPCE061A通过对 768 Hz实时时钟源分频而提供了多种实时时钟中断源。 通过对 实时时钟源分频而提供了多种实时时钟中断源 1.4低电压监测和低电压复位 低电压监测和低电压复位 低电压监测功能可以提供系统内电源电压的使用情况。 级电压监测低限 级电压监测低限: 低电压监测功能可以提供系统内电源电压的使用情况。4级电压监测低限:2.4 V, , 2.8 V,3.2 V和3.6 V。可通过编程来控制,系统默认的电压监测低限为2.4 V。 , 和 可通过编程来控制,系统默认的电压监测低限为 。 低电压复位当电源电压低于2.4 V时,系统会变得不稳定且易出故障,导致电源电压 低电压复位当电源电压低于 时 系统会变得不稳定且易出故障, 过低的原因很多,如电压的反跳、负载过重、电池能量不足等。 过低的原因很多,如电压的反跳、负载过重、电池能量不足等。如果系统设置了低电 压复位( 压复位(LVR)功能。当电源电压低于该值时,会在 个时钟周期之后产生一个复位信 )功能。当电源电压低于该值时,会在4个时钟周期之后产生一个复位信 使系统复位。 号,使系统复位。
河北工业大学本科毕业设计 (论文)前期报告 论文)
专业:电子科学与技术 专业: 指导教师信息:教师号: 姓名: 指导教师信息:教师号:02109 姓名: 职称: 武一 职称:教授 报告提交日期: 报告提交日期:2012年3月3日 年 月 日
基于SPCE061A单片机的语音识别 单片机的语音识别 基于 系统设计
1.3 任务书要求进度完成情况
1 任务书完 成进度情况 通过三周的时间,查阅有关语音识别技术和 通过三周的时间,查阅有关语音识别技术和SPCE061A 单片机等相关资料,对本课题已经基本熟悉, 单片机等相关资料,对本课题已经基本熟悉,对基于语 音的处理及识别系统的各个模块有了初步的了解, 音的处理及识别系统的各个模块有了初步的了解,用软 件完成初步的电路设计, 件完成初步的电路设计,并完成了前期报告
2
人们在现实生活中还常常用到一些短小的命令来控制被控对象的行为, 针对这种特定人的孤立词的汉语识别, 本设计以语音的线性预测系数为 语音特征, 基于时序的特征值差的分段线性匹配法为识别方法, 识别率 高, 且运算简单, 能很好地满足设计要 求。
3
1.2 拟采用的研究方法
预处理
1.1噪音去除 噪音去除 将通过麦克风输入的一段模 拟语音信号进行量化和采样, 拟语音信号进行量化和采样, 字语音信号; 转换成数 字语音信号;去 噪,得到干净的数字语音信 号,再通过预加重技术滤除 低频干扰(尤其是 尤其是50Hz或 低频干扰 尤其是 或 60Hz的工频干扰 提升语音 的工频干扰)提升语音 的工频干扰 信号的高频部分。 信号的高频部分。 1.2 端点检测 采用当前帧与前帧的过零率 和能量值的差作为检验端点 的标准能很好地解决背景噪 声的问题。 声的问题。
相关文档
最新文档