语音信号的提取与识别技术——说话人识别系统的研究
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
毕业设计说明书
语音信号的提取与识别技术
——说话人识别系统的研究
作者:学号:
学院(系):
专业:
指导教师:
评阅人:
20**年6月
中北大学
毕业设计(论文)任务书
学院、系:
专业:
学生姓名:学号:
设计(论文)题目:语音信号的提取与识别技术
起迄日期: 20**年2月15日~20**年6月21日
设计(论文)地点:
指导教师:
系主任:
发任务书日期:20**年2月15日
毕业设计(论文)任务书
1.毕业设计(论文)课题的任务和要求:
1.了解声音信号的特征参数,及现阶段研究处理方法。以现阶段信号处理领域比较活
跃的语音信号为具体研究对象,进行相关知识的了解与学习。
2.学会在语音信号处理中使用MATLAB软件工具。
3.针对基本的个别个体的特定声音进行与信识别研究。
4.根据研究情况利用MATLAB语言进行相关算法的实现。
2.毕业设计(论文)课题的具体工作内容(包括原始数据、技术要求、工作要求等):
1.查阅相关资料,利用已学的相关知识进行消化和理解。
2.了解现阶段的语音处理情况,分析研究相关的产品。
3.研究学习基本的识别处理方法。
4.学习相关信号处理软件。。
5.对软件的学习达到能对基本的算法进行软件的处理。
6.完成毕业设计论文。
毕业设计(论文)任务书
3.对毕业设计(论文)课题成果的要求〔包括毕业设计(论文)、图纸、实物样品等):
1、毕业论文一份;
2、英文文献1份,相应的中文译文1份。
4.毕业设计(论文)课题工作进度计划:
起迄日期工作内容
2006年
2月15日~ 3月31日4月 1日~ 5月31日6月 1日~ 6月20日6月20日~ 6月21日系统学习,查阅资料,作开题报告;英文资料翻译;
撰写毕业论文;
论文答辩。
学生所在系审查意见:
系主任:
年月日
中北大学
毕业设计(论文)开题报告
学生姓名:学号:
学院、系:
专业:
设计(论文)题目:语音信号提取与识别技术
指导教师:
20**年 3 月 8 日
毕业设计(论文)开题报告
1.结合毕业设计(论文)课题情况,根据所查阅的文献资料,撰写2000字左右的文献综述:
文献综述
语音信号识别研究的根本目的是研究出一种具有听觉功能的机器,能直接接受人的口呼命令,理解人的意图并做出相应的反映。语音识别系统的研究涉及微机技术、人工智能、数字信号处理、模式识别、声学、语言学和认知科学等许多学科领域,是一个多学科综合性研究领域。近年来,高性能数字信号处理芯片DSP (DigitalSignalProcess)技术的迅速发展,为语音识别的实时实现提供了可能,其中,AD公司的数字信号处理芯片以其良好的性价比和代码的可移植性被广泛地应用于各个领域。因此,我们采用AD 公司的定点DSP处理芯片ADSP2181实现了语音信号的识别。
1 语音识别的基本过程
根据实际中的应用不同,语音识别系统可以分为:特定人与非特定人的识别、独立词与连续词的识别、小词汇量与大词汇量以及无限词汇量的识别。但无论那种语音识别系统,其基本原理和处理方法都大体类似。一个典型的语音识别系统的原理图如图1所示[1]。
语音识别过程主要包括语音信号的预处理、特征提取、模式匹配几个部分。预处理包括预滤波、采样和量化、加窗、端点检测、预加重等过程。语音信号识别最重要的一环就是特征参数提取。提取的特征参数必须满足以下的要求:
(1)提取的特征参数能有效地代表语音特征,具有很好的区分性;
(2)各阶参数之间有良好的独立性;
(3)特征参数要计算方便,最好有高效的算法,以保证语音识别的实时实现。
在训练阶段,将特征参数进行一定的处理后,为每个词条建立一个模型,保存为模
板库。在识别阶段,语音信号经过相同的通道得到语音特征参数,生成测试模板,与参考模板进行匹配,将匹配分数最高的参考模板作为识别结果。同时,还可以在很多先验知识的帮助下,提高识别的准确率。
2 系统的硬件结构
2.1 ADSP2181的特点[2]
AD公司的DSP处理芯片ADSP2181是一种16 b的定点DSP芯片,他内部存储空间大、运算功能强、接口能力强。有以下的主要特点:
(1)采用哈佛结构,外接16.67 MHz晶振,指令周期为30 ns,指令速度为33 MI /s,所有指令单周期执行;
(2)片内集成了80 kB的存储器:16 kB字的(24b)的程序存储器和16kB(16b)的数据存储器;
(3)内部有3个独立的计算单元:算术逻辑单元(ALU)、乘累加器(MAC)和桶形移位器(SHIFT),其中乘累加器支持多精度和自动无偏差舍入;
(4)一个16 b的内部DMA端口(IDMA),供片内存储器的高速存取;一个8 b自举DMA(BDMA)口,用于从自举程序存储器中装载数据和程序;
(5)6个外部中断,并且可以设置优先级或屏蔽等。
由于ADSP2181以上的特点,使得该芯片构成的系统体积小、性能高、成本和功耗低,能较好地实现语音识别算法。
2.2 系统的硬件结构
在构成语音识别电路时,我们采用了ADSP2181的主从结构设计方式,通过IDMA口由CPU装载程序。语音识别系统的硬件结构如图2所示。
在这种结构中,PC机为主CPU,ADSP2181为从CPU,由PC机通过IDMA口将程序装载到ADSP2181的内部存储器中。PC机总线通过CPLD译码,形成等控制信号,与ADSP2181的IDMA口相连。这样,在ADSP2181全速运行时,主机可以查询从机的运行状态,可以访问到ADSP2181内部所有的程序存储器和数据存储器。这对