MATLAB在_语音信号处理_课程教学中的应用

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

-183

-

引言

《语音信号处理》课程是我校电子信息科学与技术和通信工程专业四年级的专业选修课程,课程内容较多,涉及大量的数学运算和公式推导,由于概念抽象,使得学生难以理解。因此,淡化理论的推导过程,使概念直观化,将是帮助学生理解教学内容的关键之一。

基于MATLAB 平台,可以将教学内容中的一些难以理解的要点或者抽象的概念用M A TL A B 语言开发成可执行的程序,从而将“语音信号处理”课程中较难掌握和理解的重点理论和方法通过编程演示出来,使学生对所学知识的理解更加透彻。

本文以MATLAB 实现对语音信号的端点检测以及整个语音识别系统的仿真为例,来说明MALAB 在“语音信号处理”这门课程教学中的应用。

1 语音信号的端点检测

MATLAB在《语音信号处理》课程教学中的应用

李爱平1 李爱勤2 王小娟1

1.西藏民族学院 712082;2.解放军信息工程大学 450000

端点检测算法的作用是对语音信号中的有声片段和无声片段进行分割,从而可以找出语音段的起始点和终止点,才有可能使采集到的数据是真正要分析的语音信号,这样不但减少了数据量、运算量和处理时间,同时也有利于语音识别系统识别率的提高。端点检测常用的方法是双门限法,一般利用短时过零率和短时能量来实现。

1.1 短时能量

对语音信号的处理一般是以帧为单位的,一帧语音信号的长度一般取20ms 左右。设语音波形的第n 帧语音信号为x n (m ),则第n 帧语音信号x n (m )的短时能量用E n

为:

1.2 短时过零率

短时过零率表示一帧语音信号波形穿过横轴(零电平)的次数。过零分析是语音时域分析中最简单的一种。对于连续语音信号,过零意味着时域波形通过时间轴;而对于离散信号,如果相邻的取样值的改变符号称为过零,过零率就是样本改变符号的次数。定义语音信号x n (m )的

短时过零率:

其中sng[ ]

为符号函数,即:

1.3利用MATLAB 实现对语音信号的端点检测

在实验室环境中,在Windows XP 系统下采用

Windows 自带录音软件录制,使用采样率44kHz,16bit 的语音信号,取语音信号的帧长为240点,帧移长度为80点,端点检测过程基于MATLAB 实现。实验语音源为“1、2、3”3个汉语数字的发音。图1中a 是其加窗分帧后的语音信号,b 是其短时能量,c 是其短时过零率的波形图。

从其仿真界面图可以看出,只要对短时能量和短时过零率设定相应的门限参数,就可以把语音信号的有声段检测出来

2 利用MATLAB 实现对语音识别系统的仿真

2.1 原理简介

语音识别就是让机器能听懂人类的语

音。一个语音识别系统主要包括语音信

DOI :10.3969/j.issn.1001-8972.2010.17.093

-184

-

号预处理、信号特征参数提取、建立模板库、进行模式匹配几个阶段。其中,语音信号预处理包括预滤波,采样、量化、加窗、端点检测、预加重等环节。其基本框架如图2所示。

在这个模式匹配过程中,首先是要对人的自然语言的语音信号进行预处理,将连续模拟信号变成离散数字信号,语音离散数字信号包含大量冗余信息,能极大的影响语音识别的识别率,因此需要对语音数字信号进行特征参数提取,剔除对语音识别没有用的冗余信息。通常使用倒谱、Mel 倒谱参数等抽取实际所需的语音特征参数,这些特征参数的时间序列构成了语音识别模板,经过周而复始的大量反复输入、提取,最终得到最优的语音识别模板,然后将不同词条的大量语音模板按一定数据结构构建模板库。计算机在语音识别过程中要对计算机存放模板库中的语音模板与输入的语音数字信号的特征进行比较,通过识别决策如搜索、匹配等策略,获得最佳的匹配模板。

2.2 仿真实现

本实验中所提取的特征参数为Mel 倒谱系数,模板匹配过程中采用的是DTW 算法。

所使用的语音数据库有:0,1,2,3,4,5,6,7,8,9共10个数字样本元素。语音识别时,说话者对每个孤立数字再次发音,作为识别命令。语音识别后的具体结果如图3

所示。

3 结束语

本文围绕语音信号的数字处理过程,以语音信号的端点检测和语音识别系统的仿真实现为例,说明MALAB 语言在“语音信号处理”这门课程教学中应用。在这门课程教学中引用MATLAB 作为软件实

施平台,可以加深学生对课堂抽象理论的理解,并能掌握语音信号处理中的基本分析方法和理论应用,提高学生对这门课程的学习兴趣。

企业就能依据一个完整的需求系统对职工培训进行规划,达到企业整体培训需求与个人需求的有机结合。

3、加强培训基地建设

良好的环境是职工培训的基础,充足的培训场地,齐全的教学设施,现代化的电教设备和办公用品,专用的职工实验室及雄厚的师资队伍是一所好学校必需具备的条件。

4、注重提高教师素质

企业应在培养教师方面下工夫,对培训老师的培养教育要实行两条腿走路的方针,一是要送到高一级学校进修学习,增强他们的理论知识和专业水平,或让教师参加行业各种研讨班,增长见识,拓宽知识面,吸收先进的培训理念及掌握新的培训技能,提高培训能力。二是要培养教师们的高度责任心,激发他们爱岗敬业的精神,钻研业务知识的积极性,不断提高职业素质及个人修养的品质。

5、开发个性化教材

教材是能否实现有效高质育人的关键和基础,没有好的教材,再好的项目和课程也要落空。如果一个培训单位没有自己的特色教材,没有自己的核心教材,就没有自己的核心技术。

6、适合成人培训特点

企业职工培训的对象是成人,培训受时间、参差不齐的文化素质和各类工种及年龄悬殊的限制。培训过程中我们要注意既要考虑工作需要的培训内容,也要适应地考虑学员的具体学习要求,使他们学到真正希望学到的知识,要多采用启发式、自我指导、行为学习等方法,给他们创造一种愉快轻松的学习氛围,要多鼓励和表扬,增加学员学习的自信心。

7、培训要引入考核与激励机制

要把培训成绩作为职工定级、使用和激励的依据,做到培训与考核相结合,根据考核结果进行适当奖励,激发职工的学习兴趣,培训与晋升、晋级相结合,把培训的实绩作为使用的重要指标。

8、抓好培训后的“跟踪管理”要定期对受训职工的工作效率和工作质量进行调查,获取意见反馈,改进培训方法;要检查各部门管理者是否将培训内容贯彻到工作中去,是否按培训的标准严格要求员工,避免出现“你培训你的,我管理我的”问题。

相关文档
最新文档