动态时间规整算法

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

. 特定人识别中的DTW算法简单介绍

分类:语音技术应用2010-07-16 10:03215人阅读评论(1)收藏举报DTW(Dynamic Time Warping)是动态时间规整算法,在语音识别系统中通常

用于特定人识别,特定人识别即A用户使用这个语音识别系统,B用户使用就

会出现语音识别出错或无法识别的现象。DTW在语音识别系统中,是一个需要用户事先训练的系统。从操作方面上,首

先需要训练,对需要控制的命令录制对

应的语音;使用时只要说出与训练时同

样的语音命令,即可出现识别结果,实

现声控。

比如,一些简单的语音识别玩具,约10多个特定的命令词。

DTW在语音识别系统中充当数据匹配比对模块。语音识别系统首先采集用户的语音,经过

端点检测,找出用户的有效语音而把其他非语音段给删除;然后经过MFCC特征提取,得

到用户声音的特征,最后进入DTW,进行欧式距离的比对,距离最小对应的模板,即为识

别结果。

几个名词解释:

MFCC--- 语音频谱包络抽取

欧式距离--- 在二维和三维空间中的欧式距离的就是两点之间的距离,二维的公式是d = sqrt((x1-x2)^+(y1-y2)^)

三维的公式是

d=sqrt(x1-x2)^+(y1-y2)^+z1-z2)^)

推广到n维空间,欧式距离的公式是

d=sqrt( ∑(xi1-xi2)^ ) 这里i=1,2..n

xi1表示第一个点的第i维坐标,xi2表示第二个点的第i维坐标

相关文档
最新文档