DTW算法计算实例_补充版

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

DTW 计算实例
DTW (dynamic time warping )算法在语音识别中主要应用于由于说话人不同或者说话人在不同时间由于发声方法不同,产生发声速度不同及其他语音特征参数的变化而引起的在模式匹配时,待测模式与参考模式时间长度不一样的问题。

DTW 算法是一种非线性匹配算法,它是使时间长度不一样的模式A 与B 的元素之间匹配,使匹配后的两个模式之间的累积距离最小,从而保证模式之间的最大声学相似性。

上面是一个具体的计算实例,参考的是上海交通大学计算机系吴亚栋老师的课件。

下面是我对DTW 计算过程的理解。

m n (n = 6)待用动态时间规整进行匹配的语音。

而待测模式中的a1-a4可以理解为待匹配的语音段的每帧的特征,相应的b1-b6也可理解为参考语音段的每帧的特征。

首先计算模式A 与模式B 每个元素之间的距离,相当于计算语音A 与语音B 之间每帧特征之间的距离,距离可以用欧式距离或者其他的距离。

上表中的黑色数字表示的就是待测模式与参考模式每个元素(也就是每帧的特征)之间的距离。

然后求累计距离: (1) 取初始累积距离g(a1,b1) = 2d(a1,b1),对应于表格中的a1与b1对应格子的红色数值,表示语音A 第一帧与语音B 第一帧的特征距离。

(2)
然后从左下角根据A 与B 每个元素的距离(黑色数值)计算每个匹配点的累积距离(表格中的红色数字),并且记录累积距离计算过程中的具体路径(表格中的蓝色连接线,也就是局部最佳路径)。

说明: ● 局部最佳路径记录了在路径限制条件下,求当前累积距离时,根据的是上一步哪个累积距离(也就是),方便在最后从A m 回溯到B n 找到全局最佳路径。


本次计算实例用的路径限制是
累积距离:
对于上面的路径约束,具体的推导公式为:
g(i,j)= min{g(i-1,j)+d(ai,bj)*wn(1);
g(i-1,j-1)+d(ai,bj)*wn(2);
g(i,j-1)+d(ai,bj)*wn(3)}
其中,wn(1)=wn(3)=1,wn(2)=2。

当然还有其他的路径限制,请大家自己查找资料。

(3)最后要想找到最佳匹配路径,从终点ck(ik=4,jk=6)出发,根据局部最佳路径往回找,一直到初始匹配点(a1,b1),找到的路径即为最佳匹配路径(表格中红色连接线)。

相关文档
最新文档