最短编辑距离算法(Minimum Edit Distance)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

最小编辑距离算法Minimum Edit Distance

詹卫东

北京大学中文系

最小编辑距离算法描述

function Min-Edit_Distance (target, source)n = length(target);m = length(source);

create distance matrix d[n,m];d[0,0]=0;

d[0,1]=1,…d[0,m]=m; d[1,0]=1,…d[n,0]=n;for each i from 1 to n do for each j from 1 to m do

d[i, j] = min( d[i-1, j] + insertCost(target i )),

d[i-1, j-1] + substituteCost(source j , target i ),d[i, j-1] + deleteCost(source j ));

return d[n,m];

最小编辑距离计算练习

•intention Æexecution

i n t e n * t i o n * e x e c u t i o n d s s s i 1 2 2 2 1

= 8

i n t e n t i o n e x e c u t i o n s s s s s 2 2 2 2 2

= 10

参考文献

•Daniel Jurafsky& James H. Martin, 2000, Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition, Chapter 5, section 5.6, pp153-156, Prentice-Hall Inc..

相关文档
最新文档