最短编辑距离算法(Minimum Edit Distance)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
最小编辑距离算法Minimum Edit Distance
詹卫东
北京大学中文系
最小编辑距离算法描述
function Min-Edit_Distance (target, source)n = length(target);m = length(source);
create distance matrix d[n,m];d[0,0]=0;
d[0,1]=1,…d[0,m]=m; d[1,0]=1,…d[n,0]=n;for each i from 1 to n do for each j from 1 to m do
d[i, j] = min( d[i-1, j] + insertCost(target i )),
d[i-1, j-1] + substituteCost(source j , target i ),d[i, j-1] + deleteCost(source j ));
return d[n,m];
最小编辑距离计算练习
•intention Æexecution
i n t e n * t i o n * e x e c u t i o n d s s s i 1 2 2 2 1
= 8
i n t e n t i o n e x e c u t i o n s s s s s 2 2 2 2 2
= 10
参考文献
•Daniel Jurafsky& James H. Martin, 2000, Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition, Chapter 5, section 5.6, pp153-156, Prentice-Hall Inc..