算法设计动态规划(编辑距离)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《算法设计与分析》课程报告
课题名称:动态规划——编辑距离问题
课题负责人名(学号):
同组成员名单(角色):无
指导教师:左劼
评阅成绩:
评阅意见:
提交报告时间:2010年 6 月 23 日
动态规划——编辑距离问题
计算机科学与技术专业
学生指导老师左劼
[摘要]动态规划的基本思想与分治法类似,也是将待求解的问题分解成若干份的子问题,先分别解决好子问题,然后从子问题中得到最终解。但动态规划中的子问题往往不是相互独立的,而是彼此之间有影响,因为有些子问题可能要重复计算多次,所以利用动态规划使这些子问题只计算一次。将字符串A变换为字符串所用的最少字符操作数称为字符串A到B的编辑距离。
关键词:动态规划矩阵字符串操作数编辑距离
一、问题描述
1、基本概念:设A和B是2个字符串。要用最少的字符操作将字符串A转换为字符串B。字符串操作包括:
(1) 删除一个字符;
(2) 插入一个字符;
(3) 将一个字符改为另一个字符。
将字符串A变换为字符串B所用的最少字符操作数称为字符串A 到B的编辑距离,记为d(A,B)。
2、算法设计:设计一个有效算法,对于给定的任意两个字符串A 和B,计算其编辑距离d(A,B)。
3、数据输入:输入数据由文件名为input.txt的文本文件提供。文件的第1行为字符串A,第二行为字符串B。
4、结果输出:将编辑距离d(A,B)输出到文件ouput.txt的第一行。
输入文件示例输出文件示例
input.txt output.txt
fxpimu 5
xwrs
二、分析
对于本问题,大体思路为:把求解编辑距离分为字符串A从0个字符逐渐增加到全部字符分别想要变为字符串B该如何变化以及变化的最短距离。
具体来说,首先选用数组a1存储字符串A(设长度为n),a2存储字符串B(设长度为m),d矩阵来进行具体的运算;这里有两个特殊情况比较简单可以单独考虑,即A的长度为0而B不为0还有A不为0B为0,这两种情况最后的编辑距离分别为m和n;讨论一般情况,d矩阵为d[n][m],假定我们从d[0][0]开始一直进行以下操作到了d[i][j]的位置,其中删除操作肯定是A比B长,同理,插入字符操作一定是A比B短,更改字符操作说明一样长,我们所要做的是对d[i][j-1]
d[i-1][j] d[i-1][j-1]所存数进行比较,其中最小的即为当前长度和样式的字符串A变为B的编辑距离,依次这样计算到最后的d[n][m]中所存的数即为最终的编辑距离。
三、证明
1、理论前提:动态规划的基本思想与分治法类似,也是将待求解的问题分解成若干份的子问题,先分别解决好子问题,然后从子问题中得到最终解。但动态规划中的子问题往往不是相互独立的,而是彼此之间有影响。该算法的有效性依赖于两个重要的性质:最优子结构性质和问题重叠性质。
最有子结构性:以自底向上的方法递归地从子问题的最优解逐步构造出整个问题的最优解。
重叠子问题性:每次产生的子问题并不总是新问题,利用动态规划对每一个子问题只解一次,并将其存入表格中,下次用到该子问题的解时,只要查找表格即可。
2、本题:本题首先符合最优子结构性,即让字符串A从1开始递增到最终长度n,也就是从只有一个字符开始计算,每增加一个字符计算一次,符合自底向上的方法递归地解决子问题;其次符合重叠子问题性,每增加一个字符计算的时候总要用到前一状态时的编辑距离,并且本题我采用了矩阵来存储旧子问题的数据,都只计算了一次,所以也符合。
3、总结:综上两点,可知本题采用了动态规划的思想来解决,并能得到正确的答案。
四、代码及解释(注释)
#include
#include
#include
#include
using namespace std;
const int MAX=1000;
int min(int a,int b)
{
if(a>=b)
return b;
else
return a;
}
int main()
{
int d[MAX][MAX];
int i,j;
char a1[MAX], a2[MAX];
FILE *fp;
fp=fopen("input.txt","r");
fscanf(fp,"%s",a1);
fscanf(fp,"%s",a2);
fclose(fp);
int n=strlen(a1)-1; //字符串末尾多1
int m=strlen(a2)-1;
for(i=0;i<=n;i++) //从i变到0字符串,i个需要i次(添加) d[i][0]=i;
for(i=0;i<=m;i++) //从0字符串变到j,j个需要j次(删除) d[0][i]=i;
for(i=1;i<=n;i++)
{
for(j=1;j<=m;j++)
{
if(a1[i]!=a2[j])
d[i][j]=min(min(d[i][j-1],d[i-1][j]),d[i-1][j-1])+1;
//加一个,减一个,变一个else
d[i][j]=d[i-1][j-1];
}
}
cout< fp=fopen("output.txt","w"); fprintf(fp,"%d",d[n][m]); fclose(fp); return 0; } /* 输入:fxpimu xwrs 输出:5 */ 五、复杂度分析 以下为核心代码部分: for(i=0;i<=n;i++) //从i变到0字符串,i个需要i次(添加) d[i][0]=i; 一重循环时间复杂度为T(n) for(i=0;i<=m;i++) //从0字符串变到j,j个需要j次(删除) d[0][i]=i; 一重循环时间复杂度为T(m) for(i=1;i<=n;i++) { for(j=1;j<=m;j++) { if(a1[i]!=a2[j]) d[i][j]=min(min(d[i][j-1],d[i-1][j]),d[i-1][j-1])+1; //加一个,减一个,变一个