串匹配问题:BF算法、KMP算法、BM算法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一、实验内容和目的

1、深刻理解并掌握蛮力算法的设计思想;

2、提高应用蛮力算法设计算法的技能;

3、理解这样一个观点:用蛮力法设计的算法,一般来说,经过适度的努

力后,都可以对算法的第一个版本进行一定程度的改良,改进其时

间性能。

二、实验原理及基本技术路线图(方框原理图)

串匹配问题——给定两个串S=“s1s2…s n” 和T=“t1t2…t m”,在主

串S中查找子串T的过程称为串匹配,也称模式匹配。

串匹配问题属于易解问题。

串匹配问题的特征:

(1)算法的一次执行时间不容忽视:问题规模n 很大,常常需要在

大量信息中进行匹配;

(2)算法改进所取得的积累效益不容忽视:串匹配操作经常被调用,执行频率高。

BF算法:

基本思想:从主串S的第一个字符开始和模式T的第一个字符进行比

较,若相等,则继续比较两者的后续字符;若不相等,则从主串S

的第二个字符开始和模式T的第一个字符进行比较,重复上述过程,若T中的字符全部比较完毕,则说明本趟匹配成功;若最后一轮匹配

的起始位置是n-m,则主串S中剩下的字符不足够匹配整个模式T,

匹配失败。这个算法称为朴素的模式匹配算法,简称BF算法。

KMP算法:

1. 在串S和串T中分别设比较的起始下标i和j;

2. 循环直到S中所剩字符长度小于T的长度或T中所有字符均比较

完毕

2.1 如果S[i]=T[j],则继续比较S和T的下一个字符;否则

2.2 将j向右滑动到next[j]位置,即j=next[j];

2.3 如果j=0,则将i和j分别加1,准备下一趟比较;

2.4 如果T中所有字符均比较完毕,则返回匹配的起始下标;否则返回0;

BM算法:

BM算法与KMP算法的主要区别是匹配操作的方向不同。虽然BM算法仅把匹配操作的字符比突顺序改为从右向左,但匹配发生失败时,模式T右移的计算方法却发生了较大的变化。

设计思想:设文本串T,模式串为P。首先将T与P进行左对齐,然后进行从右向左比较,若是某趟比较不匹配时,BM算法就采用两条启发式规则,即坏字符规则和好后缀规则,来计算模式串向右移动的距离,直到整个匹配过程的结束。

开始 主串S 长度→m

模式T 长度→n

0→i

i

0→b

i →a

S[a]=T[b]且b ≨n a 加1

b 加1 b=n

Y

N

Y

Y

Y

N

N

N

BF 算法

结束

开始

主串S 长度→m 模式T 长度→n

0→a 0→b

a ≦m-n

S[a]=T[b]且b ≨n

a 加1

b 加1

b=n

Y

Y Y

N

N

N

KMP 算法

结束

next[b]→b

a-b →a

b=-1

b 加1

三、 所用仪器、材料(设备名称、型号、规格等)

Windows 7,Microsoft Visual C++ 6.0

四、 实验方法、步骤 1、 实现BF 算法;

2、 实现BF 算法的改进算法:KMP 算法和BM 算法;

开始

i ≦主串S 长度-1

模式T 长度-1→j

j ≧0且S[i]=T[j]

i 减1

j 减1

j<0

Y

Y

Y

N

N

N

BM 算法

结束 0→a 0→b

0→z

模式T 长度-1→i

i+DIST(T,S[i])→i

3、观察并记录运行结果。

五、实验过程原始记录(数据、图表、计算等)源程序:

#include "stdio.h"

#include "conio.h"

#include

//BF算法

int BF(char s[],char t[])

{

int i;

int a;

int b;

int m,n;

m=strlen(s); //主串长度

n=strlen(t); //子串长度

printf("\n*****BF*****算法\n");

for(i=0;i

{

b=0;

a=i;

while(s[a]==t[b]&&b!=n)

{

a++;

b++;

}

if(b==n)

{

printf("查找成功!!\n\n");

return 0;

}

}

printf("找不到%s\n\n",t);

return 0;

}

//前缀函数值,用于KMP算法

int GETNEXT(char t[],int b)

{

int NEXT[10];

NEXT[0]=-1;

int j,k;

j=0;

k=-1;

while(j

{

if ((k==-1)||(t[j]==t[k]))

{

j++;

k++;

NEXT[j]=k;

}

else k=NEXT[k];

}

b=NEXT[b];

return b;

}

//KMP算法

int KMP(char s[],char t[])

{

int a=0;

int b=0;

int m,n;

m=strlen(s); //主串长度

n=strlen(t); //子串长度

printf("\n*****KMP算法*****\n");

while(a<=m-n)

{

while(s[a]==t[b]&&b!=n)

{

a++;

b++;

}

if(b==n)

{

printf("查找成功!!\n\n");

return 0;

}

相关文档
最新文档