串匹配问题:BF算法、KMP算法、BM算法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、实验内容和目的
1、深刻理解并掌握蛮力算法的设计思想;
2、提高应用蛮力算法设计算法的技能;
3、理解这样一个观点:用蛮力法设计的算法,一般来说,经过适度的努
力后,都可以对算法的第一个版本进行一定程度的改良,改进其时
间性能。
二、实验原理及基本技术路线图(方框原理图)
串匹配问题——给定两个串S=“s1s2…s n” 和T=“t1t2…t m”,在主
串S中查找子串T的过程称为串匹配,也称模式匹配。
串匹配问题属于易解问题。
串匹配问题的特征:
(1)算法的一次执行时间不容忽视:问题规模n 很大,常常需要在
大量信息中进行匹配;
(2)算法改进所取得的积累效益不容忽视:串匹配操作经常被调用,执行频率高。
BF算法:
基本思想:从主串S的第一个字符开始和模式T的第一个字符进行比
较,若相等,则继续比较两者的后续字符;若不相等,则从主串S
的第二个字符开始和模式T的第一个字符进行比较,重复上述过程,若T中的字符全部比较完毕,则说明本趟匹配成功;若最后一轮匹配
的起始位置是n-m,则主串S中剩下的字符不足够匹配整个模式T,
匹配失败。这个算法称为朴素的模式匹配算法,简称BF算法。
KMP算法:
1. 在串S和串T中分别设比较的起始下标i和j;
2. 循环直到S中所剩字符长度小于T的长度或T中所有字符均比较
完毕
2.1 如果S[i]=T[j],则继续比较S和T的下一个字符;否则
2.2 将j向右滑动到next[j]位置,即j=next[j];
2.3 如果j=0,则将i和j分别加1,准备下一趟比较;
2.4 如果T中所有字符均比较完毕,则返回匹配的起始下标;否则返回0;
BM算法:
BM算法与KMP算法的主要区别是匹配操作的方向不同。虽然BM算法仅把匹配操作的字符比突顺序改为从右向左,但匹配发生失败时,模式T右移的计算方法却发生了较大的变化。
设计思想:设文本串T,模式串为P。首先将T与P进行左对齐,然后进行从右向左比较,若是某趟比较不匹配时,BM算法就采用两条启发式规则,即坏字符规则和好后缀规则,来计算模式串向右移动的距离,直到整个匹配过程的结束。
开始 主串S 长度→m
模式T 长度→n
0→i
i 0→b i →a S[a]=T[b]且b ≨n a 加1 b 加1 b=n Y N Y Y Y N N N BF 算法 结束 开始 主串S 长度→m 模式T 长度→n 0→a 0→b a ≦m-n S[a]=T[b]且b ≨n a 加1 b 加1 b=n Y Y Y N N N KMP 算法 结束 next[b]→b a-b →a b=-1 b 加1 三、 所用仪器、材料(设备名称、型号、规格等) Windows 7,Microsoft Visual C++ 6.0 四、 实验方法、步骤 1、 实现BF 算法; 2、 实现BF 算法的改进算法:KMP 算法和BM 算法; 开始 i ≦主串S 长度-1 模式T 长度-1→j j ≧0且S[i]=T[j] i 减1 j 减1 j<0 Y Y Y N N N BM 算法 结束 0→a 0→b 0→z 模式T 长度-1→i i+DIST(T,S[i])→i 3、观察并记录运行结果。 五、实验过程原始记录(数据、图表、计算等)源程序: #include "stdio.h" #include "conio.h" #include //BF算法 int BF(char s[],char t[]) { int i; int a; int b; int m,n; m=strlen(s); //主串长度 n=strlen(t); //子串长度 printf("\n*****BF*****算法\n"); for(i=0;i { b=0; a=i; while(s[a]==t[b]&&b!=n) { a++; b++; } if(b==n) { printf("查找成功!!\n\n"); return 0; } } printf("找不到%s\n\n",t); return 0; } //前缀函数值,用于KMP算法 int GETNEXT(char t[],int b) { int NEXT[10]; NEXT[0]=-1; int j,k; j=0; k=-1; while(j { if ((k==-1)||(t[j]==t[k])) { j++; k++; NEXT[j]=k; } else k=NEXT[k]; } b=NEXT[b]; return b; } //KMP算法 int KMP(char s[],char t[]) { int a=0; int b=0; int m,n; m=strlen(s); //主串长度 n=strlen(t); //子串长度 printf("\n*****KMP算法*****\n"); while(a<=m-n) { while(s[a]==t[b]&&b!=n) { a++; b++; } if(b==n) { printf("查找成功!!\n\n"); return 0; }