暴力算法
//暴力算法
int index(SString S,SString T,int pos)
{int i=pos,j=1;while(i<=S[0]&&j<=T[0]){if(S[i]==T[j]){++i;++j;}else {i=i-j+2;j=1;}}if(j>T[0])return i-T[0];else return 0;}
kmp算法
next[]数组的求法:
例子:abaabcac
模式串的下标从1开始
- 第一位固定为0;
- 第二位固定为1;
- 从第三位(i)开始(其余的每一位都如此),
从该位 (i) 的前一位开始,从右向左寻找子串
从模式串的头部(最左边),从左向右寻找子串
找到两头子串的最大相同的个数
把最大相同的个数的下一位的索引给next[i]
//next函数算法
void get_next(SString T,int next[])
{int j; int i=1;next[1]=0;j=0;while(i<T[0]){if(j==0||T[i]==T[j]){i++;j++;next[i]=j;}else j=next[j];}
}
int Index_KMP(SString S,SString T,int pos)
{ int next[MAXSTRLEN+1]; get_next(T,next);int i=pos; int j=1;while(i<=S[0]&&j<=T[0])//i j都不超过其串的长度{//失配 //1:失配,当j==0时,则目标主串的检测指针前进一位,模式串检测指针回到T[1].进行下一趟的比较//2:失配,当j>0时,那么在下一趟比较时,模式串的起始位置为Tnext[j],目标主串S的检测指针不回溯,仍然指向上一趟失配的位置 if(j==0||S[i]==T[j]){++i;++j;//继续比较后继字符 }else j=next[j];//模式串向右移动 }if(j>T[0]) return i-T[0];//匹配成功 else return 0;
}
kmp算法改进版
例子:abaabcac
求nextval[]数组:(需要根据next[]数组来求)
1.
void get_nextval(SString T,int nextval[])
{int j; int i=1;nextval[1]=0;j=0;while(i<T[0]){if(j==0||T[i]==T[j]){i++;j++;if(T[i]!=T[j])nextval[i]=j;else nextval[i]=nextval[j];}else j=nextval[j];}
}int Index_KMP_val(SString S,SString T,int pos)
{ int nextval[MAXSTRLEN+1]; get_nextval(T,nextval);int i=pos; int j=1;while(i<=S[0]&&j<=T[0])//i j都不超过其串的长度{//失配 //1:失配,当j==0时,则目标主串的检测指针前进一位,模式串检测指针回到T[1].进行下一趟的比较//2:失配,当j>0时,那么在下一趟比较时,模式串的起始位置为Tnext[j],目标主串S的检测指针不回溯,仍然指向上一趟失配的位置 if(j==0||S[i]==T[j]){++i;++j;//继续比较后继字符 }else j=nextval[j];//模式串向右移动 }if(j>T[0]) return i-T[0];//匹配成功 else return 0;
}
包含三个算法的全部程序代码
#include <stdio.h> // printf(); scanf()
#include <stdlib.h> // exit()
#include <malloc.h> // malloc()
#include <time.h> // srand((unsigned)time(NULL));
#include <string.h>// 函数结果状态代码
#define TRUE 1
#define FALSE 0
#define OK 1
#define ERROR 0
#define INFEASIBLE -1
#define OVERFLOW -2// Status是函数的类型,其值是函数结果状态代码
typedef int Status;// #define ElemType int // 也可以用宏定义确定ElemType类型
typedef int ElemType;
// Status是函数的类型,其值是函数结果状态代码 -----串的定长顺序存储表示-----
#define MAXSTRLEN 255 // 用户可在255(1个字节)以内定义最大串长
typedef unsigned char SString[MAXSTRLEN + 1]; // 0号单元存放串的长度Status StrAssign(SString &T, char *chars) {if(strlen(chars) > MAXSTRLEN)return ERROR;else {T[0] = strlen(chars); // 0号单元存放串的长度for(int i=1; i<=T[0]; i++)T[i] = *(chars+i-1);return OK;}
}Status StrCopy(SString &T, SString S) {for(int i=0; i<=S[0]; i++)T[i] = S[i];return OK;
}int StrCompare(SString S, SString T) {int i;for(i=1; i<=S[0] && i<=T[0]; ++i)if(S[i] != T[i])return S[i]-T[i];return S[0]-T[0];
}int StrLength(SString S) {return S[0];
}Status StrEmpty(SString S) {if(S[0] == 0)return TRUE;elsereturn FALSE;
}Status Concat(SString T, SString S1, SString S2) {// 若未截断,则返回TRUE;否则返回FALSE。int i;if(S1[0]+S2[0] <= MAXSTRLEN) // 未截断{for(i=1; i<=S1[0]; i++) // 将串S1赋给TT[i] = S1[i];for(i=1; i<=S2[0]; i++) // 将串S2赋给T中已有串S1的后面T[S1[0]+i] = S2[i];T[0] = S1[0] + S2[0]; // 新串的长度return TRUE;} else if(S1[0] < MAXSTRLEN) { // 截断S2的部分字符序列for(i=1; i<=S1[0]; i++) // 将串S1赋给TT[i] = S1[i];for(i=1; i<=MAXSTRLEN-S1[0]; i++)// 将串S2未截断的部分赋给T中已有串S1的后面T[S1[0]+i] = S2[i];T[0] = MAXSTRLEN;return FALSE;} else { // 截断(仅取S1)for(i=1; i<=MAXSTRLEN; i++) // 将串S1赋给TT[i] = S1[i];T[0] = MAXSTRLEN;return FALSE;}
}//Concat 算法 4.2
// 初始条件:串S存在,1≤pos≤StrLength(S)且0≤len≤StrLength(S)-pos+1。
// 操作结果:用Sub返回串S的第pos个字符起长度为len的子串。
Status SubString(SString Sub, SString S, int pos, int len) {int i;if(pos<1 || pos>S[0] || len<0 || len>S[0]-pos+1)return ERROR;for(i=1; i<=len; i++)Sub[i] = S[pos+i-1];Sub[0] = len;return OK;
}void StrPrint(SString T) {for( int i = 1; i<= T[0]; i++)printf("%c ", T[i]);printf("\n");
}
//将模式串的next函数值存入到数组next中
//next函数算法
void get_next(SString T,int next[])
{int j; int i=1;next[1]=0;j=0;while(i<T[0]){if(j==0||T[i]==T[j]){i++;j++;next[i]=j;}else j=next[j];}
}//利用模式串T的next函数求T在主串S中第pos个字符之后的位置
//KMP算法 其中T非空 1<=pos<=StrLength(S) void get_nextval(SString T,int nextval[])
{int j; int i=1;nextval[1]=0;j=0;while(i<T[0]){if(j==0||T[i]==T[j]){i++;j++;if(T[i]!=T[j])nextval[i]=j;else nextval[i]=nextval[j];}else j=nextval[j];}
}int Index_KMP(SString S,SString T,int pos)
{ int next[MAXSTRLEN+1]; get_next(T,next);int i=pos; int j=1;while(i<=S[0]&&j<=T[0])//i j都不超过其串的长度{//失配 //1:失配,当j==0时,则目标主串的检测指针前进一位,模式串检测指针回到T[1].进行下一趟的比较//2:失配,当j>0时,那么在下一趟比较时,模式串的起始位置为Tnext[j],目标主串S的检测指针不回溯,仍然指向上一趟失配的位置 if(j==0||S[i]==T[j]){++i;++j;//继续比较后继字符 }else j=next[j];//模式串向右移动 }if(j>T[0]) return i-T[0];//匹配成功 else return 0;
}int Index_KMP_val(SString S,SString T,int pos)
{ int nextval[MAXSTRLEN+1]; get_nextval(T,nextval);int i=pos; int j=1;while(i<=S[0]&&j<=T[0])//i j都不超过其串的长度{//失配 //1:失配,当j==0时,则目标主串的检测指针前进一位,模式串检测指针回到T[1].进行下一趟的比较//2:失配,当j>0时,那么在下一趟比较时,模式串的起始位置为Tnext[j],目标主串S的检测指针不回溯,仍然指向上一趟失配的位置 if(j==0||S[i]==T[j]){++i;++j;//继续比较后继字符 }else j=nextval[j];//模式串向右移动 }if(j>T[0]) return i-T[0];//匹配成功 else return 0;
}//暴力算法
int index(SString S,SString T,int pos)
{int i=pos,j=1;while(i<=S[0]&&j<=T[0]){if(S[i]==T[j]){++i;++j;}else {i=i-j+2;j=1;}}if(j>T[0])return i-T[0];else return 0;} int main()
{ int x;int number;int pos;char c[MAXSTRLEN+1],d[MAXSTRLEN+1];SString S;SString T;printf("输入字符串S(主串):");scanf("%s",c);if(!StrAssign(S, c)) {printf("串长超过MAXSTRLEN=%d,程序正常退出。\n", MAXSTRLEN);exit(0);}printf("输入字符串T(模式串):");scanf("%s",c);if(!StrAssign(T, c)) {printf("串长超过MAXSTRLEN=%d,程序正常退出。\n", MAXSTRLEN);exit(0);} // StrPrint(S);// StrPrint(T);printf("输入要在主串开始的位置pos:");scanf("%d",&pos);printf("选择要是用的算法1(暴力算法)/2(kmp算法next)/3(kmp算法nextval):");scanf("%d",&x);if(x==1){number=index(S, T, pos);printf("%d",number);}else if(x==2){int next1[MAXSTRLEN+1];get_next( T,next1);for(int i=1;i<=T[0];i++){printf("%d ",next1[i]);}printf("\n"); number=Index_KMP(S,T,pos);printf("%d",number);}else if(x==3){int nextval1[MAXSTRLEN+1];get_nextval( T,nextval1);for(int i=1;i<=T[0];i++){printf("%d ",nextval1[i]);}printf("\n"); number=Index_KMP_val(S,T,pos);printf("%d",number);}return 0;}