ez_lcw
2019-03-15 14:02:15
一个算是冷门的算法(在竞赛上),不过其算法思想值得深究。
kmp的算法思想,具体可以参考这篇日报。
trie树(字典树)。
扩展kmp的模板问题:
给你两个字符串s,t,长度分别为n,m。
请输出s的每一个后缀与t的最长公共前缀。
哈希是不可能的,这辈子都不可能的。
由图可知,
我们会发现:在求
因为已经计算出
所以有:
然后得:
因为计算
又因为刚刚求出了
所以匹配的开头阶段是求
这时我们可以设置辅助参数:
那么对于上述的例子:
即:
然后得:
也就是说求
这其实就是kmp的思想。
设
然后我们设取这个最大值k的位置是
首先,根据定义,
我们设(仅仅是为了下面的讲解方便)
然后令
下面分两种情况讨论:
也就是
我们设
此时
也就是说,
即
然后由
又因为
所以
又因为
所以
所以这段的代码比较简单:
if(i+nxt[i-p0]<extend[p0]+p0)extend[i]=nxt[i-p0];
//i相当于k+1
//nxt[i-p0]相当于L
//extend[p0]+p0相当于p
//因为在代码里我是从0开始记字符串的,所以本应在小于号左侧减1,现在不用了。
也就是
图可能略丑
同样,我们设
此时
同理,
那么我们设
那么
又因为:
即
所以
也就是说
即
那么我们就可以从
那么这段的代码长这样:
int now=extend[p0]+p0-i;
now=max(now,0);//这里是防止i>p
while(t[now]==s[i+now]&&now<(int)t.size()&&now+i<(int)s.size())now++;//暴力求解的过程
extend[i]=now;
p0=i;//更新p0
求
求T的每一个后缀与T的最长公共前缀长度
听起来好熟悉,我们再看一下题面:
求S的每一个后缀与T的最长公共前缀长度
我们发现求直接复制重新打一遍就好了。
这其实和
要注意的一点是:求
因为求
#include<bits/stdc++.h>
#define N 1000010
using namespace std;
int q,nxt[N],extend[N];
string s,t;
void getnxt()
{
nxt[0]=t.size();//nxt[0]一定是T的长度
int now=0;
while(t[now]==t[1+now]&&now+1<(int)t.size())now++;//这就是从1开始暴力
nxt[1]=now;
int p0=1;
for(int i=2;i<(int)t.size();i++)
{
if(i+nxt[i-p0]<nxt[p0]+p0)nxt[i]=nxt[i-p0];//第一种情况
else
{//第二种情况
int now=nxt[p0]+p0-i;
now=max(now,0);//这里是为了防止i>p的情况
while(t[now]==t[i+now]&&i+now<(int)t.size())now++;//暴力
nxt[i]=now;
p0=i;//更新p0
}
}
}
void exkmp()
{
getnxt();
int now=0;
while(s[now]==t[now]&&now<min((int)s.size(),(int)t.size()))now++;//暴力
extend[0]=now;
int p0=0;
for(int i=1;i<(int)s.size();i++)
{
if(i+nxt[i-p0]<extend[p0]+p0)extend[i]=nxt[i-p0];//第一种情况
else
{//第二种情况
int now=extend[p0]+p0-i;
now=max(now,0);//这里是为了防止i>p的情况
while(t[now]==s[i+now]&&now<(int)t.size()&&now+i<(int)s.size())now++;//暴力
extend[i]=now;
p0=i;//更新p0
}
}
}
int main()
{
cin>>s>>t;
exkmp();
int len=t.size();
for(int i=0;i<len;i++)printf("%d ",nxt[i]);//输出nxt
puts("");
len=s.size();
for(int i=0;i<len;i++)printf("%d ",extend[i]);//输出extend
return 0;
}
洛谷上有一道扩展