最长公共子串

题目链接:https://cn.vjudge.net/contest/318888#problem/H

 

题意:

求两个子串的字符串的最长公共子串

 

思路:

"最长公共子串"解法(摘自罗穗骞的国家集训队论文):

字符串的任何一个子串都是这个字符串的某个后缀的前缀。 求A和B的最长公共子串等价于求A的后缀和B的后缀的最长公共前缀的最大值。如果枚举A
和B的所有的后缀, 那么这样做显然效率低下。 由于要计算A的后缀和B的后缀的最长公共前缀, 所以先将第二个字符串写在第一个字符串后面, 中间用一个没有出现过的字符隔开,再求这个新的字符串的后缀数组。观察一下,看看能不能从这个新的字符串的后缀数组中找到一些规律。以A=“ aaaba”, B=“ abaa” 为例,如图所示。

 

 

那么是不是所有的height值中的最大值就是答案呢?不一定!有可能这两个后缀是在同一个字符串中的,所以实际上只有当 suffix(sa[i-1])和suffix(sa[i])不是同一个字符串中的两个后缀时, height[i]才是满足条件的。而这其中的最大值就是答案。 记字符串A和字符串B的长度分别为|A|和|B|。 求新的字符串的后缀数组和height数组的时间是O(|A|+|B|),然后求排名相邻但原来不在同一个字符串中的两个后缀的 height 值的最大值,时间也是O(|A|+|B|),所以整个做法的时间复杂度为O(|A|+|B|)。时间复杂度已经取到下限,由此看出,这是一个非常优秀的算法。

ps:因为两个字符合成一个字符时,中间(位置k)会用一个没有出现过的字符隔开,所以判断两个后缀是不是同一个字符串可以借助这个位置k

即当(sa[i]-k)*(sa[i-1]-k)<0时,两个后缀属于不同的字符串,此题求乘积时可能会爆int,注意一下即可



 1 #include <stdio.h>
 2 #include <iostream>
 3 #include <algorithm>
 4 #include <string.h>
 5 #include <stdlib.h>
 6 #include <math.h>
 7 #include <queue>
 8 #include <set>
 9 
10 #define INF 0x3f3f3f3f
11 #define pii pair<int,int>
12 #define LL long long
13 using namespace std;
14 typedef unsigned long long ull;
15 const int MAXN = 200005;
16 
17 int wa[MAXN], wb[MAXN], wv[MAXN], ws_[MAXN];
18 void Suffix(int *r, int *sa, int n, int m)
19 {
20     int i, j, k, *x = wa, *y = wb, *t;
21     for(i = 0; i < m; ++i) ws_[i] = 0;
22     for(i = 0; i < n; ++i) ws_[x[i] = r[i]]++;
23     for(i = 1; i < m; ++i) ws_[i] += ws_[i - 1];
24     for(i = n - 1; i >= 0; --i) sa[--ws_[x[i]]] = i;
25     for(j = 1, k = 1; k < n; j *= 2, m = k)
26     {
27         for(k = 0, i = n - j; i < n; ++i) y[k++] = i;
28         for(i = 0; i < n; ++i) if(sa[i] >= j) y[k++] = sa[i] - j;
29         for(i = 0; i < n; ++i) wv[i] = x[y[i]];
30         for(i = 0; i < m; ++i) ws_[i] = 0;
31         for(i = 0; i < n; ++i) ws_[wv[i]]++;
32         for(i = 1; i < m; ++i) ws_[i] += ws_[i - 1];
33         for(i = n - 1; i >= 0; --i) sa[--ws_[wv[i]]] = y[i];
34         t = x;
35         x = y;
36         y = t;
37         for(x[sa[0]] = 0, i = k = 1; i < n; ++i)
38             x[sa[i]] = (y[sa[i - 1]] == y[sa[i]] && y[sa[i - 1] + j] == y[sa[i] + j]) ? k - 1 : k++;
39     }
40 }
41 int Rank[MAXN], height[MAXN], sa[MAXN], r[MAXN];
42 void calheight(int *r,int *sa,int n)
43 {
44     int i,j,k=0;
45     for(i=1; i<=n; i++)Rank[sa[i]]=i;
46     for(i=0; i<n; height[Rank[i++]]=k)
47         for(k?k--:0,j=sa[Rank[i]-1]; r[i+k]==r[j+k]; k++);
48 }
49 int n,minnum[MAXN][17];
50 void RMQ()
51 {
52     int i,j;
53     int m=(int)(log(n*1.0)/log(2.0));
54     for(i=1;i<=n;i++)
55         minnum[i][0]=height[i];
56     for(j=1;j<=m;j++)
57         for(i=1;i+(1<<j)-1<=n;i++)
58             minnum[i][j]=min(minnum[i][j-1],minnum[i+(1<<(j-1))][j-1]);
59 }
60 int Ask_MIN(int a,int b)
61 {
62     int k=int(log(b-a+1.0)/log(2.0));
63     return min(minnum[a][k],minnum[b-(1<<k)+1][k]);
64 }
65 int calprefix(int a,int b)
66 {
67     a=Rank[a],b=Rank[b];
68     if(a>b)
69         swap(a,b);
70     return Ask_MIN(a+1,b);
71 }
72 char s[MAXN];
73 int q[MAXN];
74 int main()
75 {
76     while (~scanf("%s",s)){
77         int k = strlen(s);
78         s[k] = 'z'+1;
79         scanf("%s",s+k+1);
80         int n = strlen(s);
81         for (int i=0;i<n;i++){
82             r[i] = s[i]-'a'+1;
83         }
84         int maxx = 0;
85         Suffix(r,sa,n+1,28);
86         calheight(r,sa,n);
87         for (int i=1;i<=n;i++){
88             if (height[i]>maxx && 1ll*(sa[i]-k)*(sa[i-1]-k)<0)
89                 maxx = height[i];
90         }
91         printf("%d\n",maxx);
92     }
93     return 0;
94 }

 

全部评论

相关推荐

02-25 13:02
中南大学 C++
点赞 评论 收藏
分享
昨天 22:20
已编辑
门头沟学院 golang
27届,bg为四非本211硕,如题,导师不放实习,且每周至少一次线下组会(工作日),从研一上开始实习,然后我组在研一下引入了打卡机五段大厂分别是:美团到店、美团服务零售、快手电商、字节TikTok、字节CapCut。目前要结束我的第五段实习了(不会再刷第六段,好好搞学校的事,还有秋招)本来一直告诉自己的是“所有委屈到了终点再说”,过去告诉自己的终点自然还没到,但我觉得自己仿佛已经到了另一个终点,有感而发,写了这篇文章也许你会觉得为啥不尝试问问导师能不能实习,或者用其他让自己舒服的手段,我只能说,这很复杂,有导师的人自然会懂,这种一开始就把“利益冲突”摆明面上的招几乎就是不可能成功———————————————————我到底是怎么实习的?骗hr自己满勤,然后没有捷径,就是每周往返,第一段去的是北京美团,而学校在江苏,因此需要一周一次北京江苏往返,因为实习钱少,所以坐的基本是绿皮,难以入睡,下车后就是长达2小时的地铁去公司,地铁站上靠着人睡觉周末做什么?基本在做导师的科研or横向,学习的话很多时候就是尽力在晚上回到出租屋的时候学,这很难维持,但只能不断push自己如何破解打卡机?直接把打卡机偷了,或者使用指纹膜(当然我很早就做好了无法破解的准备,那就是找个长三角实习,每天早起去打卡完坐高铁去实习,从每周高铁往返变成每天)导师会压力吗?非常压力,实习的时候非常害怕微信弹出他的消息,PTSD了,有时候一周要往返两次学校,每次都跟要死了一样,之前真是情绪崩溃好几次,哈哈哈哈平时往返怎么平衡工作?我本来很晕车,为了不耽误公司和导师的进度,从车上一看电脑就头晕、吐,到后面可以随意在高铁、地铁、出租车上Coding,甚至不会再因为往返感到心累了,哈哈哈哈这一路已经淬炼出比较坚强的内心了,已经数不清多少次坐末班高铁从学校回公司,多少次凌晨6点爬起来赶车过去我会把这些当作是我人生的弯路,但现在,这些已经成为我宝贵的经验了。往后,我想我也能真正允许各种不好的情况出现了,因为我会真正把它当作我要解决的问题,而非抱怨,这又何尝不是终点呢?要照顾好身体,我不管怎么往返,一直非常在乎身体,会让自己睡够8小时,最近几星期培养早睡早起到公司健身后去工作的习惯,我觉得好身体很关键
布布永不言弃:简历里写的快手,实际实习的是很短的,也不会真的在秋招的时候写到简历上,但从给我的感悟上看,这个实习确实很有用。稍微标题党了,见谅各位
你找实习最大的坎坷是什么
点赞 评论 收藏
分享
评论
点赞
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务