HDU5069 Harry And Biological Teacher

题目

As we all know, Harry Porter learns magic at Hogwarts School. However, learning magical knowledge alone is insufficient to become a great magician. Sometimes, Harry also has to gain knowledge from other certain subjects, such as language, mathematics, English, and even algorithm.
Today, Harry is on his biological class, his teacher is doing experiment with DNA right now. But the clever teacher faces a difficult problem. He has lots of genes. Every time he picks gene a and gene b. If he want to connect gene a and gene b, he should calculate the length of longest part that the gene a’s suffix and gene b’s prefix can overlap together. For example gene a is "AAT" and gene b is "ATT", then the longest common part is "AT", so the answer is 2. And can you solve this difficult problem for him?

大意是给你一堆字符串，每次询问两个字符串的前缀和后缀的最大匹配。

思路

显然要用AC自动机做。

我们能用的有两棵树：Trie树和Fail树，一个代表前缀，一个代表后缀，很自然的往两棵树上去考虑。

对于前缀而言，在将字符串插入Trie树的时候，我们同时在它经过的每个节点上加入当前字符串的编号和它到这里时的长度。

离线询问。

然后在fail树上dfs，经过的点就将它上面的信息加入set中（每个字符串建一个set，表示当前字符串前面出现的前缀的值）。然后因为fail树记录的是后缀

，所以从根到某个节点路径上的每一个节点，都是当前点的后缀，这样前缀和后缀就建立匹配了。

~~因为i，j打错调了一天~~

代码

#include<bits/stdc++.h>
#define M 100005
#define clr(x,y) memset(x,y,sizeof(x))
using namespace std;
int n,m,mp[105];
int val[M],ttt[3],h[3][M],ans[M];
set<int>SS[M]; 
struct edge{
    int nxt,to,ex;  
}G[3][M<<1];
void Add(int a,int b,int c,int op){
    G[op][++ttt[op]]=(edge){h[op][a],b,c};
    h[op][a]=ttt[op];   
}
struct AC_automaton{
    int tt,tot;
    int pa[M][5],f[M];
    void clear(){
        clr(pa,0);
        clr(f,0);
        tt=tot=0;
    }
    void Insert(char *S,int d){
        int u=0,l=strlen(S);
        for(int i=0;i<l;i++){
            if(!pa[u][S[i]])pa[u][S[i]]=++tt;
            u=pa[u][S[i]];
            Add(u,d,i+1,1);
        }
        val[d]=u;
    }
    void get_fail(){
        queue<int>Q;
        for(int i=1;i<=4;i++){
            if(pa[0][i]!=0){
                f[pa[0][i]]=0;
                Q.push(pa[0][i]);   
            }
        }
        while(!Q.empty()){
            int u=Q.front();Q.pop();
            for(int i=1;i<=4;i++){
                if(pa[u][i]!=0){
                    f[pa[u][i]]=pa[f[u]][i];
                    Q.push(pa[u][i]);
                }
                else pa[u][i]=pa[f[u]][i];
            }
        }
        for(int i=1;i<=tt;i++)Add(f[i],i,-1,0);//fail树 
    }
}Tr;
char S[M];
void dfs(int x){
    for(int i=h[1][x];i;i=G[1][i].nxt)SS[G[1][i].to].insert(G[1][i].ex);
    for(int i=h[2][x];i;i=G[2][i].nxt){
        if(SS[G[2][i].to].empty())ans[G[2][i].ex]=0;
        else ans[G[2][i].ex]=*(--SS[G[2][i].to].end());
    }
    for(int i=h[0][x];i;i=G[0][i].nxt)dfs(G[0][i].to);
    for(int i=h[1][x];i;i=G[1][i].nxt)SS[G[1][i].to].erase(G[1][i].ex);
}
int main(){
    mp['A']=1;mp['T']=2;mp['C']=3;mp['G']=4;
    while(~scanf("%d%d",&n,&m)){
        Tr.clear();clr(h,0);clr(ttt,0);clr(val,0);
        for(int i=1;i<=n;i++){
            SS[i].clear();
            scanf("%s",S);
            int l=strlen(S);
            for(int j=0;j<l;j++)S[j]=mp[S[j]];
            Tr.Insert(S,i);
        }
        Tr.get_fail();
        for(int i=1,a,b;i<=m;i++){
            scanf("%d%d",&a,&b);
            Add(val[a],b,i,2);
        }
        dfs(0);
        for(int i=1;i<=m;i++)
            printf("%d\n",ans[i]);
    }
    return 0;
}

复杂度分析：

每个串的每个点，都会进出set一次，而串的总长不超过1e5，所以复杂度是\(O(nlogn)\)的。

全部评论

推荐最新楼层

12-29 16:55

卓驭科技_HR(准入职员工)

卓驭（大疆车载）内推

卓驭 嵌入式中间件实习 面经写一写面经，回馈一下社区。⌚️timeline：五月底👋part1：自我介绍 && 项目介绍1. 项目里的内存占用，资源使用的性能评估？性能优化的思考？2. 端侧大模型的选型？3. 机器人比赛中最难的一个问题？技术方案的选择用了多长的时间？4. 之前实习的主要工作？方案是如何确定的？5. 对车载中间件的了解？6. 。。。忘了🤏part2：八股拷打1. 设计模式？平时开发有用到过哪一些设计模式吗？2. 对多态的了解？静态and动态?3. 虚函数里面父类和子类的交互？4. C++容器中vector和list的差异？5. vector的底层实现原理？扩...

点赞评论收藏

12-27 14:38

华南农业大学前端工程师

双非本秋招 2offer

忙碌了半年，面了40+场12月最后拿到顺丰和睿联的offer，开的都不高，还有两个在泡，先签下顺丰保底了春招再战吧

点赞评论收藏

12-17 17:12

门头沟学院 Java

“我希望你把我当成资源，而不是老师。”

和mentor的第一次谈话在谈话的最后，mentor跟我说：“我希望你把我当成资源，而不是老师。”“资源”这个词直接而准确，让我一时恍然。从小到大，“老师”总是连着某种规矩与距离，让我们习惯于被动等待教导、听从指令，把自己放在一个被定义的位置上。而“资源”，主语变成了“我”。这意味着我要主动去勘探、获取自己真正需要的东西。因为最清楚自己成长渴求的，正是我自己。这种主动的探寻与吸收，才是扎实的成长。以前觉得“资源”听起来功利，但现在有了不同理解——它其实接近“把自己当成产品”，持续积累知识、能力和格局，成为对他人有价值的人。这种价值不必宏大，可以对事、对人、对团队，也可以对自己在乎的领域。重要的是让“创造价值”成为思考与行动的一部分。汲取，是为了将来能够给予；提问，也是为了有一天可以解答。让自己有价，才能对未来有用。谢谢mt，受教了

牛客你可姐：这哪儿是mt，简直是人生导师！

mt对你说过最有启发的一...

点赞评论收藏

11-22 16:20

已编辑

用友_Java开发实习生(实习员工)

27届学院本第N次简历修改冲刺中大厂求锐评（投递24天，官网200+，boss600+无面试）

一段java开发实习经历，从10月30号开始至今无面试，结合了广大牛友的建议第N个版本的简历（后期我会拼接成一页的），跪求各路大佬锐评指明不足的地方，我是不会放弃的，既然别人可以做到那么我也可以

等闲_：感觉有好多地方会被问穿，mysql存储向量这个方案问题应该很大的，如果深问的的话，为什么不用es，不用pg，不用mivus，分块策略是怎么做的，向量化是怎么向量化的，稠密向量还是稀疏向量，再深问余弦相似度，HSWM算法，Bm25算法，为什么不用混合检索或者Rank重排序优化？其他的项目不停机分库分表咋实现的，切库过程中数据有diff的话有没有补偿策略？既然有了分库分表了有没有碰到业务上不好优化的慢sql，让这个sql读从库？而且点评的话，最好自己压测过，要不这个数据也不好解释。现在就27的情况来看，很多同学已经有了中大厂实习，这个节点也会偏向这些有大厂实习的92同学，而且hc也不多，所以坚持海投吧