DS串应用--KMP算法

关于KMP算法

字符串匹配算法,emmm,网上很多介绍,有兴趣的搜一搜就有了,直接上题吧~


问题 A: DS串应用--KMP算法

题目描述

学习KMP算法,给出主串和模式串,求模式串在主串的位置

输入

第一个输入t,表示有t个实例
第二行输入第1个实例的主串,第三行输入第1个实例的模式串
以此类推

输出

第一行输出第1个实例的模式串的next值
第二行输出第1个实例的匹配位置,位置从1开始计算,如果匹配成功输出位置,匹配失败输出0
以此类推

样例输入

3
qwertyuiop
tyu
aabbccdd
ccc
aaaabababac
abac

样例输出

-1 0 0
5
-1 0 1
0
-1 0 0 1
8


问题 B: DS串应用--串替换

题目描述

给出主串、模式串、替换串,用KMP算法找出模式串在主串的位置,然后用替换串的字符替换掉模式串
本题只考虑一处替换的情况,如果你想做的完美一些,能够实现多处替换那
可能需要考虑模式串和替换串长度不一致的情况

输入

第一个输入t,表示有t个实例
第二行输入第1个实例的主串,第三行输入第1个实例的模式串,第四行输入第1个实例的替换串
以此类推

输出

第一行输出第1个实例的主串
第二行输出第1个实例的主串替换后结果,如果没有发生替换就输出主串原来的内容。
以此类推

样例输入

3
aabbccdd
bb
ff
aaabbbccc
ddd
eee
abcdef
abc
ccccc

样例输出

aabbccdd
aaffccdd
aaabbbccc
aaabbbccc
abcdef
cccccdef


问题 C: 串应用- 计算一个串的最长的真前后缀

题目描述

给定一个串,如ABCDAB,则 ABCDAB的真前缀有:{ A, AB,ABC, ABCD, ABCDA } ABCDAB的真后缀有:{ B, AB,DAB, CDAB, BCDAB } 因此,该串的真前缀和真后缀中最长的相等串为AB,我们称之为该串的“最长的真前后缀”。 试实现一个函数string matched_Prefix_Postfix(string str),得到输入串str的最长的真前后缀。若不存在最长的真前后缀则输出empty

输入

第1行:串的个数 n 第2行到第n+1行:n个字符串

输出

n个最长的真前后缀,若不存在最长的真前后缀则输出empty。

样例输入

6
a
ab
abc
abcd
abcda
abcdab

样例输出

empty
empty
empty
empty
a
ab


问题 D: DS串应用—最长重复子串

题目描述

求串的最长重复子串长度。例如:abcaefabcabc的最长重复子串是串abca,长度为4。

输入

测试次数t
t个测试串

输出

对每个测试串,输出最长重复子串长度,若没有重复子串,输出-1.

样例输入

3
abcaefabcabc
szu0123szu
szuabcefg

样例输出

4
3
-1
╭( ′? o ?′ )╭?警察叔叔!就是这个人!悄咪咪改了题目


以下是绿色健康的代码 (???)?

#include<bits/stdc++.h>
using namespace std;

class myString{
private:
    string mainstr;
    int size;
    void getnext(string p,int next[]){
        int i=1;
        next[0]=-1;
        next[1]=0;
        int j=0;
        while(i<(int)p.length()){
            if(j==-1||p[i]==p[j]){
                ++i;
                ++j;
                next[i]=j;
            }
            else
                j=next[j];
        }
    }
   int KMPFind(string p,int pos,int next[]){
     int i=pos;
     int j=0;
     while(i<(int)mainstr.length()&&j<(int)p.length()){
        if(j==-1||mainstr[i]==p[j]){
            ++i;
            ++j;
        }
        else
            j=next[j];
    }
    if(j>=(int)p.length())
        return i-j+1;
    else
        return -1;
  }
public:
    myString(){
        size=0;
        mainstr="";
    }   
    ~myString(){
        size=0;
        mainstr=""; 
    }
    void setval(string p){
        mainstr="";
        mainstr.assign(p);
        size=(int)mainstr.length();
    }
    int KMPFindSubstr(string p,int pos){
        int i;
        int L=p.length();
        int *next =new int[L + 1];
        getnext(p,next);
       /* for(i=0;i<L;i++)
            cout<<next[i]<<" ";
          cout<<endl;
        */
        int v=-1;
        v=KMPFind(p,pos,next);
        return v;
    }//模式串位置
    void Changemainstr(int i,string s,string p){
        int j;
        int pl=(int)p.length();
        int sl=(int)s.length();
        string sub1=mainstr.substr(0,i);
        string sub2=mainstr.substr(i+pl,(int)mainstr.length());
        mainstr=sub1+s+sub2;
        cout<<mainstr<<endl;
    } //模式串替换 
    string matched_Prefix_Postfix(){
        int L=(int)mainstr.length();
        int *next =new int[L + 1];
        getnext(mainstr,next);
        int ans = next[size];
        delete[]next;
        if (ans <= 0) 
            return "empty";
        return mainstr.substr(0, ans);
    }//最长的真前后缀字串
    int Maxsubstr(){
        int L=(int)mainstr.length();
        int *next =new int[L + 1];
        getnext(mainstr,next);
        int ans=INT_MIN;
        for(int i=0;i<=L;i++)
            ans=ans>next[i]?ans:next[i];
        return ans;
    }//最长重复字串(重叠)
};

int main(){
   /* int t;
    cin>>t;
   while(t--){//模式串位置
        string s;
        cin>>s;
        myString S;
        S.setval(s);
        string p;
        cin>>p;
        cout<<S.KMPFindSubstr(p,0)<<endl;
    }*/

    /*int t;
    cin>>t;
    while(t--){//模式串替换
        string s;
        cin>>s;
        myString S;
        S.setval(s);
        string p;
        cin>>p;
        int index=S.KMPFindSubstr(p,0);
        string ps;
        cin>>ps;
        cout<<s<<endl;
        if(index==-1){
            cout<<s<<endl;
        }
        else{
            S.Changemainstr(index-1,ps,p);
        }
    } */
    /*int t;
    cin>>t;
    while(t--){//最长的真前后缀字串
        string s;
        cin>>s;
        myString S;
        S.setval(s);
        cout<<S.matched_Prefix_Postfix()<<endl;
    }   */
    int t;
    cin>>t;
    while(t--){////最长重复字串(重叠)
        string s;
        cin>>s;
        myString S;
        S.setval(s);
        int ans=S.Maxsubstr();
        if(ans==0)
            ans--;
        cout<<ans<<endl;
    }   
}

多说两句

原本问题D是要求不重叠的最长重复字串,上面的代码求出来的是最长重复字串(重叠),因为用next数组来求真的太简单了,要求不重叠的比较复杂……懒得一匹_(:з」∠) _


给大佬递茶.jpg

o(*≧▽≦)ツ┏━┓
最长重复字串(不重叠),由不留名的╭( ′? o ?′ )╭?XXX大佬提供
蒟蒻瑟瑟发抖﹙ˊ_>ˋ﹚

#include <iostream>
using namespace std;
const int N=5000+15;

string s, p;
int  n[N];

void getnext(const string& p){
    n[0] = -1;
    int k = -1, i = 0;
    while(i < (int)p.size()){
        if(k == -1 || p[k] == p[i]){
            i++;
            k++;
            n[i] = k;
        }else{
            k = n[k];
        }
    }
}

int kmpMatch(const string& p, string& s){
    int j = 0, i = 0;
    int ret = 0;
    while(i < (int)s.size()){
        if(j == -1 || p[j] == s[i]){
            i++;
            j++;
        }else{
            j = n[j];
        }  

        if(j == (int)p.size()){
            ret++;
            j = 0;
        }
    }
    return ret;
}

bool check(string s, int len){
    for(int i = 0; i < (int)s.size() - len; i++){
        getnext(s.substr(i, len));
        if(kmpMatch(s.substr(i, len), s) >= 2)
            return true;
    }
    return false;
}

int main(){
    int t;
    cin >> t;
    while(t--){
        cin >> s;
        int k = 1, r = (int)s.size();
        int ans = -1;
        while(k <= r){
            int m = (k + r) >> 1;
            if(check(s, m)){
                ans = m;
                k = m + 1;
            }else{
                r = m - 1;
            }
        }
        cout << ans << endl;
    }
    return 0;
}
最后编辑于
?著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,172评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,346评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,788评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,299评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,409评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,467评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,476评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,262评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,699评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,994评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,167评论 1 343
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,827评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,499评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,149评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,387评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,028评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,055评论 2 352

推荐阅读更多精彩内容

  • 字符串匹配KMP算法详解 1. 引言 以前看过很多次KMP算法,一直觉得很有用,但都没有搞明白,一方面是网上很少有...
    张晨辉Allen阅读 2,398评论 0 3
  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 134,644评论 18 139
  • 【丰盛日记】 第105篇/第93天~2018年9月1日 1、【我拥有较强的好奇心和求知欲】虽然说不上对事事都怀着好...
    海上绿洲阅读 370评论 0 1
  • 我是后来进入那个班级的。 它是所谓的重点班,没错,整个学校的希望都寄托在它身上。单凭成绩我没法进入那个班级,嗯,我...
    9719d7cbb54e阅读 328评论 2 1
  • 二十岁的时候我已经在外流浪了三年。 这三年里我走过了很多陌生的地方,每次看着地平线吞没太阳,灿烂旖旎的霞光隐于晦暗...
    吴也白阅读 627评论 4 13