大致题意:
求出一个字符串(len<=10 000)中包含多少个出现至少两次的子串,且相同的子串互相不会覆盖
大致思路:
求出后缀数组和height数组之后,对每个后缀,求出所有和她公共前缀大于0的后缀中,构成合法子串数量的最大值。
一开始只想着用单纯O(n)的办法来解决,实际上由于字符串的特性,这个算法的覆盖度还是接近o(n)的
#include<iostream> #include<cstdio> #include<cstring> using namespace std; const int nMax = 20000; int num[nMax]; int sa[nMax], rank[nMax], height[nMax]; int wa[nMax], wb[nMax], wv[nMax], wd[nMax]; int cmp(int *r, int a, int b, int l){ return r[a] == r[b] && r[a+l] == r[b+l]; } void da(int *r, int n, int m){ // 倍增算法 r为待匹配数组 n为总长度 m为字符范围 int i, j, p, *x = wa, *y = wb, *t; for(i = 0; i < m; i ++) wd[i] = 0; for(i = 0; i < n; i ++) wd[x[i]=r[i]] ++; for(i = 1; i < m; i ++) wd[i] += wd[i-1]; for(i = n-1; i >= 0; i --) sa[-- wd[x[i]]] = i; for(j = 1, p = 1; p < n; j *= 2, m = p){ for(p = 0, i = n-j; i < n; i ++) y[p ++] = i; for(i = 0; i < n; i ++) if(sa[i] >= j) y[p ++] = sa[i] - j; for(i = 0; i < n; i ++) wv[i] = x[y[i]]; for(i = 0; i < m; i ++) wd[i] = 0; for(i = 0; i < n; i ++) wd[wv[i]] ++; for(i = 1; i < m; i ++) wd[i] += wd[i-1]; for(i = n-1; i >= 0; i --) sa[-- wd[wv[i]]] = y[i]; for(t = x, x = y, y = t, p = 1, x[sa[0]] = 0, i = 1; i < n; i ++){ x[sa[i]] = cmp(y, sa[i-1], sa[i], j) ? p - 1: p ++; } } } void calHeight(int *r, int n){ // 求height数组。 int i, j, k = 0; for(i = 1; i <= n; i ++) rank[sa[i]] = i; for(i = 0; i < n; height[rank[i ++]] = k){ for(k ? k -- : 0, j = sa[rank[i]-1]; r[i+k] == r[j+k]; k ++); } } int abs(int a){ if(a>0)return a; return -a; } char str[nMax]; int main(){ int i,j,k,sp,n,len; while(scanf("%s",str)!=EOF){ sp=31; n=0; len=strlen(str); cout<<len<<endl; for(i=0;i<len;i++){ num[i]=str[i]-'a'+1; }num[len]=0; da(num,len+1,sp); calHeight(num,len); int res=0,lcp,tmp; for(i=2;i<=len;i++){ if(height[i]==height[i-1])continue; int h=lcp=height[i]; tmp=0; for(j=i;j<=len;j++){ if(height[j]==0)break; lcp=min(lcp,height[j]); int a=min(lcp,abs(sa[j]-sa[i-1])); if(a>height[i-1]&&a!=0){ tmp=max(tmp,a-height[i-1]); } } res+=tmp; } cout<<res<<endl; } return 0; }
相关推荐
罗穗骞《后缀数组——处理字符串的有力工具》(有算法源码和解题源码) IOI2009论文,有源码,简单易懂,方便学习后缀数组的构造和各种应用。 后缀数组是一种优秀的数据结构,在字符串匹配方面有诸多应用。
学习后缀数组有一点帮组,学习了一周的后缀数组,献给正在为ACM奋斗的同学们
后缀数组的应用受到越来越多人的关注,本文详细介绍了后缀数组的基本原理以及LCP—最长公共前缀。最后给出了几道例题及解析。
后缀数组——处理字符串的有力工具,国家集训队论文
树状数组 后缀数组 字典树 多串匹配算法及启示
后缀数组模板,后缀数组的倍增法实现,名次数组,高度数组
后缀数组 笔记 后缀数组——处理字符串的有力工具 罗穗骞 后缀数组——处理字符串的有力工具 PPT 后缀数组--许智磊 后缀数组--许智磊 PPT
比较完整地介绍了后缀数组的概念,用法,解决了诸如最长回文串,最长公共子序列的问题,很值得一看
后缀数组;代码;罗穗骞;题目附代码;OI集训队资料
【摘要】本文介绍后缀数组的基本概念、方法以及应用。首先介绍 O(nlogn)复杂度构造后缀数组的倍增算法,接着介绍了配合后缀数组的最长公共前缀 LCP(Long
后缀数组 后缀数组.pdf
基于压缩后缀数组实现的一个字符串搜索库,用压缩后缀数组算法实现了一个简单核心的搜索开源库,可以扩展。
用倍增算法对后缀数组的实现,其中用rmq实现询问两个后缀的最长前缀。
后缀数组--许智磊
后缀数组(Suffix Array)标程。采用DA算法。RMQ预处理询问。
非常详细的后缀数组讲解~~~既看既懂
自己写的后缀数组构建的java源程序,带详细的源码注释
后缀数组 一个处理字符串的利器 适合有一些数据结构基础的读者
做课程设计时自己原创的后缀数组PPT,希望对大家理解和学习有益
后缀数组((处理字符串的有力工具)),后缀数组((处理字符串的有力工具))