【POJ】3693 Maximum repetition substring（后缀数组）

原题链接

题意

字符串的重复次数定义为最大数 \(R\)，以便可以将该字符串划分为 \(R\) 个相同的连续子字符串。例如，^ababab 的重复次数为 \(3\)，而 ^ababa 的重复次数为 \(1\)。

给定一个包含小写字母的字符串，求重复次数最多的连续重复子串，并且要求字典序最小。

数据范围

\(1 \leq |S| \leq 10^5\)。

思路

考虑一个重复次数大于 \(1\) 的子串。设它在原串中的起始位置为 \(i\)，重复子串的长度为 \(len\)。那么显然就有 \(\sum_{k=1}^{len-1} s[i+k]=s[i+len+k]\)。换句话说，后缀 \(i\) 和后缀 \(i+len\) 一定满足 \(lcp(i,i+len) \geq len\)。其中 \(lcp\) 表示最长公共前缀的长度。而出现次数就是 \(lcp/len+1\)。后面的 \(1\) 是子串 \([i,i+len-1]\)。

那么就可以从小到大枚举连续子串长度 \(len\)。再枚举子串的位置。直接枚举子串的复杂度是 \(O(n^2)\)。可以考虑先枚举 \(1,1+len,1+len*2....\)。再分别从每个位置往前推，不符合题意时就直接退出。至于 \(lcp\)，可以用后缀数组+ST表的方式做到 \(O(n \log n)\) 预处理，\(O(1)\) 查询。

一些细节见代码。

code：

#include
#include
#include
using namespace std;
const int N=1e5+10;
char s[N];
int T,n,m,f[N][25],x[N],y[N],c[N],sa[N],rk[N],height[N];
void get_sa()
{
	memset(c,0,sizeof(c));
	for(int i=1;i<=n;i++) c[x[i]=s[i]]++;
	for(int i=2;i<=m;i++) c[i]+=c[i-1];
	for(int i=n;i>=1;i--) sa[c[x[i]]--]=i;
	for(int k=1;k<=n;k<<=1)
	{
		int num=0;
		for(int i=n-k+1;i<=n;i++) y[++num]=i;
		for(int i=1;i<=n;i++) if(sa[i]>k) y[++num]=sa[i]-k;
		for(int i=1;i<=m;i++) c[i]=0;
		for(int i=1;i<=n;i++) c[x[i]]++;
		for(int i=2;i<=m;i++) c[i]+=c[i-1];
		for(int i=n;i>=1;i--) sa[c[x[y[i]]]--]=y[i],y[i]=0;
		swap(x,y);x[sa[num=1]]=1;
		for(int i=2;i<=n;i++)  x[sa[i]]=(y[sa[i]]==y[sa[i-1]]&&y[sa[i]+k]==y[sa[i-1]+k])?num:++num;
		if(num==n) break;m=num;
	}
}
void get_height()
{
	memset(height,0,sizeof(height));
	for(int i=1;i<=n;i++) rk[sa[i]]=i;
	for(int i=1,k=0;i<=n;i++)
	{
		if(rk[i]==1) continue;
		if(k) k--;
		int j=sa[rk[i]-1];
		while(i+k<=n&&j+k<=n&&s[i+k]==s[j+k]) k++;
		height[rk[i]]=k;
	}
}
void build_ST()
{
	for(int i=2;i<=n;i++) f[i][0]=height[i];
	for(int j=1;j<=20;j++)
		for(int i=2;i+(1<y) swap(x,y);//注意满足 xans||(now/len+1==ans&&rk[i]0&&t<=len&&s[i-t]==s[i-t+len])
				{
					if((now+t)/len+1>ans||((now+t)/len+1==ans&&rk[i-t]


					
					
					
						相关
						
				
						
			
																
								
										js 正则匹配 两个字符串之间，某个字符串之前（之后）的内容
									
									
								 

        
								
							
							

																
								
										大爽Python入门教程 1-2 数与字符串
									
									
								 

        
								
							
							

																
								
										Java21-统计字符串中每个字符出现的次数
									
									
								 

        
								
							
							

																
								
										全（十五）Jmeter 之 参数化 函数助手：__Random string（译：瑞德.丝锥）：随机字符串
									
									
								 

        
								
							
							

																
								
										生成随机字符串
									
									
								 

        
								
							
							

																
								
										09练习：统计输入的字符串中各种字符的个数
									
									
								 

        
								
							
							

																
								
										2-14str1转义字符，格式化_2-15str2格式化，字符串内置函数
									
									
								 

        
								
							
							

																
								
										python基本数据类型；关于字符串格式化的补充
									
									
								 

        
								
							
							

																
								
										Java基础-02 字符串(汉字)与16进制字符串转换(无乱码)
									
									
								 

        
								
							
							

																
								
										C语言判断给定的字符串是否为合法的ip地址的代码-C-J
									
									
								 

        
								
							
							

																
								
										把字符串a复制到字符串b，利用指针
									
									
								 

        
								
							
							

																
								
										javascript模板字符串（反引号）

【POJ】3693 Maximum repetition substring（后缀数组）

题意

数据范围

思路

code：

相关

js 正则匹配两个字符串之间，某个字符串之前（之后）的内容

大爽Python入门教程 1-2 数与字符串

Java21-统计字符串中每个字符出现的次数

全（十五）Jmeter 之参数化函数助手：__Random string（译：瑞德.丝锥）：随机字符串

生成随机字符串

09练习：统计输入的字符串中各种字符的个数

2-14str1转义字符，格式化_2-15str2格式化，字符串内置函数

python基本数据类型；关于字符串格式化的补充

Java基础-02 字符串(汉字)与16进制字符串转换(无乱码)

C语言判断给定的字符串是否为合法的ip地址的代码-C-J

把字符串a复制到字符串b，利用指针

javascript模板字符串（反引号）

标签