Rmq
简介
RMQ 是英文 Range Maximum/Minimum Query 的缩写,表示区间最大(最小)值。
在笔者接下来的描述中,默认初始数组大小为 $n$。
在笔者接下来的描述中,默认时间复杂度标记方式为 $O($ 数据预处理 $) \sim O($ 单次询问 $)$。
单调栈
由于 OI Wiki 中已有此部分的描述,本文仅给出 链接。这部分不再展开。
时间复杂度 $O(m\log m) \sim O(\log n)$
空间复杂度 $O(n)$
ST 表
由于 OI Wiki 中已有此部分的描述,本文仅给出 链接。这部分不再展开。
时间复杂度 $O(n\log n) \sim O(1)$
空间复杂度 $O(n\log n)$
线段树
由于 OI Wiki 中已有此部分的描述,本文仅给出 链接。这部分不再展开。
时间复杂度 $O(n) \sim O(\log n)$
空间复杂度 $O(n)$
Four Russian
Four russian 是一个由四位俄罗斯籍的计算机科学家提出来的基于 ST 表的算法。
在 ST 表的基础上 Four russian 算法对其做出的改进是序列分块。
具体来说,我们将原数组——我们将其称之为数组 A——每 $S$ 个分成一块,总共 $n/S$ 块。
对于每一块我们预处理出来块内元素的最小值,建立一个长度为 $n/S$ 的数组 B,并对数组 B 采用 ST 表的方式预处理。
同时,我们对于数组 A 的每一个零散块也建立一个 ST 表。
询问的时候,我们可以将询问区间划分为不超过 1 个数组 B 上的连续块区间和不超过 2 个数组 A 上的整块内的连续区间。显然这些问题我们通过 ST 表上的区间查询解决。
在 $S=\log n$ 时候,预处理复杂度达到最优,为 $O((n / \log n)\log n+(n / \log n)\times\log n\times\log \log n)=O(n\log \log n)$。
时间复杂度 $O(n\log \log n) \sim O(1)$
空间复杂度 $O(n\log \log n)$
当然询问由于要跑三个 ST 表,该实现方法的常数较大。
!!! note "一些小小的算法改进" 我们发现,在询问的两个端点在数组 A 中属于不同的块的时候,数组 A 中块内的询问是关于每一块前缀或者后缀的询问。
显然这些询问可以通过预处理答案在 $O(n)$ 的时间复杂度内被解决。
这样子我们只需要在询问的时候进行至多一次 ST 表上的查询操作了。
!!! note "一些玄学的算法改进" 由于 Four russian 算法以 ST 表为基础,而算法竞赛一般没有非常高的时间复杂度要求,所以 Four russian 算法一般都可以被 ST 表代替,在算法竞赛中并不实用。这里提供一种在算法竞赛中更加实用的 Four russian 改进算法。
我们将块大小设为 $\sqrt n$,然后预处理出每一块内前缀和后缀的 RMQ,再暴力预处理出任意连续的整块之间的 RMQ,时间复杂度为 $O(n)$。
查询时,对于左右端点不在同一块内的询问,我们可以直接 $O(1)$ 得到左端点所在块的后缀 RMQ,左端点和右端点之间的连续整块 RMQ,和右端点所在块的前缀 RMQ,答案即为三者之间的最值。
而对于左右端点在同一块内的询问,我们可以暴力求出两点之间的 RMQ,时间复杂度为 $O(\sqrt n)$,但是单个询问的左右端点在同一块内的期望为 $O(\frac{\sqrt n}{n})$,所以这种方法的时间复杂度为期望 $O(n)$。
而在算法竞赛中,我们并不用非常担心出题人卡掉这种算法,因为我们可以通过在 $\sqrt n$ 的基础上随机微调块大小,很大程度上避免算法在根据特定块大小构造的数据中出现最坏情况。并且如果出题人想要卡掉这种方法,则暴力有可能可以通过。
这是一种期望时间复杂度达到下界,并且代码实现难度和算法常数均较小的算法,因此在算法竞赛中比较实用。
以上做法参考了 [P3793 由乃救爷爷](https://www.luogu.com.cn/problem/P3793) 中的题解。
加减 1RMQ
若序列满足相邻两元素相差为 1,在这个序列上做 RMQ 可以成为加减 1RMQ,根究这个特性可以改进 Four Russian 算法,做到 $O(n) \sim O(1)$ 的时间复杂度,$O(n)$ 的空间复杂度。
由于 Four russian 算法的瓶颈在于块内 RMQ 问题,我们重点去讨论块内 RMQ 问题的优化。
由于相邻两个数字的差值为 $\pm 1$,所以在固定左端点数字时 长度不超过 $\log n$ 的右侧序列种类数为 $\sum_{i=1}^{i \leq \log n} 2^{i-1}$,而这个式子显然不超过 $n$。
这启示我们可以预处理所有不超过 $n$ 种情况的 最小值 - 第一个元素 的值。
在预处理的时候我们需要去预处理同一块内相邻两个数字之间的差,并且使用二进制将其表示出来。
在询问的时候我们找到询问区间对应的二进制表示,查表得出答案。
这样子 Four russian 预处理的时间复杂度就被优化到了 $O(n)$。
笛卡尔树在 RMQ 上的应用
不了解笛卡尔树的朋友请移步 笛卡尔树。
不难发现,原序列上两个点之间的 min/max,等于笛卡尔树上两个点的 LCA 的权值。根据这一点就可以借助 $O(n) \sim O(1)$ 求解树上两个点之间的 LCA 进而求解 RMQ。$O(n) \sim O(1)$ 树上 LCA 在 LCA - 标准 RMQ 已经有描述,这里不再展开。
总结一下,笛卡尔树在 RMQ 上的应用,就是通过将普通 RMQ 问题转化为 LCA 问题,进而转化为加减 1 RMQ 问题进行求解,时间复杂度为 $O(n) \sim O(1)$。当然由于转化步数较多,$O(n) \sim O(1)$ RMQ 常数较大。
如果数据随机,还可以暴力在笛卡尔树上查找。此时的时间复杂度为期望 $O(n) \sim O(\log n)$,并且实际使用时这种算法的常数往往很小。
例题 Luogu P3865【模板】ST 表
如果数据随机,则我们还可以暴力在笛卡尔树上查找。此时的时间复杂度为期望 $O(n)-O(\log n)$,并且实际使用时这种算法的常数往往很小。
基于状压的线性 RMQ 算法
隐性要求
- 序列的长度 $n$ 满足 $\log_2{n} \leq 64$
前置知识
-
基本位运算
-
前后缀极值
算法原理
将原序列 $A[1\cdots n]$ 分成每块长度为 $O(\log_2{n})$ 的 $O(\frac{n}{\log_2{n}})$ 块。
听说令块长为 $1.5\times \log_2{n}$ 时常数较小。
记录每块的最大值,并用 ST 表维护块间最大值,复杂度 $O(n)$。
记录块中每个位置的前、后缀最大值 $Pre[1\cdots n], Sub[1\cdots n]$($Pre[i]$ 即 $A[i]$ 到其所在块的块首的最大值),复杂度 $O(n)$。
若查询的 $l,r$ 在两个不同块上,分别记为第 $bl,br$ 块,则最大值为 $[bl+1,br-1]$ 块间的最大值,以及 $Sub[l]$ 和 $Pre[r]$ 这三个数的较大值。
现在的问题在于若 $l,r$ 在同一块中怎么办。
将 $A[1\cdots r]$ 依次插入单调栈中,记录下标和值,满足值从栈底到栈顶递减,则 $A[l,r]$ 中的最大值为从栈底往上,单调栈中第一个满足其下标 $p \geq l$ 的值。
由于 $A[p]$ 是 $A[l,r]$ 中的最大值,因而在插入 $A[p]$ 时,$A[l\cdots p-1]$ 都被弹出,且在插入 $A[p+1\cdots r]$ 时不可能将 $A[p]$ 弹出。
而如果用 $0/1$ 表示每个数是否在栈中,就可以用整数状压,则 $p$ 为第 $l$ 位后的第一个 $1$ 的位置。
由于块大小为 $O(\log_2{n})$,因而最多不超过 $64$ 位,可以用一个整数存下(即隐性条件的原因)。
??? "参考代码"
```cpp
#include
const int MAXN = 1e5 + 5;
const int MAXM = 20;
struct RMQ {
int N, A[MAXN];
int blockSize;
int S[MAXN][MAXM], Pow[MAXM], Log[MAXN];
int Belong[MAXN], Pos[MAXN];
int Pre[MAXN], Sub[MAXN];
int F[MAXN];
void buildST() {
int cur = 0, id = 1;
Pos[0] = -1;
for (int i = 1; i <= N; ++i) {
S[id][0] = std::max(S[id][0], A[i]);
Belong[i] = id;
if (Belong[i - 1] != Belong[i])
Pos[i] = 0;
else
Pos[i] = Pos[i - 1] + 1;
if (++cur == blockSize) {
cur = 0;
++id;
}
}
if (N % blockSize == 0) --id;
Pow[0] = 1;
for (int i = 1; i < MAXM; ++i) Pow[i] = Pow[i - 1] * 2;
for (int i = 2; i <= id; ++i) Log[i] = Log[i / 2] + 1;
for (int i = 1; i <= Log[id]; ++i) {
for (int j = 1; j + Pow[i] - 1 <= id; ++j) {
S[j][i] = std::max(S[j][i - 1], S[j + Pow[i - 1]][i - 1]);
}
}
}
void buildSubPre() {
for (int i = 1; i <= N; ++i) {
if (Belong[i] != Belong[i - 1])
Pre[i] = A[i];
else
Pre[i] = std::max(Pre[i - 1], A[i]);
}
for (int i = N; i >= 1; --i) {
if (Belong[i] != Belong[i + 1])
Sub[i] = A[i];
else
Sub[i] = std::max(Sub[i + 1], A[i]);
}
}
void buildBlock() {
static int S[MAXN], top;
for (int i = 1; i <= N; ++i) {
if (Belong[i] != Belong[i - 1])
top = 0;
else
F[i] = F[i - 1];
while (top > 0 && A[S[top]] <= A[i]) F[i] &= ~(1 << Pos[S[top--]]);
S[++top] = i;
F[i] |= (1 << Pos[i]);
}
}
void init() {
for (int i = 1; i <= N; ++i) scanf("%d", &A[i]);
blockSize = log2(N) * 1.5;
buildST();
buildSubPre();
buildBlock();
}
int queryMax(int l, int r) {
int bl = Belong[l], br = Belong[r];
if (bl != br) {
int ans1 = 0;
if (br - bl > 1) {
int p = Log[br - bl - 1];
ans1 = std::max(S[bl + 1][p], S[br - Pow[p]][p]);
}
int ans2 = std::max(Sub[l], Pre[r]);
return std::max(ans1, ans2);
} else {
return A[l + __builtin_ctz(F[r] >> Pos[l])];
}
}
} R;
int M;
int main() {
scanf("%d%d", &R.N, &M);
R.init();
for (int i = 0, l, r; i < M; ++i) {
scanf("%d%d", &l, &r);
printf("%d\n", R.queryMax(l, r));
}
return 0;
}
```
习题
[BJOI 2020]封印:SAM+RMQ