Skip to content

Ntt

简介

数论变换(Number-theoretic transform, NTT)是 快速傅里叶变换(FFT)在数论基础上的实现。

NTT 解决的是多项式乘法带模数的情况,可以说有些受模数的限制,数也比较大,

定义

数论变换

数论变换 是一种计算卷积(convolution)的快速算法。最常用算法就包括了前文提到的快速傅里叶变换。然而快速傅立叶变换具有一些实现上的缺点,举例来说,资料向量必须乘上复数系数的矩阵加以处理,而且每个复数系数的实部和虚部是一个正弦及余弦函数,因此大部分的系数都是浮点数,也就是说,必须做复数而且是浮点数的运算,因此计算量会比较大,而且浮点数运算产生的误差会比较大。

在数学中,NTT 是关于任意 上的离散傅立叶变换(DFT)。在有限域的情况下,通常称为数论变换 (NTT)。

离散傅里叶变换

离散傅里叶变换(Discrete Fourier transform,DFT) 是傅里叶变换在时域和频域上都呈离散的形式,将信号的时域采样变换为其 DTFT 的频域采样。

对于 $N$ 点序列 $\left{x[n]\right}_{0\le n <N}$,它的离散傅里叶变换(DFT)为

$$ \hat{x}[k]=\sum_{n=0}^{N-1} e^{-i\frac{2\pi}{N}nk}x[n] \qquad k = 0,1,\ldots,N-1. $$

其中 $e$ 是自然对数的底数,$i$ 是虚数单位。通常以符号 $\mathcal {F}$ 表示这一变换,即

$$ \hat{x}=\mathcal{F}x $$

它的 逆离散傅里叶变换(IDFT)为:

$$ x\left[n\right]={1 \over N}\sum_{k=0}^{N-1} e^{ i\frac{2\pi}{N}nk}\hat{x}[k] \qquad n = 0,1,\ldots,N-1. $$

可以记为:

$$ x=\mathcal{F}^{-1}\hat{x} $$

实际上,DFT 和 IDFT 变换式中和式前面的归一化系数并不重要。在上面的定义中,DFT 和 IDFT 前的系数分别为 $1$ 和 $\frac {1}{N}$。有时我们会将这两个系数都改 $\frac {1}{{\sqrt {N}}}$。

矩阵公式

由于离散傅立叶变换是一个 线性 算子,所以它可以用矩阵乘法来描述。在矩阵表示法中,离散傅立叶变换表示如下:

$$ {\displaystyle {\begin{bmatrix}f_{0}\f_{1}\\vdots \f_{n-1}\end{bmatrix}}={\begin{bmatrix}1&1&1&\cdots &1\1&\alpha &\alpha ^{2}&\cdots &\alpha ^{n-1}\1&\alpha ^{2}&\alpha ^{4}&\cdots &\alpha ^{2(n-1)}\\vdots &\vdots &\vdots &&\vdots \1&\alpha ^{n-1}&\alpha ^{2(n-1)}&\cdots &\alpha ^{(n-1)(n-1)}\\end{bmatrix}}{\begin{bmatrix}v_{0}\v_{1}\\vdots \v_{n-1}\end{bmatrix}}.} $$

生成子群

子群:群 $(S,⊕), (S′,⊕)$,满足 $S′⊂S$,则 $(S′,⊕)$ 是 $(S,⊕)$ 的子群

拉格朗日定理:$|S′|∣|S |$ 证明需要用到陪集,得到陪集大小等于子群大小,每个陪集要么不相交要么相等,所有陪集的并是集合 $S$,那么显然成立。

生成子群:$a \in S$ 的生成子群 $\left = {a^{(k)}, k \geq 1 }$,$a$ 是 $\left< a \right>$ 的生成元

阶:群 $S$ 中 $a$ 的阶是满足 $a^r=e$ 的最小的 $r$,符号 $\operatorname{ord}(a)$,有 $\operatorname{ord}(a)=\left|\left\right|$,显然成立。

考虑群 $Z_n^ \times ={[a], n \in Z_n : \gcd(a, n) = 1}, |Z_n^ \times | = \varphi(n)$

阶就是满足 $a^r \equiv 1 \pmod n$ 的最小的 $r$,$\operatorname{ord}(a)=r$

原根

$g$ 满足 $\operatorname{ord}_n(g)=\left|Z_n^\times\right|=\varphi(n)$,对于质数 $p$,也就是说 $g^i \bmod p, 0 \leq i < p$ 结果互不相同。

模 $n$ 有原根的充要条件 :$n = 2, 4, p^e, 2 \times p^e$

离散对数:$g^t \equiv a \pmod n,ind_{n,g}{(a)}=t$

因为 $g$ 是原根,所以 $gt$ 每 $\varphi(n)$ 是一个周期,可以取到 $| Z \times n |$ 的所有元素 对于 $n$ 是质数时,就是得到 $[1,n−1]$ 的所有数,就是 $[0,n−2]$ 到 $[1,n−1]$ 的映射 离散对数满足对数的相关性质,如

求原根可以证明满足 $g^r \equiv 1\pmod p$ 的最小的 $r$ 一定是 $p−1$ 的约数 对于质数 $p$,质因子分解 $p−1$,若 $g^{(p-1)/pi} \neq 1 \pmod p$ 恒成立,$g$ 为 $p$ 的原根。

NTT

数论变换(NTT)是通过将离散傅立叶变换化为 $F={\mathbb {Z}/p}$,整数模质数 $p$。这是一个 有限域,只要 $n$ 可除 $p-1$,就存在本元 $n$ 次方根,所以我们有 $p=\xi n+1$ 对于 $a$ 正整数 $ξ$。具体来说,对于质数 $p=qn+1, (n=2^m)$, 原根 $g$ 满足 $g^{qn} \equiv 1 \pmod p$, 将 $g_n=g^q\pmod p$ 看做 $\omega_n$ 的等价,则其满足相似的性质,比如 $g_n^n \equiv 1 \pmod p, g_n^{n/2} \equiv -1 \pmod p$

因为这里涉及到数论变化,所以 $N$(为了区分 FFT 中的 $n$,我们把这里的 $n$ 称为 $N$)可以比 FFT 中的 $n$ 大,但是只要把 $\frac{qN}{n}$ 看做这里的 $q$ 就行了,能够避免大小问题。

常见的有

$$ p = 1004535809 = 479 \times 2^{21}+1, g=3 $$

$$ p=998244353=7 \times 17 \times 2^{23}+1, g=3 $$

就是 $g^{qn}$ 的等价 $e^{2\pi n}$

迭代到长度 $l$ 时 $g_l = g^{\frac{p-1}{l}}$,或者 $\omega_n = g_l = g_N^{\frac{N}{l}} = g_N^{\frac{p-1}{l}}$

下面是一个大数相乘的模板,参考来源

??? note "参考代码" ```cpp #include #include #include #include #include #include #include #include #include #include #include #include #include #include using namespace std;

inline int read() {
  int x = 0, f = 1;
  char ch = getchar();
  while (ch < '0' || ch > '9') {
    if (ch == '-') f = -1;
    ch = getchar();
  }
  while (ch <= '9' && ch >= '0') {
    x = 10 * x + ch - '0';
    ch = getchar();
  }
  return x * f;
}

void print(int x) {
  if (x < 0) putchar('-'), x = -x;
  if (x >= 10) print(x / 10);
  putchar(x % 10 + '0');
}

const int N = 300100, P = 998244353;

inline int qpow(int x, int y) {
  int res(1);
  while (y) {
    if (y & 1) res = 1ll * res * x % P;
    x = 1ll * x * x % P;
    y >>= 1;
  }
  return res;
}

int r[N];

void ntt(int *x, int lim, int opt) {
  register int i, j, k, m, gn, g, tmp;
  for (i = 0; i < lim; ++i)
    if (r[i] < i) swap(x[i], x[r[i]]);
  for (m = 2; m <= lim; m <<= 1) {
    k = m >> 1;
    gn = qpow(3, (P - 1) / m);
    for (i = 0; i < lim; i += m) {
      g = 1;
      for (j = 0; j < k; ++j, g = 1ll * g * gn % P) {
        tmp = 1ll * x[i + j + k] * g % P;
        x[i + j + k] = (x[i + j] - tmp + P) % P;
        x[i + j] = (x[i + j] + tmp) % P;
      }
    }
  }
  if (opt == -1) {
    reverse(x + 1, x + lim);
    register int inv = qpow(lim, P - 2);
    for (i = 0; i < lim; ++i) x[i] = 1ll * x[i] * inv % P;
  }
}

int A[N], B[N], C[N];

char a[N], b[N];

int main() {
  register int i, lim(1), n;
  scanf("%s", &a);
  n = strlen(a);
  for (i = 0; i < n; ++i) A[i] = a[n - i - 1] - '0';
  while (lim < (n << 1)) lim <<= 1;
  scanf("%s", &b);
  n = strlen(b);
  for (i = 0; i < n; ++i) B[i] = b[n - i - 1] - '0';
  while (lim < (n << 1)) lim <<= 1;
  for (i = 0; i < lim; ++i) r[i] = (i & 1) * (lim >> 1) + (r[i >> 1] >> 1);
  ntt(A, lim, 1);
  ntt(B, lim, 1);
  for (i = 0; i < lim; ++i) C[i] = 1ll * A[i] * B[i] % P;
  ntt(C, lim, -1);
  int len(0);
  for (i = 0; i < lim; ++i) {
    if (C[i] >= 10) len = i + 1, C[i + 1] += C[i] / 10, C[i] %= 10;
    if (C[i]) len = max(len, i);
  }
  while (C[len] >= 10) C[len + 1] += C[len] / 10, C[len] %= 10, len++;
  for (i = len; ~i; --i) putchar(C[i] + '0');
  puts("");
  return 0;
}
```

参考资料与拓展阅读