Deep_Dark_FAntasy♂

2020-10-06 21:33 清华大学算法工程师

关注

快速傅里叶变换和快速数论变换FFT&NTT

快速傅里叶变换(FFT)

作用：加速多项式乘法

朴素高精度乘法时间O(n^2),但FFT能O(nlog2n)的时间解决

前置知识：

1.点值表示法：

f(x)={( x0,f(x0) ),( x1,f(x1) ) ,( x2, f(x2) ), ( x3, f(x3) ), ( x4, f(x4) ), ... , (xn-1, f(xn-1) )}

g(x)={( x0,g(x0) ),( x1,g(x1) ) ,( x2, g(x2) ), ( x3, g(x3) ), ( x4, g(x4) ), ... , (xn-1, g(xn-1) )}

设它们乘积为h(x)，那么

h(x)={( x0,f(x0)g(x0) ),( x1, f(x1)g(x1) ), ( x2, f(x2)g(x2) ), ... , ( xn-1, f(xn-1)g(xn-1) )}

2.复数

(a1,θ1) *（a2,θ2）为（a1a2,θ1+θ2）

快速傅里叶变换的实现：

const double PI = acos(-1);
typedef complex <double> cp;

cp omega(int n, int k) {
    return cp(cos(2 * PI * k / n), sin(2 * PI * k / n));
}

void fft(cp *a, int n, bool inv) {
    if(n == 1) return ;
    static cp buf[N];
    int m = n / 2;
    for(int i = 0; i < m ; i++){        
        buf[i] = a[2 * i];
        buf[i + m] = a[2 * i + 1];
    }
    for(int i = 0; i < n; i++)
        a[i] = buf[i];
    fft(a, m, inv);
    fft(a + m, m, inv);
    for(int i = 0; i < m; i++) {
        cp x = omega(n, i);
        if(inv) x = conj(x);
        //conj是一个自带的求共轭复数的函数，精度较高。当复数模为1时，共轭复数等于倒数
        buf[i] = a[i] + x * a[i + m];
        buf[i + m] = a[i] - x * a[i + m];
    }
    for(int i = 0; i < n; i++)
        a[i] = buf[i];
}

注1：a中i属于0-m-1是A1(i)的取值，a中i属于m到n-1是A2(i)的取值，那么递归的分析，对现在A1中的第i位置，其是由0-m/2-1的得来的，然后最后再更新a数组，a(i）就是A（omega(n, i)）的取值了。

注2：n是偶数，多项式的项数。

注3：inv表示单位根是否要取倒数，FFT的逆变换即点值表示法转化为系数表示法。

做法：把点值表示法作为系数，用取了倒数的单位根代入求个点值表示法，得到Zi再除以n就是i的系数ai（证明参考：https://www.cnblogs.com/RabbitHu/p/FFT.html）以下提到"博客"均指此篇博客。

注4：在逆FFT的时候，应该用floor(a[i].real() / n + 0.5);来得到res[i]（精度问题）

优化fft(非递归)

发现每次都往下其实都是先去递归，使得所有元素到达其应该在的地方，然后再不断往上递归对a赋值的。

规律：参考博客，可以发现，一个位置a上的数，最后所在的位置是"a二进制翻转得到的数"

据此写出非递归版本fft：先把每个数放到最后的位置上，然后不断向上，从而求出最终答案。

#include<iostream>
#include<cstdio>
#include<complex>
using namespace std;
const double PI = acos(-1);
typedef complex <double> cp;

cp a[N], b[N], omg[N], inv[N];

void init() {
    for(int i = 0; i < n; i++) {
        omg[i] = cp(cos(2 * PI * i / n), sin(2 * PI * i / n));
        inv[i] = conj(omg[i]);
    }
}

void fft(cp *a, cp *omg) {
    int lim = 0;
    while((1 << lim) < n) lim++;
    for(int i = 0; i < n; i++) {
        int t = 0;
        for(int j = 0; j < lim; j++)
            if((i >> j) & 1) t |= (1 << (lim - j - 1));
        if(i < t) swap(a[i], a[t]);    //i < t的限制使得每对点只被交换一次(否则交换两次相当于没交换) 
    }
    static cp buf[N];
    for(int l = 2; l <= n; l *= 2) {    //区间长度 
        int m = l / 2;
        for(int j = 0; j < n; j += l)    //区间起点 
            for(int i = 0; i < m; i++) {
                buf[j + i] = a[j + i] + omg[n / l * i] * a[j + i + m];
                buf[j + i + m] = a[j + i] - omg[n / l * i] * a[j + i + m];
            }
        for(int j = 0; j < n; j++)
            a[j] = buf[j];
    }
}

蝴蝶变换：

之前为什么需要buf数组：

如果

a[j + i] = a[j + i] + omg[n / l * i] * a[j + i + m]

a[j + i + m] = a[j + i] - omg[n / l * i] * a[j + i + m]

会对更新a[j + i + m]造成影响。

而通过蝴蝶变换

cp t = omg[n / l * i] * a[j + i + m]

a[j + i + m] = a[j + i] - t

a[j + i] = a[j + i] + t

不就顺序换了一下？？

反正就不用buf数组就是了。

FFT最终模板：

const double PI = acos(-1);
typedef complex <double> cp;

cp a[N], b[N], omg[N], inv[N];

void init() {
    for(int i = 0; i < n; i++) {
        omg[i] = cp(cos(2 * PI * i / n), sin(2 * PI * i / n));
        inv[i] = conj(omg[i]);
    }
}

void fft(cp *a, cp *omg) {
    int lim = 0;
    while((1 << lim) < n) lim++;
    for(int i = 0; i < n; i++) {
        int t = 0;
        for(int j = 0; j < lim; j++)
            if((i >> j) & 1) t |= (1 << (lim - j - 1));
        if(i < t) swap(a[i], a[t]);    //i < t的限制使得每对点只被交换一次(否则交换两次相当于没交换) 
    }
    for(int l = 2; l <= n; l *= 2) {    //区间长度 
        int m = l / 2;
        for(cp *p = a; p != a + n; p += l)
            for(int i = 0; i < m; i++) {
                cp t = omg[n / l * i] * p[i + m];
                p[i + m] = p[i] - t;
                p[i] += t;
            }
    }
}

题1：a*bIII http://www.acmicpc.sdnu.edu.cn/problem/show/1531

注意三点：

1.0与其他数相乘只输出一个0.

2.memset是可以对复数初始化的

3.FFT中的n需要是2的倍数

#include<bits/stdc++.h>
using namespace std;
#define int long long
const int N = 1000005;
const double PI = acos(-1);
typedef complex <double> cp;

char sa[N], sb[N];
int n = 1, lena, lenb, ans[N];
cp a[N], b[N], omg[N], inv[N];

void init(){
    for(int i = 0; i < n; i++){
        omg[i] = cp(cos(2 * PI * i / n), sin(2 * PI * i / n));
        inv[i] = conj(omg[i]);
    }
}

void fft(cp *a, cp *omg) {
    int lim = 0;
    while((1 << lim) < n) lim++;
    for(int i = 0; i < n; i++) {
        int t = 0;
        for(int j = 0; j < lim; j++)
            if((i >> j) & 1) t |= (1 << (lim - j - 1));
        if(i < t) swap(a[i], a[t]);    //i < t的限制使得每对点只被交换一次(否则交换两次相当于没交换) 
    }
    for(int l = 2; l <= n; l *= 2) {    //区间长度 
        int m = l / 2;
        for(cp *p = a; p != a + n; p += l)
            for(int i = 0; i < m; i++) {
                cp t = omg[n / l * i] * p[i + m];
                p[i + m] = p[i] - t;
                p[i] += t;
            }
    }
}


signed main()
{
    while(~scanf("%s%s",sa,sb)) {
        memset(ans, 0, sizeof(ans));
        memset(a, 0, sizeof(a));
        memset(b, 0, sizeof(b));
        n = 1;
        lena = strlen(sa), lenb = strlen(sb);
        if(lena == 1  && sa[0] == '0' || lenb == 1  && sb[0] == '0') {
            printf("0\n");
            continue;
        }
        while(n < lena + lenb) n *= 2;
        for(int i = 0; i < lena; i++){
            a[i].real(sa[lena - 1 - i] - '0');
        }
        for(int i = 0; i < lenb; i++){
            b[i].real(sb[lenb - 1 - i] - '0');
        }
        init();
        fft(a, omg);
        fft(b, omg);
        for(int i = 0; i < n; i++) {
            a[i] *= b[i];
        }
        fft(a, inv);
        for(int i = 0; i < n; i++) {
            ans[i] += floor(a[i].real() / n + 0.5);
            ans[i + 1] += ans[i] / 10;
            ans[i] %= 10; 
        }
        int beg;
        for(int i = n-1; i >= 0; i--) {
            if(ans[i] != 0){
                beg = i;
                break;
            }
        }
        for(int i = beg; i >= 0; i--){
            printf("%lld",ans[i]);
        }
        putchar('\n');
    }
    return 0;
}

FFT的缺点是它的复数运算double精度问题导致它实际上是k*nlongn的，会比NTT的常数大很多。

NTT

前置知识：

原根：对于g,p属于Z，如果g^i mod p ( 1<=i<=p-1)的值互不相同，则称g为p的原根。

或者说对于任意i，j(1<=i<j <= p-1) g^i mod p /= g^j mod p，那么g为p的原根。

常见模数有：998244353,1004535809,469762049，这几个的原根都为3

在NTT中，我们拿原根来代替FFT的单位根

#define g 3
const int mod = 998244353;
const int N = 300000;

inline get_rev()
{
    int lim = 0;
    while((1 << lim) < n) lim++;
    for(int i = 0; i < n; i++) {
        rev[i] = (rev[i >> 1] >> 1 | ((i & 1) << (lim - 1)));
    }
}

inline void ntt(int *a, int inv) {
    for(int i = 0; i < n; i++) {
        if(i < rev[i]) swap(a[i], a[rev[i]]);    //i < t的限制使得每对点只被交换一次(否则交换两次相当于没交换) 
    }
    for(int l = 2; l <= n; l *= 2) {    //区间长度 
        int m = l / 2;
        int tmp = q_pow(g, (mod-1)/l);
        if(inv == -1) tmp = q_pow(tmp, mod-2);
        for(int i = 0; i < n; i += l) {
            int omega = 1;
            for(int j = 0; j < m; j++, omega = omega*tmp%mod) {
                int x = a[i + j], y = omega * a[i + j + m] % mod;
                a[i + j] = (x + y) % mod, a[i + j + m] = (x - y + mod) % mod;
            }
        }
    }
    if(inv == -1)
    {
        int nI = q_pow(n, mod-2);
        for(int i = 0; i < n; i++) {
            a[i] = a[i] * nI % mod;
        }
    }
}

例1：http://www.acmicpc.sdnu.edu.cn/problem/show/1532

#include<bits/stdc++.h>

using namespace std;
#define int long long
#define g 3
const int mod = 998244353;
const int N = 300000;

inline int read(){
    int x=0,f=1;char ch=getchar();
    while(!isdigit(ch)){if(ch=='-')f=-1;ch=getchar();}
    while(isdigit(ch)){x=(x<<1)+(x<<3)+(ch^48);ch=getchar();}
    return x*f;
}
inline void write(int x)
{
    if(x<0)x=-x,putchar('-');
    if(x>9)write(x/10);
    putchar(x%10+'0');
}

char sa[N], sb[N];
int n = 1, a[N], b[N], rev[N], lena, lenb;

inline int q_pow(int a, int b){
    int ans = 1;
    while(b > 0){
        if(b & 1){
            ans = ans * a % mod;
        }
        a = a * a % mod;
        b >>= 1; 
    } 
    return ans;
}

inline get_rev()
{
    int lim = 0;
    while((1 << lim) < n) lim++;
    for(int i = 0; i < n; i++) {
        rev[i] = (rev[i >> 1] >> 1 | ((i & 1) << (lim - 1)));
    }
}

inline void ntt(int *a, int inv) {
    for(int i = 0; i < n; i++) {
        if(i < rev[i]) swap(a[i], a[rev[i]]);    //i < t的限制使得每对点只被交换一次(否则交换两次相当于没交换) 
    }
    for(int l = 2; l <= n; l *= 2) {    //区间长度 
        int m = l / 2;
        int tmp = q_pow(g, (mod-1)/l);
        if(inv == -1) tmp = q_pow(tmp, mod-2);
        for(int i = 0; i < n; i += l) {
            int omega = 1;
            for(int j = 0; j < m; j++, omega = omega*tmp%mod) {
                int x = a[i + j], y = omega * a[i + j + m] % mod;
                a[i + j] = (x + y) % mod, a[i + j + m] = (x - y + mod) % mod;
            }
        }
    }
    if(inv == -1)
    {
        int nI = q_pow(n, mod-2);
        for(int i = 0; i < n; i++) {
            a[i] = a[i] * nI % mod;
        }
    }
} 



signed main()
{
    while(~scanf("%s%s",sa,sb))
    {
        n = 1;
        memset(a, 0, sizeof(a));
        memset(b, 0, sizeof(b));

        lena = strlen(sa), lenb = strlen(sb);
        for(int i = 0; i < lena; i++) {
            a[i] = sa[lena - 1 - i] - '0';
        }
        for(int i = 0; i < lenb; i++) {
            b[i] = sb[lenb - 1 - i] - '0';
        }
        while(n < lena + lenb) n <<= 1;
        get_rev();

        ntt(a, 1);
        ntt(b, 1);
        for(int i = 0; i < n; i++) {
            a[i] = a[i] * b[i] % mod;
        }
        ntt(a, -1);

        for(int i = 0; i < n; i++) {
            a[i + 1] += a[i] / 10;
            a[i] %= 10;
        }
        int cnt = n;
        while(cnt >= 0 && a[cnt] == 0) cnt--;
        if(cnt == -1) {
            printf("0");
        }
        else {
            for(int i = cnt; i >= 0; i--){
                write(a[i]);
            }
        }
        putchar('\n');
    }
    return 0;
}

全部评论

推荐最新楼层

11-05 09:05

后端工程师

腾讯内推腾讯面经

腾讯内推来啦~ 热乎乎的内推码：EUTPZZRV  在腾讯，你将与来自世界各地的顶尖人才共同工作，解决最具挑战性的问题，为科技进步贡献智慧。 分享一些面经： 第一轮技术面  闭包作用及实际应用场景 HTTP/1.1、HTTP/2、HTTP/3的核心差异 实现红绿灯控制效果（异步时序逻辑） React Hooks的设计动机与类组件对比 浏览器事件代理原理及实际应用 手写Promise核心逻辑（包含resolve/reject） 数组去重与高频字符统计算法 Web安全防护措施（XSS、CSRF） 浏览器渲染流程与重排/重绘优化 跨域解决方案（JSONP、CORS、代理）  第二轮技术面  低代码平...

点赞评论收藏

分享

11-06 15:38

已编辑

北京交通大学自然语言处理

暑期实习+秋招面试汇总

bg 双飞本，2硕。算法岗暑期实习：2.25 阶跃星辰 处女面挂2.26 北银金科 挂3.06 百度 三面主管挂3.07 途家网 拒3.17 理想汽车 一面挂3.27 字节 二面挂4.01 小米二面挂5.19 华为 offer秋招：8.22 百度 二面挂8.28 浪潮 offer9.02 滴滴 offer9.01 PDD 经历一个多月 hr面挂9.05 小马智行 一面挂（问hr进度，回复说不知道...9.10 联想 秒挂（面试官说下午会收到下一场的面试通知，结果半小时秒挂9.10 海尔 offer9.15 猿辅导 二面挂9.18 紫荆芯界 三面拒绝9.24 联想(被捞) 依旧一面挂（估计学校问...

点赞评论收藏

分享

10-10 15:23

陕西师范大学 Java

这么多题目我惊了

开始手撕的时候才17分钟我无比震惊不过都没让跑测试用例 就看了我的代码

我的秋招日记

点赞评论收藏

分享

10-15 19:07

门头沟学院产品经理

人有时候也贱

点赞评论收藏

分享

昨天 21:01

中南大学 Java

每天一套面试题Day8-小红书（2）

11.说说缓存穿透、击穿、雪崩的区别 缓存穿透大量查询原本不存在的数打到数据库，缓存空值，布隆过滤器 缓存击穿是热key失效，设置逻辑过期，互斥锁 缓存雪崩是大量缓存同时失效。随机过期时间，提高缓存可用性，比如集群 12.从「敲下一个 URL」到「页面出现在屏幕」整条链路全景 先解析域名，协议，端口（https默认443，http强转https），DNS协议根据域名找到ip，TCP三次握手建立连接，IP协议帮助找到链路，到达服务器，服务器收到请求，返回页面信息，显示在屏幕上。 四次挥手 加上TCP头，IP头，MAC头（通过ARP协议知道以太网中对应的IP的MAC），在网卡加上报头和起始帧分界符...

投递小红书等公司10个岗位

点赞评论收藏

分享

评论

3

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 你实习是赚钱了还是亏钱了？ #

31393次浏览 243人参与

# CVTE求职进展汇总 #

23423次浏览 322人参与

# 京东开奖 #

474906次浏览 2689人参与

# 用一句话形容你的团队氛围 #

18963次浏览 179人参与

# 本机械人被这些公司泡过池子 #

37171次浏览 182人参与

# 你找工作是从容有余 or 匆忙滚爬？ #

12725次浏览 96人参与

# 联影求职进展汇总 #

51857次浏览 325人参与

# 中核求职进展汇总 #

28793次浏览 193人参与

# 海康威视工作体验 #

46006次浏览 158人参与

# 联影医疗求职进展汇总 #

6735次浏览 26人参与

# 外包能不能当跳板？ #

47927次浏览 245人参与

# 毕业论文进行时 #

7239次浏览 84人参与

# 2022毕业即失业取暖地 #

116861次浏览 707人参与

# 同bg的你秋招战况如何？ #

175377次浏览 1024人参与

# 机械人与华为的爱恨情仇 #

137683次浏览 1013人参与

# 嵌入式岗知多少 #

59035次浏览 548人参与

# 面对逼签的应对技巧 #

7871次浏览 40人参与

# 找实习你看重大厂光环还是业务方向 #

41821次浏览 164人参与

# 我来点评面试官 #

17089次浏览 116人参与

# 哪些公司校招卡第一学历 #

220621次浏览 777人参与

# 扒一扒那些奇葩实习经历 #

127166次浏览 1100人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务