Codeforces [Gym 102354B] Yet Another Convolution

给出两个长为 $n$ 的序列 $\{a_n\}$ 和 $\{b_n\}$ 。对于所有的 $k\in[1,n]\cap\mathbb Z_{+}$ ,求这样的 $c_k$:

$1\leq n\leq 10^5$

题目来源于 2018-2019 Summer Petrozavodsk Camp, Oleksandr Kulkov Contest 2 。

发现这题居然还是那一场通过人数最多的题目之一…深深地感觉到了自己的弱小。

然后正片部分。考虑这个式子可以怎么化,发现对于一个给定的 $k$ ,要找的 $a_i$ 和 $b_i$ 应该至少是这样的:

于是直接把这些拿出来重编号为 $1,2,3\cdots p$。那么为了保证 $\gcd(i,j)=k$,就需要满足取出的一个 pair 满足 $\gcd(i,j)=1$ 。也就是现在转化成了这么一个问题:

也就是

然后似乎就没法做了。发现本题要求 $poly(\log)$ 的做法,但是本质上对于每个 $k$ ,都有 $O(\frac{n}{k})$ 组询问,这个询问量是十分巨大的。于是考虑有没有什么可以一起处理全部询问的方法。发现似乎整体二分可行。

首先把里面的 $\min$ 通过将 $b$ 全部取反变成 $\max$:

之后考虑整体二分。具体的来讲,先考虑一组询问(即一个固定的 $i$)怎么二分。对于一个 $\min_{j=1}^p\{b_j\cdot[(i,j)=1]\}$ ,将其转化成判定性问题。假设当前二分到的值是 $ans$ ,那么考虑,如果 $\sum_{j=1}^p[ans0$,那就代表存在一个值比 $ans$ 大,符合二分性质。

那么对于这个 $\sum$ 而言,就可以变一下形了:

反演一下也就是

那么考虑整体二分的时候,对于每一层都可以把 $vmid$ 的位置都赋值为 $1$ 做例子。每次手动将一个指针移动 $vmid+1$ 处,然后对于途径的所有 $b_j$,如果 $>vmid$ 的话就 $+1$ ,否则 $-1$ 。这样做之后,直接把自己的标记下传给所有自己的约数。这样最后去 $check(i)$ 的时候就可以直接枚举所有约数而不需要再去枚举约数的倍数。发现移动指针每层都是 $O(r-l)$ 的。

于是最后考虑算一下复杂度。大概是:

的复杂度。emmm,这大概是个什么复杂度呢…考虑 $d(n)<O(\sqrt[3]n)$ ,所以最后应该不会超过 $(n\log n)^{\frac{4}{3}}\log n$

后面一个 $\log$ 是因为:

似乎是因为 $\log (\frac{n}{x})<0$ 的问题,所以需要忽略掉符号。最后大概也就是 $n\log^2 n$ 的级别。

然而实际积分出来也差不多?

看上去就是 $(n\log n)^{\frac{4}{3}}\log n$ 的亚子。不过话说回来 $d(n)=O(\sqrt[3] n)$ 的近似误差有、大,所以还是 $O($能过$)$ 比较靠谱.jpg 。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
#include <cstdio>
#include <vector>
#include <cstring>
#include <iostream>
#include <algorithm>

using namespace std ;

const int N = 300010 ;

#define p_b push_back
#define upb upper_bound

void debug(int *tp, int minn, int maxn, char c){
for (int i = minn ; i <= maxn ; ++ i)
cout << tp[i] << " " ; cout << c ;
}

int n ;
int xq ;
int cnt ;
int q[N] ;
int A[N] ;
int B[N] ;
int lq[N] ;
int rq[N] ;
int pr[N] ;
int ta[N] ;
int tb[N] ;
int Mu[N] ;
int sum[N] ;
int res[N] ;
int ans[N] ;
int tmp[N] ;
int base[N] ;
bool vis[N] ;
vector <int> d[N] ;

void add(int x, int y){
int p = d[x].size() ;
for (int i = 0 ; i < p ; ++ i)
sum[d[x][i]] += y ;
return ;
}
void upd(int x){
while (xq > x) add(base[-- xq], 1) ;
while (x > xq) add(base[xq ++], -1) ;
//debug(sum, 1, 50, '\n') ;
}
int calc(int x){
int ret = 0 ;
int p = d[x].size() ;
for (int i = 0 ; i < p ; ++ i)
ret += Mu[d[x][i]] * sum[d[x][i]] ;
return ret ;
}
void do_it(int l, int r, int vl, int vr){
if (l > r) return ;
if (vl == vr){
for (int i = l ; i <= r ; ++ i)
ans[q[i]] = vl ; return void() ;
}
int vmid = (vl + vr) >> 1 ;
int tl = 0, tr = 0 ; upd(vmid + 1) ;
for (int i = l ; i <= r ; ++ i){
if (calc(q[i]) <= 0)
lq[++ tl] = q[i] ;
else rq[++ tr] = q[i] ;
}
//cout << tl << " " << tr << endl ;
for (int i = 1 ; i <= tl ; ++ i) q[l + i - 1] = lq[i] ;
for (int i = 1 ; i <= tr ; ++ i) q[l + tl + i - 1] = rq[i] ;
do_it(l, l + tl - 1, vl, vmid) ; do_it(l + tl, r, vmid + 1, vr) ;
}
int do_do(int k){
for (int i = 1 ; i <= k ; ++ i)
tmp[q[i] = i] = tb[i], sum[i] = 0 ;
sort(tmp + 1, tmp + k + 1) ; int x ; xq = k + 1 ;
for (int i = 1 ; i <= k ; ++ i){
x = upb(tmp + 1, tmp + k + 1, tb[i]) - tmp ;
x -- ; base[x] = i ; tmp[x] ++ ;
}
int ret = -2333333 ; do_it(1, k, 1, k) ; //debug(q, 1, k, '\n') ;
for (int i = 1 ; i <= k ; ++ i)
ret = max(ret, ta[i] + tmp[ans[i]] - 1) ;
return ret ;
}
void solve(){
for (int i = 1 ; i <= n ; ++ i){
for (int j = 1 ; i * j <= n ; ++ j)
ta[j] = A[i * j], tb[j] = B[i * j] ;
res[i] = max(res[i], do_do(n / i)) ;
}
}
void sieve(int k){
vis[0] = vis[1] = Mu[1] = 1 ;
for (int i = 2 ; i <= k ; ++ i){
if (!vis[i])
pr[++ cnt] = i, Mu[i] = -1 ;
for (int j = 1 ; j <= cnt ; ++ j){
if (pr[j] * i > k) break ;
vis[i * pr[j]] = 1 ;
if (i % pr[j] == 0) break ;
Mu[i * pr[j]] = - Mu[i] ;
}
}
for (int i = 1 ; i <= k ; ++ i)
for (int j = 1 ; i * j <= k ; ++ j)
d[i * j].p_b(i) ;
}
int main(){
sieve(N - 10) ;
ios :: sync_with_stdio(false) ;
cin.tie(0) ; cout.tie(0) ; cin >> n ;
for (int i = 1 ; i <= n ; ++ i) cin >> A[i] ;
for (int i = 1 ; i <= n ; ++ i) cin >> B[i] ;
for (int i = 1 ; i <= n ; ++ i) B[i] = -B[i] ;
solve() ;
//for (int i = 1 ; i <= n ; ++ i)
// cout << res[i] << " \n"[i == n] ;
for (int i = 1 ; i <= n ; ++ i)
A[i] = -A[i], B[i] = -B[i] ;
solve() ;
for (int i = 1 ; i <= n ; ++ i)
cout << res[i] << " \n"[i == n] ;
return 0 ;
}