[CodeForces1603D] Artistic Partition（四边形不等式 + 决策单调性优化dp + 分治 + 线性筛 + 数论分块）

problem

codeforces

对于给定的正整数 $l≤l\leq$ ，定义 $c (l, r)$ 为满足下列条件的正整数对 $(i, j)$ 的数量：

$l≤i≤j≤rl\leq i\leq j\leq r$ ；
$gcd⁡(i,j)≥l\gcd(i,j)\geq l$ 。

给定正整数 $k≤nk\leq n$ 。

对所有满足 $0 = x 1 < x 2 < \dots < x k < x k + 1 = n$ 的整数序列 $x_1,...,x_{k+1})$

计算 $∑i=1kc(xi+1,xi+1)\sum_{i=1}^kc(x_i+1,x_{i+1})$ 的最小值。

你需要回答 $T$ 组询问。

对全部数据， $1≤T≤3×1051\leq T\leq 3\times 10^5$ ， $1≤k≤n≤1051\leq k\leq n\leq 10^5$ 。

solution

先设 $f (i, k) :$ 枚举到 $i$ 一共划分了 $k$ 个组的最小值。

则有转移 $f(i,k)=min⁡j≤i{f(j−1,k−1)+c(j,i)}f(i,k)=\min_{j\le i}\Big\{f(j-1,k-1)+c(j,i)\Big\}$ 。

但遗憾的是，时间空间双双起飞，而且空间并不能滚动掉。

不妨挖掘一下 $c (l, r)$ 的性质：

$ovservation1:\text{ovservation1}:$ $c(l,r)≥r−l+1c(l,r)\ge r-l+1$ 。显然至少每个 $i∈[l,r],(i,i)i\in[l,r],(i,i)$ 点对就能提供一次贡献。
$observation2:c(i,2i−1)=i\text{observation2}:c(i,2i-1)=i$ 。显然 $[i, 2 i - 1]$ 中的任意两个数的 $gcd⁡<i\gcd<i$ 。

基于以上两个观察，不难得出当 $n<2^k$ 时，答案一定为 $n$ 。

因为我们有足够多的组数可以分成形如 $c (i, 2 i - 1)$ 的形式。

所以我们状态设计的第二维就可以降成 $log⁡\log$ 级别。空间问题已经被解决了。

接下来考虑时间复杂度，其直接挂钩于优化 $c (l, r)$ 的计算。
$c(l,r)=∑i=lr∑j=ir[gcd⁡(i,j)≥l]=∑d=lr∑i=lr∑j=ir[gcd⁡(i,j)=d]=∑d=lr∑i=⌈ld⌉⌊rd⌋∑j=i⌊rd⌋[gcd⁡(i,j)=1]=∑d=lr∑i=1⌊rd⌋∑j=i⌊rd⌋[gcd⁡(i,j)=1]=∑d=lr∑j=1⌊rd⌋∑i=1j[gcd⁡(i,j)=1]=∑d=lr∑i=1⌊rd⌋φ(i)c(l,r)=\sum_{i=l}^r\sum_{j=i}^r[\gcd(i,j)\ge l]=\sum_{d=l}^r\sum_{i=l}^r\sum_{j=i}^r[\gcd(i,j)=d]\\ =\sum_{d=l}^r\sum_{i=\lceil\frac{l}{d}\rceil}^{\lfloor\frac rd\rfloor}\sum_{j=i}^{\lfloor\frac rd\rfloor}[\gcd(i,j)=1]=\sum_{d=l}^r\sum_{i=1}^{\lfloor\frac rd\rfloor}\sum_{j=i}^{\lfloor\frac rd\rfloor}[\gcd(i,j)=1]\\ =\sum_{d=l}^r\sum_{j=1}^{\lfloor\frac rd\rfloor}\sum_{i=1}^j[\gcd(i,j)=1]=\sum_{d=l}^{r}\sum_{i=1}^{\lfloor\frac rd\rfloor}\varphi(i)$
记 $S(n)=∑i=1nφ(i)S(n)=\sum_{i=1}^n\varphi(i)$ ，即 $φ(i)\varphi(i)$ 的前缀和。则 $c(l,r)=∑i=lrS(⌊ri⌋)c(l,r)=\sum_{i=l}^rS(\lfloor\frac ri\rfloor)$ 。

$O (n)$ 线性筛预处理 $φ(i),S(i)\varphi(i),S(i)$ 后，可以数论分块做到 $O(r−l+1)O(\sqrt{r-l+1})$ 计算。

考虑进一步地优化转移。

$k$ 只与 $k - 1$ 挂钩。所以状态转移的时候不妨先枚举 $k$ 再枚举 $i$ 。

对于固定的 $k$ ，我们简化内层转移写成 $f(i)=min⁡j≤i{f(j−1)+c(j,i)}f(i)=\min_{j\le i}\Big\{f(j-1)+c(j,i)\Big\}$ 。

看见这种形式的转移方程，我们 ~~打表验证~~ 大胆猜测是决策单调性的。

证明 $c (l, r)$ 区间包含单调性。

即 $∀l≤l′≤r′≤r\forall\ l\le l'\le r'\le r$ 有 $c(l′,r′)≤c(l,r)c(l',r')\le c(l,r)$ 。根据 $c (l, r)$ 的定义显然。
证明 $c (l, r)$ 满足四边形不等式（交叉小于包含）。

即 $∀l1<l2<r1<r2\forall\ l_1<l_2<r_1<r_2$ 有 $c(l1,r1)+c(l2,r2)≤c(l1,r2)+c(l2,r1)c(l_1,r_1)+c(l_2,r_2)\le c(l_1,r_2)+c(l_2,r_1)$ 。
$c(l1,r2)+c(l2,r1)=∑i=l1r2S(⌊r2i⌋)+∑i=l2r1S(⌊r1i⌋)=∑i=l1l2−1S(⌊r2i⌋)+∑i=l2r2S(⌊r2i⌋)+∑i=l1r1S(⌊r1i⌋)−∑i=l1l2−1S(⌊r1i⌋)=∑i=l1l2−1(S(⌊r2i⌋)−S(⌊r1i⌋))+∑i=l2r2S(⌊r2i⌋)+∑i=l1r1S(⌊r1i⌋)=∑i=l1l2−1(S(⌊r2i⌋)−S(⌊r1i⌋))+c(l2,r2)+c(l1,r1)c(l_1,r_2)+c(l_2,r_1)=\sum_{i=l_1}^{r_2}S(\lfloor\frac{r_2}{i}\rfloor)+\sum_{i=l_2}^{r_1}S(\lfloor\frac{r_1}{i}\rfloor)\\ =\sum_{i=l_1}^{l_2-1}S(\lfloor\frac{r_2}{i}\rfloor)+\sum_{i=l_2}^{r_2}S(\lfloor\frac{r_2}{i}\rfloor)+\sum_{i=l_1}^{r_1}S(\lfloor\frac{r_1}{i}\rfloor)-\sum_{i=l_1}^{l_2-1}S(\lfloor\frac{r_1}{i}\rfloor)\\ =\sum_{i=l_1}^{l_2-1}\Big(S(\lfloor\frac{r_2}{i}\rfloor)-S(\lfloor\frac{r_1}{i}\rfloor)\Big)+\sum_{i=l_2}^{r_2}S(\lfloor\frac{r_2}{i}\rfloor)+\sum_{i=l_1}^{r_1}S(\lfloor\frac{r_1}{i}\rfloor)\\ =\sum_{i=l_1}^{l_2-1}\Big(S(\lfloor\frac{r_2}{i}\rfloor)-S(\lfloor\frac{r_1}{i}\rfloor)\Big)+c(l_2,r_2)+c(l_1,r_1)$
显然 $∑i=l1l2−1(S(⌊r2i⌋)−S(⌊r1i⌋))≥0\sum_{i=l_1}^{l_2-1}\Big(S(\lfloor\frac{r_2}{i}\rfloor)-S(\lfloor\frac{r_1}{i}\rfloor)\Big)\ge0$ ，所以 $ c(l_1,r_2)+c(l_2,r_1)\ge c(l_1,r_1)+c(l_2,r_2)$ 得证。

所以 $f (i)$ 是具有决策点单调的性质的。经典 $1D1D\text{1D1D}$ 类单调性优化。

证明 $f (i)$ 具有决策单调性。

即设 $g (i)$ 为 $i$ 的最佳转移决策点，则 $∀j<ig(j)≤g(i)\forall_{j<i}\ g(j)\le g(i)$ 。

设 $y < x < j < i$ ，且 $f (j)$ 的最佳决策点为 $x$ 。则有：
- $f(x−1,j)+c(x,j)≤f(y−1,j)+c(y,j)f(x-1,j)+c(x,j)\le f(y-1,j)+c(y,j)$ 。
- $c(y,j)+c(x,i)≤c(y,i)+c(x,j)c(y,j)+c(x,i)\le c(y,i)+c(x,j)$ 。
两式相加有： $f(x−1)+c(x,j)+c(y,j)+c(x,i)≤f(y−1)+c(y,j)+c(y,i)+c(x,j)f(x-1)+c(x,j)+c(y,j)+c(x,i)\le f(y-1)+c(y,j)+c(y,i)+c(x,j)$ 。

化简后有： $f(x−1)+c(x,i)≤f(y−1)+c(y,i)f(x-1)+c(x,i)\le f(y-1)+c(y,i)$ 。

所以对于 $i$ 而言，最佳决策点选 $x$ 一定优于/不劣于选 $y$ 。

那么我们就对于外层枚举的每一个 $k$ ，跑决策点的分治。

$(l, r, L, R)$ ：处理 $i∈[l,r]i\in[l,r]$ 的最优决策点落在 $[L, R]$ 区间内。

$mid=l+r2mid=\frac{l+r}2$ ，先算出 $c (R + 1, m i d)$ ，然后 $c(i,mid)=c(i+1,mid)+S(⌊midi⌋)c(i,mid)=c(i+1,mid)+S(\lfloor\frac{mid}{i}\rfloor)$ 。

再从 $min⁡(mid,R)\min(mid,R)$ 开始 $→L\rightarrow L$ 枚举 $m i d$ 的最佳决策点。

因为最佳决策点编号必须小于自己编号。

再根据 $m i d$ 分成左右并把决策点区间分成左右。

复杂度额额额，约莫 $O(n+T+knnlog⁡n)O(n+T+kn\sqrt{n}\log n)$ 。

code

#include <bits/stdc++.h>
using namespace std;
#define int long long
#define maxn 100005
int T, n, cnt;
int prime[maxn], phi[maxn], vis[maxn], S[maxn];
int f[maxn][20];void sieve( int n = 1e5 ) {phi[1] = 1;for( int i = 2;i <= n;i ++ ) {if( ! vis[i] ) prime[++ cnt] = i, phi[i] = i - 1;for( int j = 1;j <= cnt and i * prime[j] <= n;j ++ ) {vis[i * prime[j]] = 1;if( i % prime[j] == 0 ) {phi[i * prime[j]] = phi[i] * prime[j];break;}else phi[i * prime[j]] = phi[i] * phi[prime[j]];}}for( int i = 1;i <= n;i ++ ) S[i] = S[i - 1] + phi[i];
}int calc( int l, int r ) {int ans = 0;for( int i;l <= r;l = i + 1 ) {i = min( r / ( r / l ), r );ans += S[r / l] * ( i - l + 1 );}return ans;
}void solve( int l, int r, int L, int R, int k ) {if( l > r ) return;int mid = l + r >> 1;int sum = calc( R + 1, mid );int ans = 1e18, pos;for( int i = min( R, mid );i >= L;i -- ) {sum += S[mid / i];if( sum + f[i - 1][k - 1] <= ans )ans = sum + f[i - 1][k - 1], pos = i;}f[mid][k] = ans;solve( l, mid - 1, L, pos, k );solve( mid + 1, r, pos, R, k );
}signed main() {for( int i = 1;i <= 1e5;i ++ ) f[i][1] = i * (i + 1) >> 1;sieve();for( int k = 2;k <= 17;k ++ ) solve( 1, 1e5, 1, 1e5, k );scanf( "%lld", &T );while( T -- ) {int k;scanf( "%lld %lld", &n, &k );if( k > 17 or (1 << k) > n ) printf( "%lld\n", n );else printf( "%lld\n", f[n][k] ); }return 0;
}