【学习笔记】HLPP+丧心病狂的优化

嗯,我也不知道我在月考即将爆炸 + NOIp 即将爆炸之际,学 HLPP 的目的何在QAQ

#define $ u $ 的伴点集合 与 $ u $ 相隔一条边的且 $ u $ 能达到的点的集合

Preface

预流推进的大体思路是,对每个点记录超额流( $ \mathrm{Extra~Flow} $ ) ,即允许流在非源点暂时存储,并伺机将超额流推送出去。不可推送的,就会流回源点。那么最终答案显然存储在 $\rm Extra[T] $ 里面。

但同时这也有一个问题,就是会出现两个点相互推送不停的情况。为了防止这样,我们采用最高标号的策略,给每个点一个高度,对于一个点 $ u $ 以及它的伴点集合 $ \{v\} $ ,当且仅当 $ h_u = h_v + 1 $ 时才可以推送流。并且我们对于源点 $\mathrm{S} $ ,设置 $ h_{\rm S} = N $ ,并对于 $\mathrm{S} $ 实行无限制推送。那么最后的答案就保存在 $ Extra[T] $ 里面 。

但有时,我们发现有个点是”谷“,即周围点的高度都比它高,但是它有超额流。那么我们此时考虑拔高它的高度,即 重贴标签( $ relabel $ ) 操作。

初步的算法流程

以下我们用 $ \mathrm{Extra}_u $ 表示 $ u $ 的超额流, $ h_u $ 表示 $ u $ 的高度,用 $ f_k $ 表示边 $ k $ 的容量。

  • 1)首先把所有的 $ h_i $ 都置为零,并把 $ h_s $ 置为 $ N $ (点数)。
  • 2)将 $\mathrm{S} $ 的流推送到每个与 $\mathrm{S} $ 相邻的点,同时把他们加入一个以高度为键值得大根堆,所以每次取出的应该是高度最高的、且超额流不为零的点,并执行推送操作。
  • 3)对于点 $ u $ 推送过程中,如果 $ \mathrm{Extra}_u $ 减到了 $ 0 $ ,就立即退出(优化一)
  • 4)对于每条出边 $ k $ ,推送的流量 $ F = min(f_k,\mathrm{Extra}_u) $ 并执行两个点( $ u,v $ )的超额流增减。如果 $ v $ 不在堆里面,要把 $ v $ 放到堆里面。
  • 5)如果推送完毕 $ Extra[u] $ 不为零,那么从他的伴点集合选取一个高度最小的点并记录它的高度 $ h_{min} $ ,则新的 $ h_u = h_{min}+1 $ ,并把 $ u $ 入堆。

接下来我们发现,重贴标签的过程似乎与 $\rm ISAP $ 有点点像……所以我们不妨通过一个 $\rm Gap $ 数组来记录”断层情况“。即如果对于一个点 $ u $ 来说,他的伴点集 $ \{v\} $ 已经不存在 $ h_u = h_v + 1 $ 的点了,并且也不存在一个点 $ j $ 使得 $ h_j = h_u $ 那么这个地方就是一个断层 $ (\rm Gap) $ ,那么也就是说,对于所有 $ h_i> h_u $ 的点来说,它们把流推送到 $ h_u $ 的高度就不能继续推送了,所以我们直接 $ h_i = N + 1 $ ,让他们回流到源点。(优化二)

接下来这个优化,亲测可以提速 $ 4000ms $ ,平均每个测试点提速 $ 700 $ ~ $ 800ms $ ,去掉数据最小的点,每个点平均提速 $ 1000ms $ 。这就是—— $\rm BFS $ ! 不妨一开始就倒着 $ \rm BFS $ 一遍,搜出每个点离汇点的最短距离作为初始高度而不是把零作为初始高度(源点高度还是 $N$) 。

嗯, $\rm Mr_Spade $ 大佬实在太强了 。

对了,代码实现方面,需要好多判断不是源点和汇点的小细节…

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
struct state{
int num, h ;
bool operator <(const state & now)
const{ return h < now.h ; }
} ; priority_queue <state> heap ;
BFS init ;
int N, M, S, T, cnt = -1, A, B, C, D, t, min_h ;
int head[MAXN], Extra[MAXN], H[MAXN], Gap[MAXN], node ;

inline void Preflow_Push(){
register int i, k ;
for (i = 1 ; i <= N ; ++ i)
if(H[i] < Inf) ++ Gap[H[i]] ;
for(k = head[S]; k != -1 ; k = E[k].next)
if (t = E[k].f){
E[k].f -= t, E[k ^ 1].f += t ;
Extra[S] -= t, Extra[to(k)] += t ;
if(to(k) != T && !vis[to(k)])
heap.push((state){to(k), H[to(k)]}), vis[to(k)] = 1 ;
}
while(!heap.empty()){
vis[node = heap.top().num] = 0, min_h = Inf, heap.pop() ;
for(k = head[node] ; k != -1 ; k = E[k].next){
if(E[k].f && H[node] == H[to(k)] + 1){
t = min(Extra[node], E[k].f) ;
E[k].f -= t, E[k ^ 1].f += t ;
Extra[node] -= t, Extra}[to(k)] += t ;
if(!vis[to(k)] && to(k) != S && to(k) != T)
heap.push((state){to(k), H[to(k)]}), vis[to(k)] = 1 ;
}
if (E[k].f) min_h = min(min_h, H[to(k)]) ;
if (!Extra[node]) break ;
}
if(Extra[node]) {
if (!-- Gap[H[node]])
for(i = 1; i <= N ; ++ i)
if(i != S && i != T && H[i] > H[node] && H[i] < N + 1) H[i] = N + 1 ;
H[node] = Inf; H[node] = min_h + 1 ;
heap.push((state){node, H[node]}), vis[node] = 1, ++ Gap[H[node]] ;
}
}
}
inline int read() {fast;}
int main(){
Input() ;
for (i = 1 ; i <= N ; ++ i)
head[i] = -1, H[i] = Inf ;
while(M --){Add; }
q.push(T), H[T] = 0 ;
while(!q.empty()){
int now = q.front() ; q.pop() ;
for(k = head[now] ; k != -1 ; k = E[k].next)
if (H[to(k)] > H[now] + 1)
H[E[k].to] = H[now] + 1, q.push(E[k].to) ;
}
if (H[S] == 0) { cout << 0 << endl ; return 0 ; }
H[S] = N, Preflow_Push() ; cout << Extra[T] << endl ;
}

看起来我们加上下面这一句话的毒瘤卡常就可以有 $ 4000ms $ 左右的好成绩,但事实上,这个速度依旧慢的要死。

注意!这个写法是经典写法,其时间复杂度是 $ \boldsymbol{\Theta(n^2m\log n)} $ 的,也就是说在 $ \boldsymbol{n=1200} $ 时会带一个 $ \boldsymbol{10} $ 倍的长🌲

怎么优化呢——

神奇的优化

各位,你们将会见到迄今为止OI界最丧心病狂的优化(之一)……

来,我们首先思考思考普通的HLPP到底会慢在哪里:

  • 1)STL 支持的 heap (比如优先队列)实在是太太太…太慢了!

  • 2)每次 Gap 优化,我们的时间复杂度是紧确的 $ \Theta(n) $ 。的这显然不合算,因为假设我当前的 $ \boldsymbol{gap} $ (断层)正好位于倒数第一高的点和倒数第二高的点,那么也就相当于我单次会浪费 $ \boldsymbol{\Theta(n)} $ 的时间

事实上…普通的 $ \rm HLPP $ 代码并不长,主要问题就是这两个。

我们考虑,如果不用堆的话怎么做呢?

呃…不用堆的意思并不是我们不从高度最大的点开始推送。这个地方需要一个 $ idea $ ——在 $ HLPP $ 中,高度函数 $ \boldsymbol{H(x)} $ 和点数集大小 $ \boldsymbol{N(x)} $ 是广义同阶的。 换句话说,我们可以考虑从高度入手。

换句话说,我们原来是通过节点编号访问节点以及其高度,现在我们如果从高度入手,再去访问节点,我们就可以做到 $ \boldsymbol{O(n)} $ 而不是 $ \boldsymbol{O(n\log n)} $ 。 那么由于同一高度的节点或许有很多,直接开一个 $ vector $ 。在这个地方我们用 $ vector $ 而不用二维数组建立二维关系的原因,主要是我们初始化麻烦得很,如果套用 $ memset $ 或者 $ fill $ 的话,常数之大可想而知。

那么这两个问题就顺理成章地解决了。但这个地方还有一个优化,就是虽然 $ vector $ 和 $ list $ 都是线性容器,但是 $ list $ 的本质是双向链表,频繁处理插入删除操作时会具有更优秀的表现。

也就是说,原来的 $ Gap $ 数组我们可以直接用 $ list $ 做,以图更小的常数。那么这时存在一个问题,就是虽然本质上删除是容易的,但是你怎么知道要删同一高度下的哪个元素(=@__@=)?就算你知道, $ list $ 也不知道啊2333

hhh不皮了,其实我们记录一下位置就好,即记录一下每个节点在 $ list $ 中的位置,单独开一个 $ Iterator $ 类型的 $ vector $ 记录即可。

好了,现在我们获得了 $ 10 $ 倍 $ + $ 的常数优势qwq,撒花花…

哦对,还有几点我debug的时候被坑死的点:

  • 1、那个 $\rm Iterator $ 类型的 $ vector $ 对象是点的编号不是高度!
  • 2、注意下标!下标!再说一遍,下标!因为STL自带左闭右开的性质wrnm,所以一定要注意,如果你是 $ [1,n] $ 选手,注意你的 assign 函数!
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
typedef list<int> List ; 
int step ;

struct Edge{
int to, f, next ;
Edge(int to,int f,int next):to(to),f(f),next(next){}//没有人发现正下方这句注释前半句和后半句都是三个音节的吗qaq
} ; vector <int> q, H, \mathrm{Extra}, Set[MAXN], cnt ; List Gap[MAXN] ;//list,就是快(
//q:队列,H:高度,\mathrm{Extra}:每个点的超额流,Set:…就是那个经典版HLPP里的堆,高度做第一维
int Ans, N, M, S, T, max_H, now_H ; vector <Edge> E[MAXN] ; /*vector存边(据说会快)*/vector<List::iterator> Era_pos ; //辅助定位+删除

inline void eggs() { ;}//for free~
inline int my_min(int a, int b){return a & ((a - b) >> 31) | b & ( ~ (a - b) >> 31) ;}//黑科技
inline void Add(int f, int v, int u){ E[u].push_back(Edge(v, f, E[v].size())), E[v].push_back(Edge(u, 0, E[u].size() - 1)) ; }
inline int qr(){ rr int k = 0 ; char c = gc() ; while (!isdigit(c)) c = gc() ;while (isdigit(c)) k = (k << 1) + (k << 3) + c - 48, c = gc() ; return k ; }

inline void Init_label(){//等价于一开始的那个BFS,只执行一次
rr int i, h = 0, t = 0 ;q.clear(), q.resize(N) ;
H.assign(N + 1, N + 1) ; H[T] = 0 ; q[t ++] = T ;//从T(高度小的)向前标号
while (h < t){//队列……BFS……真熟悉啊……嗝……
rr int now = q[h] ; ++ h ;
for (vector <Edge> :: Iter k = E[now].begin() ; k != E[now].end() ; ++ k)
if (H[k->to] == N + 1 && E[k->to][k->next].f) H[k->to] = H[now] + 1, ++ cnt[H[k->to]], q[t ++] = k->to ;
}
rep(i, 0, N + 1) Set[i].clear(), Gap[i].clear() ;//还是清空一下比较好吧
rep(i, 0, N)
if (H[i] <N + 1)
Era_pos[i] = Gap[H[i]].insert(Gap[H[i]].BG, i), //疑似insert函数的返回值是一个指针qaq
(Extra[i]>0) ? Set[H[i]].push_back(i) : eggs() ;//这个彩蛋(eggs)是因为,三目运算符":"两边类型需要形同…
max_H = now_H = H[q[-- t]] ; //更新,BFS的性质,最后一个元素一定高度最大(除了源点)
}
inline void Push(int x, Edge &e){//单独写出来的push函数,好像很方便?
rr int now_flow = min(Extra[x], e.f) ;
Extra[x] -= now_flow, e.f -= now_flow, Extra[e.to] += now_flow, E[e.to][e.next].f += now_flow ;
if (Extra[e.to] > 0 && Extra[e.to] <= now_flow) Set[H[e.to]].push_back(e.to) ; // push it into "heap"
}
inline void _Push(int x){
rr int i, x_h = N, t = H[x] ;
for (vector <Edge> :: Iter k = E[x].BG ; k != E[x].end() ; ++ k)
if (k->f > 0)//如果可以流
if (H[k->to] == H[x] - 1) { Push(x, *k) ; if (!Extra[x]) return ;} else x_h = min(x_h, H[k->to] + 1) ;
if (cnt[H[x]] <= 1){//如果出现断层了
for(i = t ; i <= max_H ; Gap[i].clear(), ++ i)//这个gap的for肯定比O(n)优秀
for(List::Iter k = Gap[i].BG ; k != Gap[i].end() ; ++ k) cnt[H[*k]] --, H[*k] = N ;
max_H = t - 1 ; /*断层以上的高度都没用了*/return ;
}
-- cnt[t], Era_pos[x] = Gap[t].erase(Era_pos[x]) ; H[x] = x_h ; if (x_h == N) return ; //重贴标签操作,为当前点删除原来的高度
++ cnt[x_h], Era_pos[x] = Gap[x_h].insert(Gap[x_h].begin(), x), max_H = max(now_H = x_h, max_H), Set[x_h].push_back(x) ;//增添新的高度
}
inline int HLPP(){
rr int i, now ; H.assign(N, 0) ; H[S] = N ; Era_pos.resize(N) ;
rep(i, 0, N - 1) if (i != S) Era_pos[i] = Gap[H[i]].insert(Gap[H[i]].BG, i) ;
cnt.assign(N, 0), cnt[0] = N - 1 ; Extra.assign(N, 0), Extra[S] = INF, Extra[T] =- INF ;
rep(i, 0, E[S].size() - 1) Push(S, E[S][i]) ; //下面源点要单独拿出来推送,因为源点推送时高度差不需要=1.
Init_label() ; //初始化(BFS)
while (now_H >= 0) //正式开始HLPP(泪目)
if (Set[now_H].empty()) now_H -- ; //高度递减,实现一个堆的效果
else now = Set[now_H].back(), Set[now_H].pop_back(), _Push(now) ;
return Extra[T] + INF ;
}
int main(){
N = qr(),; rr int i ;//下面的++N是为了日后好操作qaq
rep(i, 1, M) Add(qr(), qr(), qr()) ; ++ N, Ans = HLPP() ; cout << Ans << endl ; return 0 ;
}

撒fa~

后记

  • 1、这道题的经典版本好几个月之前我写了一天…然后今天又翻出来,发现了巨佬 KevinYu 抛了一个玉,我就打算优化一波…毒瘤啊,什么 $ vector $ 存边、 $ list $ 我都是第一次用…
  • 2、不得不说…某些大佬的码风真是不可看啊…都写题解了怎么还这么…这么…(虽然自己的也不咋地qaq)
  • 3、最后,人艰不拆,人艰不拆…