$\newcommand{\O}{\mathrm{O}}$
区間更新 $a_i \leftarrow val (val \ge 0 とする) (i \in [l, r))$, 区間剰余更新 $a_i \leftarrow a_i \% val (val \ge 1 とする) (i \in [l, r))$, 区間和 $\underset{l \le i < r}{\mathrm{sum}} a_i$ のクエリを効率的に処理できる.
詳しくは ここの part2 に書いている. 計算量は $\O (\log ^2 n)$ と書いてあるがポテンシャルを考えると $\O(\log n \log \mathrm{MAX \_ VAL})$ だと思う. ならしの解析は これ と同じように行う.
セグ木が保持するノード($2n$ 個ぐらいある) に対応する区間 $[l, r)$ について $D(l, r)$ を区間 $[l, r)$ に含まれる数のうち異なる数 $a[k]$ の $\mathrm{ceil} (\log (a[k] + 1))$ の和とする. ただしここで区間内に値が $1$ 種類のみの場合は $0$ と定めることにする. またすべてのノードの $D(l, r)$ の和をポテンシャル $C$ とする. ここで $C = \O(n \log n \log \mathrm{MAX \_ VAL})$ であることに注意する.
区間更新にかかる実際の計算量は $\O (\log n)$ であるが、 区間更新に伴う $C$ の値の増加分を考えると, 中途半端に区間更新される部分($D(l, r)$ の一部だけが更新されるような区間 $[l, r)$) は $\O (\log n)$ 個なのでポテンシャルは全体で高々 $\O (\log n \log \mathrm{MAX \_ VAL})$ だけ増加する.
次に剰余更新 ($\% val$) の場合は $max \_ val[k] \neq min \_ val[k]$ かつ $max \_ val[k] \ge val$ の場合に通常の遅延更新より深く探索することになるが、このような探索を $1$ 度行うとその区間内の $D(l, r)$ の値が少なくとも $1$ 減る. これは区間内には $2$ 種類以上の数があること, $max \_ val[k] \ge val$ が成り立つこと, ある数 $p$ をそれ以下の数 $q$ で剰余をとったときに $p/2$ 未満になること, から言える.
以上より区間更新, 区間剰余更新のならし計算量は各回の $C$ の増加分および減少分と $C = \O (n \log n \log \mathrm{MAX \_ VAL})$ という事実を考えると $\O( \log n \log \mathrm{MAX \_ VAL})$ であることが分かる.
剰余更新の場合、 RangeAddQuery は上記のならしが回らないため相性が悪い.
時間計算量: 構築 $\O (n)$, query(区間和) $\O( \log n)$, update, modulo_update ならし $\O (\log n \log \mathrm{MAX \_ VAL})$ ($\mathrm{MAX \_ VAL}$ はデータの値の最大値とする)
template<typename T> class segtree { private: int n,sz; vector<T> node, min_val, max_val, lazy; vector<bool> lazyFlag; void update(int id){ node[id] = node[2*id+1] + node[2*id+2]; min_val[id] = min(min_val[2*id+1],min_val[2*id+2]); max_val[id] = max(max_val[2*id+1],max_val[2*id+2]); } public: segtree(const vector<T>& v) : n(1), sz((int)v.size()){ while(n < sz) n *= 2; node.resize(2*n-1,0); lazy.resize(2*n-1,0); lazyFlag.resize(2*n-1,false); min_val.resize(2*n-1,numeric_limits<T>::max()); max_val.resize(2*n-1,numeric_limits<T>::min()); for(int i = 0; i < sz; i++){ node[i+n-1] = min_val[i+n-1] = max_val[i+n-1] = v[i]; } for(int i=n-2; i>=0; i--){ update(i); } } void eval(int k, int l, int r) { if(lazyFlag[k]){ node[k] = (r - l) * lazy[k]; min_val[k] = max_val[k] = lazy[k]; if(r - l > 1){ lazy[k*2+1] = lazy[k*2+2] = lazy[k]; lazyFlag[k*2+1] = lazyFlag[k*2+2] = true; } lazyFlag[k] = false; } } void update(int a, int b, T x, int k=0, int l=0, int r=-1){ if(r < 0) r = n; eval(k, l, r); if(b <= l || r <= a){ return; } if(a <= l && r <= b){ lazy[k] = x; lazyFlag[k] = true; eval(k, l, r); }else{ update(a, b, x, 2*k+1, l, (l+r)/2); update(a, b, x, 2*k+2, (l+r)/2, r); update(k); } } void modulo_update(int a, int b, T x, int k=0, int l=0, int r=-1){ if(r < 0) r = n; eval(k, l, r); if(b <= l || r <= a || max_val[k] < x){ return; } if(a <= l && r <= b && max_val[k] == min_val[k]) { lazy[k] = max_val[k] % x; lazyFlag[k] = true; eval(k, l, r); }else{ modulo_update(a, b, x, 2*k+1, l, (l+r)/2); modulo_update(a, b, x, 2*k+2, (l+r)/2, r); update(k); } } T query(int a, int b, int k=0, int l=0, int r=-1) { if(r < 0) r = n; eval(k, l, r); if(b <= l || r <= a){ return 0; } if(a <= l && r <= b){ return node[k]; } T vl = query(a, b, 2*k+1, l, (l+r)/2); T vr = query(a, b, 2*k+2, (l+r)/2, r); return vl + vr; } void print() { for(int i = 0; i < sz; i++){ cout << query(i,i+1) << " "; } cout << endl; } };
区間 mod, 一点更新, 区間和の verify
Codeforces : The Child and Sequence
提出コード