$\newcommand{\O}{\mathrm{O}}$

区間加算 $a_i \leftarrow a_i + val (i \in [l, r))$, 区間和 $\underset{l \le i < r}{\mathrm{sum}} a_i$ のクエリを効率的に処理できる.
区間加算のクエリを要素一つ一つに愚直にやっていると遅くなるが区間がセグ木のノードに対応する区間を含んだ場合そのノードにそれより下に伝播されるべき加算の記録を持っておく. そしてその後実際に区間和のクエリで探索された時に初めてその下に伝播させるようにしてやると $\O (\log n)$ で効率よくクエリを処理できる.
このような処理は遅延評価と呼ばれ, Haskell などの言語で取り入れられているらしい.
以下の実装では高速化のため range, query 関数を非再帰での実装にしている(非再帰で書かないほうが意味的には理解しやすいが...).
時間計算量: 構築 $\O (n)$, 各クエリ $\O (\log n)$
template<typename T> class segtree {
private:
int n,sz,h;
vector<T> node, lazy;
void eval(int k) {
if(lazy[k]){
node[k] += lazy[k];
if(k < n) {
lazy[k*2] += lazy[k] / 2, lazy[k*2+1] += lazy[k] / 2;
}
lazy[k] = 0;
}
}
public:
segtree(const vector<T>& v) : sz((int)v.size()), h(0) {
n = 1;
while(n < sz) n *= 2, h++;
node.resize(2*n, 0), lazy.resize(2*n, 0);
for(int i = 0; i < sz; i++) node[i+n] = v[i];
for(int i = n-1; i >= 1; i--) node[i] = node[2*i] + node[2*i+1];
}
void range(int a, int b, T x) {
a += n, b += n - 1;
for(int i = h; i > 0; i--) eval(a >> i), eval(b >> i);
int ta = a, tb = b++, length = 1;
while(a < b){
if(a & 1) lazy[a++] += length * x;
if(b & 1) lazy[--b] += length * x;
a >>= 1, b >>= 1, length <<= 1;
}
while(ta >>= 1, tb >>= 1, ta){
if(!lazy[ta]){
eval(2*ta), eval(2*ta+1), node[ta] = node[2*ta] + node[2*ta+1];
}
if(!lazy[tb]){
eval(2*tb), eval(2*tb+1), node[tb] = node[2*tb] + node[2*tb+1];
}
}
}
T query(int a, int b) {
a += n, b += n - 1;
for(int i = h; i > 0; i--) eval(a >> i), eval(b >> i);
b++;
T res1 = 0, res2 = 0;
while(a < b) {
if(a & 1) eval(a), res1 += node[a++];
if(b & 1) eval(--b), res2 += node[b];
a >>= 1, b >>= 1;
}
return res1 + res2;
}
void print(){for(int i = 0; i < sz; i++) cout<<query(i,i+1)<< " ";cout<<endl;}
};
AOJ : RSQ and RAQ 提出コード