[KIT Community Posts] Merge sort tree и техника частичного каскадирования

#	User	Rating
1	tourist	3803
2	jiangly	3707
3	Benq	3627
4	ecnerwala	3584
5	orzdevinwang	3573
6	Geothermal	3569
6	cnnfls_csy	3569
8	Radewoosh	3542
9	jqdai0815	3532
10	gyh20	3447

#	User	Contrib.
1	maomao90	164
2	awoo	163
3	adamant	162
4	maroonrk	152
5	-is-this-fft-	151
6	nor	150
7	atcoder_official	147
8	TheScrasse	146
9	Petr	145
10	SecondThread	142

Автор: [user:Friendiks,2023-11-21]↵
↵
Больше про алгоритмы в ТГ канале: https://t.me/KogutIvanTutoring ↵
## Пререквизиты↵
Дерево отрезков, merge sort(сортировка слиянием)↵
## Вступление↵
Для начала решим такую задачу:↵
↵
Дан массив размера $n$, а также $q$ запросов вида: количество различных элементов на отрезке от $l$ до $r$ (${l, r} \le n$).↵
Для данной задачи существует решение через персистентное дерево отрезков, но его рассматривать мы не будем. Рассмотрим другое решение. Для начала для каждого элемента найдем индекс ближайшего равного ему справа, а если такого нет, поставим большое число(в нашем случае $10^9+7$, но главное, чтобы оно было больше $n$) и построим новый массив, который хранит вместо элемента данный найденный индекс(или большое число). Тогда можно заметить, что количество различных чисел на отрезке $[l, r]$ — это количество чисел на отрезке в новом массиве, больших $r$. Упражнение для читателя — понять почему это так ;)↵
↵
Теперь надо научиться искать количество больших на отрезке. Воспользуемся структурой данных **Merge Sort Tree**.↵
↵
## Merge sort tree ↵
Идея  merge sort tree заключается в том, чтобы построить дерево отрезков и в каждой вершине хранить отсортированный отрезок покрытый вершиной. Несложно заметить, что для каждой вершины массивы в ее детях отсортированы и поэтому можно применить слияние как в merge sort и за $O(st[l].size()+st[r].size())$ получить то, что нам надо. Пример кода для пересчета приведен ниже.↵
↵
~~~~~↵
st.resize(st[l].size()+st[r].size()) // размер должен быть равен итоговому размеру, иначе функция merge выдаст ошибку↵
merge(st[l].begin(), st[l].end, st[r].begin(), st[r].end, st[v].begin())↵
// v - текущая вершина, l - левый сын, r - правый сын.↵
// st - вектор, хранящий дерево отрезков↵
~~~~~↵
↵
На первый взгляд, кажется, что асимптотика построения и занимаемая память это $O({n^2 \log n}$), но на самом деле достаточно понять, что каждый элемент массива будет находиться в $O(\log n)$ отрезках. На каждой высоте мы учтем элемент ровно 1 раз, а так как высота дерева отрезков $O(\log n)$, то и каждый элемент будет учтен в $O(\log n)$ отрезках. Из этого можно сделать вывод, что на самом деле асимптотика построения merge sort tree и занимаемая им память $O({n \log n})$.↵
↵
## Решение задачи с помощью merge sort tree за $O({n \log n} + {q \log^2 n})$↵
↵
Решим задачу используя эту структуру. Теперь мы можем дойти до каждой вершины, такой, что она покрывает отрезок, который полностью лежит в отрезке запроса, а потом бинарным поиском найти количество больших $r$. Как известно, любой отрезок разбивается на $O({\log n})$ отрезков дерева отрезков, а также бинарный поиск работает за $O({\log n})$, а значит мы умеем отвечать на запрос за  $O({\log^2 n})$.↵
↵
Эта асимптотика уже очень хорошая, но можно сделать лучше, и в этом поможет **Техника Частичного Каскадирования**.↵
## Решение задачи с помощью merge sort tree и техники частичного каскадирования за $O({n \log n} + {q \log n})$↵
↵
Основная идея техники частичного каскадирования заключается в том, чтобы заранее предпосчитать для каждого числа в массиве вершины первое большее либо равное число в левом сыне и первое большее либо равное число в правом сыне. Сделать это можно линейным проходом по массиву вершины и поддержанием двух указателей на нужный элемент в левом и правом сыне. Пример кода, который это делает приведен ниже.↵
↵
~~~~~↵
st[v].resize(st[l].size()+st[r].size());↵
cascad[v].resize(st[l].size()+st[r].size());↵
merge(st[l].begin(), st[l].end(), st[r].begin(), st[r].end(), st[v].begin());↵
int i = 0, j = 0;↵
for(int k = 0; k < st[v].size(); ++k){↵
    while(i < (int)st[l].size() && st[l][i] < st[v][k]) i++;↵
    while(j < (int)st[r].size() && st[r][j] < st[v][k]) j++;↵
    cascad[v][k] = make_pair(i,j);↵
}↵
~~~~~↵
↵
Теперь можно заметить, что для ответа на запрос нужно в корне найти бинарным поиском первый больший либо равный $r$ (если пишите дерево отрезков на полуинтервалах, а иначе надо искать строго больший). Обозначим найденный элемент за $x$. Если отрезок лежит не полностью, то при переходе в левого(или правого) ребенка можно передавать $x$ для ребенка, он будет равен `cascad[v][x].first`(или `second`). Иначе, если отрезок полностью лежит в запросе, ответом будет $st[v].size() - x$ (если считать, что индексы нумеруются с нуля). Можно заметить, что если все элементы меньше, то написанный выше `while` вернет размер массива и все сработает корректно. Не сложно заметить, что суммарно ответ на запрос теперь работает за $O({\log n})$, а значит мы решили задачу за $O({n \log n} + {q \log n})$.↵
↵
## Задачи↵
↵
- https://codeforces.com/group/on4GqeQ4Du/contest/328897/problem/I↵
↵
- https://codeforces.com/group/on4GqeQ4Du/contest/328897/problem/H↵
↵
- [problem:1899G]↵
↵
- https://informatics.msk.ru/mod/statements/view3.php?chapterid=113732#1↵
↵
## Дополнительно↵
↵
* Merge sort tree также может использоваться для поиска k-ой порядковой статистики за $O({\log^3 n})$ без каскадирования за запрос и за $O({\log^2 n})$ с каскадированием. ~~Также е~~↵
* Если вместо массивов использовать декартовы деревья, то можно будет изменять элементы за $O({\log^2 n})$, но придется отказаться от каскадирования.

Rev.	By	When	Δ	Comment
ru4	Friendiks	2023-11-23 09:40:27	400	Мелкая правка: 'ованием.\nСпасибо ' -> 'ованием.\n\nСпасибо '
ru3	Kogut_Ivan	2023-11-22 10:29:24	12	(опубликовано)
ru2	Friendiks	2023-11-22 10:25:13	156	Мелкая правка: 'log^2 n})$' -> 'log^2 n})$, но придется отказаться от каскадирования.' (сохранено в черновиках)
ru1	Kogut_Ivan	2023-11-21 19:33:00	5098	Первая редакция (опубликовано)

History