Сортировка строк.

→ Обратите внимание

До соревнования
Codeforces Round 943 (Div. 3)
20:53:41
Зарегистрироваться »

→ Трансляции

CodeChef Starters 132 Solution Discussion

aryanc403

Трансляция идет

Codeforces Round 943 Solution Discussion

aryanc403

До начала 23:18:39

Всё →

→ Лидеры (рейтинг)

№	Пользователь	Рейтинг
1	tourist	3690
2	jiangly	3647
3	Benq	3581
4	orzdevinwang	3570
5	Geothermal	3569
5	cnnfls_csy	3569
7	Radewoosh	3509
8	ecnerwala	3486
9	jqdai0815	3474
10	gyh20	3447

Страны | Города | Организации

Всё →

→ Лидеры (вклад)

№	Пользователь	Вклад
1	maomao90	174
2	awoo	165
3	adamant	163
4	TheScrasse	160
5	nor	158
6	maroonrk	156
7	-is-this-fft-	152
8	SecondThread	147
9	orz	146
10	pajenegod	145

Всё →

→ Найти пользователя

→ Прямой эфир

Детальнее →

Блог пользователя maximumSHOT

Сортировка строк.

Автор maximumSHOT, история, 8 лет назад, По-русски

Привет всем! Хотел узнать за сколько (асимптотика) работает сортировка строк следующим образом?

int n;
vector< string > a(n);
sort(a.begin(), a.end());

Будем считать, что все строки имеют длину от 1 до 1e5 и сумма длин всех строк не превышает 2e5. 1 <= sumLen <= 2e5

Количество строк от 1 до 1е5. 1 <= n <= 1e5

P.S. Известно, что существует сортировка строк за время O(sumLen) и O(sumLen * k) памяти или

за время O(sumLen * log(K)) и O(sumLen) памяти с помощью бора, но хотелось бы

разобраться с более короткой версией (с точки зрения написания кода). Заранее Спасибо!

maximumSHOT
8 лет назад
12

Комментарии (12)

Написать комментарий?

markysha

8 лет назад, # |

← Rev. 2 →

-58

не подумав сказанная дичь...

→ Ответить

maximumSHOT

8 лет назад, # ^ |

Такая сортировка даст нам строку, образованную конкатенацией наших строк в одну, причем такая строка будет лексикографически минимальной, а нам нужно отношение наших строк между собой.

Контрпример: b и ba : bba > bab, но b < ba

→ Ответить

markysha

8 лет назад, # ^ |

Пожалуй ты прав)

→ Ответить

fdoer

8 лет назад, # |

+30

O(sumLen * log(n)), и вот почему.

Предположим сначала, что все строки имеют одинаковую длину L, тогда sumLen = n * L. std::sort делает O(n * log(n)) сравнений, каждое сравнение делается за O(L). Получается сортировка за O(nL log(n)) = O(sumLen log(n)).

Если же длины строк разные, то получится даже меньше операций, так как при сравнении длинной строки с короткой на последние символы длинной мы никогда не посмотрим.

→ Ответить

fdoer

8 лет назад, # ^ |

Что касается памяти, говорят, что стандартом это не ограничивается. На практике используемый алгоритм сортировки и, соответственно, потребление памяти зависят от входных данных, но здравый смысл подсказывает, что вряд ли реализации понадобится использовать больше памяти, чем на поддержание перестановки O(n) итераторов или на стек рекурсии глубиной O(n).

→ Ответить

adamant

8 лет назад, # ^ |

+20

Допустим, у нас n - 2 строки длины 1 и две строки длины k. Сходу неочевидно, что мы не получим слишком много сравнений больших строк друг с другом. И, кажется, чтобы доказать, что это $\text{[math]}$ , нужно опираться на то, что сортировка в C++ применяется именно introsort.

→ Ответить

Burunduk1

8 лет назад, # ^ |

Я тоже раньше этот факт только для Quick-Sort и модификаций доказывал... Забавно, вроде для MergeSort и HeapSort тоже верно. Интересно, есть хотя бы одна реальная nlogn сортировка, которая слишком долго сортит строки? =)

→ Ответить

adamant

8 лет назад, # ^ |

А что такое "реальная"? :)

→ Ответить

savinov

8 лет назад, # ^ |

По крайней мере не та, в которой стоит if на то, что если сортируемые элементы строки — то сортировать пузырьком :D

→ Ответить

adamant

8 лет назад, # ^ |

А если сортировка просто в конце делает O(n) сравнений последних двух элементов, чтобы убедиться, что они отсортированы, она реальная или уже нет? :)

В отличие от пузырька всё же она делает $\text{[math]}$ сравнений всегда

→ Ответить

Burunduk1

8 лет назад, # ^ |

Мы можем в любую nlogn сортировку вставить n сравнений первых двух элементов, от этого она останется nlogn и станет TL-иться на твоём примере. Но это искусственно созданная сортировка. Реальная -- в смысле, не искусственно испорченная, и за nlogn.

→ Ответить

GoToCoding

8 лет назад, # |

← Rev. 2 →

-23

Можно сортирвку за O(N * logN * logM). N — кол-во строк, M — длина макс. строки. Считаем хэш всех строк, и когда сравниваем 2 строки, используем бинпоиск. То есть общий префикс будет иметь равный хэш, а вот следующий символ будет отличаться.

→ Ответить

Соревнования по программированию 2.0

Время на сервере: 01.05.2024 20:41:21 (l3).

Десктопная версия, переключиться на мобильную.

При поддержке