Еще одна строковая задача

13 лет назад, # |

-8

Для каждого сдвига перебираем длину суфикса, который совпадает с префиксом, бинарным поиском. Суфикс и префикс сравниваем за константу полиномиальными хешами.

Если не проходит по времени, увеличиваем таймлимит :о)

→ Ответить

daftcoder

13 лет назад, # ^ |

+10

Бинарным поиском длину суффикса? o_O А оно... монотонное?

→ Ответить

Gerald

13 лет назад, # ^ |

+3

Опередил меня =)

→ Ответить

AlexSkidanov

13 лет назад, # ^ |

0

Че-то я снубил :о)

→ Ответить

Gerald

13 лет назад, # ^ |

+8

Дело в том, что эта функция не монотонная. Бинпоиск делать нельзя.

Например для строки "abaсaba", "aba" совпадает, а "ab" нет.

→ Ответить

Skiminok

13 лет назад, # |

← Rev. 5 →

+3

UPD: это неверно. См. далее верное решение.

→ Ответить

Zlobober

13 лет назад, # ^ |

0

Для каждого суффикса t длины большей n (он отвечает какому-то циклическому сдвигу s) определим, какая вершина дерева соответствует суффиксу t^R (то бишь префиксу t) такому, что их пересечение образует в точности циклический сдвиг - т.е. искомый префикс t кончается в позиции, отстоящей на n вперёд от начала рассматриваемого суффикса t. Вроде бы это можно сделать за O(N).

Я что-то не понимаю, как это за O(N) сделать.

→ Ответить

Skiminok

13 лет назад, # ^ |

0

Ну как же. Если у нас есть суффикс t[i..], то мы знаем, в каком символе должен начинаться парный ему — это t^R[(n - i)..], ибо циклический сдвиг — это t[i..(i + n - 1)]. В процессе построения дерева t^R, как только мы достроили ветку для этого парного суффикса n - i, надо просто в каком-то заведенном массивчике для i-го суффикса t прописать ссылку на эту вершину дерева.

→ Ответить

cmd	13 лет назад, # ^ \| ← Rev. 3 → +8 А в t^R же суффикс будет отвечать не префиксу исходной строки, а перевернутому префиксу. Т.е. к примеру строка abab - не будет хорошей, т.к. ab != ba, а она хорошая. Или я не правильно понял идею? → Ответить

Skiminok

13 лет назад, # ^ |

+10

Да, вы правы.

Я сейчас повнимательней полистал Гасфилда, и родилась такая идея: строим дерево для строки t = s + s + s.

Теперь такое наблюдение: если есть какая-то подстрока α, повторяющаяся два раза подряд в средней части t, т.е. t = wααu, n ≤ |wα| < 2n, то циклический сдвиг, равный суффиксу wα длины n, является хорошим. Гасфилд называет такие места тандемными повторами.

Все тандемные повторы можно найти за время $\text{[math]}$ , где k — количество этих повторов. Так как k = O(n), то итоговое время $\text{[math]}$ . Описан алгоритм здесь, выглядит вроде не очень сложно.

→ Ответить

Gerald

13 лет назад, # ^ |

0

Ставлю плюс =))

Отличное решение =)

→ Ответить

it4.kp

13 лет назад, # ^ |

+5

Если кто хочет попрактиковаться в подсчете тандемных повторов, то можно попробовать эту задачу: http://www.spoj.pl/problems/KPARCH/.
Там, кстати, можно обойтись без суффиксных массивов, только "разделяй и влавствуй" + z-функция.

→ Ответить

Gerald

13 лет назад, # ^ |

0

А можете поведать как их считать таким методом? Может есть литература?

→ Ответить

it4.kp

13 лет назад, # ^ |

+5

Есть литература :)
Алгоритм описан в книге Jewels of Stringology на странице 119.

→ Ответить

winger

13 лет назад, # ^ |

+10

Почему тандемных повторов O(n)? Если я правильно все понял, для s=a^n их будет порядка n^2

→ Ответить

Gerald

13 лет назад, # ^ |

0

Ну можно искать не все, а только примитивные тандемные повторы, их N*logN.

→ Ответить

winger

13 лет назад, # ^ |

0

Ага, так верю.

→ Ответить

Connector

13 лет назад, # |

← Rev. 3 →

0

Думается всетаки можно таким методом решить.

Научимся решать: http://olympiads.ru/zaoch/2009/problems/k.shtml .

Я в свое время решал с помощью KMP. Собственно, текст в котором ищем text = s + s, искомый образец patern = s. n = strlen(s). Как обычно построим префикс функцию и начнем искать образец в тексте. Начиная с символа n-1 (индексация с 0) при поиске образца в тексте обращаем внимание на следующий факт.

Если после некоторой итерации указатель на символ в образце равен n, то в случае с задачей поиска строки в подстроке можно говорить о том, что найдено вхождение образца в текст. В нашей же задаче значение указателя -- это и будет наибольший префикс, который является суффиксом. Если p = n, то возьмем значение префикс функции от s.

→ Ответить

Gerald

13 лет назад, # ^ |

0

Понимаете так делать нельзя. Так вы найдете наибольший суффикс который равен префиксу нулевого циклического сдвига строки. То есть у вас суффикс меняется всё время, а префикс нет.

P.S. Задача уже решена, сверху Skiminok написал отличное решение с помощью нахождение тандемных повторов.

→ Ответить

PavelKunyavskiy

13 лет назад, # |

0

Эта задача решается суфф. массивом. + rmq + dsu. придумал еще на контесте, но не успел написать.

Посмотрим на циклический сдвиг i. Когда он хороший? когда $\text{[math]}$ . Отлично. Построим суффмассив по циклическим сдвигам строки s. Посчитаем lcp.

Проверим условие для всех j, расположенных в суфмассиве раньше чем i. Симметрично сделаем для остальных.

Будем идти по массиву с начала в конец. На i-ом шаге ответим для i-го лексикографически цикл. сдвига. Очевидно что проверка - запрос к дереву отрезков для написанной выше функции. Осталось эту функцию пересчитать. Утверждается что в любой момент все строки можно разбить на множества с одинаковым lcp, причем эти множества - отрезки в суффмассиве. Честно объедением отрезки которые теперь имеют одинаковое lcp. Не сложно что это несколько отрезков ближних к текущей позиции. Причем таких объединений всего O(N). Кадое делается деревом отрезков за log. Чтобы просто понимать на каких отрезках делать объединение поможет dsu. Думаю можно и без него. Итого суммарно O(NlogN).

Думаю что написал довольно криво, вопросы приветствуются.

→ Ответить

Gerald

13 лет назад, # ^ |

0

Вообще неравенство какое-то странное, оно по модулю что ли? или ты строку саму к себе приписываешь?

→ Ответить

PavelKunyavskiy

13 лет назад, # ^ |

← Rev. 2 →

0

Неравенство нормальное. По модулю там ничего нет. lcp считается в зацикленной строке.

→ Ответить

№	Пользователь	Рейтинг
1	tourist	3690
2	jiangly	3647
3	Benq	3581
4	orzdevinwang	3570
5	Geothermal	3569
5	cnnfls_csy	3569
7	Radewoosh	3509
8	ecnerwala	3486
9	jqdai0815	3474
10	gyh20	3447

№	Пользователь	Вклад
1	maomao90	174
2	awoo	164
3	adamant	163
4	TheScrasse	159
5	nor	157
6	maroonrk	156
7	-is-this-fft-	152
8	Petr	146
8	orz	146
10	BledDest	145

Блог пользователя Gerald