Хеш-функция

→ Обратите внимание

До соревнования
Educational Codeforces Round 167 (Rated for Div. 2)
23:25:07
Зарегистрироваться »

→ Трансляции

Codeforces Educational Round 167 Solution Discussion (with Shayan)

Shayan

До начала 25:30:06

Всё →

→ Лидеры (рейтинг)

№	Пользователь	Рейтинг
1	tourist	3845
2	jiangly	3707
3	Benq	3630
4	orzdevinwang	3573
5	Geothermal	3569
5	cnnfls_csy	3569
7	jqdai0815	3532
8	ecnerwala	3501
9	gyh20	3447
10	Rebelz	3409

Страны | Города | Организации

Всё →

→ Лидеры (вклад)

№	Пользователь	Вклад
1	maomao90	171
2	adamant	163
3	awoo	161
4	nor	152
5	maroonrk	151
5	-is-this-fft-	151
7	TheScrasse	148
8	atcoder_official	146
9	Petr	145
10	pajenegod	144

Всё →

→ Найти пользователя

→ Прямой эфир

Детальнее →

Блог пользователя Renyxa

Хеш-функция

Автор Renyxa, история, 8 лет назад, По-русски

Здравствуйте. Дорешиваю задачи с полуфинала республиканской олимпиады, но одну задачу никак не могу решить. Подскажите пожалуйста, как решить эту задачу.

-1

Renyxa
8 лет назад
8

Комментарии (8)

Написать комментарий?

kvk1920

8 лет назад, # |

← Rev. 2 →

for (x = 'a'; x <= 'z'; ++x) f[1][((0 * 3) ^ x) % D]++;

for (i = 1; i < n; ++i) for (j = 0; j < D; ++j) for (x = 'a'; x <= 'z'; ++x) f[i + 1][((j * 33) ^ x) % D] += f[i][j];

f[i][j] — количество слов длиной i и значением функции j. Будем приписывать к нему букву x. тогда из каждого такого слова f[i][j] получим слово длины i + 1 и со значением функции ((j * 33) ^ x) % D.

ответом будет f[n][k], да.

→ Ответить

Stratonov

8 лет назад, # ^ |

← Rev. 2 →

все отлично, но не так просто

сложность твоего решения n*D*26 = (10)*(2^25)*(26) а это довольно много

→ Ответить

i.trofimow

8 лет назад, # ^ |

да и в память не влезает, даже если только последний слой хранить.

→ Ответить

Slamur

8 лет назад, # |

← Rev. 2 →

Мне кажется, что можно решить следующим образом.

Если M <= 20, то можно посчитать предложенную выше динамику: f[length][hash] — кажется решение за O(N * K * 2^M) (K — размер алфавита) успеет при данном дополнительном ограничении.

В ином случае проделаем следующие шаги (я не уверен, что они корректны при M <= 20):

Заметим, что 33 = 32 + 1 = 2^5 + 2^0 = (1 << 5) + 1. То есть 33 * x = (x << 5) + x.

Также обратим внимание, что все коды символов занимают не более 5 битов, откуда:

33 * hash(word) XOR ord(letter) = ((hash(word) << 5) + hash(word)) XOR ord(letter) = (hash(word) << 5) + (hash(word) XOR ord(letter)),

то есть XOR влияет только на последние 5 битов хеша.

Так как 33 и 2^M взаимно просты, то мы умеем обращать вычисление хеша (правда только по модулю):

hash(word) = (hash(word + letter) XOR ord(letter))* 33^{-1},

где 33^{-1} — обратный элемент к 33 по модулю 2^M.

Сначала посчитаем, сколько слов из (N — 5) букв имеют тот или иной хеш, это опять же можно сделать просто перебором всех слов за 26^(N — 5). Так как N <= 10, то 26^(N — 5) — не более, чем порядка 10^7 состояний.

После этого переберем последние 5 букв слова, для каждого набора посчитаем хеш префикса, если хеш всего слова был тем, что нам дали во входных данных — состояний будет 26^5, а это, как указывалось выше, порядка 10^7. Для каждого полученного хеша ответ увеличится на количество префиксов длины (N — 5), имеющих такой хеш — а это мы посчитали заранее.

→ Ответить

Stratonov

8 лет назад, # ^ |

то есть XOR влияет только на последние 5 битов хеша.

мне кажется что это не так Число может выйти за модуль после XOR и тогда там будет непонятно что, правильнее вроде бы сказать XOR влияет на последние 5 бит 33 * hash(word) а не всего хеша

→ Ответить

i.trofimow

8 лет назад, # ^ |

Там модуль 2^M, а когда ты берешь по такому модулю остаются только M младших бит. разве нет?

→ Ответить

ptyrs

8 лет назад, # ^ |

Да, эта задача была когда-то давно в Coci (2014 год, март, 6 задача). Моё решение http://ideone.com/eJ3mWJ использует в целом эту же идею.

→ Ответить

Slamur

8 лет назад, # ^ |

Интересно, что на COCI у этой задачи единственной из всего контеста было ограничение по памяти в 256 MB, а по предложенной выше ссылке ограничение стоит в 32 MB.

В связи с этим мне видится следующее уменьшение используемой памяти: для M = 25 все слова длины 5 имеют свой уникальный хеш (что очевидно, ведь 2^5 > 26), поэтому для этого случая можно при генерации хешей из первых 5 символов хранить не количество слов с таким хешем, а просто "было ли слово с таким хешем". Это можно сделать с помощью битсета, чем мы резко сократим память: с 2^25 байт (если считать, что мы хранили количество в однобайтном типе) до 2^25 / 32 или 2^25 / 64 байт в зависимости от реализации битсета.

Для 21 <= M <= 24 можно сделать аналогично: мы будем хранить 26 — M битсетов, в битсете b[i] для хеша H хранить бит b[i][H] == 1 только тогда, когда i-ый бит количества слов с хешом H будет равен 1. Таким образом, мы сможем вычислять количество слов с заданным хешом за 26 — M <= 5, а памяти будет тратиться не более, чем 2^M / 32 * (26 — M) — опять же не превысит 2^25 / 32.

Для M <= 20 можно будет также посчитать динамику просто, не парясь о памяти или времени.

→ Ответить

Соревнования по программированию 2.0

Время на сервере: 26.06.2024 18:09:54 (k1).

Десктопная версия, переключиться на мобильную.

При поддержке