Как я пихал неправильные решения или о тестах на всеросе

№	Пользователь	Рейтинг
1	ecnerwala	3649
2	Benq	3581
3	orzdevinwang	3570
4	Geothermal	3569
4	cnnfls_csy	3569
6	tourist	3565
7	maroonrk	3531
8	Radewoosh	3521
9	Um_nik	3482
10	jiangly	3468

№	Пользователь	Вклад
1	maomao90	174
2	awoo	164
3	adamant	162
4	TheScrasse	159
5	nor	158
6	maroonrk	156
7	-is-this-fft-	151
8	SecondThread	147
9	orz	146
10	pajenegod	145

Привет сообществу Codeforces! В этом посте я поделюсь с вами историей того, как я писал всеросс 2017. Вы погрузитесь в мир необычайно жутких багов и необычайно слабых тестов:) Рекомендую для лучшего понимания прочитать условия 5 и 8 задач всеросса (Накопитель и Траектория обучения) http://neerc.ifmo.ru/school/archive/2016-2017/ru-olymp-roi-2017-day2.pdf

Рассказ начну с того, что второй тур всеросса начался для меня не слишком удачно. Где-то около часа я безуспешно пытался решить первую задачу и запихал решение, которое заходит на 20 баллов и получает WA на след. группу, что свидетельствует о плохих тестах в первой группе (проблем с памятью у меня явно быть не могло). Я подумал, что первая подгруппа первой задачи мало волнует составителей, и решил не обращать на это внимание.

Потом вроде контест пошел получше, и за 1.5 часа до конца у меня уже было 200 баллов по первым двум задачам (как оказалось можно получить 100 баллов за первую и решить ее за квадрат при ограничениях до 10^6, но мы дойдем до этого:) ). В последний час я придумал, как решать 4-ую на 50, но вследствие казавшихся мне тогда сверхъестественными причин, я получал WA на 4-ой подгруппе, не проходя только 1 тест из подгруппы и проходя полностью 1, 2, 3 и 5 (т.е получая 30 баллов за первые 3; нельзя получить баллы за 5-ую подгруппу, не пройдя 4-ую). Это казалось мне очень странным, но я ничего не мог с этим поделать, и к концу тура у меня так и осталось 30 баллов по этой задаче. Покопавшись в коде дома и посмотрев тест, я обнаружил совершенно нелепый баг: в компараторе set-а я кидал в set отрезки и сравнивал их лишь по сумме на отрезке, не написав в компараторе, что нужно делать, если суммы окажутся равны; таким образом при удалении одного отрезка у меня по-видимому удалялись все отрезки с данной суммой на отрезке. (Код: https://pastebin.com/P6b425j8)

Однако это каким-то образом работало и не проходило лишь 1 (!) тест из 4-ой подгруппы. Я списал это на то, что составители тестов даже и не думали о том, что так можно набагать и тест, который не прошло моя программа, по-видимому, генерился рандомно, и мне не повезло (а может и повезло, иначе я бы не пополнил свой опыт ошибок) в том, что в этом рандомном тесте мой баг проявился. Я подумал, что на этом мои косяки в решенных задачах (и косяки авторов тестов) закончились.

Каково же было мое удивление, когда рассказывая свое решение первой задачи (Накопитель) второго дня другу, я обнаружил то, что причины, по которым я считал, что мое решение этой задачи работает за линию, на самом деле неверны, более того, я начал подозревать, что существует тест, на котором мое решение работает за квадрат. Мое решение было удивительно банальным в плане идеи (расскажу для случая когда строка t, которую нам нужно получить состоит из всех плюсов): перебираем отрезок из плюсов, и пытаемся расшириться от него влево или вправо, пока можем, с помощью цикла while (код: https://pastebin.com/nAw6uiBc). Немного поразмышляв, я и в самом деле придумал контртест, на котором моя программа работает 15 секунд уже на строке длиной 10^5 (оригинальные ограничения строки до 10^6). Тест этот устроен довольно просто: сначала делаем строку s такой: ++-++-++-++-.... и в конце приписываем отрезок из минусов с длиной, равной длиной нашей строки. Пример такой строки: ++-++-++----------

Довольно понятно, почему мое решение будет работать на таком тесте за квадрат: программа будет стараться расшириться от каждого отрезка из плюсов и будет делать это довольно успешно на первой половине строки, но превратить всю строку в плюсы никогда не сможет, при этом при каждом расширении будет затрачено порядка O (n) операций и расширений тоже будет O(n), т.е итоговая асимптотика = O(n^2). Эта оценка и подтвердилась на практике, я сгенерил этот тест на 10^6 и не смог дождаться, пока моя программа отработает; лишь уменьшив длину до 10^5 я увидел, что время выполнения на таком тесте — порядка 15 секунд. Очень странно, что подобный тест не был включен в комплект тестов, так как мое решение довольно банально и, по идее, члены жюри должны были придумать против него контртест.

Этим постом я не старался как-то принизить работу жюри олимпиады, я понимаю, что редко существуют тесты, которые заваливают все неверные решения разом. Да и мне грех жаловаться, ведь баллы в результате у меня только увеличились. Но хочется думать, что получив Accepted, ты и в самом деле решил задачу, а не просто послал решение, которое работает на всех тестах, которые придумали составители:)

Комментарии (10)

Написать комментарий?

samatbor

7 лет назад, # |

Автокомментарий: текст был обновлен пользователем samatbor (предыдущая версия, новая версия, сравнить).

→ Ответить

SerezhaE

+19

Еще вдогонку. У меня в первой задаче первого дня на туре зашло решение за квадрат времени (n ≤ 50000). Потом мне объяснили, почему теоретически такое может зайти в интерактивную задачу, но тогда непонятно, почему нельзя было поставить большие ограничения или вообще не делать такую группу. Также некоторые участники рассказывали, что по последней задаче первого дня на 73 балла заходило решение, изначально рассчитанное на 54.

7 лет назад, # ^ |

Про 4 первого дня я тоже знаю. У меня на 54 Флойд зашел, причем я два раза его запускал:)

halin.george

А ты не думал о том, что нет смысла валить жадность тремя тестами в группе, если группа не заходит без хотя бы одного теста? Тут смысл даже не в жадности, а в том что при групповой оценке в каждую группу можно лишь по тесту добавить против каждого неправильного решения, а больше и не нужно.

Ты про какую задачу? Если ты про Накопитель , то у них просто нигде теста не было:) Если про 8-ую, то у них не было такого теста на первых 3 подгруппах,да и, полагаю, в 4-ой он появился случайно.

Alexponomarev7

+73

Более забавная история. В 5-ой задаче у меня не проходит второй sample test, но при этом решение набирает 100 баллов. Причем тестов, которые могут валить мое решение — тьма.

Мда...

linjek

Ахах, а вот это уже эпик =) Только интересно, зачем ты отправлял решение на проверку, которое не проходит семплы ?)

Потому что оно должно было набирать 50 баллов вроде. Хотел проверить, что набирает свои баллы, а потом уже дописывать до 100, Но не пришлось :)

Sehnsucht

В 5 задаче дико косячил (сделал за O(log(n)) там, где должен быть аморт. O(1)) и за несколько минут до конца пытался как-то запихать решение, которое всегда проходило 3-ю и 4-ю подгруппу, но не проходило 5-ю в единственном тесте с TL. 3-я подгруппа это 10^6 без разрезания подстрок, 4-я это 10^3 с разрезанием строк, 5-я это 10^6 с разрезанием строк. "Разрезание" строки за O(n), так что скорее всего 3-я подгруппа тоже должна была упасть.

В 4 задаче решение за квадрат набрало лишние 17 баллов, где у меня в худшем случае (сумма Si)^2.

Блог пользователя samatbor