Каверзы подсчёта рейтинга для соревнования ботов

#	User	Rating
1	tourist	3880
2	jiangly	3669
3	ecnerwala	3654
4	Benq	3627
5	orzdevinwang	3612
6	Geothermal	3569
6	cnnfls_csy	3569
8	jqdai0815	3532
9	Radewoosh	3522
10	gyh20	3447

#	User	Contrib.
1	awoo	161
2	maomao90	160
3	adamant	156
4	maroonrk	153
5	-is-this-fft-	148
5	atcoder_official	148
5	SecondThread	148
8	Petr	147
9	nor	144
9	TheScrasse	144

Для внутрикорпоративного тренинга планируется соревнование ботов. Откуда слизывать общую идею, то есть тьфу, брать примеры для подражания нынче вариантов много. Однако не всё ясно с тем как выявлять победителя (по рейтингу например).

Проблем вижу несколько. Сейчас хочу попросить идей/советов только по одной из них. Вот утрированный пример:

Играют два игрока, допустим, Ка и Бу в камень-ножницы-бумага. Ка придумал гениальную стратегию — кидать "камень" с вероятность 50% а всё остальное по 25%. Бу был ещё гениальнее и его стратегия — кидать "бумагу" с вероятностью 50%, а остальное по 25%.

Таким образом стратегии у них тупо одинаковые, но при игре вдвоём Бу при большом числе игр ощутимо ведёт в счёте.

Правда это только пока не придёт игрок Но (идея которого заключается в том чтобы с вероятностью 50% кидать "ножницы"). Он конечно всё испортит и рейтинги сравняются.

Если резюмировать, проблема в том что для некоторых игр (а у нас видимо будет похожая по стилю, ну может больше с закосом под блек-джек или что-то такое) некоторые стратегии при сравнении не будут отражать реальную их силу. (думаю, по-умному, это называется как-нить типа "отсутствие транзитивности" для отношения силы стратегий)

Не думаю что проблему можно решить "идеально", поэтому собираю пока варианты которые хотя бы отчасти помогут положению. Пока есть только два предложения:

Добавить в систему безбашенных ботов играющих равномерно-рандомно (тогда относительно них "тупость/умность" других игроков будет проявляться) — но это вообще достаточно сложно и непонятно и зависит ещё от того какая игра будет окончательно выбрана.
Определять победителя по рейтингу исходя не из "у кого больше", а вместо этого использовать лотерею в которой шансы на выигрыш пропорциональны рейтингу (ну точнее экспоненте от разницы рейтингов и блабла) — как это реализовать понятно, и даже в какой-то мере забавный подход, зато самой проблемы это не отменяет вообще. ;-)

В общем, буду страшно благодарен за подсказки и размышления!

RodionGork's blog