Блог пользователя lxn

Автор lxn, история, 6 лет назад, перевод, По-русски

Мне было интересно распределение рейтинга на codeforces. Рейтинг каждого участника доступен на сайте, можно пойти на вкладку 'Рейтинг' загрузить все страницы и распарсить их.

Картинка актуальна на 21.08.2018

Может быть кому-то еще это интерсно.

  • Проголосовать: нравится
  • +173
  • Проголосовать: не нравится

»
6 лет назад, # |
  Проголосовать: нравится +26 Проголосовать: не нравится

How about a rating distribution chart by country? Lol. I am already predicting the culprit of the green color's dominance in cf.

»
6 лет назад, # |
  Проголосовать: нравится 0 Проголосовать: не нравится

Автокомментарий: текст был переведен пользователем lxn (оригинальная версия, переведенная версия, сравнить).

»
6 лет назад, # |
Rev. 3   Проголосовать: нравится +3 Проголосовать: не нравится

Есть соотношения в числах? Например, сколько пользователей с рейтингом 1600-1699, 1700-1799 и т.д.

И было бы здорово, если бы учитывались только активные пользователи, которые сделали как минимум одну отправку за 3 месяца или 6 месяцев, принявшие участие больше, чем в одном раунде

  • »
    »
    6 лет назад, # ^ |
      Проголосовать: нравится +19 Проголосовать: не нравится

    Сгруппировал по 100:


    draw column for rating [0 100) using color cccccc: 1 coders draw column for rating [100 200) using color cccccc: 0 coders draw column for rating [200 300) using color cccccc: 0 coders draw column for rating [300 400) using color cccccc: 3 coders draw column for rating [400 500) using color cccccc: 6 coders draw column for rating [500 600) using color cccccc: 23 coders draw column for rating [600 700) using color cccccc: 81 coders draw column for rating [700 800) using color cccccc: 189 coders draw column for rating [800 900) using color cccccc: 458 coders draw column for rating [900 1000) using color cccccc: 1009 coders draw column for rating [1000 1100) using color cccccc: 2071 coders draw column for rating [1100 1200) using color cccccc: 3683 coders draw column for rating [1200 1300) using color 77ff77: 6240 coders draw column for rating [1300 1400) using color 77ff77: 10000 coders draw column for rating [1400 1500) using color 77ddbb: 7247 coders draw column for rating [1500 1600) using color 77ddbb: 3309 coders draw column for rating [1600 1700) using color aaaaff: 2878 coders draw column for rating [1700 1800) using color aaaaff: 1826 coders draw column for rating [1800 1900) using color aaaaff: 1192 coders draw column for rating [1900 2000) using color ff88ff: 1203 coders draw column for rating [2000 2100) using color ff88ff: 731 coders draw column for rating [2100 2200) using color ffcc88: 596 coders draw column for rating [2200 2300) using color ffcc88: 268 coders draw column for rating [2300 2400) using color ffbb55: 157 coders draw column for rating [2400 2500) using color ff7777: 115 coders draw column for rating [2500 2600) using color ff7777: 57 coders draw column for rating [2600 2700) using color ff3333: 45 coders draw column for rating [2700 2800) using color ff3333: 19 coders draw column for rating [2800 2900) using color ff3333: 13 coders draw column for rating [2900 3000) using color ff3333: 17 coders draw column for rating [3000 3100) using color aa0000: 11 coders draw column for rating [3100 3200) using color aa0000: 2 coders draw column for rating [3200 3300) using color aa0000: 4 coders draw column for rating [3300 3400) using color aa0000: 0 coders draw column for rating [3400 3500) using color aa0000: 1 coders

    На сколько я понимаю тут только те пользователи, которые за последние пол года хоть раз участвовали в раундах.

»
6 лет назад, # |
Rev. 3   Проголосовать: нравится +16 Проголосовать: не нравится

Most likely, most of the group of 1200-1600 people who participated once, and then just left the code, or at first go to the div 1, then merge to 1300-1500.

»
6 лет назад, # |
  Проголосовать: нравится +8 Проголосовать: не нравится

It would be much more interesting if you did some follow-up analysis (e.g. compare to some known distributions) or gave additional observations (e.g. the first column of a colour is always higher than the last column of the previous colour if and only if the rating boundary between those colours is above the rating of new users).

  • »
    »
    6 лет назад, # ^ |
      Проголосовать: нравится +32 Проголосовать: не нравится

    I guess the first column of a color is always higher than the last column of the previous color for experts and onward is because most of the users in that area have just changed colors for the first time maybe, and still feel like they're in the transition phase, so they decide to stay away from rated rounds for a while (and enjoy the new color maybe? :P). Hence their numbers accumulate.

    • »
      »
      »
      6 лет назад, # ^ |
        Проголосовать: нравится +16 Проголосовать: не нравится

      That would be my hypothesis, too. This would mean that this phenomenon would not be observable if one only considers participants who competed recently.

      • »
        »
        »
        »
        6 лет назад, # ^ |
          Проголосовать: нравится +8 Проголосовать: не нравится

        I agree with you that passive users can be the reason of 'new color phenomenon'.

        But let's compare it with topcoder's distribution, especialy for algorithm compititions (they are most similar with codeforces's rounds). If we look at topcoder's rating distribution there is no 'new color phenomenon'. Topcoder's rating distribution contains more coders and topcoder's rated events are not so popular (codeforces rounds somtimes have about 9000 competitors). I mean that topcoder's rating distribution contains more passive users, but it doesn't have 'new color phenomenon'. So i guess that the main reason is diffirence in rating scheme.

        There is one signifitian difference in topcoder's rating scheme and codeforces's rating scheme, and I think that this is a codeforces's issue. In topcoders's srm you can't be unrated if you open any problem and it is beter to solve 1 problem than to solve 0 problems. In codeforces it is sometimes beter to solve no problems than solve one or two problem. In codeforces you can read problems and than deside to be unrated. For example you can predict that if you have no idea how to solve C, D etc, you will defenitely loose you rating — just do not solve anything. Is is some kind of 'dirty game' :( but this is the chance for such passive users. And temptation is more when you are closer to color change.