Сжатие массива больших чисел.

→ Обратите внимание

До соревнования
EPIC Institute of Technology Round Summer 2024 (Div. 1 + Div. 2)
33:39:41
Зарегистрироваться »

*есть доп. регистрация

→ Лидеры (рейтинг)

№	Пользователь	Рейтинг
1	tourist	3845
2	jiangly	3707
3	Benq	3630
4	orzdevinwang	3573
5	Geothermal	3569
5	cnnfls_csy	3569
7	jqdai0815	3532
8	ecnerwala	3501
9	gyh20	3447
10	Rebelz	3409

Страны | Города | Организации

Всё →

→ Лидеры (вклад)

№	Пользователь	Вклад
1	maomao90	171
2	awoo	163
2	adamant	163
4	maroonrk	152
5	nor	151
5	-is-this-fft-	151
7	TheScrasse	147
7	atcoder_official	147
9	Petr	145
10	pajenegod	144

Всё →

→ Найти пользователя

→ Прямой эфир

Детальнее →

Блог пользователя Diplomate

Сжатие массива больших чисел.

Автор Diplomate, история, 8 лет назад, По-русски

Не раз вижу, что для использования какого-нибудь алгоритма, имеющего дело с большими числами, нужно предварительно сжать эти числа, однако поиск самого алгоритма сжатия ничего не дал. Правильно ли я понимаю, что для этого нужно создать массив пар <число, ссылка на число в прежнем массиве>, отсортировать его и по порядку перенумеровать числа с 1?

сжатие, массива, больших, чисел

Diplomate
8 лет назад
10

Комментарии (10)

Написать комментарий?

yerkimbekov

8 лет назад, # |

Как я делаю сжатие

for(int i = 1; i <= n; ++i){
    scanf("%lld",&a[i].first);     
    a[i].second = i;
}

sort(a+1,a+n+1);

for(int i = 1; i <= n; ++i){
    b[a[i].second] = i;
}

В массиве B уже сжатый массив A.

→ Ответить

dalex

8 лет назад, # ^ |

И... оно фигово работает, когда в массиве a есть одинаковые числа.

→ Ответить

Diplomate

8 лет назад, # ^ |

← Rev. 2 →

Насколько я понимаю, нужно увеличивать присваиваемое b[a[i].second] число только тогда, когда очередное a[i] имеет значение, отличное от значения a[i-1]. Тогда этот алгоритм будет корректным.

Да и таким способом не очень удобно восстанавливать первоначальные значения.

→ Ответить

dalex

8 лет назад, # |

Короче, есть три способа.

Посортить, как уже выше написали, пары (a[i], i). Потом в новый массив записывать числа по порядку на индексы a[i].second, при этом если a[i].first не меняется, записываемое число тоже не должно меняться.
Добавить все числа в сет. Потом пройтись по сету и сохранить в мапе, что первый элемент сета будет 1, второй элемент сета будет 2, и т.д. Потом заменить числа в исходном массиве как a[i] = mp[a[i]].
(мне кажется, это лучший способ) Посортить копию массива и убрать дубликаты. Потом бинпоиском найти позицию каждого элемента в этом массиве: a[i] = lower_bound(copy.begin(), copy.end(), a[i]) — copy.begin()

→ Ответить

Diplomate

8 лет назад, # ^ |

← Rev. 2 →

А что, если мне потом надо будет быстро преобразовывать сжатое число в несжатое? В новом массиве хранить пары <сжатое число, номер в несжатом и неотсортированном>?

→ Ответить

dalex

8 лет назад, # ^ |

Обычно обратно преобразовывать не нужно (я ни разу не видел, чтоб было нужно), но если все-таки нужно, наиболее очевидный способ — просто сохранить эту инфу в map. Даже можно не в map, а просто в массив, т.к. все ключи — сжатые числа, и они от 1 до n.

→ Ответить

ifsmirnov

8 лет назад, # ^ |

Обратно бывает нужно во всяких задачах на отрезки (типа площади объединения прямоугольников). В твоём случае никакой map не нужен же, достаточно посмотреть на copy[i].

→ Ответить

ifsmirnov

8 лет назад, # |

← Rev. 2 →

+34

int a[maxn]; // исходный массив
int shr[maxn]; // сжатые координаты, shr -- от shrink
int k; // количество различных
for (int i = 0; i < n; ++i)
    shr[i] = a[i];
sort(shr, shr+n);
k = unique(shr, shr+n) - shr;

// индекс по исходному значению
int idx = lower_bound(shr, shr+k, val) - shr;

// исходное значение по индексу
int val = shr[idx];

Tips&tricks:

Добавить в массив shr 0 и MAXN (или правую/левую границу прямоугольника, если исходные числа -- это координаты точек в прямоугольнике). Так будет удобнее писать штуки на полуинтервалах.
Если нужен только относительный порядок, сразу после инициализации shr делаем

for (int i = 0; i < n; ++i)
    a[i] = lower_bound(shr, shr+k, a[i]) - shr;

и забываем про shr.

3. Не надо использовать map. Это в разы дольше, я так ловил TL-и. map стоит использовать только если координаты не известны заранее.

→ Ответить

CountZero

8 лет назад, # |

всегда пишу простой код с sort+lower_bound, но вообще можно обойтись одной сортировкой и одним дополнительным массивом:

Spoiler

void compress(vector<int>& a) {
  vector<int> b(a); // отсортированный массив индексов
  iota(b.begin(), b.end(), 0);
  sort(b.begin(), b.end(), [&a](int i, int j) { return a[i] < a[j]; });

  int add = 0, prev = 0;
  for (size_t i = 1; i < a.size(); ++i) {
    int add1 = a[b[i]] != a[b[i - 1]];
    prev = a[b[i - 1]] = prev + add;
    add = add1;
  }
  a[b.back()] = prev + add;
}

→ Ответить

Zlobober

8 лет назад, # |

← Rev. 3 →

+15

void compress(vector<int>& A) {
    map<int, int> M;
    for (int x : A)
        M[x]; // не опечатка
    int idx = 0;
    for (auto& it : M)
        it.second = idx++;
    for (int& x : A)
        x = M[x];
}

→ Ответить

Соревнования по программированию 2.0

Время на сервере: 29.06.2024 07:55:20 (k2).

Десктопная версия, переключиться на мобильную.

При поддержке