算法基础课:离散化


离散化

特指整数离散化,有序、保序离散化。

vector alls;	// 存储所有待离散化的值
sort(alls.begin(), alls.end());	// 将所有值排序
alls.erase(unique(alls.begin(), alls.end(), alls.end()));	// 去掉重复元素

// 二分求出x对应的离散化的值
int find(int x) {
    int l = 0, r = alls.size() - 1;
    while (l < r) {
        int mid = l + r >> 1;
        if (alls[mid] >= x) r = mid;
        else l = mid + 1;
    }
    return r + 1;
}

为什么需要离散化?

一组数,每个数的大小范围在 -1e9 到 +1e9 之间。

但是这些数很稀疏,在进行求这些数的和的操作时不可能遍历所有的区间。

故而要使用离散化,将其映射到连续的数组空间中。

例题

image-20220524100837500

算法

  • 因为存在n次添加操作、2n次(l,r)查询操作,在最坏的情况下他们都各不相同,故而构成映射的数组空间是3 * 1e5 + 10 这么大。
  • 利用 pair 存储添加和查询对。
  • 第一步先将所有的数存入动态数组空间(包括存储的 x 和查询的左右端点 l , r),进行排序、去重。
  • 再将其值进行离散化查询,通过二分查找,找到其在数组中的下标。
  • 通过下标和其值,插入到建立好的数组空间,求其前缀和
  • 通过前缀和: arr[r] - arr[l - 1]得到区间和

C++实现

#include
#include
#include

using namespace std;

typedef pair PII;

const int N = 300010;

int n, m;
int a[N], s[N];

vector alls;
vector add, query;

int find (int x) {
    int l = 0, r = alls.size() - 1;
    while (l < r) {
        int mid = (l + r) >> 1;
        if (alls[mid] >= x) r = mid;
        else l = mid + 1;
    }

    return r + 1;
}

int main() {
    cin >> n >> m;
    for (int i = 0; i < n; i ++) {
        int x, c;
        cin >> x >> c;
        add.push_back({x, c});

        alls.push_back(x);
    }

    for (int i = 0; i < m; i ++) {
        int l, r;
        cin >> l >> r;
        query.push_back({l, r});

        alls.push_back(l);
        alls.push_back(r);
    }

    // 去重
    sort(alls.begin(), alls.end());
    alls.erase(unique(alls.begin(), alls.end()), alls.end());

    // 处理插入
    for (auto item : add) {
        int x = find(item.first);
        a[x] += item.second;
    }

    // 预处理前缀和
    for (int i = 1; i <= alls.size(); i ++) s[i] = s[i - 1] + a[i];

    // 处理询问
    for (auto item : query) {
        int l = find(item.first), r = find(item.second);
        cout << s[r] - s[l - 1] << endl;
    }

    return 0;

}