AcWing 787. 归并排序


归并排序介绍

归并排序是建立在归并操作上的一种有效,稳定的排序算法,该算法是采用分治法(\(Divide~and~Conquer\))的一个非常典型的应用。将已有序的子序列合并,得到完全有序的序列;即先使每个子序列有序,再使子序列段间有序。若将两个有序表合并成一个有序表,称为二路归并。

归并排序思想

它的基本思想:归并排序,首先把一个数组中的元素,按照某一方法,先拆分了之后,按照一定的顺序各自排列,然后再归并到一起,使得归并后依然是有一定顺序的 。归并排序算法可以利用递归的思想或者迭代的思想去实现。首先我们先把一个无序的数组去拆分,然后利用一定的规则,去合并。类似于二叉树的结构。

归并排序流程

  • 把长度为n的输入序列分成两个长度为 \(n/2\) 的子序列;
  • 对这两个子序列分别采用归并排序;
  • 将两个排序好的子序列合并成一个最终的排序序列。

具体实现?

第一步,划分子区间:每次递归的从中间把数据划分为左区间和右区间。原始区间为 \([start,end]\)\(start=0\)\(end=len-1\),减一是因为数组的下标从 \(0\) 开始。然后从中间元素划分,划分之后的左右区间分别为 \([start,(end-start+1)/2+start]\),右区间为 \([(end-start+1)/2+start+1,end]\)。重复过程,直到每个子区间只有一个或者两个元素。

第二步,合并子区间:子区间划分好以后,分别对左右子区间进行排序,排好序之后,在递归的把左右子区间进行合并。

  • 开辟一个数组 \(a\),存放 \(l\)\(q\) 之间(也就是需要归并的左边数组)的元素;
  • 开辟一个数组 \(b\),存放 \(q\)\(r\) 之间(也就是需要归并的右边数组)的元素;
  • \(a\)\(b\) 中的数字逐个比较,把较小的先放在数组 \(A\) 中(从数组 \(a_0\) 开始存放,依次往后覆盖原来的数),然后较小的数组指针往后移动,指向下一位再和另外一个数组比较。

动图演示

算法稳定性与时间复杂度

归并排序稳定性

算法稳定性:假设在数列中存在 \(a_i = a_j\),若在排序之前,\(a_i\)\(a_j\) 前面;并且排序之后,\(a_i\) 仍然在 \(a_j\) 前面,则这个排序算法是稳定的。

归并排序是 稳定 的算法。

归并排序时间复杂度

了解归并排序的应该都知道,归并排序的时间复杂度是 \(O(nlogn)\),且这个时间复杂度是稳定的,不随需要排序的序列不同而产生波动。那这个时间复杂度是如何得来的呢?我们可以这样分析,假设我们需要对一个包含n个数的序列使用归并排序,并且使用的是递归的实现方式,那么过程如下:

  • 递归的第一层,将 \(n\) 个数划分为 \(2\) 个子区间,每个子区间的数字个数为 \(n/2\)
  • 递归的第二层,将 \(n\) 个数划分为 \(4\) 个子区间,每个子区间的数字个数为 \(n/4\)
  • 递归的第三层,将 \(n\) 个数划分为 \(8\) 个子区间,每个子区间的数字个数为 \(n/8\);
    ……
  • 递归的第 \(logn\) 层,将 \(n\) 个数划分为 \(n\) 个子区间,每个子区间的数字个数为 \(1\)

而归并排序的合并操作,则是从最底层开始(子区间为 \(1\) 的层),对相邻的两个子区间进行合并,过程如下:

  • 在第 \(logn\) 层,每个子区间的长度为 \(1\),共 \(n\) 个子区间,每相邻两个子区间进行合并,总共合并 \(n/2\) 次。\(n\) 个数字都会被遍历一次,所有这一层的总时间复杂度为 \(O(n)\)
    ……
  • 在第二层,每个子区间长度为 \(n/4\),总共有 \(4\) 个子区间,每相邻两个子区间进行合并,总共合并 \(2\) 次。\(n\) 个数字都会被遍历一次,所以这一层的总时间复杂度为 \(O(n)\)
  • 在第一层,每个子区间长度为 \(n/2\),总共有 \(2\) 个子区间,只需要合并一次。\(n\) 个数字都会被遍历一次,所以这一层的总时间复杂度为 \(O(n)\)

我们可以发现,对于每一层来说,在合并所有子区间的过程中,\(n\) 个元素都会被操作一次,所以每一层的时间复杂度都是 \(O(n)\)。而之前我们说过,归并排序划分子区间,将子区间划分为只剩 \(1\) 个元素,需要划分 \(logn\) 次,共有 \(logn\) 层,所以归并排序的时间复杂度就是 \(O(nlogn)\)

归并序实现

#include 
#include 
#include 
#include 
#include 
using namespace std;

const int N = 100010;

int a[N], tmp[N]; //a是需要排序的数组,tmp是辅助数组

void merge_sort(int q[], int l, int r)
{
    if (l >= r)
    {
        return;
    }
    int mid = (l + r) >> 1;
    //递归划分子区间
    merge_sort(q, l, mid);
    merge_sort(q, mid + 1, r);
    int i = l, j = mid + 1, cnt = 0;
    //合并子区间
    while (i <= mid && j <= r)
    {
        if (q[i] <= q[j]) //q[i]更小存q[i]
        {
            tmp[cnt ++ ] = q[i ++ ]; //注意cnt和i要+1
        }
        else //存q[j]
        {
            tmp[cnt ++ ] = q[j ++ ]; //记得+1
        }
    }
    while (i <= mid) //左边数组有剩余
    {
        tmp[cnt ++ ] = q[i ++ ];
    }
    while (j <= r) //右边数组有剩余
    {
        tmp[cnt ++ ] = q[j ++ ];
    }
    for (int i = l, j = 0; i <= r; i ++ , j ++ ) //更新q数组
    {
        q[i] = tmp[j];
    }
}

int main()
{
    int n;
    scanf("%d", &n);
    for (int i = 0; i < n; i ++ )
    {
        scanf("%d", &a[i]);
    }
    merge_sort(a, 0, n - 1);
    for (int i = 0; i < n; i ++ )
    {
        printf("%d ", a[i]);
    }
    return 0;
}

相关