再探快速排序 → 递进式演进,是否更容易理解?


开心一刻

  爷爷有退休金,奶奶没有

  可奶奶很要强

  为了不让爷爷看不起,她找了份环卫的工作

  结果要早起,她起不来

  现在爷爷每天要早起扫大街

前情回顾

  关于快排,楼主之前写过两篇关于它的文章

  感觉讲的有点突兀,看过之后你们的表情是这样的

  贴心的我实在是难以忍受你们那无辜的小眼神,决定让你们的表情变成这样

两区域划分

  问题描述:给定一个整型数组 arr 和一个整数 target ,请把小于等于 target 的数放在数组的左边,大于 target 的数放在数组的右边

  常规实现

  如果不做任何限制,我相信大家很容易想到如下方法

  准备一个新数组,然后遍历 arr , arr 素逐个与 target 进行比较

  小于等于 target 的元素从左往右放入到新数组中,大于 target 的元素从右往左放入到新数组中

  当 arr 遍历完,新数组中的元素顺序即是:小于等于 target 的数在左边,大于 target 的数在右边

  我们来看代码实现

  假设 arr 是 [9,8,3,2,6,4,5,0,1,1,1] , target 是 7,那么得到的结果是 [3,2,6,4,5,0,1,1,1,8,9] 

  细心的小伙伴会大声道:你这不对,3 怎么在 2 的前面,6 的位置也不对,...

  现在是区域划分,不是排序、不是排序、不是排序!

  我们换个方式来看

  现在清楚了吧

  我们从两个维度来看看这个算法的优劣,时间复杂度 O(N) ,额外空间复杂度 O(N) 

  时间复杂度已经没法优化,额外空间复杂度能不能优化了?

  优化实现

  常规实现中,用了一个新的数组,那有没有什么办法拿掉这个新数组后,仍然可以完成区域的划分了?

  我们记录边界索引 lte , lte 左边是小于等于区域, lte 至遍历索引 i 之间是大于区域,具体实现步骤如下

  分两种情况进行处理

    1、如果 arr[i] <= target ,则 arr[i] 和 lte 的前一个元素进行交换, lte 右移,i++

    2、如果 arr[i] > target , lte 不动,i++

  我们看个具体案例就懂了

  相当于小于等于区推着大于区往后走

  再来看具体代码实现

  此时,时间复杂度 O(N) ,只用到了一个额外变量 lte ,所以额外空间复杂度 O(1) 

荷兰国旗(三区域划分)

  我们把问题进行一个升级:给定一个整型数组 arr ,和一个数  target ,请把小于 target 的数放在数组的左边,等于 target 的数放在数组的中间,大于 target 的数放在数组的右边

  荷兰国旗是三种颜色

  正好对应问题描述中的三个区域,所以也称这个问题为荷兰国旗问题

  常规实现

  可以在 两区域划分 的 常规实现 的基础上进行改造;我们直接看代码

  很明显,时间复杂度 O(N) ,额外空间复杂度 O(N) 

  时间复杂度已经没法优化了,我们需要优化额外空间复杂度

  优化实现

  如果要求额外空间复杂度 O(1),时间复杂度 O(N)

  类比 两区域划分 的 优化实现 ,我们分两个边界索引,左边界索引 lt 往左是小于区,右边界索引 gt 往右是大于区, lt 至遍历索引 i 之间是等于区域,i 至 gt 之间是待定(未比较)区域

  分三种情况进行处理:

    1、 arr[i] < target , arr[i] 和 lt 后一个元素进行交换, lt 右移,i++

    2、 arr[i] == target ,i++

    3、 arr[i] > target , arr[i] 和 gt 前一个元素进行交换, gt 左移,i 不动

  我们来看个具体案例就理解了

  是不是有点感觉了?

  我们再来看看代码的实现

  时间复杂度 O(N) ,仅用了有限几个变量,额外空间复杂度 O(1) 

快速排序

  配角已经悉数登场,接下来有请主角登场

  1.0 版本

  基于 两区域划分 ,我们来实现快速排序

  1、我们取最后一个元素作为 target ,将最后一个元素之前(不包括最后一个元素)所有元素进行一次 两区域划分 ,然后将大于区的第一个元素与 target 进行交换

  2、此时 target 所在的位置是 lte + 1 ,然后对 left ~ lte 和 lte+2 ~ right 这两个区域分别做 两区域划分 

  3、重复步骤1、2,最终实现排序

  直接看代码

  2.0 版本

  类似 荷兰国旗问题 对 两区域划分 的优化,一次处理一批等于 target 的元素

  处理步骤与 1.0 版本 类似,如下

  1、取最后一个元素作为 target ,将最后一个元素之前的元素按 荷兰国旗问题 处理,然后将大于区域的第一个元素与 target 进行交换

  2、此时, lt+1 ~ gt 范围的元素都等于 target ,不需要再处理;只需要对 left ~ lt 和 gt+1~ right 这两个区域分别做 荷兰国旗问题 处理

  3、重复步骤1、2,最终实现排序

  代码实现如下:

  3.0 版本

  不管是 1.0 版本 还是 2.0 版本 ,时间复杂度都是 O(N2),比如对 [1,2,3,...,N-1,N] 进行排序

  时间复杂度就是:O( N-1 + N-2 + ... + 2 + 1 ),常数项可以忽略,也就是 O(N2)

  因为我们取 target 的时候,固定取的最右边元素,所以我们需要随机取 target 

  我们可以从 left ~ right 中随机取一个元素作为 target ,然后以此 target 对 arr[left...right] 做 荷兰国旗问题 处理

  代码实现如下:

  partition 版本

  其实就是 3.0 版本 的另外一种叫法

  实现基本一致,如下

总结

  演进过程

  从 两区域划分 ->  荷兰国旗问题 -> 快速排序 

  快排 1.0 -> 快排 2.0 -> 快排 3.0

  递进式实现,便于大家理解快速排序

  注意点

  实现的过程中,一些边界值需要注意

  边画图,边梳理,结合实际案例进行分析实现