十大经典排序算法的总结
前言
排序算法的术语:
- 稳定 :如果 a 原本在 b 前面,而 a=b,排序之后 a 仍然在 b 的前面
- 不稳定 :如果 a 原本在 b 的前面,而 a=b,排序之后 a 可能会出现在 b 的后面
- 内排序 :所有排序操作都在内存中完成
- 外排序 :由于数据太大,因此把数据放在磁盘中,而排序通过磁盘和内存的数据传输才能进行
- 时间复杂度 : 一个算法执行所耗费的时间
- 空间复杂度 :运行完一个程序所需内存的大小
一些名词:
- n: 数据规模
- k: “桶”的个数
- In-place: 占用常数内存,不占用额外内存
- Out-place: 占用额外内存
十大经典排序算法的总结:
算法分类图:
经过思考,我发现了算法的具体实现也是分两类的
分别是:
-
比较排序
例如冒泡排序就是比较排序 他依赖于两个元素的比较
每个数都必须和其他数组比较,比较排序适用于各种规模的数据 -
非比较排序
又例如计数排序就术语非比较排序 他是通过确定每个元素之前有多少个元素来排序
非比较排序时间复杂度低,为:O(n),但由于非比较排序需要占用空间来确定唯一位置,对数据规模和数据分布有一定的要求
冒泡排序
实现步骤:
-
1: 比较相邻的元素,较大数字交换之较小数字之后
-
2: 对每一对相邻元素作同样的工作,到最后应该为最大元素
-
3: 针对所有的元素重复以上的步骤,除了最后一个
-
4: 重复步骤 1~3,直到排序完成
动图:
代码:
算法分析
- 最佳情况:T(n) = O(n^2)
- 最差情况:T(n) = O(n^2)
- 平均情况:T(n) = O(n^2)
但是不应该呀,冒泡排序的最佳情况是可以做到 O(n) 的
优化:
1.优化外层循环
若在某一趟排序中未发现气泡位置的交换,则说明待排序的无序区中所有气泡均满足排序结果,因此,冒泡排序过程可在此趟排序后终止
> 2.优化内层循环
在每趟扫描中,记住最后一次交换发生的位置。下一趟排序开始时,R[位置-1]是无序区,R[位置~n]是有序区,从而减少排序的趟数。
> 算法分析
最佳情况:T(n) = O(n)
最差情况:T(n) = O(n^2)
平均情况:T(n) = O(n^2)
选择排序
实现步骤:
-
1: 初始状态:无序区为[1…n],有序区为空
-
2: 第 i 趟排序(i=1,2,3…n-1)开始时,当前有序区和无序区分别为[1…i-1]和(i…n)。该趟排序从当前无序区中-选出关键字最小的记录 [k],将它与无序区的第 1 个记录 R 交换,使[1…i]和[i+1…n)分别变为记录个数增加 1 个的新有序区和记录个数减少 1 个的新无序区
-
3: n-1 趟结束,数组有序化了
动图:
代码:
算法分析
- 最佳情况:T(n) = O(n^2)
- 最差情况:T(n) = O(n^2)
- 平均情况:T(n) = O(n^2)
插入排序
实现步骤:
- 1: 从第一个元素开始,该元素可以认为已经被排序
- 2: 取出下一个元素,在已经排序的元素序列中从后向前扫描
- 3: 如果该元素(已排序)大于新元素,将该元素移到下一位置
- 4: 重复步骤 3,直到找到已排序的元素小于或者等于新元素的位置
- 5: 将新元素插入到该位置后
- 6: 重复步骤 2~5。
动图:
代码:
算法分析
- 最佳情况:T(n) = O(n)
- 最差情况:T(n) = O(n^2)
- 平均情况:T(n) = O(n^2)
希尔排序
实现步骤:
- 1:选择一个增量序列 t1,t2,…,tk,其中 ti>tj,tk=1;
- 2:按增量序列个数 k,对序列进行 k 趟排序;
- 3:每趟排序,根据对应的增量 ti,将待排序列分割成若干长度为 m 的子序列,分别对各子表进行直接插入排序。仅增量因子为 1 时,整个序列作为一个表来处理,表长度即为整个序列的长度。
动图:
代码:
算法分析
- 最佳情况:T(n) = O(nlog2 n)
- 最差情况:T(n) = O(nlog2 n)
- 平均情况:T(n) = O(nlog2 n)
归并排序
实现步骤:
- 1:把长度为 n 的输入序列分成两个长度为 n/2 的子序列
- 2:对这两个子序列分别采用归并排序
- 3:将两个排序好的子序列合并成一个最终的排序序列
动图:
代码:
算法分析
- 最佳情况:T(n) = O(n)
- 最差情况:T(n) = O(nlogn)
- 平均情况:T(n) = O(nlogn)
快速排序
实现步骤:
- 1:从数列中挑出一个元素,称为 “基准”(pivot )
- 2:重新排序数列,所有元素比基准值小的摆放在基准前面,所有元素比基准值大的摆在基准的后面(相同的数可以到任一边)。在这个分区退出之后,该基准就处于数列的中间位置。这个称为分区(partition)操作
- 3:递归地(recursive)把小于基准值元素的子数列和大于基准值元素的子数列排序
动图:
代码:
算法分析
- 最佳情况:T(n) = O(nlogn)
- 最差情况:T(n) = O(n^2)
- 平均情况:T(n) = O(nlogn)
堆排序
这里用到了完全二叉树的部分性质
实现步骤:
- 1:将初始待排序关键字序列(R1,R2….Rn)构建成大顶堆,此堆为初始的无序区
- 2:将堆顶元素 R[1]与最后一个元素 R[n]交换,此时得到新的无序区(R1,R2,……Rn-1)和新的有序区(Rn),且满足 R[1,2…n-1]<=R[n]
- 3:由于交换后新的堆顶 R[1]可能违反堆的性质,因此需要对当前无序区(R1,R2,……Rn-1)调整为新堆,然后再次将 R[1]与无序区最后一个元素交换,得到新的无序区(R1,R2….Rn-2)和新的有序区(Rn-1,Rn)。不断重复此过程直到有序区的元素个数为 n-1,则整个排序过程完成
动图:
代码:
算法分析
- 最佳情况:T(n) = O(nlogn)
- 最差情况:T(n) = O(nlogn)
- 平均情况:T(n) = O(nlogn)
计数排序
实现步骤:
- 1:找出待排序的数组中最大和最小的元素;
- 2:统计数组中每个值为 i 的元素出现的次数,存入数组 C 的第 i 项
- 3:对所有的计数累加(从 C 中的第一个元素开始,每一项和前一项相加)
- 4:反向填充目标数组:将每个元素 i 放在新数组的第 C(i)项,每放一个元素就将 C(i)减去 1
动图:
代码:
算法分析
- 最佳情况:T(n) = O(n+k)
- 最差情况:T(n) = O(n+k)
- 平均情况:T(n) = O(n+k)
桶排序
实现步骤:
- 1:人为设置一个 BucketSize,作为每个桶所能放置多少个不同数值(例如当 BucketSize==5 时,该桶可以存放{1,2,3,4,5}这几种数字,但是容量不限,即可以存放 100 个 3);
- 2:遍历输入数据,并且把数据一个一个放到对应的桶里去;
- 3:对每个不是空的桶进行排序,可以使用其它排序方法,也可以递归使用桶排序;
- 4:从不是空的桶里把排好序的数据拼接起来。
如果递归使用桶排序为各个桶排序,则当桶数量为 1 时要手动减小 BucketSize 增加下一循环桶的数量,否则会导致内存溢出。
图解:
代码:
算法分析
- 最佳情况:T(n) = O(n+k)
- 最差情况:T(n) = O(n+k)
- 平均情况:T(n) = O(n^2)
基数排序
实现步骤:
- 1:取得数组中的最大数,并取得位数
- 2:arr 为原始数组,从最低位开始取每个位组成 radix 数组
- 3:对 radix 进行计数排序(利用计数排序适用于小范围数的特点)
基数排序有两种方法:
- MSD:从高位开始进行排序
- LSD:从低位开始进行排序
动图:
代码:
算法分析
- 最佳情况:T(n) = O(n * k)
- 最差情况:T(n) = O(n * k)
- 平均情况:T(n) = O(n * k)
基数排序 、计数排序、桶排序都利用了桶的概念,但对桶的使用方法还是有区别的:
- 基数排序: 根据键值的每位数字来分配桶
- 计数排序: 每个桶只存储单一键值
- 桶排序: 每个桶存储一定范围的数值