目录
一.前言
二.归并小补充
三.计数排序
操作步骤:
代码部分:
四.稳定性的概念:
五.排序大总结:
六.结语
一.前言
我们已经进入排序的尾篇了,本篇主要讲述计数排序以及汇总各类排序的特点。码字不易,希望大家多多支持我呀!(三连+关注,你是我滴神!)
二.归并小补充
归并排序即有外排序,也有内排序,这是它的弊端所在。
当数据太多的时候,就会把数据存在磁盘中。
假设我们有大约4G的数据那要选择什么排序好呢?
我们这里不能用希尔排序,因为在磁盘中是不支持下标访问的。磁盘的特点是顺序写,顺序读。所以在这里只有归并排序在可以做到在磁盘中排序。
但别忘了我们还有1G的内存,我们把让小文件在里面进行排序再拿出来。这时候内存中的排序就可以用希尔排序了。
然后我们再通过合并两个有序序列的相关操作,用fscanf来读对比两个文件中谁小再fprintf写到大文件中去。
以此类推
最后我们再对两个大文件进行对比,然后覆盖写入原文件中去。
三.计数排序
思想:计数排序又称为鸽巢原理,是对哈希直接定址法的变形应用。
操作步骤:
- 统计相同元素出现次数
- 根据统计的结果将序列回收到原来的序列中
计数排序的特性总结:
计数排序在数据范围集中时,效率很高,但是适用范围及场景有限
时间复杂度:O(MAX(N,范围))
空间复杂度:O(范围)
稳定性:稳定
接下来我们开始进行分析:
每个值对应一个位置,如5就对下标为5的地方++。
对所有值开始计数
当统计好出现的次数时,我们又应该如何排序呢?
在原数组中,0出现0次那我们就覆盖写0次,1出现3次,那我们就依次覆盖写3次.......
之所以会有排序的效果是因为我们count遍历的时候是从小到大去遍历的。
该排序也是有局限性的,在我们新的数据中最大数是199,那我们就得开200个空间去遍历它们,可是前面有100空间是浪费的,因为没有数出现在那。
这种方法本质是绝对映射,值为多少那么下标就为多少。
为了避免空间的浪费,我们采用的相对映射的方法,在投影下标时用该数减数据中的最小值就能得到相对位置,而在我们需要往回去覆盖时重新+最小值就可以回到原来的位置。这种适合范围相对集中的时候,如果出现绝对大的值那就不行了。
代码部分:
代码其实很好写,最关键的是要知道如何处理相对映射时的下标转换,以及返回覆盖时重新加上最小值。
void CountSort(int* a, int n)
{//找出最大与最小int max = a[0];int min = a[0];for (int i = 0; i < n; i++){if (a[i] < min){min = a[i];}if (a[i] > max){max = a[i];}}//划定范围int range = max - min + 1;//创建count数组int* count = (int*)malloc(sizeof(int) * range);if (count == NULL){perror("malloc faile");return;}//初始化数组memset(count, 0, sizeof(int) * range);//开始计数for (int i = 0; i < n; i++){//记住要用到相对映射//往count数组里面计数count[a[i] - min]++;}//开始覆盖,最重要的一步int j = 0;for (int i = 0; i < range; i++){while (count[i]--){a[j] = i + min;j++;}}
}
时间复杂度:O(N+range)
因为我们不仅仅要遍历原数组a,还要遍历count数组。如果数据范围很大,那么range影响就大。
对于空间复杂度也是同理。
所以计数排序适用于数据范围集中的时候。
四.稳定性的概念:
如果排完序后能保证红5还在黑5的前面,那么这个排序就是稳定的。(相同数据的顺序是否变化——相对顺序)
稳定性的意义:
假设我们比赛的时候有选手的分数是相同的,那我们就要看谁先提交,那谁就排前面。
五.排序大总结:
其中选择排序之所以不稳定是因为在确保1相对稳定时,我们无法保证3的相对稳定。
而堆排序中因为堆顶的值要进行交换,所以也不能保证稳定性
快速排序也无法保证稳定性,当有3个5时,如果左边的5作key,那么它就会换到中间去,就破坏了相对顺序了。
归并是可以做到稳定的,只要我们在取小插入的过程中把<改成<=就行了。
六.结语
排序正式完结了,感谢大家对我的支持与陪伴,我会努力写出更通俗易懂的文章。最后感谢大家的观看,友友们能够学习到新的知识是额滴荣幸,期待我们下次相见~kk