首先,为什么会有排序算法稳定性的说法?只要能排好不就可以了吗?
看例子
第1行是数字2 记作 1 2
第2行是数字4 记作 2 4
第3行是数字2 记作 3 2
排序后的结果(如果看不懂命令的意思,参照这个博客)
那么引入我们的问题,有没有可能排序结果是这样子
排序的结果是正确的,可是它却打乱了原本的文件顺序。
那么在什么场景会出现这种情况呢?
我们在管理数据的时候,比如有ID和体重。那么胖的排前面,轻的排后面,没问题!如果是体重相等呢?那就按服从ID排序了!
起始稳定排序的意义就是保证两次排序结果相同,好好体会这句话的意义。
快速排序和归并排序的平均时间复杂度都是一样的,那为什么不全部都用归并排序?
归并排序需要开辟额外的空间,在数据较小时,可能不占优势。
数组长度 | 快速排序(运行时间/毫秒) | 归并排序(运行时间/毫秒) |
---|---|---|
100 | 0 | 0 |
1000 | 1 | 1 |
10000 | 1 | 3 |
100000 | 14 | 14 |
1000000 | 79 | 120 |
10000000 | 982 | 1186 |
100000000 | 55733 | 12328 |
算法 | 最坏时间复杂性 | 平均时间复杂性 |
---|---|---|
快速排序 | n^2 | n*log(n) |
归并排序 | n*log(n) | n*log(n) |
例子
例如要排序的内容是一组原本按照价格高低排序的对象,如今需要按照销量高低排序,使用稳定性算法,可以使得想同销量的对象依旧保持着价格高低的排序展现,只有销量不同的才会重新排序。(当然,如果需求不需要保持初始的排序意义,那么使用稳定性算法依旧将毫无意义)
换句话说,以某种关键字的方式排序后,能不影响到其他关键字原来排序结果的方法就是稳定的,比如一开始按照价格高低排序结果为 a(10元,卖了5个) b(8元,卖了20个) c(6元,卖了20个) d(4元,卖了30个),则按照销量重拍后如果保持 d(30个,价格为4元) b(20个,价格为8元) c(20个,价格为6元) a(5个,价格为10元),则说明该方法为稳定的,而如果出现c在b前,破坏了排序前b在c前的顺序,则说明这个方法是不稳定的