算法入门篇四 桶排序

桶排序

计数排序(基于统计)

  • 要求数据是有限的,和数据状况有关,比如对于200个人统计他们的年龄分布,这个时候需要申请200个桶,因此对于输入数据的规模有限制,如果输入规模是不定的,空间申请就会很麻烦。

基数排序

思想

  • 要求排序的数字都是十进制的数字,找到最高位的数字,对于其中不满足位数的数字前面补0,例如【100,23,34】就需要改写成【100,023,034】的形式。
  • 准备和数字相同数目的桶(类比于先进先出的队列),所有数字按照个位数字进桶,然后按照从左往右的次序依次往出倒数字,如果一个桶内有多个数字按照次序(队列)倒数,再按照十位数字进桶,原理和先前类似,倒出;再按照百位数字进桶,出桶。最后的次序是从小到大的。

落地

  • 初始数组为【23,13,3,24,23,14】,申请两个栈,一个为count,一个是help。count按照次序分别是【0,1,2,3,4,5,6,7,8,9】这个用于统计对应的数字的个数,比如上面这个例子的话,个位是3的个数有4个,个位是4的个数有3个。而help指定的是数组中元素的个数。此时一个6个元素,所以将help的大小设置为6。
  •  统计完对应的数字数字之后,得到的count为【0,0,0,4,2,0,0,0,0,0】,对其进行加工,对应元素的位置等于自身的值+前面的元素值。如果是0号位置就是本身,1号就是0+0,2号是0+0;3号是4+0;4号是4+0;5号是6+0;依次类推剩余元素的值都是6。经过加工后的count数组含义就是小于等于相应位置上元素的个数。比如小于等于3的有三个元素;小于等于5,6,7,8,9的有6个元素。

操作过程 

  • 从右往左遍历,第一个元素是14,个位数小于等于6的有6个,所以将14填写在help的5位置上,并且将count数组中的4对应的6减1,变成5。
  • 下一个元素是23,个位元素对应的是3,查询count数组,小于等于3的元素有四个,因此将23填写在help数组的3号位置,count中3号位置的4减1;
  • 下一个元素是24, 个位元素对应的是4,查询count数组,小于等于4的元素有5个,因此将24填写在help数组的4号位置,count中4号位置的5减1;
  • 下一个元素是3, 个位元素对应的是3,查询count数组,小于等于3的元素有3个,因此将3填写在help数组的2号位置,count中3号位置的3减1;
  • 下一个元素是13, 个位元素对应的是3,查询count数组,小于等于3的元素有2个,因此将3填写在help数组的1号位置,count中3号位置的2减1;
  • 下一个元素是23, 个位元素对应的是3,查询count数组,小于等于3的元素有1个,因此将3填写在help数组的0号位置,count中3号位置的1减1;

完整代码

package class03;import java.util.Arrays;public class Code02_RadixSort {// only for no-negative valuepublic static void radixSort(int[] arr) {if (arr == null || arr.length < 2) {return;}radixSort(arr, 0, arr.length - 1, maxbits(arr));}public static int maxbits(int[] arr) {int max = Integer.MIN_VALUE;for (int i = 0; i < arr.length; i++) {max = Math.max(max, arr[i]);}int res = 0;while (max != 0) {res++;max /= 10;}return res;}// arr[begin..end]排序public static void radixSort(int[] arr, int L, int R, int digit) {final int radix = 10;int i = 0, j = 0;// 有多少个数准备多少个辅助空间int[] bucket = new int[R - L + 1];for (int d = 1; d <= digit; d++) { // 有多少位就进出几次// 10个空间// count[0] 当前位(d位)是0的数字有多少个// count[1] 当前位(d位)是(0和1)的数字有多少个// count[2] 当前位(d位)是(0、1和2)的数字有多少个// count[i] 当前位(d位)是(0~i)的数字有多少个int[] count = new int[radix]; // count[0..9]for (i = L; i <= R; i++) {j = getDigit(arr[i], d);count[j]++;}for (i = 1; i < radix; i++) {count[i] = count[i] + count[i - 1];}for (i = R; i >= L; i--) {j = getDigit(arr[i], d);bucket[count[j] - 1] = arr[i];count[j]--;}for (i = L, j = 0; i <= R; i++, j++) {arr[i] = bucket[j];}}}public static int getDigit(int x, int d) {return ((x / ((int) Math.pow(10, d - 1))) % 10);}// for testpublic static void comparator(int[] arr) {Arrays.sort(arr);}// for testpublic static int[] generateRandomArray(int maxSize, int maxValue) {int[] arr = new int[(int) ((maxSize + 1) * Math.random())];for (int i = 0; i < arr.length; i++) {arr[i] = (int) ((maxValue + 1) * Math.random());}return arr;}// for testpublic static int[] copyArray(int[] arr) {if (arr == null) {return null;}int[] res = new int[arr.length];for (int i = 0; i < arr.length; i++) {res[i] = arr[i];}return res;}// for testpublic static boolean isEqual(int[] arr1, int[] arr2) {if ((arr1 == null && arr2 != null) || (arr1 != null && arr2 == null)) {return false;}if (arr1 == null && arr2 == null) {return true;}if (arr1.length != arr2.length) {return false;}for (int i = 0; i < arr1.length; i++) {if (arr1[i] != arr2[i]) {return false;}}return true;}// for testpublic static void printArray(int[] arr) {if (arr == null) {return;}for (int i = 0; i < arr.length; i++) {System.out.print(arr[i] + " ");}System.out.println();}// for testpublic static void main(String[] args) {int testTime = 500000;int maxSize = 100;int maxValue = 100000;boolean succeed = true;for (int i = 0; i < testTime; i++) {int[] arr1 = generateRandomArray(maxSize, maxValue);int[] arr2 = copyArray(arr1);radixSort(arr1);comparator(arr2);if (!isEqual(arr1, arr2)) {succeed = false;printArray(arr1);printArray(arr2);break;}}System.out.println(succeed ? "Nice!" : "Fucking fucked!");int[] arr = generateRandomArray(maxSize, maxValue);printArray(arr);radixSort(arr);printArray(arr);}}

稳定性

  •  相同元素排序保证先后顺序
  • 同样数值的个体之间,如果不因为排序而改变相对次序,这个排序就是有稳定性的,否则则没有
  • 基于比较的排序,一般都是不稳定的;基数排序(按照个位、十位、百位上的元素的大小进行相对次序的排列)和计数排序(统计相同数值的元素出现的次数,押入对应的元素组成的数据栈,利用栈先入后出的特性,保持元素的相对次序,参考上文统计0-200员工年龄分布问题)是稳定的
  • 不具备稳定性的排序:选择排序、快速排序 和 堆排序
  • 具备稳定性的排序 :冒泡排序、插入排序 、归并排序 、一切桶排序思想下的排序(计数排序和基数排序)
  • 目前没有 时间复杂度为O(N*logN)  额外时间复杂度O(1)  又稳定的排序
  • 稳定性 主要体现在 非基础类型数据的排序,比如对自定义结构体学生类型{年龄、班级},先按照年龄排序,再按照班级进行排序

分析

  • 桶排序思想下的排序都是不基于比较的排序
  • 时间复杂度为O(N),额外空间负载度O(M)
  • 应用范围有限,需要样本的数据状况满足桶的划分

汇总

  • 快速排序不是基于比较的排序
 时间空间稳定性备注
选择排序O(N^2)O(1)不稳定{5,5,5,3} 3和第一个5交换,不稳定
冒泡排序O(N^2)O(1)稳定 
插入排序O(N^2)O(1)稳定{3,4,4,5}新插入元素4,不可以越过与其相等元素的左边,即元素相等的话,只会排在相等区域的最后位置
归并排序O(N*logN)O(N)稳定{1,1,2,2}{1,1,2,2}左边和右边进行比较拼接的时候,先拷贝左边的元素,再拷贝右边的元素
快速排序O(N*logN)O(logN)不稳定{3,4,5,6,6,6,6,6,|2,333}  2会和第一个6进行交换,打破了相对次序
堆排序O(N*logN)O(1)不稳定树状结构,{5,5,5,5,6}第一个5会和6交换,不稳定
桶排序(基数/计数)O(N)O(M)稳定非比较
  • 归并、快排、和堆排序最为关键;不在乎稳定性的前提小,使用快速排序最好,时间最快(实验可知);需要稳定性的话,使用归并排序;在乎额外空间的话,使用堆排序

常见的坑

  • 归并排序的额外空间复杂度可以变为O(1),但是会失去稳定性的优势,详见《归并排序,内部缓冲法》
  • 原地归并排序,很垃圾,会将时间复杂度变成O(N^2)
  • 快速排序也可以做到稳定性,但是非常难,详见《01 stable sort》
  • 所有的改进都不重要  目前没有 时间复杂度为O(N*logN) 额外空间复杂度为  O(1) 又稳定的排序
  • 将一个数组中,所有的奇数移到数组的左边,所有的偶数移到数组的右边。保持相对次序不变的同时,要是时间复杂度为O(N),空间复杂度为O(1)。这个没法做😂😂😂😂

对于排序的改进优化

  • 充分利用O(N*logN)和O(N^2)的排序的各自优势
  • 数据规模很大的时候使用快速排序,当数据规模减少,数据项在60以内的时候,该换成插入排序,同时使用快速和插入两种方法,能进一步提高效率,减少时间复杂度。

稳定性考虑

  • 如果输入的数据是基础类型,使用快速排序;如果输入的类型是自定义的类型,使用插入、归并这些可以保证稳定性的排序方法
  • Java里面自带的排序算法,即array.sort,如果是常规类型,比如int的话是使用快速排序,提高速度;如果是自定义的类型,比如学生的年龄,结构体定义的字段,会使用桶排序,保证比较的稳定性。即算法看重时间复杂度 空间复杂度和稳定性(数值相等的元素排序,保证先后次序不变)
  • 基础类型按照数值传递,非基础类型,比如自定义结构体按照引用传递,具体体现在integer这个类型,127相等,128就不等了。因为128以上就作为不同内存了,也就是按照引用比较了

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/447219.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

RTP概述

1.1. RTP是什么 RTP全名是Real-time Transport Protocol&#xff08;实时传输协议&#xff09;。它是IETF提出的一个标准&#xff0c;对应的RFC文档为RFC3550&#xff08;RFC1889为其过期版本&#xff09;。RFC3550不仅定义了RTP&#xff0c;而且定义了配套的相关协议RTCP&…

算法入门篇五 链表

牛客网 算法入门篇 判断一个链表是否为回文结构 给定一个单链表的头节点head&#xff0c;请判断这个链表是否为回文结构1->2->1&#xff0c;返回为True;1->2->3为False 思路&#xff1a; 1&#xff0c;遍历链表&#xff0c;将所有元素压入栈中&#xff0c;然后再…

实时流媒体编程基于Linux环境开发

一、流媒体简介 随着Internet的日益普及&#xff0c;在网络上传输的数据已经不再局限于文字和图形&#xff0c;而是逐渐向声音和视频等多媒体格式过渡。目前在网络上传输音频/视频&#xff08;Audio/Video&#xff0c;简称A/V&#xff09;等多媒体文件时&#xff0c;基本上只有…

算法入门篇六 二叉树

牛客网 算法入门篇 左程云老师 个人复习&#xff0c;如果侵全&#xff0c;设为私密 二叉树遍历&#xff08;递归&#xff09; 先序遍历&#xff08;中&#xff0c;左&#xff0c;右&#xff09; 中序遍历&#xff08;左&#xff0c;中&#xff0c;右&#xff09; 后序遍历&a…

算法入门篇七 前缀树

牛客网 左程云老师的算法入门课 找二叉树的节点的后继节点 原则 如果节点有右子树&#xff0c;那么后继节点就是右子树的最左边的第一个节点如果节点没有右子树&#xff0c;如果节点是父节点的右孩子&#xff0c;就继续往上找&#xff0c;直到找到一个父节点是沿途节点的父节…

算法入门篇八 贪心算法

牛客网 左程云老师的算法入门课 贪心算法 贪心算法的解题步骤 例子 题目要求 解题策略 按照结束时间早的会议先安排&#xff0c;比如先安排【2&#xff0c;4】&#xff0c;当4结束了&#xff0c;所有开始时间小于4的全部淘汰&#xff0c;【1&#xff0c;7】、【3&#xff…

算法入门篇九 暴力递归

牛客网 左程云老师的算法入门课 暴力递归 原则 汉诺塔问题 问题 打印n层汉诺塔从左边移动到最右边的过程 思想 一共六个过程&#xff0c;左到右、左到中&#xff0c;中到左&#xff0c;中到右&#xff0c;右到左&#xff0c;右到中&#xff0c;互相嵌套使用 左到右 将1…

rtsp和sdp

RTSP 是由Realnetwork 和Netscape共同提出的如何有效地在IP网络上传输流媒体数据的应用层协议 。 实时流协议&#xff08;RTSP&#xff09;建立并控制一个或几个时间同步的连续流媒体&#xff0c;如音频和视频。尽管连续媒体流与控制流交叉是可能的&#xff0c;RTSP本身并不发…

使用javascript实现对于chineseocr的API调用

ChineseOCR在线API 网页地址 界面 提供多种接口调用方式&#xff0c;比如在线调用、Javascript api调用、curl api调用和python api调用四种方式&#xff0c;本次使用javascript api调用的方式进行OCR识别在线Javascript工具 在线工具网页链接在线Base64 转化工具 在线工具…

移动流媒体业务的技术与标准

1 引言   流媒体业务是从Internet上发展起来的一种多媒体应用&#xff0c;指使用流&#xff08;Streaming&#xff09;方式在网络上传输的多媒体文件&#xff0c;包括音频、视频和动画等。   流媒体传输技术的主要特点是以流&#xff08;streaming&#xff09;的形式进行多…

使用python实现对于chineseocr的API调用

ChineseOCR在线API 网页链接 界面 提供多种接口调用方式&#xff0c;比如在线调用、Javascript api调用、curl api调用和python api调用四种方式&#xff0c;本次使用javascript api调用的方式进行OCR识别在线Base64 转化工具 Base64在线小工具代码修改 新增一个变量fill_w…

算法入门篇十 图

图的存储方式 临接表临接矩阵 表达 点集/边集有向图/无向图 Graph&#xff08;大结构就是图&#xff09;&#xff08;包含点集合和边集合&#xff09; import java.util.HashMap; import java.util.HashSet;public class Graph {public HashMap<Integer, Node> nodes;…

超文本传输协议

超文本传输协议 超文本传输协议超文件传输协定(HTTP&#xff0c;HyperTextTransfer Protocol)是因特网上应用最为广泛的一种网络传输协定。所有的WWW文件都必须遵守这个标准。设计HTTP最初的目的是为了提供一种发布和接收HTML页面的方法。 目录 介绍请求信息请求方法安全方法超…

利用MFC调用libvlc.dll作一个简单的播放器

简单介绍MFC调用libvlc.dll作一个简单的播放器&#xff0c;抛砖引玉&#xff0c;各位VC达人继续深入研究&#xff0c;Jeremiah对VC确实不太感兴趣&#xff0c;所以就不做太深入的研究了。2009.10.29修改&#xff1a;加入clip_children属性设置。参开第1步。环境&#xff1a; …

使用Remix编写Solidity语言的小例子

设置数值/取数值/加法运算 讲解 uint默认使用256位数的整型view表示这个函数仅仅对于数据仅仅是读取&#xff0c;没有修改操作returns(uint )&#xff0c;如果单纯指定uint&#xff0c;返回的是函数体内的return值&#xff0c;如果包含uint sum,uint SAD_a&#xff0c;那么返…

RTP协议栈简介

流媒体指的是在网络中使用流技术传输的连续时基媒体&#xff0c;其特点是在播放前不需要下载整个文件&#xff0c;而是采用边下载边播放的方式&#xff0c;它是视频会议、IP电话等应用场合的技术基础。RTP是进行实时流媒体传输的标准协议和关键技术&#xff0c;本文介绍如何在L…

使用多线程的方式调用chineseocr_API

ChineseOCR在线API 网页链接 界面 提供多种接口调用方式&#xff0c;比如在线调用、Javascript api调用、curl api调用和python api调用四种方式&#xff0c;本次使用javascript api调用的方式进行OCR识别代码 import glob import base64 import os import requests import …

开源好代码 音视频

VirtualDub 一、简介 图1VirtualDub主界面 VirtualDub是一款开源的音视频捕获、处理软件。VirtualDub也可称为一款多媒体编辑软件&#xff0c;因为它包含了多媒体输入、编辑、处理、输出等各个环节&#xff0c;但是作者并未将它定位为一款多媒体编辑软件&#xff08;参见官网&a…

深入理解Solidity 二

Solidity数据位置 所有复杂的数据类型&#xff0c;即数组、结构和映射类型&#xff0c;都会有一个额外属性“数据位置”&#xff0c;用来指定数据的存储位置&#xff0c;即数据是存储在memory还是存储在storage里面根据上下文环境&#xff0c;IDE会自动指定数据的默认存储位置…

VOIP简介

一、什么是VOIP VOIP全称为&#xff08;VoiceOver Internet Protocol&#xff09;&#xff0c;是一种利用Internet网络进行语音通信的技术&#xff0c;更通俗一点说&#xff0c;就是IP电话。就是以IP分组交换网为传输平台&#xff0c;对模拟的语音信号进行编码压缩&#xff0c…