数据结构——排序算法——计数排序

计数排序就是一种时间复杂度为 O(n) 的排序算法,该算法于 1954 年由 Harold H. Seward 提出。在对一定范围内的整数排序时,它的复杂度为 O(n+k)(其中 k 是整数的范围大小)。

伪计数排序

我们需要对一列数组排序,这个数组中每个元素都是 [1,9] 区间内的整数。那么我们可以构建一个长度为 9 的数组用于计数,计数数组的下标分别对应区间内的 9 个整数。然后遍历待排序的数组,将区间内每个整数出现的次数统计到计数数组中对应下标的位置。最后遍历计数数组,将每个元素输出,输出的次数就是对应位置记录的次数。

void countingSort9(std::vector<int>& arr) {// Create an array of length 9, where indices 0-8 correspond to numbers 1-9//建立长度为 9 的数组,下标 0~8 对应数字 1~9std::vector<int> counting(9, 0);// Iterate through each element in the input array//建立长度为 9 的数组,下标 0~8 对应数字 1~9for (int element : arr) {// Count the occurrences of each integer and store them in the counting array//建立长度为 9 的数组,下标 0~8 对应数字 1~9counting[element - 1]++;}int index = 0;// Iterate through the counting array and output each element//遍历计数数组,将每个元素输出for (int i = 0; i < 9; i++) {// Output each element as many times as it appears in the input//遍历计数数组,将每个元素输出while (counting[i] != 0) {arr[index++] = i + 1;counting[i]--;}}
}

算法非常简单,但这里的排序算法 并不是 真正的计数排序。因为现在的实现有一个非常大的弊端:排序完成后,arr 中记录的元素已经不再是最开始的那个元素了,他们只是值相等,但却不是同一个对象。

在纯数字排序中,这个弊端或许看起来无伤大雅,但在实际工作中,这样的排序算法几乎无法使用。因为被排序的对象往往都会携带其他的属性,但这份算法将被排序对象的其他属性都丢失了。

伪计数排序 2.0

对于这个问题,我们很容易想到一种解决方案:在统计元素出现的次数时,同时把真实的元素保存到列表中,输出时,从列表中取真实的元素。

void countingSort9(std::vector<int>& arr) {// Create an array of length 9, where indices 0-8 correspond to numbers 1-9// 建立长度为 9 的数组,下标 0~8 对应数字 1~9std::vector<int> counting(9, 0);// Record the actual elements at each index, using a queue to maintain stability//记录每个下标中包含的真实元素,使用队列可以保证排序的稳定性std::unordered_map<int, std::queue<int>> records;// Iterate through each element in the input array//遍历 arr 中的每个元素for (int element : arr) {// Count the occurrences of each integer and store them in the counting array// 将每个整数出现的次数统计到计数数组中对应下标的位置counting[element - 1]++;// Initialize a queue for each unique element if it doesn't exist//初始化每个唯一元素的队列(如果不纯在)if (records.find(element - 1) == records.end()) {records[element - 1] = std::queue<int>();}// Add the element to the corresponding queue//将元素添加到相应的队列records[element - 1].push(element);}int index = 0;// Iterate through the counting array and output each element// 遍历计数数组,将每个元素输出for (int i = 0; i < 9; i++) {// Output the element as many times as it appears in the input//输出的次数就是对应位置记录的次数while (counting[i] != 0) {// Output the actual element from the queue//输出的次数就是对应位置记录的次数arr[index++] = records[i].front();records[i].pop();counting[i]--;}}
}

在这份代码中,我们通过队列来保存真实的元素,计数完成后,将队列中真实的元素赋到 arr 列表中,这就解决了信息丢失的问题,并且使用队列还可以保证排序算法的稳定性。

但是,这也不是 真正的计数排序,计数排序中使用了一种更巧妙的方法解决这个问题

真正的计数排序

举个例子,班上有
10 名同学:他们的考试成绩分别是:7,8,9,7,6,7,6,8,6,6,他们需要按照成绩从低到高坐到 0~9 共 10 个位置上。
用计数排序完成这一过程需要以下几步:
1.第一步仍然是计数,统计出: 4名同学考了 6 分,3名同学考了 7分,2名同学考了 8 分,1名同学考了9分;
2.然后从头遍历数组: 第一名同学考了7分,共有 4个人比他分数低,所以第一名同学坐在 4 号位置(也就是第5个位置)
3.第二名同学考了 8 分,共有 7 个人 (4 + 3) 比他分数低,所以第二名同学坐在 7 号位置;
4.第三名同学考了 9分,共有 9 个人 (4 + 3 + 2)比他分数低,所以第三名同学坐在 9 号位置;
5.第四名同学考了7分,共有 4 个人比他分数低,并且之前已经有一名考了 7分的同学坐在了 4 号位置,所以第四名同学坐在5号位置。
6…依次完成整个排序

区别就在于计数排序并不是把计数数组的下标直接作为结果输出,而是通过计数的结果,计算出每个元素在排序完成后的位置,然后将元素赋值到对应位置

void countingSort(std::vector<int>& arr) {// Check for empty or single-element array//判空及防止数组越界if (arr.empty() || arr.size() <= 1) return;// Find the maximum and minimum values in the array//找到最大值,最小值int max = arr[0];int min = arr[0];for (int i = 1; i < arr.size(); i++) {if (arr[i] > max) max = arr[i];else if (arr[i] < min) min = arr[i];}// Determine the counting array size//确定计数范围int range = max - min + 1;// Create a counting array of length 'range'//建立长度为 range 的数组,下标 0~range-1 对应数字 min~maxstd::vector<int> counting(range, 0);// Iterate through the input array and count the occurrences of each element//遍历 arr 中的每个元素for (int element : arr) {// 将每个整数出现的次数统计到计数数组中对应下标的位置,这里需要将每个元素减去 min,才能映射到 0~range-1 范围内counting[element - min]++;}// Calculate the cumulative counts//记录前面比自己小的数字的总数int preCounts = 0;for (int i = 0; i < range; i++) {// 当前的数字比下一个数字小,累计到 preCounts 中preCounts += counting[i];// 将 counting 计算成当前数字在结果中的起始下标位置。位置 = 前面比自己小的数字的总数。counting[i] = preCounts - counting[i];}// Create a result arraystd::vector<int> result(arr.size());// Place elements in the result array according to their countsfor (int element : arr) {// counting[element - min] 表示此元素在结果数组中的下标result[counting[element - min]] = element;// 更新 counting[element - min],指向此元素的下一个下标counting[element - min]++;}// Copy the sorted result back to the original array//将结果赋值返回arrfor (int i = 0; i < arr.size(); i++) {arr[i] = result[i];}
}

倒序遍历的计数排序

void countingSort(std::vector<int>& arr) {// Check for empty or single-element array//判空及防止数组越界if (arr.empty() || arr.size() <= 1) return;// Find the maximum and minimum values in the array//找到最大值,最小值int max = arr[0];int min = arr[0];for (int i = 1; i < arr.size(); i++) {if (arr[i] > max) max = arr[i];else if (arr[i] < min) min = arr[i];}// Determine the counting array size//确定计数范围int range = max - min + 1;// Create a counting array of length 'range'//建立长度为 range 的数组,下标 0~range-1 对应数字 min~maxstd::vector<int> counting(range, 0);// Iterate through the input array and count the occurrences of each element//遍历 arr 中的每个元素for (int element : arr) {// 将每个整数出现的次数统计到计数数组中对应下标的位置,这里需要将每个元素减去 min,才能映射到 0~range-1 范围内counting[element - min]++;}//每个元素在结果数组中的最后一个下标位置 = 前面比自己小的数字的总数 + 自己的数量 - 1。我们将 counting[0] 先减去 1,后续 counting 直接累加即可//记录前面比自己小的数字的总数counting[0]--;for (int i = 1; i < range; i++) {// 将 counting 计算成当前数字在结果中的最后一个下标位置。位置 = 前面比自己小的数字的总数 + 自己的数量 - 1// 由于 counting[0] 已经减了 1,所以后续的减 1 可以省略。counting[i] +=  counting[i-1];}// Create a result arraystd::vector<int> result(arr.size());// 从后往前遍历数组,通过 counting 中记录的下标位置,将 arr 中的元素放到 result 数组中for (int i = arr.size() - 1; i >= 0; i--) {// counting[arr[i] - min] 表示此元素在结果数组中的下标result[counting[arr[i] - min]] = arr[i];// 更新 counting[arr[i] - min],指向此元素的前一个下标counting[arr[i] - min]--;}// Copy the sorted result back to the original array//将结果赋值返回arrfor (int i = 0; i < arr.size(); i++) {arr[i] = result[i];}
}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/78449.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

RCP-第2章 ROS+Matlab

RCP系列文章 第一章 Matlab安装 第2章 ROSMatlab Matlab安装 RCP系列文章前言一、Matlab 获取二、安装1.解压10.软件安装中&#xff08;我的电脑大约需要10分钟&#xff09;12.完成) 三、破解1.打开安装包解压后的【R2018b(64bit)】中的【Crack】文件夹2.全选该文件夹下所有文…

机器学习基础之《分类算法(6)—决策树》

一、决策树 1、认识决策树 决策树思想的来源非常朴素&#xff0c;程序设计中的条件分支结构就是if-else结构&#xff0c;最早的决策树就是利用这类结构分割数据的一种分类学习方法 2、一个对话的例子 想一想这个女生为什么把年龄放在最上面判断&#xff01;&#xff01;&…

APP备案您清楚了吗?

根据近日工业和信息化部发布的《工业和信息化部关于开展移动互联网应用程序备案工作的通知》要求&#xff0c;在中华人民共和国境内从事互联网信息服务的APP主办者&#xff0c;应当依照《中华人民共和国反电信网络诈骗法》《互联网信息服务管理办法》&#xff08;国务院令第292…

Java时间复杂度和空间复杂度(详解)

目录 1.复杂度分析 2.时间复杂度 大O的渐进表示法 3.空间复杂度 1.复杂度分析 当我们设计一个算法时&#xff0c;怎样衡量其好坏&#xff1f; 算法在编写为可执行程序后&#xff0c;运行时需要耗费时间资源和空间&#xff08;内存&#xff09;资源。因此&#xff0c;衡量一…

springboot+vue上传图片

这里是一个简单的示例&#xff0c;演示了如何在Spring Boot中从Vue.js上传图像&#xff1a; 1.前端Vue.js代码&#xff1a; <template><div><input type"file" change"handleFileUpload"><button click"uploadImage">…

java复习-线程的同步和死锁

线程的同步和死锁 同步问题引出 当多个线程访问同一资源时&#xff0c;会出现不同步问题。比如当票贩子A&#xff08;线程A&#xff09;已经通过了“判断”&#xff0c;但由于网络延迟&#xff0c;暂未修改票数的间隔时间内&#xff0c;票贩子B&#xff08;线程B&#xff09;…

SpringBoot-线程池ThreadPoolExecutor异步处理(包含拆分集合工具类)

ThreadPoolExecutor VS ThreadPoolTaskExecutor ThreadPoolTaskExecutor是对ThreadPoolExecutor进行了封装处理。 配置文件application.yml # 异步线程配置 自定义使用参数 async:executor:thread:core_pool_size: 10max_pool_size: 100 # 配置最大线程数queue_capacity: …

【css面试题】 实现一个盒子的水平竖直居中对齐效果

面试题里有时还会强调 子盒子宽高是否已知&#xff0c;要注意一下 尝试一&#xff1a;给父盒子设置padding 或者子盒子设置margin <style>.father{width: 300px;height: 200px;overflow: hidden; /* 放坑爹现象&#xff0c;不信你删了试试 */background-color: #db7b7b…

61、SpringBoot -----跨域资源的设置----局部设置和全局设置

★ 跨域资源共享的意义 ▲ 在前后端分离的开发架构中&#xff0c;前端应用和后端应用往往是彻底隔离的&#xff0c;二者不在同一个应用服务器内、甚至不再同一台物理节点上。 因此前端应用和后端应用就不在同一个域里。▲ 在这种架构下&#xff0c;前端应用可能采用前端框架&a…

【驱动开发】实现三盏灯的控制,编写应用程序测试

head.h #ifndef __HEAD_H__ #define __HEAD_H__//LED1:PE10 //LED2:PF10 //LED3:PE8#define LED_RCC 0X50000A28 //使能GPIO#define LED_MODER 0X50006000 //设置输出模式 #define LED_ODR 0X50006014 //设置输出高低电平#define LED2_MODER 0X50007000 …

【分布式计算】六、命名机制 Naming

1.基本思想&#xff1a;用于标记分布式系统中的实体 2.pure name:1、不能代表全部&#xff0c;随机字符串2、仅用于比较 3.identifier(ID)&#xff1a;一个ID对应一个实体、一个实体对应一个实体、ID永远对应同一实体 4.无层次命名&#xff08;Flat Naming&#xff09;   a.非…

JVM调优的GC日志观察解读

如果各项参数设置合理&#xff0c;系统没有超时日志出现&#xff0c;GC 频率不高&#xff0c;GC 耗时不高&#xff0c;那么没有必要进行 GC 优化 如果 GC 时间超过 1-3 秒&#xff0c;或者频繁 GC&#xff0c;则必须优化。 一、参数解读 Jvm 调优典型参数设置; -Xms: 堆内存的…

NEDC、WLTC、CLTC,三种汽车能源消耗测试标准有什么区别?

NEDC、WLTC、CLTC,三种汽车能源消耗测试标准有什么区别? 参考链接:https://cj.sina.com.cn/articles/view/1677177940/63f7b454027018pu2 2023 年 1 月,抱着对先进新能源汽车的数码设备充电配置兴趣,小编抽空参观了第二十届广州国际车展,详细可以看这篇稿件《走马观花逛广…

【5种数据结构的操作】RedisTemplate模版类!

RedisTemplate 是 Spring Data Redis 提供的一个操作 Redis 的模板类&#xff0c;它封装了 Redis 的操作&#xff0c;方便开发者进行 Redis 缓存操作。 可以使用Autowired注解直接调用&#xff01;&#xff01;&#xff01; Autowired private RedisTemplate redisTemplate; …

VMware vCenter 从6.7跨版本升级至7.0U3N

本文尝试使用 vCenter Server Appliance 管理界面 (VAMI) 进行对vCenter Server Appliance7应用进行小版本升级&#xff0c;从6.7.0.47000升级到7.0.3.01600&#xff08;7.0U3N&#xff09;。 一、升级前的准备工作 1、检查当前运行环境&#xff08;当前为6.7.0.47000&#x…

Git:git clone 之 --recursive 选项

在git的repo中&#xff0c;可能会有子项目的代码&#xff0c;也就是"git中的git" --recursive是递归的意思&#xff0c;不仅会git clone当前项目中的代码&#xff0c;也会clone项目中子项目的代码。 我们有时在git clone的时候漏掉 --recursive选项&#xff0c;导致编…

【办公自动化】用Python批量从上市公司年报中获取主要业务信息

&#x1f935;‍♂️ 个人主页&#xff1a;艾派森的个人主页 ✍&#x1f3fb;作者简介&#xff1a;Python学习者 &#x1f40b; 希望大家多多支持&#xff0c;我们一起进步&#xff01;&#x1f604; 如果文章对你有帮助的话&#xff0c; 欢迎评论 &#x1f4ac;点赞&#x1f4…

python3 重启docker方法

一、工作中的问题 工作中进行测试时&#xff0c;需要修改nacos配置&#xff0c;修改完成后再重启对应的docker容器&#xff0c;让配置生效&#xff0c;研究了下&#xff0c;使用docker库可以做到。 如何修改nacos配置可以参见我的另一篇文章&#xff0c;传送门 python3 修改…

软件测试行业已经卷到什么程度了?

近几个月经常听到IT行业的人员吐槽找工作难的事情&#xff0c;特别是找软件测试工作相比前几年难了很多&#xff0c;以前只要简历一挂网上&#xff0c;每天会接到好多个面试邀请电话&#xff0c;甚至两三天或者一周内就能把工作找好&#xff0c;而现在把简历投了个遍&#xff0…

10. 正则表达式匹配

10. 正则表达式匹配 class IsMatch:"""10. 正则表达式匹配https://leetcode.cn/problems/regular-expression-matching/description/"""def solution(self, s: str, p: str) -> bool:m, n len(s), len(p)memo [[-1] * n for _ in range(m)]…