【漫画版】指挥官的排序战术:快速排序算法解密

作者介绍:10年大厂数据\经营分析经验,现任字节跳动数据部门负责人。
会一些的技术:数据分析、算法、SQL、大数据相关、python,欢迎探讨交流
欢迎加入社区:码上找工作
作者专栏每日更新:
LeetCode解锁1000题: 打怪升级之旅
python数据分析可视化:企业实战案例
漫画版算法详解
python源码解读
程序员必备的数学知识与应用

背景设定

现在你是一名军官,负责一个小队的战斗准备。小队有6名士兵,每个人的战斗力不同。为了最大化战斗效率,你需要根据士兵们的战斗力将他们从小到大排序
在这里插入图片描述

排序过程

  • 角色引入:六名士兵名字标识为①-⑥分别站成一行,每人盾牌显示着他们的战斗力。数值分别是20, 15, 10, 30, 25, 5。队伍看起来很混乱,没有任何顺序。

在这里插入图片描述
这时候你需要让他们根据战斗力从小到大排序你会怎么做?

  • 决策时刻
    • 作为军官,你决定选取第一名士兵(战斗力20)作为基准(基准士兵)。你让他举起手来,所有人的目光都集中在他身上。

在这里插入图片描述

  • 你命令:“比20战斗力低的,到他左边!比20战斗力高的,到他右边!动作快!”

  • 行动实施

    • 士兵们开始移动。士兵们根据你的命令重新排列自己的位置。战斗力为15和10的士兵迅速站到了左边,而战斗力为30和25的士兵则跑到了右边。战斗力为5的士兵最后一个,也加入到了左边。

在这里插入图片描述

  • 最终,基准士兵走到中间,正确的位置上。

  • 递归排序

    • 你接着指挥左边的小队和右边的小队分别进行相同的排序操作。左边的小队(15, 10, 5)和右边的小队(30, 25)也需要找到各自的基准,然后再次排序。
    • 你对左边的小队说:“15,你是这次的基准!”然后重复之前的排序指令。
    • 右边的小队也同样,选取30作为基准。

结局

  • 通过一系列的命令和移动,最终所有士兵都按照战斗力从低到高成功排序。
  • 排序完成后,队伍看起来整齐划一,每个士兵都知道自己的位置。你作为军官,对完成的排序感到满意,小队的战斗准备现在看起来更有序,准备迎接即将到来的挑战。

在这里插入图片描述
以上过程你作为军官用的就是快速排序的算法,看着步骤少是因为你能直接知道每个人的战斗力,并且每个人也知道其他人的战斗力,所以大家很快能排序好,实际通过代码实现的话步骤会更多一些,需要有更多的对比,因为没有提前知道其他人战斗力的前提在。

算法介绍

快速排序是一种非常高效的排序算法,由托尼·霍尔在1960年发明。它是一种使用分治策略的递归排序算法,目的是将一个大列表分为两个小列表,小列表中的元素分别比另一列表的元素小,然后递归地排序这两个子列表。

快速排序的基本步骤包括:

  1. 选择基准值(Pivot Selection)
    快速排序首先从数组中选择一个元素作为基准值,选择方法有多种,可以是第一个元素、最后一个元素、中间元素,或者随机元素,下图使用第一个元素。

  2. 分区操作(Partitioning)
    通过重新排列数组,使得比基准值小的元素全部移动到基准值的左侧,而比基准值大的元素全部移动到基准值的右侧。这个操作结束时,基准值就处于数组的中间位置。这一过程称为分区(Partitioning)。

  3. 递归排序子数组(Recursively Sorting the Sub-arrays)
    递归地将左侧子数组和右侧子数组进行排序。递归的基准情形是子数组的大小为0或1,这时子数组已经达到完全排序。

代码示例

def quicksort(nums, left, right):"""递归执行快速排序,不断分割列表。参数:nums : list[int] -- 待排序的列表left : int -- 当前分割区域的左边界索引right : int -- 当前分割区域的右边界索引"""if left < right:pi = partition(nums, left, right)print(nums, left,pi)quicksort(nums, left, pi - 1)   # 递归排序基准左侧的部分quicksort(nums, pi + 1, right)  # 递归排序基准右侧的部分def partition(nums, left, right):"""对数组进行划分,返回基准值的最终位置。参数:nums : list[int] -- 待排序的列表left : int -- 当前分割区域的左边界索引right : int -- 当前分割区域的右边界索引返回:int -- 基准值的最终位置索引"""pivot = nums[left]  # 选择最左边的元素作为基准i = left + 1        # 将i初始化为基准右边的第一个元素j = right           # 将j初始化为最右边的元素while True:while i <= j and nums[i] <= pivot:       # i从左向右移动,直到找到一个大于基准的值i += 1while i <= j and nums[j] > pivot:        # j从右向左移动,直到找到一个小于基准的值j -= 1if i <= j:nums[i], nums[j] = nums[j], nums[i]  # 交换找到的两个值else:breaknums[left], nums[j] = nums[j], nums[left]    # 将基准值进行交换return j                                     # 返回基准值的位置# 测试代码
arr = [20, 15, 10, 25, 30, 5]
quicksort(arr, 0, len(arr) - 1)
print("Sorted array:", arr)

算法图解

partition1 按基准值进行左右分区
# 排序前 初始值
20, 15, 10, 25, 30,  5
# 第一次分区后 比基准值20小的在左边,比20大的在右边
5, 15, 10, 20, 25, 30

详细的动态GIF图参考,每个步骤变化时间2s,建议详细查看对比
在这里插入图片描述

partition2 递归排序左侧分区 5,15,10
# right = 3,指向20
quicksort(nums, left, pi - 1)   # 递归排序基准左侧的部分
# 第一次递归左分区 5,15,10
5, 15, 10, 20, 25, 30 
# 执行后还是返回 因为交换自己保持不变
5, 15, 10, 20, 25, 30
  1. i=1, 指向15,i 已经比基准值大,这时候保持=1不变
  2. j=2, 指向10,j 向左寻找比基准值小的值,这时候往左一直j=0的时候,这时候i>j,跳出循环
  3. j = left = 0,这时候5自己交换自己,这个步骤依然会执行
  4. 返回 j=0

在这里插入图片描述

partition3 递归排序左侧分区 15,10
# pi = 0,指向5
quicksort(nums, left, pi - 1)   # 递归排序基准左侧的部分
# 继续调用 quicksort,这时候 left < -1,不成立,所以走到右侧部分
quicksort(nums, pi + 1, right)# 5, 15, 10, 20, 25, 30 排序 15,10 后
5, 10 ,15, 20, 25, 30
  1. i=2, 指向10,向右移动,指向20
  2. j=2, 指向10,小于基准值15,保持不变
  3. i>j,交换j和基准值

在这里插入图片描述
4. 交换后返回j=2
在这里插入图片描述

partition4 递归排序右侧分区 25, 30

同上忽略

快速排序的算法性能

  • 时间复杂度

    • 最好情况:(O(n log n)),当分区操作能将列表均等划分时。
    • 平均情况:(O(n log n)),对于随机排列的数组。
    • 最坏情况:(O(n^2)),当数组已经接近排序完成或完全逆序时,每次分区只能减少一个元素。
  • 空间复杂度

    • 最坏情况下,由于递归调用的栈空间,空间复杂度为 (O(n))。
    • 通过尾递归优化,可以将空间复杂度降低到 (O(\log n))。

快速排序的优点与缺点

  • 优点

    • 平均情况下非常高效。
    • 排序是就地进行的,除了递归栈,不需要额外的存储空间。
    • 高度优化的快速排序通常比其他 (O(n \log n)) 算法更快。
  • 缺点

    • 最坏情况下的性能较差。
    • 递归导致的堆栈溢出。
    • 非稳定排序,即相等的元素的原始顺序可能会被打乱。

算法改进

基于快速排序存在的缺点,我们一起来探讨一下这些问题,并提供几种改进策略,包括代码示例。

快速排序的基本问题

  1. 最坏情况性能:当输入数组已经接近排序完成或完全逆序时,快速排序的性能退化到 (O(n^2))。这种情况发生在基准值选取不当时,如始终选择第一个元素作为基准值。

  2. 重复元素处理:当数组中存在大量重复元素时,快速排序可能会进行不必要的比较和交换,导致效率降低。

改进策略

1. 优化基准值选择

一个好的基准值选择可以最大限度地确保数组被均等地分割,从而优化递归的深度和效率。

  • 三数取中法
    从数组的第一个元素、中间元素和最后一个元素中选择中位数作为基准值。这种方法通常可以防止对已经部分排序的数组进行排序时的性能退化。
2. 尾递归优化

快速排序通常通过递归实现,递归调用会消耗额外的栈空间。优化递归调用可以减少栈空间的使用。

  • 尾递归
    总是先递归较小的子数组,然后使用尾递归(或循环)处理较大的子数组。这可以确保递归栈的最大深度尽可能小。
3. 小数组切换到插入排序

插入排序在小数组上表现更优,因为它的常数因子较小,简单且快速。

  • 混合排序策略
    当数组大小减少到某个阈值(通常是10-20)时,切换到插入排序。
4. 处理重复元素

大量重复元素会减慢快速排序的速度,因为它们增加了不必要的比较和交换。

  • 三向切分快速排序
    这种变体通过将数组切分为三部分来处理含有大量重复元素的数组:小于基准值的元素、等于基准值的元素、以及大于基准值的元素。

代码示例:改进的快速排序

以下是一个集成了这些改进策略的快速排序的Python实现:

import randomdef quicksort(arr, low, high):while low < high:if high - low < 16:  # 小数组使用插入排序insertion_sort(arr, low, high)breakelse:pivot_index = partition(arr, low, high)if pivot_index - low < high - pivot_index:quicksort(arr, low, pivot_index - 1)low = pivot_index + 1else:quicksort(arr, pivot_index + 1, high)high = pivot_index - 1def partition(arr, low, high):mid = (low + high) // 2pivot = sorted([arr[low], arr[mid], arr[high]])[1]pivot_index = arr.index(pivot)arr[pivot_index], arr[high] = arr[high], arr[pivot_index]i = lowfor j in range(low, high):if arr[j] <= pivot:arr[i], arr[j] = arr[j], arr[i]i += 1arr[i], arr[high] = arr[high], arr[i]return idef insertion_sort(arr, low, high):for i in range(low + 1, high + 1):key = arr[i]j = i - 1while j >= low and key < arr[j]:arr[j + 1] = arr[j]j -= 1arr[j + 1] = keyarray = [random.randint(0, 100) for _ in range(100)]
quicksort(array, 0, len(array) - 1)
print(array)

这段代码首先处理小数组的优化,并且使用三数取中法来选择基准值,以提高快速排序处理含有重复元素和部分排序数组的效率。此外,通过尾递归优化来减少栈深度。

快速排序的应用场景

快速排序适用于大数据集合,尤其是在平均性能很关键的场合。由于其就地排序的特性,也适合用于内存空间有限的系统。然而,对于小数组,其他 (O(n^2)) 的算法如插入排序可能更优,因此在实际应用中,快速排序常与其他排序算法结合使用。例如,在快速排序接近完成时切换到插入排序。

快速排序由于其优异的平均性能,广泛用于各种编程库和系统中,是处理大数据集的首选算法之一。

看完啦,如果本文对你有帮助,欢迎关注点赞,谢谢大家

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/9819.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

基于自我对弈框架的偏好优化算法SPPO

传统的从人类反馈中进行强化学习&#xff08;RLHF&#xff09;的方法仰赖如Bradley-Terry模型等参数模型,但这样的模型难以充分捕捉人类偏好中的非递移性和非理性。最新的研究进展显示,直接使用偏好机率可以更准确地反映人类偏好,从而实现更灵活、更精确的语言模型对齐。本文提…

教你解决PUBG绝地求生登不进去 无法进入游戏 启动很慢的问题

尽管《绝地求生》&#xff08;PUBG&#xff09;以它那扣人心弦的战术竞技和逼真模拟的战场氛围风靡全球&#xff0c;揽获无数玩家的喜爱&#xff0c;但一些玩家在经历了一场血脉喷张的生存较量后&#xff0c;却不得不面对一个不那么愉悦的后续&#xff1a;游戏在结算阶段后出现…

YOLOv5改进 | 注意力机制 | 理解全局和局部信息的SE注意力机制

在深度学习目标检测领域&#xff0c;YOLOv5成为了备受关注的模型之一。本文给大家带来的是能够理解全局和局部信息的SE注意力机制。文章在介绍主要的原理后&#xff0c;将手把手教学如何进行模块的代码添加和修改&#xff0c;并将修改后的完整代码放在文章的最后&#xff0c;方…

C语言/数据结构——每日一题(分割链表)

一.前言 今天在LeetCode觉得很不错&#xff0c;想和大家们一起分享这道链表题——分割链表&#xff1a;https://leetcode.cn/problems/partition-list-lcci废话不多说&#xff0c;让我们直接进入正题吧。 二.正文 1.1题目描述 1.2题目分析 大致思路&#xff1a;我们可以通过…

从头开始的建材类电商小程序开发指南

在当今数字化时代&#xff0c;小程序已经成为了许多企业推广和销售的重要渠道。对于建筑材料行业来说&#xff0c;开发一个属于自己的小程序商城不仅可以提升产品曝光度&#xff0c;还可以提供更好的用户购物体验。下面&#xff0c;我们将逐步教你如何开发建筑材料行业小程序。…

文章分享:《肿瘤DNA甲基化标志物检测及临床应用专家共识(2024版)》

本文摘自于《肿瘤DNA甲基化标志物检测及临床应用专家共识&#xff08;2024版&#xff09;》 目录 1. DNA甲基化标志物概述 2 DNA甲基化标志物的临床检测 2.1 临床样本前处理注意事项 2.2 DNA甲基化标志物检测技术方法 2.2.1 DNA提取与纯化 2.2.2 DNA转化 2.2.3 DNA 甲基…

翻工第二次 Ant Design Pro 下载,发现问题,电脑网络配置有误,魔法了

一、相关网址链接 鱼皮的用户中心项目 &#xff08;前端Ant Design Pro构建&#xff09; 语雀 ## 没有选择umi版本这一步 Issue #11144 ant-design/ant-design-pro GitHub 关于umi ui图标未显示问题_umi ui不出现-CSDN博客 二、存在问题 导致下载速度慢 本人镜像代码写…

AI实景模型无人自动直播助手.减少商家在短视频线上卖货的成本,开启无人直播新时代!

在互联网时代&#xff0c;直播已经成为信息传播的主流方式&#xff0c;尤其是在年轻人中&#xff0c;直播更是备受追捧。然而&#xff0c;对于许多想要尝试直播的人来说&#xff0c;缺乏合适的主播可能成为一大障碍。那么&#xff0c;面对这一难题&#xff0c;如何实现手机无人…

C++ 常量

常量是指在程序运行过程中&#xff0c;其值不能被改变的量。 如&#xff1a;i255;arearr3.14; 在程序中直接使用数值有两个问题&#xff1a; 可读性差&#xff1b; 可维护差&#xff1b; 一 符号常量 C语言符号常量的顶用形式如下&#xff1a; 二 C99的const常量 C 语言co…

【C++】学习笔记——优先级队列

文章目录 十、优先级队列1. priority_queue的介绍2. 优先级队列如何使小的数据优先级高3. 仿函数介绍4. priority_queue的模拟实现 补&#xff1a; 反向迭代器未完待续 十、优先级队列 1. priority_queue的介绍 优先级队列 其实也不属于队列&#xff0c;它跟 stack 和 queue …

NSS刷题

1、[SWPUCTF 2021 新生赛]gift_f12 打开题目后查看源码无发现&#xff0c;用f12发现flag 2、[GDOUCTF 2023]hate eat snake 打开链接是一个贪吃蛇小游戏&#xff0c;f12找到js文件中有一个speed的语句&#xff0c;该语句的作用是使速度增加&#xff0c;因此&#xff0c;将该语…

引用数据类型 栈内存 堆内存

let m { a: 10, b: 20 }; let n m; n.a 15; console.log(m.a) // 15 原因&#xff1a;基本数据类型存储在栈内存中&#xff0c;引用数据类型存储在堆内存中 &#xff0c;引用数据类型存储在堆内存中会在栈内存中创建一个指针&#xff0c;栈内存中的这个指针指向堆内存中的地…

SpringCloud生态体系介绍

Spring Cloud是一系列框架的有序集合。它利用Spring Boot的开发便利性巧妙地简化了分布式系统基础设施的开发&#xff0c;如服务发现注册、配置中心、智能路由、消息总线、负载均衡、断路器、数据监控等&#xff0c;都可以用Spring Boot的开发风格做到一键启动和部署。 SpringC…

linux上安装Jmeter环境

以前都是在Windows本机上使用界面版Jmeter&#xff0c;今天试一下安装到linux上在linux中使用&#xff0c;Jmeter的使用需要先安装jdk环境然后再配置jmeter。 1.配置环境 linux环境&#xff1a;Centos 8.2 64位 JDK版本&#xff1a;jdk-8u221-linux-x64.tar.gz &#xff08;…

数据中心法

数据中心法是实现词法分析器的结构化方法。通过设计主表和子表分开存储状态转移信息&#xff0c;实现词法分析器的控制逻辑和数据结构分离。 主要解决了状态爆炸、难以维护和复杂性的问题。 状态爆炸是指当状态和转移较多时&#xff0c;单一使用一个表来存储所有的信息的话会导…

YOLO数据集制作(一)|Labelme标注的矩形框json文件转txt

以下教程用于将使用Labelme软件标注生成的json格式文件转成YOLO使用的txt格式&#xff0c;适用场景&#xff1a;矩形框 使用方法&#xff1a;将json文件夹路径填到json_dir后&#xff0c; 将保存转化后txt的路径填入txt_dir后&#xff0c;运行即可转化。 运行完成后会生成label…

OpenAI 正在开发一种可以防止版权诉讼的工具

OpenAI 正在开发一种名为 Media Manager 的工具&#xff0c;该工具将使内容创建者和所有者能够确定他们是否愿意将自己的内容用于 ML 研究和 AI 模型训练。 Media Manager 将做什么&#xff1f; 明年推出的 Media Manager 将使内容创作者和所有者能够更好地控制他们的工作是否…

Oracle体系结构初探:闪回技术

在Oracle体系结构初探这个专栏中&#xff0c;已经写过了REDO、UNDO等内容。觉得可以开始写下有关备份恢复的内容。闪回技术 — Oracle数据库备份恢复机制的一种。它可以在一定条件下&#xff0c;高效快速的恢复因为逻辑错误&#xff08;误删误更新等&#xff09;导致的数据丢失…

岩点×数说故事×小红书 | 发布《中国攀岩行业分析报告》

从下班健身到下班攀岩&#xff0c;从“鸡娃”到岩馆“溜娃”&#xff0c;被奥运“正名”的攀岩运动&#xff0c;在国内熬过了萌芽阶段&#xff0c;悄然开出了花。2023年&#xff0c;各类重磅攀岩赛事重启、线下岩馆疯狂扩张&#xff0c;小众攀岩正式进入大众视野&#xff0c;风…

249 基于matlab的MED、OMEDA、MOMEDA、MCKD信号处理方法

基于matlab的MED、OMEDA、MOMEDA、MCKD信号处理方法。最小熵反褶积(MED)&#xff0c;最优最小熵反卷积调整卷积 (OMEDA),多点最优最小熵解卷积调整&#xff08;Multipoint Optimal Minimum Entropy Deconvolution Adjusted&#xff0c;MOMEDA&#xff09;&#xff0c;最大相关峭…