python数据结构与算法分析_数据结构和算法分析

问题引出

假设有一道题目:有一组N个数而要确定其中第k个最大者,我们称之为选择问题,那么这个程序如何编写?最直观地,至少有两种思路:

1、将N个数读入一个数组中,再通过某种简单的算法,比如冒泡排序法,以递减顺序将数组排序,则第k个位置上的元素就是我们需要的元素

2、稍微好一些的做法,将k个元素读入数组并以递减顺序排序,接着将接下来的元素再逐个读入,当新元素被读到时,如果它小于数组中的第k个元素则忽略之,否则将其放到数组中正确的位置上,同时将数组中的一个元素挤出数组,当算法终止时,位于第k个位置上的元素作为答案返回

这两种算法都很简单,但是假设我们有一千万个元素的随机文件和k=5000000进行模拟将发现,两个算法尽管最终都可以给出正确答案,但是在合理时间内均无法结束。因此,这两种算法都不能被认为是好的算法,因为从实际角度出发,它们无法在合理的时间内处理输入的数据。

数据结构和算法分析的提出

在许多问题中,一个很重要的观念是:写出一个工作程序并不够。如果这个程序在巨大的数据集上运行,那么运行时间就变成了重要的问题,我们将在接下来的文章中看到对于大量的输入如何估计程序的运行时间,尤其是如何在未具体编码的情况下比较两个程序运行的时间。我们还将看到彻底改进程序速度以及确定程序瓶颈的方法,这些方法将使得我们能够发现需要我们集中精力努力优化的那些代码段。

那么,首先,先了解一下什么是数据结构和算法分析(特别指出,后文的例子均以Java代码编写)。

数据结构

数据结构是计算机存储、组织数据的方式,是指数据相互之间存在一种或多种特定关系的数据元素的集合。通常情况下,精心选择的数据结构可以带来更高的运行或者存储效率(这就是为什么我们要研究数据结构的原因),数据结构往往同高效的检索算法和索引技术相关。

常见的数据结构有数组、栈、队列、链表、树、散列等,这些数据结构将是本数据结构的分类中重点研究的对象。

算法分析

算法是为求解一个问题需要遵循的、被清楚指定的简单指令的集合。对于一个问题,一旦某种算法给定并且(以某种方式)被确定是正确的,那么重要的异步就是确定该算法将需要多少注入时间或空间等资源量的问题。如果:

1、一个问题的求解算法竟然需要长达一年时间,那么这种算法就很难有什么用处

2、一个问题需要若干个GB的内存的算法,在当前大多数机器上也是无法使用的

数学基础

无论是数据结构还是算法分析,都用到了大量的数学基础,下面将这些数学的基础简单总结一下:

1、指数

(1)XAXB = XA+B

(2)XA/XB = XA-B

(3)(XA)B = XABsi

(4)XN + XN = 2XN ≠ X2N

(5)2N + 2N = 2N + 1

2、对数

(1)XA = B当且仅当logxB = A

(2)logAB = logCB / logCA

(3)logAB = logA + logB,A>0且B>0

3、级数

(1)∑2i = 2N+1 - 1

(2)∑Ai = (AN+1 - 1) / (A - 1),若0i ≤ 1 / (1 - A)

4、模运算

如果N整除A、N整除B,那么就说A与B模N同余,记为A≡B(mod N)。直观地看,这意味着无论是A还是B被N去除,所得余数都是相同的,于是假如有A≡B(mod N),则:

(1)A + C ≡ B + C(mod N)

(2)AD ≡ BD (mod N)

时间复杂度

在计算机科学中,算法的时间复杂度是一个函数,它定量描述了该算法的运行时间。这是一个关于代表算法输入值的字符串的长度的函数,时间复杂度常用大O符号表述,不包括这个函数的低阶项和首项系数,使用这种方式时,时间复杂度可被称为是渐进的,他考察当输入值大小趋近无穷时的情况。

那么首先先看一个简单的例子,这里是计算Σi3的一个简单程序片段:

 1 public static void main(String[] args) 2 { 3 System.out.println(sum(5)); 4 } 5  6 public static int sum(int n) 7 { 8 int partialSum; 9 10 partialSum = 0;11 for (int i = 0; i <= n; i++)12 partialSum += i * i * i;13 14 return partialSum;15 }

对这个程序片段的分析是简单的:

1、声明不记入时间

2、第10行和都14行各占一个时间单元

3、第12行每次执行占用4个时间单元(两次乘法、一次加法和一次赋值),而执行N次共占用4N个时间单元

4、第11行在初始化i,测试i≤n和对i的自增都隐含着开销,所有这些总开销是初始化1个时间单元,所有的测试为N+1个时间单元,所有自增为N个时间单元,共2N+2个时间单元

忽略调用方法和返回值的开销,得到总量是6N+4个时间单元,按照最开始的定义不包括这个函数的低阶项和首项系数,因此我们说该方法的时间复杂度是O(N)。继而,我们顺便得出若干个一般法则:

法则一----for循环

一个for循环的运行时间至多是该for循环内部那些语句(包括测试)的运行时间乘以迭代的次数,因此假如一个for循环迭代N次,那么其时间复杂度应该为O(N)

法则二----嵌套for循环

从里向外分析这些循环,在一组嵌套循环内部的一条语句总的运行时间为该语句的运行时间乘以该组所有的for循环的大小的乘积,因此假如有以下代码:

 1 public static int mutliSum(int n) 2 { 3 int k = 0; 4 for (int i = 0; i < n; i++) 5 { 6 for (int j = 0; j < n; j++) 7 { 8 k++; 9 }10 }11 12 return k;13 }

则其时间复杂度应为O(N2)

法则三----顺序语句

将各个语句的运行时间求和即可,比如有以下代码:

 1 public static int sum(int n) 2 { 3 int k = 0; 4  5 for (int i = 0; i < n; i++) 6 k++; 7 for (int i = 0; i < n; i++) 8 { 9 for (int j = 0; j < n; j++)10 {11 k++;12 }13 }14 15 return k;16 }

第一个for循环的时间复杂度为N,第二个嵌套for循环的时间复杂度为N2,综合起来看sum方法的时间复杂度为O(N2)

常见的时间复杂度与时间效率的关系有如下的经验规则:

O(1) < O(log2N) < O(N) < O(N * log2N) < O(N2) < O(N3) < O(N!)

至于每种时间复杂度对应哪种数据结构和算法,后面都会讲到,从上面的经验规则来看:前四个算法效率比较高,中间两个差强人意,最后一个比较差(只要n比较大,这个算法就动不了了)。

46439991f5971e595aca3bfe15ae629a.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/505840.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

单片机与树莓派蓝牙连接_用树莓派玩转蓝牙

作者&#xff1a;Vamei 出处&#xff1a;http://www.cnblogs.com/vamei 严禁转载。蓝牙是一个使用广泛的无线通信协议&#xff0c;这两年又随着物联网概念进一步推广。我将介绍蓝牙协议&#xff0c;特别是低功耗蓝牙&#xff0c;并用树莓派来实践。树莓派3中内置了蓝牙模块。树…

禁止更改计算机名_计算机改名、加域脚本集合

windows计算机改名、改密码、设置ip、加域脚本集合今天和大家分享一下&#xff0c;如何将前面的改名加域整合在一起&#xff0c;根据选择执行对应的命令。新建txt文档&#xff0c;输入一下代码&#xff0c;另存为“自动加域脚本.bat”。echo offcolor 1Fmode con cols100 lines…

加载文件流_jvm类加载的过程

一个类从加载到虚拟机到使用结束从虚拟机卸载包括了加载、验证、准备、解析、初始化、使用、卸载&#xff0c;即为一个类的生命周期下面来看一下类加载的过程&#xff0c;即加载、验证、准备、解析、初始化5个阶段都做了什么事&#xff1a;阶段1&#xff1a;加载加载阶段虚拟机…

php 消息队列_消息队列篇——windows本地搭建RabbitMQ Server

前言&#xff1a;最近的PHP项目中有使用AMQP&#xff0c;解耦一些业务性的功能模块。因为工作使用的是线上Linux搭建&#xff0c;为了方便测试所以我决定本地搭建一个MQ服务。RabbitMQ简介&#xff1a;MQ全称为Message Queue, 消息队列(MQ)是一种应用程序对应用程序的通信方法。…

小程序底部弹窗css_微信小程序之animation底部弹窗动画(两种方法)

简单分享一下常用的底部弹窗层或下拉框弹出层(代码需要修改)的内容弹窗的动画效果&#xff0c;这里分享的是点击按钮后底部弹窗的动画效果。第一种方式是动态设置显示区域的高度&#xff0c;第二种方法是动态设置显示区域的移动的位置(使用到 transform:translateY )&#xff1…

js cookie 存储checkbox_浏览器数据存储方式总结,网友:“精辟”!

今天主要来讲下前端的数据存储&#xff0c;说起数据存储&#xff0c;大家肯定第一时间想起cookie&#xff0c;localstorage&#xff0c;sessionstorage&#xff0c;而其实还有userData和IndexedDB这两种数据存储&#xff0c;接下来将对它们进行一个比较详细的总结一、为什么要进…

mysql获取一个表的数据作为值插入_请问如何在mysql中得到一个即将插入数据表中的那条数据的id值(id自增长)?...

我们在写数据库程序的时候,经常会需要获取某个表中的最大序号数,一般情况下获取刚插入的数据的id&#xff0c;使用select max(id) from table 是可以的。但在多线程情况下&#xff0c;就不行了。下面介绍三种方法(1) getGeneratedKeys()方法:程序片断:Connection conn ;Serial…

navigator工具_Javascript常用工具类

就算现今是以框架为主流的前端&#xff0c;依然离不开JS&#xff0c;因为他是框架底层的一部分。我先上传代码截图(截图显示会更好看点)&#xff0c;截图后面有带源码(源码方便大家复制)。/** * 文件描述:js项目开发中的常用方法工具 * *//** * 全局常量 */var DEFAULT_LINE_KE…

tail将输出的日志放到文件中_如何将Spring Boot应用中日志输出格式改为JSON?

作者&#xff1a;DEV出自&#xff1a;解道JDON原文&#xff1a;jdon.com/55006今天&#xff0c;我们有了一类称为日志聚合系统的应用程序。当我们拥有大量微服务并且我们希望跨微服务跟踪日志时&#xff0c;日志聚合很有用。传统的Java应用程序日志如下所示&#xff1a;2020-09…

造轮子是什么意思_程序员为什么热衷于造轮子,升职加薪吗?

作者&#xff1a;小傅哥博客&#xff1a; https://bugstack.cn-沉淀、分享、成长&#xff0c;让自己和他人都能有所收获&#xff01;一、前言哪个架构师没造过轮子&#xff1f;你想过这样一件事吗&#xff1f; 是先具备能力在安排职位&#xff0c;还是先安排职位在学习&#xf…

阿里云 服务器 系统 php mysql_阿里云服务器配环境(Ubuntu 16.04+Nginx+MySQL+PHP)并部署hexo博客...

购买服务器阿里云向学生出售优惠价格的服务器&#xff0c;一个月只需9.5块&#xff0c;具体配置看图吧更新Ubuntu源&#xff0c;安装Git123sudo apt updatesudo apt upgradesudo apt-get install git配置Nginx安装Nginxsudo apt install nginx开启Nginx服务sudo service nginx …

python web开发项目 源码_Python + Flask 项目开发实践系列七

对于 Python Flask 这种灵活的web开发框架&#xff0c;在前面的六个系列文章中详细的进行了说明&#xff0c;主要讲到了页面的首页加载时的页面渲染&#xff0c;增加功能&#xff0c;删除功能&#xff0c;修改功能&#xff0c;查询功能&#xff0c;查询详情功能等一些页面常见…

回调函数 相当于线程_阿里面试题:请简述下 Node 的线程模型

前言如果你有一定的前端基础&#xff0c;比如 HTML、CSS、JavaScript、jQuery&#xff1b;那么&#xff0c;Node.js 能让你以最低的成本快速过渡成为一个全栈工程师(我称这个全栈为伪全栈&#xff0c;我认为的全栈也要精通数据库&#xff0c;不喜勿喷)&#xff0c;从而触及后端…

微信小程序 本地mysql_微信小程序系列之使用缓存在本地模拟服务器数据库

微信小程序系列之使用缓存在本地模拟服务器数据库现在将data.js这个文件视作是本地数据库的初始化数据&#xff0c;要做的第一件事就是讲这些初始化数据装进缓存中&#xff0c;以形成数据库的初始化数据整个应用程序的生命周期&#xff0c;类比一下页面的生命周期&#xff0c;在…

jvm垃圾回收机制_JVM 垃圾回收机制之堆的分代回收

JVM垃圾回收机制之堆的分代回收前言前文我们了解了Java的GC机制&#xff0c;对于堆中的对象&#xff0c;JVM采用引用计数和可达性分析两种算法来标记对象是否可以清除&#xff0c;本文中我们还会了解到JVM将对分成了不同的区域&#xff0c;以便于更好的回收对象。堆的分代Java的…

roadhog不是内部或外部命令_git:git 不是内部或外部命令,也不是可运行的程序

出现git 不是内部或外部命令&#xff0c;也不是可运行的程序解决方案&#xff1a;Windows下配置Git1、从git官网下载windows版本的git&#xff1a;http://git-scm.com/downloads或是从该链接下载对应版本&#xff1a;https://github.com/git-for-windows/git/releases/tag/v2.1…

前端设定项目奖金有多少_【系列二】建筑工程项目激励模式探讨

​​建筑工程一般以项目制的形式运作&#xff0c;如何在这种“一次性”的组织形式下&#xff0c;确保项目符合质量、安全、进度等方面的要求&#xff0c;并确保项目的经济效益&#xff0c;对项目人员实施恰当的项目激励是关键。我们认为&#xff0c;建筑工程项目的激励主要包括…

xss过滤器无法处理ajax请求_thunkPHP 预防XSS攻击

比如在有人恶意在你的输入框中或文本域中输入<script>标签&#xff0c;如果不做处理的话&#xff0c;输入框中的<script>会保存到我们数据库中&#xff0c;等到将这个数据拿出来展示的时候&#xff0c;就等于将这个内容放入到了html代码中&#xff0c;那么这个<…

mysql bcmod_nextcloud网盘搭建:Ubuntu18.04+Nginx+Mysql

背景前几天在windows系统上搭建了一个seafile网盘服务器&#xff0c;在试用时对它的功能还是比较满意的&#xff0c;有保存文件&#xff0c;共享文件&#xff0c;小组讨论和小组文件共享等功能&#xff0c;基本上可以满足项目式学习的需求。不过在第一节课上课试用时(一个班大概…

mysql mode_MYSQL中的sql_mode模式

mysql数据库的中有一个环境变量sql_mode,定义了mysql应该支持的sql语法&#xff0c;数据校验等&#xff01;我们可以通过以下方式查看当前数据库使用的sql_mode&#xff1a;mysql>select sql_mode一&#xff0c;sql_mode值的含义ONLY_FULL_GROUP_BY对于GROUP BY聚合操作&…