python 分位数计算代码_Python数据分析第十一节 数据运算

数据运算不仅仅是加减乘除的基本运算,还要包括数据的比较,汇总和相关性的计算等等,这一节我们将计算的问题帮大家汇总出来~

目录

一. 加减乘除运算

二. 比较运算

三. 汇总运算

  1. count 非空值计数

  2. sum 求和

  3. 其他(均值,最大最小值,中位数,众数,方差,标准差,分位数)

四. 相关性运算

9fc83fa7f16e8021bdee9aad696dcff3.png

一. 加减乘除运算

以下表为例:

41226ce766af57fc43f9645eda14c812.png

加法运算

我们需要生成新的一列“总和”,将四个季度的销售额相加:

decaa3d0809d2cb3651ff48902f2d93e.png

df['总和'] 表示生成新的一列,列名为“总和”

减法运算

我们看一下第二季度和第一季度销售额的差额,用第二季度减第一季度:

b368f27d756beedc8c8d0a4127291d30.png

乘法和除法的计算格式也是一样的,这里就不在具体举例说明。

二. 比较运算

这里介绍的比较,是指对比表格的两列大小之间的关系,输出的值为True 或者False,跟Excel中用IF 函数进行对比效果是一样的。

举例:比较是否第二季度销售额大于等于第一季度

56e9409c3c881d27182dc65f03b7b9e1.png

常用对比语句:

# 第一季度大于第二季度df['第一季度']>df['第二季度']# 第一季度不等于第二季度df['第一季度']!=df['第二季度']# 第一季度小于等于第二季度df['第一季度']<=df['第二季度']

三. 汇总计算

1. count 非空值计数

在python 中直接调用count()函数,返回的结果为该数据表中每列非空值的个数。具体实现如下所示:

d6e844bc363e58d7e5dc2007f3fdc366.png

上面是查看每一列非空值的个数,如果想要查看每一行的非空值个数又该怎么办呢?其实count()方法默认参数是axis=0,即查看每一列。查看每行只需要输入参数axis=1 即可:

edc186b78fb1de614e15477be572e549.png

当然,我们也可以查看具体某一列的非空值个数,比如我们想看一下第一季度这一列的非空值个数:

ad9c782812268075fbd505024ae446f2.png

2. sum 求和

在python中,直接在整个数据表上调用sum()函数,返回的是该数据表每一列的求和结果,例子如下所示:

fa74436c58b700dc568e67d386925db4.png

如果想对每一行进行求和,则需要在sum后面括号中输入axis=1即可。

当然只对某一列求和也是可以的,比如对第一季度求和,代码如下:

df['第一季度'].sum()

3. 其他

# 求均值df.mean()# 求最大值df.max()# 求最小值df.min()# 求中位数df.median()# 求众数df.mode()# 求方差df.var()# 求标准差df.std()# 求分位数# 1.求1/4分位数df.quantile(0.25)# 2.求2/4分位数df.quantile(0.5)# 3.求3/4分位数df.quantile(0.75)

四. 相关性运算

相关性常用来衡量两个事物之间的相关程度,我们一般用相关系数来衡量两者的相关程度,所以相关性计算就是计算相关系数,比较常用的是皮尔逊相关系数。

在python中求相关系数用的是corr()方法,例子如下:

e1de65b5769a68dd1c1c1d932f44808f.png

上面算出的是第一季度销售额和总销售额的相关性系数

我们还可以利用corr()函数算出两两之间的相关性,示例如下:

d646f4cc9ebd3564eb3bff1af4e45819.png

这样就生成了相关性系数的矩阵图!

?

长按关注公众号

欢迎留言交流

f427ae8f2d52fe90bce6e0ec57c51c51.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/464865.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

自己动手写一个 strace

这次主要分享一下一个动手的东西&#xff0c;就是自己动手写一个 strace 工具。用过 strace 的同学都知道&#xff0c;strace 是用来跟踪进程调用的 系统调用&#xff0c;还可以统计进程对 系统调用 的统计等。strace 的使用方式有两种&#xff0c;如下&#xff1a;strace 执行…

在Asp.net网页中使用接口

在开发Asp.net时&#xff0c;我们会经常有应用MasterPage或是WebUserControl。这样会遇上一个问题&#xff0c;需要在aspx去找MasterPage或是WebUserControl内的对象&#xff0c;或是从aspx传值给它们。比如一个WebUserControl被aspx调用之后&#xff0c;它产生的ID会随着aspx的…

xss绕过尖括号和双括号_xss挑战平台练习

-------------------------XSS挑战之旅-------------------------最近在学习xss&#xff0c;找到了一个xss练习平台&#xff0c;在线地址&#xff1a;http://test.xss.tv/实验环境也可以本地搭建&#xff0c;不过需要phpmysql的环境&#xff1a;xss通关小游戏&#xff1a;https…

上世纪八九十年代的收录放音机拆解

头条看到刘工发的收录放音机美图&#xff0c;发上来大家回忆下&#xff0c;大家跟这些老古董有什么故事&#xff1f;推荐阅读&#xff1a;专辑|Linux文章汇总专辑|程序人生专辑|C语言我的知识小密圈关注公众号&#xff0c;后台回复「1024」获取学习资料网盘链接。欢迎点赞&…

String in Java

转载于:https://www.cnblogs.com/ywxt/p/java_string.html

dfs hdfs 修改文件名称_CDH6.3.2生产更换HDFS 数据目录

事情是这样的&#xff0c;楼主刚入职一家新公司&#xff0c;刚开始搭建的集群时ecs只有一个系统盘&#xff0c;集群安装完成运行几天后&#xff0c;分分钟就要爆了&#xff0c;于是申请增加磁盘&#xff0c;就有了下面的操作&#xff0c;生怕操作失误&#xff0c;集群挂了&…

c++thread里暂停线程_多线程技术

1.程序程序(Program)”是一个静态的概念&#xff0c;一般对应于操作系统中的一个可执行文件&#xff0c;比如&#xff1a;我们要启动酷狗听音乐&#xff0c;则对应酷狗的可执行程序。当我们双击酷狗&#xff0c;则加载程序到内存中&#xff0c;开始执行该程序&#xff0c;于是产…

出差CVTE

去CVTE和连总吃饭周一晚上11点&#xff0c;我给我们领导打电话&#xff0c;说有个问题一定要去CVTE。晚上到家的时候是12点多&#xff0c;没洗澡&#xff0c;我跟小云说我早上要6点起来去广州&#xff0c;小云问我说去广州干嘛&#xff0c;我说&#xff0c;去出差解决问题。​然…

html实现 左图右文_让CSS flex布局最后一行左对齐的N种方法

作者&#xff1a;张鑫旭https://www.zhangxinxu.com/wordpress/2019/08/css-flex-last-align/前言小伙伴们是否还记得&#xff0c;之前小编也发布了几篇关于CSS相关文章不妨一起来回顾回顾&#xff1a;《手把手整理CSS3知识汇总【思维导图】》《关于前端CSS写法104个知识点汇总…

定位到元素后获取其属性_Selenium界面自动化测试(4)(Python):元素定位及操作...

在操作Web元素之前&#xff0c;需要先找到该元素&#xff0c;这个查找的过程称之为元素定位。Selenium支持8种元素定位方法&#xff1a;ID&#xff1a;根据元素的id属性值来定位元素。Name&#xff1a;根据元素的name属性值来定位元素。Class Name&#xff1a;根据元素的class属…

芯片公司急聘嵌入式软件精英人才

薪酬待遇及联系方式薪酬待遇&#xff1a;40~150万不等&#xff0c;另有股票期权等&#xff0c;待遇丰厚&#xff0c;详细面议工作地点&#xff1a;北京市朝阳区联系人&#xff1a;杨先生微信&#xff1a;MichaelYao7PS&#xff1a;推荐成功入职者有推荐费嵌入式软件工程师岗位职…

这一年就要过去

「远方钟声响起&#xff0c;这一年就要过去&#xff0c;快乐时光不停留......」楠哥从幼儿园新学习了一首新年小曲。今年已经是12月份了&#xff0c;2021年就要结束&#xff0c;即将到来的是2022年的新的一年。2021年这一年里非常感谢读者的一路支持&#xff0c;当然这不是一篇…

unc 隐藏共享文件夹_你真的了解任务栏吗?win10任务栏居然隐藏了这么多小窍门...

平常使用电脑&#xff0c;最常用的是桌面&#xff0c;桌面上最常用的大约是任务栏&#xff0c;但是你真的了解任务栏吗&#xff1f;除了一小部分朋友熟悉之外&#xff0c;大部分人估计都是没有留意到&#xff0c;其实任务栏就功能角度来说&#xff0c;的确算一个宝藏之地。什么…

手机充电IC设置电流与实测电流不一致问题剖析

大家好&#xff0c;我是写代码的篮球球痴&#xff0c;转一篇我朋友记得诚的文章本文转载来自一位基带大佬&#xff0c;解决问题的思路很重要。原文链接&#xff1a;https://blog.csdn.net/AirCity123/article/details/104428325?spm1001.2014.3001.5502某手机的充电架构如下&a…

Spring系列(六) Spring Web MVC 应用构建分析

DispatcherServlet DispatcherServlet 是Spring MVC的前端控制器名称, 用户的请求到达这里进行集中处理, 在Spring MVC中, 它的作用是为不同请求匹配对应的处理器, 将结果传递给视图解析器最终呈现给客户端. 前端控制器模式&#xff08;Front Controller Pattern&#xff09;是…

做个好人,加个晚班

我和建平在腾讯加班的日子前几天&#xff0c;他让我给他发照片&#xff0c;因为公司里年末要发照片墙&#xff0c;他说要把我的和他的照片放上去&#xff0c;然后我硬是找了几张觉得不错的给他&#xff0c;然后他也真的放上去了。再看那些照片&#xff0c;拍出来的效果都不咋样…

中ridge_10种线性代数在数据科学中的强大应用(内附多种资源)

原文选自 | Analytics Vidhya作者 | Khyati Mahendru本文转载自 TalkingData数据学堂 &#xff0c;未经允许禁止转载本文摘要线性代数为各种各样的数据科学算法和应用提供支持在这里&#xff0c;我会向您介绍通过线性代数帮助您成为更好的数据科学家的10种实际应用我们已将这些…

语言与golang语言运行速度_Golang语言情怀第13期 Go 语言设计模式 介绍

设计模式是什么俗话说&#xff1a;站在别人的肩膀上&#xff0c;我们会看得更远。设计模式的出现可以让我们站在前人的肩膀上&#xff0c;通过一些成熟的设计方案来指导新项目的开发和设计&#xff0c;以便于我们开发出具有更好的灵活性和可扩展性&#xff0c;也更易于复用的软…

苦练IoT应用开发,还能加速变现,这个机会别错过

都说人间大事&#xff0c;不过吃喝二字。厨房经济近年来显示出了巨大发展潜力&#xff0c;智能厨电已成为潮流趋势。智慧厨电究竟是如何——让厨房小白做出一顿可口大餐&#xff1f;让懒人摆脱厨房油烟和洗碗的困扰&#xff1f;让怕冷的人喝到永远55℃的热水&#xff1f;……在…

android人脸识别demo_零门槛解决Windows人脸识别应用开发难题

自人脸识别免费SDK——ArcFace3.0上线以来&#xff0c;凭借对人脸识别、活体检测、年龄检测、性别检测等核心算法模型进行全面升级&#xff0c;大幅提升算法鲁棒性&#xff0c;显著降低接入门槛&#xff0c;同时支持Windows、iOS、Android&#xff08;包含Android10&#xff09…