python做excel数据分析统计服_Python也能做到Excel那样，条件统计轻松解决工作需求...

python做excel数据分析统计服_Python也能做到Excel那样，条件统计轻松解决工作需求...

news/2025/4/21 12:44:55/文章来源:https://blog.csdn.net/weixin_39973271/article/details/110281489

此系列文章收录在公众号中：数据大宇宙 > 数据处理 >E-pd

转发本文并私信我"python"，即可获得Python资料以及更多系列文章(持续更新的)

经常听别人说 Python 在数据领域有多厉害，结果学了很长时间，连数据处理都麻烦得要死。后来才发现，原来不是 Python 数据处理厉害，而是他有数据分析神器—— pandas

前言

Excel 中除了 Vlookup 函数，一系列条件统计函数(sumif、countif、maxif)就用得最多，毕竟在 Excel 中进行数据统计是常见需求。

今天我们来看看在 pandas 中如何做到条件统计。

本文使用泰坦尼克号沉船事件的乘客名单作为例子：

pclass：船舱等级survived：是否生还fare：票价sex：性别home.dest：住址需求1：性别统计

"男女分别有多少人？"

这需要我们在Excel中有很多方式完成，比如透视表或函数公式，下面简单列出函数公式的做法：

简单使用 countifs 即可这里不再单独使用 countif 了，管他是否只有一个条件，统一用 xxxifs 类函数即可

在pandas，不会有啥条件统计函数的，因为这就是先筛选，再统计：

行2：得到性别列是女性的 bool 列行3：df[cond] 就是女性的记录，简单通过 len 方法，即可得到记录数(人数)不过你可能会觉得这很麻烦，因为如果还要男性的人数，也需要执行一次差不多的代码。

实际上我们可以直接对性别列分组统计即可：

不多说了，代码语义简直与中文一样这里唯一不好的地方是，需要通过 size 方法获得每个分组的记录数需求2：不同的统计方法

刚刚是求人数，现在希望求出女性的平均票价。

以下是Excel的公式做法：

那么 pandas 的做法呢？

想必聪明的你一定大概知道怎么做，pandas中求平均的是方法mean：

行3：同样语义非常清晰。.fare.mean() 恰好反映"票价的平均"同样，简单分组即可一次获得所有分组的统计信息：

按 sex 分组，求票价的平均需求3：非常规匹配

上面的条件都是完全符合，有时候我们需要统计有包含关系的条件。

"住址是New York 的人数"

Excel的xxifs类函数公式都能支持通配符：

前后用 * 包围内容，表示包含此内容即符合条件在pandas中，由于筛选与统计是独立分开的，因此只需要知道怎么筛选，那么此需求即可迎刃而解：

行2：由于住址列是字符串类列，使用 .str 可访问字符串类型列的各种方法contains 判断列中是否包含指定内容。如果本身内容是 nan(不存在值) ，那么直接赋值为 False如果我们只需要住址结尾是 NY 的人数？

Excel中由于用通配符，因此表达更直接：

注意，没有修改公式，只是输入内容变成 *NY ，表示 NY 前面可以是任意内容在pandas这麻烦多了，这次不能使用contains方法：

行2：使用 endswith 方法即可完成怎么与 Excel 的统计结果不一样！！

你会发现，Excel 的统计结果包含小写字母的 ny 结尾！

一次解决所有问题

以上 pandas 的做法主要有以下问题：

不能用通配符表达不同的文本规则，只能用不同的方法，我记不住这么多方法呀不能忽略大小写(实际上面的需求，pandas 的结果更合理)其实.str.contains方法本身就是使用正则表达式，我们可以直接用contains解决所有文本规则相关问题：

行2： NY$ ，表示 NY 在结尾处参数 case = False ，不区分大小写pandas 用于文本匹配的还有 match 方法，此系列文章不再深入讲解了。更多高级应用方法，请关注 pandas 专栏 [带你玩转Python数据处理—pandas]

总结

本文重点：

构造 bool 列，是核心知识点Series.str.contains 用于文本规则条件匹配

如果希望从零开始学习 pandas ，那么可以看看我的 pandas 专栏。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/245561.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

android 系统倒计时显示时间,Android 依据系统时间整点、半点倒计时

android 系统倒计时显示时间,Android 依据系统时间整点、半点倒计时

activity_main.xml中的代码xmlns:android"http://schemas.android.com/apk/res/android"android:layout_width"match_parent"android:layout_height"match_parent"android:background"android:color/white">android:id"id/myt…

阅读更多...

java贪吃蛇_如何用Java还原童年回忆？在线教你完成贪吃蛇小游戏

java贪吃蛇_如何用Java还原童年回忆？在线教你完成贪吃蛇小游戏

今天我就从零开始来完成这个小游戏，完成的方式也是一步一步的添加功能这样的方式来实现。额，不好意思，放错了，重来第一步完成的功能：写一个界面大家见到的贪吃蛇小游戏，界面肯定是少不了的。因此&#xff0…

阅读更多...

android+建模工具,什么是适用于Android Studio的3D模型环境的最佳工具

android+建模工具,什么是适用于Android Studio的3D模型环境的最佳工具

首先，你已经链接的页面没有引用文字。它代替了this文本。现在，关于文本本身：你正在脱离情境和/或误解它。这是一个完整的引文：The Android framework provides plenty ofstandard tools for creating attractive, functionalgrap…

阅读更多...

python编写统计选票的程序_使用python编写微信公众号发稿统计程序

python编写统计选票的程序_使用python编写微信公众号发稿统计程序

近日为学校公众号统计发稿情况，需统计本年度各部门分别所发稿件标题、时间、作者等。首先考虑查看公众号后台有无统计功能，看到的界面如下： 每页只显示7天的消息，且没有部门作者信息。再看另一界面： 只统计总体的发稿…

阅读更多...

android 刷windows10,微软计划在Android机上刷Windows 10

android 刷windows10,微软计划在Android机上刷Windows 10

据外媒TechCrunch报道，目前微软正努力采取措施让Android设备运行Windows 10系统来提升自己的市场份额。目前，微软在公布Windows 10的发展战略时开始尝试与新的手机厂商合作，而这些厂商之前都至推出过Android系统手机。微软计划在Android机上刷…

阅读更多...

jtextpane设置不能选中_在Bridge cc中不能使用camera raw 的编辑功能，解决方法

jtextpane设置不能选中_在Bridge cc中不能使用camera raw 的编辑功能，解决方法

有时我们在Bridge cc中想对raw文件进行处理，这时需要启动camera raw功能，可是当我们启用时却显示不能编辑，下面说下如何启动使用camera raw 的编辑功能1.打开一张raw格式文件，在文件菜单或者右键选择在camera raw中打开&#xff0…

阅读更多...

android icon命名规则,安卓手机的APP图标尺寸规范和图标命名规范

安卓手机的APP图标尺寸规范和图标命名规范点击查看原文android图标包括：程序启动图标、底部菜单图标、弹出对话框顶部图标、长列表内部列表项图标、底部和底部tab标签图标。1、安卓程序启动图标尺寸：ldpi(120dpi)小屏幕mdpi(160dpi)中屏幕hdpi(240dpi)大…

阅读更多...

python俄罗斯方块课程设计报告_用python实现俄罗斯方块

python俄罗斯方块课程设计报告_用python实现俄罗斯方块

!/usr/bin/python -- conding:utf-8 -- from tkinter import * import time import threading import random import math from tkinter import messagebox 变量定义 BIANCHANG 19 COLOR [red, orange, yellow, green, blue, purple, #00C5CD, #00EE76, #388E8E, #556B2F, #6…

阅读更多...

intent android 匿名,Android 匿名启动activity 启动系统activity

intent android 匿名,Android 匿名启动activity 启动系统activity

一般我们使用Intent 进行activity跳转时我们都知道需要跳转的activity的名字,例如：Intent intentnew Intent(FirstActivity.this,SecondActitivy.class);startActivity(intent);当SecondActitivy.class和FirstActivity不再同一个App的时候,我们就需要用到匿名启动&a…

阅读更多...

opencv python教程简书_Python-OpenCV —— 基本操作一网打尽

opencv python教程简书_Python-OpenCV —— 基本操作一网打尽

OpenCV是一个基于BSD许可（开源）发行的跨平台计算机视觉库，可以运行在Linux、Windows、MacOS操作系统上。它轻量级而且高效——由一系列 C 函数和少量C类构成，同时提供了Python、Ruby、MATLAB等语言的接口，实现了图像处…

阅读更多...

android listview 数据同步,android中ListView数据刷新时的同步方法

android listview 数据同步,android中ListView数据刷新时的同步方法

本文实例讲述了android中ListView数据刷新时的同步方法。分享给大家供大家参考。具体实现方法如下：public class Main extends BaseActivity {private static final String TAG "tag";private static final int STATUS_CHANGE 0;ExpandableListView mEl…

阅读更多...

python __reduce__魔法方法_Python魔法方法指南

python reduce魔法方法_Python魔法方法指南

(译)Python魔法方法指南简介本指南归纳于我的几个月的博客，主题是魔法方法。什么是魔法方法呢？它们在面向对象的Python的处处皆是。它们是一些可以让你对类添加“魔法”的特殊方法。它们经常是两个下划线包围来命名的（比如 __init__ &a…

阅读更多...

opengles 顶点数组 android,OpenGLES顶点属性、顶点数组和缓冲区对象

opengles 顶点数组 android,OpenGLES顶点属性、顶点数组和缓冲区对象

顶点属性数据可以用一个顶点数组对每个顶点指定，也可以将一个常量值用于一个图元的所有顶点OpenGLES支持最少16个顶点属性。准确查询顶点数量方法如下：GLint maxVertexAttribs;glGetIntegerv(GL_MAX_VERTEX_ATTRIBS, &maxVertexAttribs);一、指定顶点…

阅读更多...

java 实体类临时注解_JPA：Java持久层API--配置流程

java 实体类临时注解_JPA：Java持久层API--配置流程

一、JPA概述1.1 JPA是什么JPA （Java Persistence API） Java持久化API。是一套Sun公司 Java官方制定的ORM 方案,是规范，是标准 ，sun公司自己并没有实现关注点： ORM ，标准概念 （关键字&#xf…

阅读更多...

android新架构,Android新架构组件 LifeCycles 简介

android新架构,Android新架构组件 LifeCycles 简介

一、前言为了使开发者能尽快在 Android 平台上开发出高质量的项目，Android 官方推出了 Android Jetpack 项目，旨在从基础，架构，行为以及界面 4 大方面体系化地为我们提供组件级别的支持。当然，在实际开发过程中&#x…

阅读更多...

领域驱动设计 pdf_什么是领域驱动设计？

领域驱动设计 pdf_什么是领域驱动设计？

什么是领域驱动设计？你可能使用领域驱动设计(DDD)开发了一些项目。你可能很满意， 使用领域模型来开发领域业务。并且得意地展示给你的同事看，他们会说“666”。但有的时候你使用领域模型你总觉得哪儿有点不对劲。你会嘀咕你可能遗漏了什么。 …

阅读更多...

Android四级缓存,RecyclerView 源码四级缓存原理

Android四级缓存,RecyclerView 源码四级缓存原理

入口我们从使用功能上去读取源码，通常的用法是这个样子-> 我们设置layoutmanager，GridLayouManager 继承LinearLayoutManager，所以我们就LinearLayoutManager 为基准查看rv.layoutManager GridLayoutManager(this,5)rv.addItemDecoration…

阅读更多...

织梦自定义html文本,织梦自定义标签dede:sql根据自定义字段填的文章id获取相关文章...

织梦自定义html文本,织梦自定义标签dede:sql根据自定义字段填的文章id获取相关文章...

这篇文章主要为大家详细介绍了织梦自定义标签dede:sql根据自定义字段填的文章id获取相关文章，具有一定的参考价值，感兴趣的小伙伴们可以参考一下,有需要的朋友可以收藏方便以后借鉴。有的时候我们需要通过织梦的dede:sql据自定义字段填的文章id获取相关文…

阅读更多...

python 杀死子进程_Python：当父异常终止时，如何杀死子进程？

python 杀死子进程_Python：当父异常终止时，如何杀死子进程？

小编典典呵呵，我昨天自己在研究这个！假设您无法更改子程序： 在Linux上，prctl(PR_SET_PDEATHSIG,...)可能是唯一可靠的选择。（如果绝对有必要终止子进程，那么您可能希望将终止信号设置为SIGKILL而不是SIGTE…

阅读更多...

html评论置顶功能,微信公众号精选留言评论怎么置顶显示？功能在哪里设置？...

html评论置顶功能,微信公众号精选留言评论怎么置顶显示？功能在哪里设置？...

微信公众号精选留言怎么置顶？微信公众号留言功能新增了置顶精选留言的设置，那么微信公众号留言功能在哪里设置呢？下文小乐哥给大家介绍一下！微信公众号精选留言怎么置顶？微信公众平台悄然上线了一个新功能，…

阅读更多...

最新文章