pandas输出到excel_学Python还不会处理Excel数据?带你用pandas玩转各种数据处理

4d90cfd095e09f03f102b9cd2ef40487.png

开场白

以前学习 Python 的 pandas 包时,经常到一些 excel 的论坛寻找实战机会。接下来我会陆续把相关案例分享出来,还会把其中的技术要点做详细的讲解。

本文要点:

  • 使用 xlwings ,如同 vba 一样操作 excel
  • 使用 pandas 快速做透视表

注意:虽然本文是"替代Excel Vba"系列,但希望各位读者明白,工具都是各有所长,适合才是好。


请关注本号,后续会有更多相关教程。私信我"python",即可获得按水平领域分类好的Python资料

19ea343ed78cb2df3e5e54a67c78766b.png

案例

今天的例子非常简单,从一个表中读取学生的数据,然后按班级汇总各个科目的成绩。下图,左为原始数据,右为示意结果:

a105182a7aeea17723ce16bed367d4a5.png

导入包

本文所需的包,安装命令如下:

pip install xlwings pip install pandas

脚本中导入

7b72f48af64d219ccf5be41192cbf0d2.png

读取表格的数据

9b735427c6108702e089b5245d40eb19.png
  • 使用 xw.books[] 可以快速访问当前打开的工作簿。可以使用索引也可以使用名字。
  • 同样,通过 book.sheets[] 快速访问工作表,可以使用索引也可以使用名字。

接下来读取表格数据

19b1220f808c8b62432e1046aae5ccd2.png
  • 通过 sheet.range(地址) 即可访问单元格区域。
  • 接着使用 current_region 快速得到整个表格数据。这里可以使用其他方式定位数据的大小。
  • options(pd.DataFrame) 是一个很关键的操作,我们希望把数据放入 pandas 的 DataFrame ,以便快速处理数据。然后通过 value 获得。

我们来看看数据

86804094b125168a08c849735d5c3a8f.png
  • 现在姓名列变成了 index 。不过需求是不需要理会姓名,因此我们不处理。
  • [班级]列变成小数。其实是小数也不会影响结果。

数据透视

接下来就非常简单,直接使用 pandas 做出透视表。

844c9bb4ae98ed55121a77553477242d.png
  • 使用 pd.pivot_table ,即可快速生成透视表。
  • 其中参数 index ,则是结果左边的行分类字段——[班级]。
  • 参数 margins ,表示生成一个汇总行。
  • 参数 margins_name ,则是汇总行的名字。
  • 注意,其实还有一个参数 aggfunc ,用于指定汇总方式,默认是 mean

如果你对 excel 的透视表比较熟悉就会马上学会这些。

47e0f01a4fe9a9596dba9b5d0ee735f8.png
  • index 相当于 excel 透视表的行区域
  • values 相当于 excel 透视表的值区域
  • columns 相当于 excel 透视表的字段区域
  • 放入 index 与 columns 的字段,一般是分类的字段,比如:班级,性别。
  • 放入 values 的字段,一般是连续值,比如:分数,销售额。如果是类别的值,一般会用于统计个数。
  • 上述3个参数都可以传入列表,以表示处理多个字段。

但是,看一下结果,却发现了一些问题:

2b691d1e962e4da8dd17fddb40130ce5.png
  • 列的顺序与原数据不一样了。
  • 结果需要把总分列放到最右边。

下面是针对上述问题的解决方法

88a098200cd1fa20def63e6fa43cd39a.png
  • cols=df.columns[1:].tolist() 首先需要读取原数据的字段(第一个字段是班级,因此通过切片 1: 从第2个字段开始)。
  • cols.append(cols.pop(0)) 把[汇总]移到列表的最后。
  • pv_df=pv_df[cols] 把透视表的字段调整为我们需要的顺序。
  • pv_df.reset_index(inplace=True) 是为了把[班级]从 index 移动回来作为 column。

看看结果,非常完美

e925995a5e5e7f351ac27e8121474cb0.png

输出结果

把 DataFrame 写回 excel 是非常容易。比如: wrk.range('O11').value=pv_df

但是这会把其中的 index 也输出到 excel上。因此,我们可以分开两步输出。如下:

692a11f33a7aabb4548a219c90607123.png
  • 第一行代码,首先输出字段行。
  • 第二行代码,输出值。

完整代码

以下是完整的代码:

4fcfc23f26552e1f4fcbc40f73dc6424.png

与 Vba 的对比

本文的案例是从某个知名 excel 论坛中挑选的,我从中挑选了最简短的 vba 解决方案。如下:

5234938faf64c1bfc34cf63c0116bd69.png
  • 可以看到使用 vba 进行统计,代码很长,并且都不是给人看的。
  • 如果原数据的字段顺序有变化,这代码立刻无效。并且代码仍然可以跑出结果,只是错误结果而已。
  • 如果需求有变化,比如:求出每个班级的 top 3的学生。很快就放弃了吧。

总结

  • 如果需要从 excel 读取数据进行汇总处理,可以选用 xlwings + pandas(如果数据非常规范并且无需处理格式等,可以直接使用 pandas)。
  • pandas 中的 pivot_table 快速得到各种方式的分组汇总。

[源码地址](https://github.com/CrystalWindSnake/Creative/tree/master/python/excel_pandas)

请关注本号,后续会有更多相关教程。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/561263.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

cadence设计运算放大器_21.比较器的原理与特性,它与运算放大器的本质区别总结归纳...

1.电压比较器的工作原理电压比较器,顾名思义,就是两个输入端的其中一个作为基准,另外一个与基准作比较,输出只存在高电平和低电平两种状态。通过电压比较器,可以将模拟信号转变为数字信号。输入引脚的电位 > -输入引…

插入排序最优_排序专题插入排序

今天开始,我计划用几篇专题来集中练习下有关排序的算法,排序算法是算法中最基础的算法了,所以这部分我们是要尽可能的全都掌握了。排序算法最常见的有如下几种:插入排序(Insertion Sort)选择排序(Selection Sort)希尔排序(Shell S…

c语言设计指导实训,C语言程序设计实训指导

与《c语言程序设计(第2版)》配套,给出所有习题及参考答案。按知识点,精选12个典型实训,给出实训目的与要求、实训内容及实训参考程序。附有自测(考试)样卷及参考答案,供读者自测。提供Turbo C 2.0上机环境介绍及常见的Turbo C 2.0…

python程序代码_python基础二

Python基础-注释的引入注释的分类:<1>单行注释:以#开头&#xff0c;#右边的所有文字当作说明&#xff0c;而不是真正要执行的程序&#xff0c;起辅助说明作用多行注释用三个单引号 ‘’’ 或者三个双引号 “”" 将注释括起来&#xff0c;例如:1、单引号&#xff08;…

电气自动化c语言实践操作论文,项目实践论文,关于独立学院电气工程其自动化专业基于CDIO的实践模式相关参考文献资料-免费论文范文...

导读:本文关于项目实践论文范文,可以做为相关论文参考文献,与写作提纲思路参考。(广州大学松田学院 广东广州 511370)摘 要&#xff1a;独立学院作为培养应用型人才的新生力量,要与地方经济社会发展相衔接,培养满足地方经济社会发展需要的、高素质的应用型人才.如何培养符合广东…

linux里用c实现cat_【案例】用T云做了什么能让企业在工业自动化控制系统行业里实现逆向增长?...

从制造至“智”造&#xff0c;工业正在逐步向自动化、智能化方向深入发展。行业背景&#xff1a;受疫情影响&#xff0c;2020年&#xff0c;上半年雪虐风饕&#xff0c;自动化市场需求下滑&#xff0c;随着后期政策红利推出&#xff0c;市场回暖&#xff0c;上半年的自动化需求…

微软符号服务器 2020年_微软介绍了2020年后它将如何淘汰Edge中的Flash支持

Microsoft Edge微软(通过Bleeping Computer)提供了更多关于它将如何放弃对Flash in Edge的支持以符合Adobe的计划的细节&#xff0c;包括一些值得注意的例外。正如所料&#xff0c;默认情况下&#xff0c;Edge将从2020年12月起禁用闪存。2020年6月之前发布的Flash版本将被完全屏…

深入jvm虚拟机第三版源码_深入JVM虚拟机,阿里架构师直言,这份文档真的是JVM最深解读...

作为一名优秀的 Java 开发程序员&#xff0c;以及想那些想要学习 Java 更深层一点的知识的同学&#xff0c;对 JVM 的熟悉与熟练使用是必不可缺的核心技能了&#xff0c;也是每个 Java 程序员应该要做到的。深入学习 JVM 可以有助于我们掌握 Java 应用程序是如何运作的&#xf…

android 信鸽 自动重启,Android简单集成信鸽推送

添加项目的buid.gradlendk {//选择要添加的对应cpu类型的.so库abiFilters armeabi, armeabi-v7a, arm64-v8a// 还可以添加 x86, x86_64, mips, mips64}manifestPlaceholders [XG_ACCESS_ID:"2100332371",XG_ACCESS_KEY : "ABRD93KT147K",]依赖//采集安装列…

python变量类型是动态的_python内存动态分配过程详解

一、前言 大多数编译型语言&#xff0c;变量在使用前必须先声明&#xff0c;其中C语言更加苛刻&#xff1a;变量声明必须位于代码块最开始&#xff0c;且在任何其他语句之前。其他语言&#xff0c;想C和java,允许“随时随地”声明变量&#xff0c;比如&#xff0c;变量声明可以…

python树莓派串口通信实例_树莓派通过串口发送数据

可以通过串口登陆树莓派&#xff0c;也可以通过串口向其他主机发送数据。树莓派的串口接受数据科技爱好者博客已经写过&#xff0c;可以参考这篇文章&#xff1a;树莓派与arduino串口通信实践。这篇文章教大家如果通过树莓派的串口发送数据。 一、开启树莓派的串口功能 sudo ra…

sklearn朴素贝叶斯分类器_python机器学习:方法链和朴素贝叶斯分类器

今天我们在学习朴素贝叶斯分类器之前&#xff0c;我们先来总结下前面经常用到的内容&#xff0c;方法链&#xff1a;在scikit-learn中所有模型的fit方法返回的都是self。我们用一行代码初始化模型并拟合&#xff0c;对应代码如下&#xff1a;logreg LogisticRegression().fit(…

24v开关电源维修技巧_焊机维修案例汇总6

案例1&#xff1a;开机保护检查整流桥、场管、快恢复二极管都正常。通电试机&#xff0c;面板亮黄灯&#xff0c;拔掉中板变压器接插线&#xff0c;黄灯灭&#xff0c;怀疑中板变压器有损坏。断电&#xff0c;用电感表测量变压器电感量&#xff0c;中板采用三个变压器并联&…

华为鸿蒙mota30手机多少钱,华为Mate30系列基本确认:麒麟985、鸿蒙系统、5G,价格满意!...

原标题&#xff1a;华为Mate30系列基本确认&#xff1a;麒麟985、鸿蒙系统、5G&#xff0c;价格满意&#xff01;现在华为越来越的受到国人的重视&#xff0c;一方面是因为米国对于华为的不公正待遇&#xff0c;另一方面还是因为华为产品可以真正的让用户们认可。现在&#xff…

android组合控件 重叠,Android 组合控件实现布局的复用的方法

看到很多项目会有实现自己的标题栏的做法&#xff0c;通常的界面是左边按钮或文字&#xff0c;加上中间的标题和右边的按钮或文字组成的。比较好的一种做法是使用include标签&#xff0c;复用同一个xml文件来实现布局的复用。但是这种方法是通过代码的方式来设置标题&#xff0…

1到100的偶数之和是多少_新射雕群侠传之铁血丹心手游新侠客独孤求败全渠道上线 新玩法桃花岛开启...

点击上面蓝字获取更多精彩资讯金庸正版授权手游《新射雕群侠传之铁血丹心》新英雄独孤求败傲世登场&#xff0c;桃花岛新惊喜即将海量释放!国庆最长假期即将到来&#xff0c;《新射雕群侠传》玩法福利再度升级&#xff0c;不止是神话品质独孤求败的安卓全渠道开放&#xff0c;更…

python顺序结构实验_Python程序设计实验报告二:顺序结构程序设计(验证性实验)...

安徽工程大学 Python程序设计实验报告 班级物流192姓名芦靓学号3190505217成绩 日期2020.3.19 指导老师修宇 【实验名称】 实验二 顺序结构程序设计&#xff08;验证性实验&#xff09; 【实验目的】 &#xff08;1&#xff09;掌握数据的输入输出的方法&#xff1b; &#xff…

三星s9android recovery,三星手机怎么进入recovery模式?详细图文教程指导

【刷机之家】其实对于经常刷机的朋友来说进入recovery模式是一件再正常不过的事情了&#xff0c;但是对于很多刚刚接触刷机的新手朋友来说可能不太了解&#xff0c;当你仔细阅读完本教程之后相信即使你是一个完全不了解刷机的朋友也会知道该如何进入recovery模式。本教程主要是…

css布局方式_网页布局都有哪种?一般都用什么布局?

随着Web技术不断的革新&#xff0c;CSS近几年也变得多年前要更强大。在Web开发中&#xff0c;CSS是不可或缺的一部分&#xff0c;对于很多Web开发者来说&#xff0c;有很多CSS属性不知道&#xff0c;或者说他们知道&#xff0c;但忘记在最恰当的时候使用最适合的CSS属性。而且时…

复合消隐信号的作用_南大《AFM》:可拉缩、粘合、导电的双信号柔性彩色薄膜...

导读&#xff1a;本文得到了一种可伸缩、可粘合、可自修复、可导电的双信号柔性电子结构彩色薄膜&#xff0c;具有很大的应用潜力。柔性电子设备在各种应用中发挥着不可忽视的作用&#xff0c;如健康监控、感觉皮肤、可植入设备等。柔性电子材料的研究已取得了很大进展&#xf…