Python 实现Excel自动化办公(下)

上一讲我们讲到了Python 针对Excel 里面的特殊数据处理以及各种数据统计,本讲我们将引入Pandas 这个第三方库来实现数据的统计,只要一个方法就可以统计到上一讲的数据统计内容,本讲也会扩展讲讲Pandas所涉及到的相关使用方法。

统计输出

import pandas as pdpd1=pd.read_excel("test1.xls")pd2=pd.read_excel("test2.xls",skiprows=2) #skiprows=2表示忽略前几行,skip_footer用来省略尾部的行数
#统计输出print(pd1.describe()) #数字类型的统计输出,它是DateFrame类型print(pd1.min()) #输出每一列里面最小值print(pd1.max())#输出每一列里面最大值print(pd1.sum()) #输出每一列的求和值print(pd1.mean()) #输出每一列的平均值print(pd1.median())#输出每一列的中位数

通用输出或格式化输出

#通用输出或格式化输出print(pd1.head()) #输出前五条数据,DateFrame类型的带有标签的数据print(pd1.tail()) #输出后五条数据,DateFrame类型的带有标签的数据print("获取到所有的值:\n{0}".format(pd1))#格式化输出所有数据print(pd1.values) #输出的是全部值的一个二维的ndarrayprint(pd1.dtypes) #输出每一列数据的数据类型,它是Series类型的数据print(pd1.columns) #输出序号的名字,它是Index类型的索引对象print(pd1.columns.values) #输出序号的名字,返回的是一个一维的ndarrayprint(pd1.shape) #输出

指定输出

#指定输出print(pd1.values[0]) #输出第一行的值print(pd1.values[0:2])#查看第一二行的值,返回的是一个二维的ndarrayprint(pd1[0:3]) #返回的是DateFrame类型的前三列数据,带有标签print(pd1[0:3].values) #返回的是ndarray类型的前三列数据的值,不带表头标签print(pd1.sample(2).values) #获取指定行数的值,它是一个二维的ndarrayprint(pd1['工号'].values) #查看某一列所有的值,返回的是一维的ndarray

转置输出

#转置输出print(pd1.T)#整个数据集的翻转展示print(pd1[0:3].T) #前三行数据翻转展示

排序输出

#排序输出print(pd1.sort_index(axis=1,ascending=False)) #axis等于1按列进行排序 如ABCDEFG 然后ascending倒叙进行显示print(pd1.sort_values(by="月工资"))#按值进行排序

常规操作

#常规操作pd1['job']=None #增加一列pd1.loc[1]=[1000,'林ok','男','哈尔滨','1978-05-28 00:00:00','2003-06-20 00:00:00',333,0.5,555.0,"tester"]#增加一行pd1.drop([1],axis=0,inplace=True) #删除指定行 axis=0 表示行,inplace=True表示在原有的数据上改变pd1.drop('job',axis=1,inplace=True)#删除指定列 axis=1 表示列pd1.to_excel('test1.xls',sheet_name='new sheet',index=False,header=True)#保存新增的内容,index表示是否增加索引,header表示是否加列表表头pd1.index=(pd1.index+100) #设置索引的值pd1.rename(columns={'工号':'num','姓名':'name'},inplace=True) #修改表头信息pd1.set_index("num",drop=True,inplace=True) #设置索引的值,drop默认True,普通列被用作索引后,原列删除pd1.reset_index(drop=False,inplace=True)#还原索引为普通列,重新变为默认的整型索引,drop=False 原有的索引不变,添加一列,列名index;pd.set_option('display.max_rows', 3,'display.max_columns', 3,"display.max_colwidth",3,'display.width',3) #设置显示print(pd1.head())print(pd1.index) #输出索引信息print(len(pd1.index)) #输出索引的长度

合并操作​​​​​​

#合并操作pd3=pd.concat([pd1,pd2],axis=0) #将两个excel数据进行合并操作,注意保持数据格式上的一致print(pd3)

缺失值处理​​​​​​​

#缺失值处理print(pd2)print(pd2['job'].isna())#检测是否是Nanprint(pd2['job'].isnull())#检测是否是空值print(pd2['job'].notna())#检测是否是Nanprint(pd2['job'].notnull())#检测是否是空值print(pd2.loc[pd2['job'].notnull(),:]) #过滤出来job不为null的行print(pd2.drop([1],axis=0,inplace=True)) #删除指定行 axis=0 表示行,inplace=True表示在原有的数据上改变print("*"*100)
import numpy as np #这里是为了构建数据引入的,后面会有文章单独讲解df = pd.DataFrame([[np.nan, 2, np.nan, 0], [3, 4, np.nan, 1], [np.nan, np.nan, np.nan, np.nan], [np.nan, 3, np.nan, 4]], columns=list('ABCD'))print(df)print(df.fillna(100))#将为空的填充为100分print(df.fillna({"A":222},inplace=True))#将A列为nan的值设置为222print(df.dropna(axis="columns"))#删除有空值的列print(df.dropna(axis=1,how="all"))#删除掉全是空值的列print(df.dropna(axis=0,how="all"))#删除掉全是空值的行

这一讲就分享到这里,内容也不少需要多实践去了解它的使用技巧,以上更多的是print语句进行输出来检查每一个是否符合预期。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/706458.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Python 实现 ROC指标计算(变动率指标):股票技术分析的利器系列(15)

Python 实现 ROC指标计算(变动率指标):股票技术分析的利器系列(15) 介绍算法公式 代码rolling函数介绍核心代码计算OSC 完整代码 介绍 ROC(变动率指标)是一种技术分析指标,用于衡量价格变动的速…

windows系统使用Vscode在WSL调试golang本地进程

背景: windows10企业版 vscodegolang1.20 wsl编译运行。 vscode 使用本地wsl进行进程attach操作,发现:Access is denied. 本地进程启动,vscode调试进程。windows-Linux控制台: Starting: C:\Users\book\go\bin\dlv.exe dap --l…

Ubuntu Mysql Innodb cluster集群搭建+MaxScale负载均衡(读写分离)

Ubuntu系统版本 20.04.3 LTS (Focal Fossa) 、64位系统。 cat /etc/os-release查看Ubuntu系统是32位还是64位 uname -m如果显示“i686”,则表示安装了32位操作系统。如果显示“x86_64”,则表示安装了64位操作系统。 一、安装MySql 参考: https://blog.csdn.net/qq_3712…

什么是去中心化云计算?

去中心化云计算是一种新型的云计算方式,它与传统的中心化云计算不同,将数据和计算任务分布到多个节点上,而不是将数据集中存储在中心服务器上。这种云计算方式具有许多优势,包括提高数据安全性、降低运营成本、增强可扩展性和灵活…

.NET Core Web API 之SignalR

SignalR是一个面向ASP.NET开发人员的库,它简化了将实时Web功能添加到应用程序中的过程。实时Web功能指的是服务器代码能够即时地将内容推送到连接的客户端,而不需要客户端每次都发送请求来获取新数据。 SignalR是一个集成的客户端与服务器库&#xff0c…

MCU最小系统电路设计(以STM32F103C8T6为例)

目录 一、何为最小系统? 二、最小系统电路设计 1.电源 (1)各种名词解释 (2)为什么会有VDD_1 _2 _3区分? (3)Mirco USB (4)5v->3.3v滤波电路 &#…

Unity(第九部)物体类

拿到物体的某些数据 using System.Collections; using System.Collections.Generic; using UnityEngine;public class game : MonoBehaviour {// Start is called before the first frame updatevoid Start(){//拿到当前脚本所挂载的游戏物体//GameObject go this.gameObject;…

naive-ui-admin 表格去掉工具栏toolbar

使用naive-ui-admin的时候,有时候不需要显示工具栏,工具栏太占地方了。 1.在src/components/Table/src/props.ts 里面添加属性 showToolbar 默认显示,在不需要的地方传false。也可以默认不显示 ,这个根据需求来。 2.在src/compo…

历史新知网:寄快递寄个电脑显示器要多少钱?

以下文字信息由(新史知识网)编辑整理发布。 让我们赶紧来看看吧! 问题1:快递寄电脑显示器要多少钱? 此物有多重? 顺丰寄就可以了,但是必须是原包装的,不然不好寄。 问题2&#xff1…

vue项目从后端下载文件显示进度条或者loading

//API接口 export const exportDownload (params?: Object, peCallback?: Function) > {return new Promise((resolve, reject) > {axios({method: get,url: ,headers: {access_token: ${getToken()},},responseType: blob,params,onDownloadProgress: (pe) > {peC…

React Switch用法及手写Switch实现

问&#xff1a;如果注册的路由特别多&#xff0c;找到一个匹配项以后还会一直往下找&#xff0c;我们想让react找到一个匹配项以后不再继续了&#xff0c;怎么处理&#xff1f;答&#xff1a;<Switch>独特之处在于它只绘制子元素中第一个匹配的路由元素。 如果没有<Sw…

全量知识系统问题及SmartChat给出的答复 之1

Q1. 一套完整的全量知识系统应该有哪些组成部分&#xff1f; 一套完整的全量知识系统应该包括以下组成部分&#xff1a; 数据采集&#xff1a;收集、整理、清洗和存储各种数据&#xff0c;包括结构化数据、半结构化数据和非结构化数据等。 数据存储和管理&#xff1a;建立可靠…

使用css reset 还是使用Normalize.css

文章目录 使用css reset 还是使用Normalize.cssCSS Reset:Normalize.css:总结Normalize.css 的使用&#xff08;例如Vue 3.0 和 Vue CLI 4.x 项目&#xff09;1.安装2.main.js 中导入3.测试引用是否成功。 使用css reset 还是使用Normalize.css 使用 CSS Reset 还是 Normalize…

GCN,R-GCN,岭回归,SVR,随机森林,Adaboost

图卷积神经网络(graph convolutional network, GCN),它将卷积神经网络拓展到图结构形式 中&#xff0c;GCN因可以很好地融合图结构数据的结构特征和属性特征并且有较好的组合泛化能力而被广泛使用。 关系图卷积神经网络(relational-graph convolutional network, R-GCN)&#…

【无标题】积鼎CFD VirtualFlow:航空及汽车燃油晃动流体仿真计算及试验对比

图1 汽车储液罐内的液体晃动 燃油晃动&#xff0c;作为航空、航海及汽车工业中一个重要的物理现象&#xff0c;一直以来都受到广泛关注。在飞行器、船舶或汽车的运行过程中&#xff0c;由于外部扰动或内部燃料的消耗&#xff0c;油箱内的燃油会产生晃动。这种晃动不仅会影响燃…

【Git教程】(五)分支 —— 并行式开发,分支相关操作(创建、切换、删除)~

Git教程 分支 1️⃣ 并行式开发2️⃣ 修复旧版本中的 bug3️⃣ 分支4️⃣ 当前活跃分支5️⃣ 重置分支指针6️⃣ 删除分支7️⃣ 清理提交对象&#x1f33e; 总结 对于版本提交为什么不能依次进行&#xff0c;以便形成一条直线型的提交历史记录&#xff0c;我们认为有 以下两个…

2024热门UI设计工具推荐

最好的UI设计工具可以适应几乎每一个设计过程&#xff0c;并且有望满足您的创造性要求。但既然UI设计工具那么多&#xff0c;应该用什么工具呢&#xff1f; 在过去的几年里&#xff0c;Sketch和figma的结合一直是许多设计师的选择&#xff0c;但其他工具也提供了有竞争力的特点…

远程控制桌面,让电脑办公更简单

随着科技的不断发展&#xff0c;远程办公已经成为了越来得越多企业和个人的选择。远程控制电脑办公&#xff0c;仅需1款软件即可轻松get&#xff01; 1.绿虫电脑管理软件 是一款功能强大的办公电脑管理软件&#xff0c;仅需安装在被控端电脑&#xff0c;主控端通过网页登录后…

LeetCode 刷题 [C++] 第240题.搜索二维矩阵 II

题目描述 编写一个高效的算法来搜索 m x n 矩阵 matrix 中的一个目标值 target 。该矩阵具有以下特性&#xff1a; 每行的元素从左到右升序排列。 每列的元素从上到下升序排列。 题目分析 通过分析矩阵的特点发现&#xff0c;其左下角和右上角可以看作一个“二叉搜索树的根节…

C++ 补充之常用遍历算法

C遍历算法和原理 C标准库提供了丰富的遍历算法&#xff0c;涵盖了各种不同的功能。以下是一些常见的C遍历算法以及它们的概念和原理的简要讲解&#xff1a; for_each&#xff1a;对容器中的每个元素应用指定的函数。 概念&#xff1a;对于给定的容器和一个可调用对象&#xff…