Python自动化办公篇—pandas操作Excel:读取+查看+选择+清洗+排序+筛选+函数+写入

目录

  • 专栏导读
  • 库的介绍
  • 库的安装
  • 1、读取数据
  • 2、查看数据
  • 3、选择数据
  • 4、数据清洗
  • 5、数据排序
  • 6、数据筛选
  • 7、数据操作
  • 8、数据写入
  • 总结

专栏导读

文章名称链接
Python自动化办公—pyautogui图像定位\点击功能,实现自动截取当前屏幕并检索点击(可制作为游戏点击脚本)点我进行跳转
Python办公自动化—openpyxl获取Excel某列的批注信息自动插入到旁边一列点我进行跳转
Python链接MySQL(三)—mysql-connector-python实现—增—删—查—改点我进行跳转
Python办公MySQL(二):Python连接MySQL实现简单的—增—删—查—改(详细教程)点我进行跳转
Python提取PDF中的图片并保存点我进行跳转
Python将图片以超链接形式插入Excel表格且以相对路径插入(发给任何人都能打开)点我进行跳转
Python办公—openpyxl合并单元格点我进行跳转
Python100个库分享第21个—xlsxwriter (办公库篇)点我进行跳转
python+selenium判断【加载中】元素在就一直等待不在就点击下载(非常好用)点我进行跳转
Python提取PDF中的表格写入Excel点我进行跳转
pandas读取Excel将某列为键某列(可多列)为值—写入字典(json)(键不可重复如重复保留最后有一个键值对)点我进行跳转
Python读取超大Excel表格(100万行x30列)三种方法点我进行跳转
Python如何将Excel转CSV(3种常见方法+时间测试)点我进行跳转
Python+smtplib库实现Foxmail自动批量给客户发送账单点我进行跳转
Python实现Excel\CSV文件的双重分组求汇总(在Excel中也称之为透视)点我进行跳转
Python+tkinter自制一对多多对多匹配GUI工具(CSV版—可改写Excel版)附完整代码点我进行跳转
Python+PySimpleGUI实现一个选择文件并做处理的GUI办公小工具(完整代码)点我进行跳转
Python+sentence-transformers框架实现相似文本识别(附完整代码+保姆教学)点我进行跳转
Python+PySide6实现一个选择文件并做处理的GUI办公小工具(完整代码)点我进行跳转
Python+docx2pdf批量将word转pdf点我进行跳转
Python对账单中某些跨账单重复的单号进行获取点我进行跳转
Python+pandas读取Excel中的每一个sheet中的每一行点我进行跳转
CSV转Excel文件(适合大文件转VBA语言)点我进行跳转
Python读取Excel每一行为列表—大PK(openpyxl\pandas\xlwings\xlrd\Spire.XLS\python_calamine)看谁用时少?点我进行跳转
Python之Spire.XLS进行Excel与CSV文件互转换点我进行跳转
利用python将Excel文件拆分成100行为一个的小文件(行数可自己设置)点我进行跳转
Python递归—求一组数字的指定和多少种组合方式点我进行跳转
Python看板—python+plotly+streamlit实现简易看板(附完整版代码)点我进行跳转
pandas读取Excel统计每一个文件的行数点我进行跳转
Python+pyautogui自动选择附件并上传点我进行跳转
Python+PIL计算两个图像的相似度并返回第一个不匹配的像素的x坐标(附完整版代码)点我进行跳转
Python+openpyxl将Excel的某一列转成文本格式点我进行跳转
Python对csv文件的某一列进行拆分+再写入保存点我进行跳转
Excel转CSV文件(适合大文件转VBA)点我进行跳转
Python+selenium+PIL实现网页自动截图点我进行跳转
Python批量读取csv(xlsx)文件指定表头获取内容(表头可乱序)点我进行跳转
Python将Excel数字对应列的字母写成字典(json)—如1为A列,2为B列以此类推(更新与2024-4-3)点我进行跳转
Python+openpyxl读取Excel(每一行为列表)点我进行跳转
Python如何批量将图片以超链接的形式插入Excel点我进行跳转
利用Python批量压缩图片大小(不改变图片尺寸,不改变图片格式)点我进行跳转
  • 🌸 欢迎来到Python办公自动化专栏—Python处理办公问题,解放您的双手

  • 🏳️‍🌈 博客主页:请点击——> 一晌小贪欢的博客主页求关注

  • 👍 该系列文章专栏:请点击——>Python办公自动化专栏求订阅

  • 🕷 此外还有爬虫专栏:请点击——>Python爬虫基础专栏求订阅

  • 📕 此外还有python基础专栏:请点击——>Python基础学习专栏求订阅

  • 文章作者技术和水平有限,如果文中出现错误,希望大家能指正🙏

  • ❤️ 欢迎各位佬关注! ❤️

库的介绍

库的安装

pip install xxx -i https://pypi.tuna.tsinghua.edu.cn/simple/

1、读取数据

  • pd.read_csv(): 从CSV文件读取数据

  • pd.read_excel(): 从Excel文件读取数据

  • pd.read_sql(): 从SQL数据库读取数据

  • pd.read_json(): 从JSON文件读取数据

  • pd.read_html(): 从网页读取HTML表格

2、查看数据

  • df.head(n): 显示前n行数据(默认是5行)

  • df.tail(n): 显示后n行数据(默认是5行)

  • df.info(): 显示DataFrame的信息(包括列名、数据类型、非空值数量等)

  • df.describe(): 显示数值列的统计信息(如计数、均值、标准差等)

3、选择数据

  • df[column_name]: 选择单列数据

  • df[[column1, column2]]: 选择多列数据

  • df.loc[row_indexer, column_indexer]: 基于标签选择数据

  • df.iloc[row_indexer, column_indexer]: 基于整数位置选择数据

  • df.at[row_label, column_label]: 选择单个值(基于标签)

  • df.iat[row_position, column_position]: 选择单个值(基于整数位置)

4、数据清洗

  • df.dropna(): 删除包含缺失值的行或列

  • df.fillna(value): 用指定的值填充缺失值

  • df.replace(to_replace, value): 替换值

  • df.astype(dtype): 更改列的数据类型

  • df.duplicated(): 显示重复的行

  • df.drop_duplicates(): 删除重复的行

5、数据排序

  • df.sort_values(by=column_name, ascending=True): 对指定列进行排序

  • df.sort_index(): 对索引进行排序

  • df.rank(): 对数据进行排名

6、数据筛选

  • df[condition]: 使用条件表达式筛选数据

  • df.query('column_name > value'): 使用字符串表达式筛选数据

7、数据操作

  • df.apply(function): 对DataFrame的每个元素、行或列应用函数

  • df.applymap(function): 对DataFrame的每个元素应用函数

  • df.map(function): 对Series的每个元素应用函数

  • df.groupby(by): 根据列的值对数据进行分组

  • df.merge(other_df, on=column_name): 根据列的值合并两个DataFrame

  • df.concat([df1, df2], axis=0): 连接多个DataFrame(沿行或列)

  • df.pivot(index=None, columns=None, values=None): 创建一个透视表

8、数据写入

  • df.to_csv(file_path): 将DataFrame写入CSV文件

  • df.to_excel(file_path): 将DataFrame写入Excel文件

  • df.to_sql(name, con, if_exists='fail', index=True): 将DataFrame写入SQL数据库

  • df.to_json(file_path): 将DataFrame写入JSON文件

文章名称链接
Python自动化办公—pyautogui图像定位\点击功能,实现自动截取当前屏幕并检索点击(可制作为游戏点击脚本)点我进行跳转
Python办公自动化—openpyxl获取Excel某列的批注信息自动插入到旁边一列点我进行跳转
Python链接MySQL(三)—mysql-connector-python实现—增—删—查—改点我进行跳转
Python办公MySQL(二):Python连接MySQL实现简单的—增—删—查—改(详细教程)点我进行跳转
Python提取PDF中的图片并保存点我进行跳转
Python将图片以超链接形式插入Excel表格且以相对路径插入(发给任何人都能打开)点我进行跳转
Python办公—openpyxl合并单元格点我进行跳转
Python100个库分享第21个—xlsxwriter (办公库篇)点我进行跳转
python+selenium判断【加载中】元素在就一直等待不在就点击下载(非常好用)点我进行跳转
Python提取PDF中的表格写入Excel点我进行跳转
pandas读取Excel将某列为键某列(可多列)为值—写入字典(json)(键不可重复如重复保留最后有一个键值对)点我进行跳转
Python读取超大Excel表格(100万行x30列)三种方法点我进行跳转
Python如何将Excel转CSV(3种常见方法+时间测试)点我进行跳转
Python+smtplib库实现Foxmail自动批量给客户发送账单点我进行跳转
Python实现Excel\CSV文件的双重分组求汇总(在Excel中也称之为透视)点我进行跳转
Python+tkinter自制一对多多对多匹配GUI工具(CSV版—可改写Excel版)附完整代码点我进行跳转
Python+PySimpleGUI实现一个选择文件并做处理的GUI办公小工具(完整代码)点我进行跳转
Python+sentence-transformers框架实现相似文本识别(附完整代码+保姆教学)点我进行跳转
Python+PySide6实现一个选择文件并做处理的GUI办公小工具(完整代码)点我进行跳转
Python+docx2pdf批量将word转pdf点我进行跳转
Python对账单中某些跨账单重复的单号进行获取点我进行跳转
Python+pandas读取Excel中的每一个sheet中的每一行点我进行跳转
CSV转Excel文件(适合大文件转VBA语言)点我进行跳转
Python读取Excel每一行为列表—大PK(openpyxl\pandas\xlwings\xlrd\Spire.XLS\python_calamine)看谁用时少?点我进行跳转
Python之Spire.XLS进行Excel与CSV文件互转换点我进行跳转
利用python将Excel文件拆分成100行为一个的小文件(行数可自己设置)点我进行跳转
Python递归—求一组数字的指定和多少种组合方式点我进行跳转
Python看板—python+plotly+streamlit实现简易看板(附完整版代码)点我进行跳转
pandas读取Excel统计每一个文件的行数点我进行跳转
Python+pyautogui自动选择附件并上传点我进行跳转
Python+PIL计算两个图像的相似度并返回第一个不匹配的像素的x坐标(附完整版代码)点我进行跳转
Python+openpyxl将Excel的某一列转成文本格式点我进行跳转
Python对csv文件的某一列进行拆分+再写入保存点我进行跳转
Excel转CSV文件(适合大文件转VBA)点我进行跳转
Python+selenium+PIL实现网页自动截图点我进行跳转
Python批量读取csv(xlsx)文件指定表头获取内容(表头可乱序)点我进行跳转
Python将Excel数字对应列的字母写成字典(json)—如1为A列,2为B列以此类推(更新与2024-4-3)点我进行跳转
Python+openpyxl读取Excel(每一行为列表)点我进行跳转
Python如何批量将图片以超链接的形式插入Excel点我进行跳转
利用Python批量压缩图片大小(不改变图片尺寸,不改变图片格式)点我进行跳转

总结

  • 希望对初学者有帮助

  • 致力于办公自动化的小小程序员一枚

  • 希望能得到大家的【一个免费关注】!感谢

  • 求个 🤞 关注 🤞

  • 此外还有办公自动化专栏,欢迎大家订阅:Python办公自动化专栏

  • 求个 ❤️ 喜欢 ❤️

  • 此外还有爬虫专栏,欢迎大家订阅:Python爬虫基础专栏

  • 求个 👍 收藏 👍

  • 此外还有Python基础专栏,欢迎大家订阅:Python基础学习专栏

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/29335.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

为什么网上这么多破解 Intellij IDEA 的工具,但是官方却不管呢?

大家好,我是小2,一个程序员~ 程序员小2 每天一篇技术重磅好文,涉及一线互联网大厂应用架构(高可用、高性能、高稳定),AI、大数据、java架构等热门领域。 112篇原创内容 公众号 来源:Java知音…

基于Spring Boot+VUE旅游管理系统

1管理员功能模块 管理员通过点击后台管理,进入页面可以输入用户名、密码、角色进行登录相对应操作,如图1所示。 图1管理员登录界面 管理员通过点击后台管理,进入页面可以填写首页、个人中心、用户管理、旅游方案管理、旅游购买管理、系统管…

python web框架哪家强?Flask、Django、FastAPI对比

前言 当你掌握了python的基础知识,并且会用和HTML和CSS编写简单的静态网页。现在你只需再掌握一个python web框架的知识,就可以开始编写一个动态的网站了。目前市面比较流程的python web框架有三个flask、Django、FastAPI。接下来我们对比一下。他们三个…

bwip-js-条码生成-常见条码类型-常用参数设置

文章目录 1.常用参数设置2.常见条码类型3.常见参数4.总结1.常用参数设置 生成svg代码。 var BWIPJS = require(bwip-js);let svg = BWIPJS.toSVG({bcid: code128, // 条形码类型text: 123456789, // 显示文本scale: 1, // 放大系数width: 20, …

sherpa-onnx说话人识别+语音识别自动开启(VAD)+语音识别Python API

专栏总目录 获取该开源项目的渠道,是我在b站上,看到了由csukuangfj制作的一套语音识别视频。以下地址均为csukuangfj在视频中提供,感谢分享! 新一代 Kaldi: 说话人识别+VAD+语音识别之 Python API_哔哩哔哩_bilibili 开源项目地址:GitHub - k2-fsa/sherpa-onnx: Speech-t…

HarmonyOS NEXT 从不懂到 ToDo List 实例开发

本文将从一个前端开发者的角度出发,速通鸿蒙 Next 开发的方方面面,并最终开发一个 Todo List 小实例。 简介 首先,鸿蒙使用 ArkTS 作为原生开发语言。如果你熟悉 TypeScript 编程语言,那基本上可以无缝过渡,因为 Ark…

Linux常⽤服务器构建-samba

目录 1. 介绍 2. 安装 3. 配置 3.1 创建存放共享⽂件的路径 3.2 创建samba账户 4 重启samba 5. 访问共享⽂件 5.1 mac下访问⽅式 5.2 windows下访问⽅式 1. 介绍 Samba 是在 Linux 和 UNIX 系统上实现 SMB 协议的⼀个免费软件,能够完成在 windows 、 mac 操作系统…

统计分析方法-非参数检验-python

文章目录 前言非参数检验特点常见的非参数检验一、Cliffs Delta动机定义二、Wilcoxon Signed-Rank Test定义三、 Friedman检验适用场景公式python 代码Wilcoxon Signed-Rank Test和 cliffs deltaFriedman前言 记录一下自非参数检验的学习过程,如有不对请纠正。 非参数检验 …

C# OpenCvSharp函数形参-Size

在C#中使用OpenCvSharp库时,Mat类是用于表示图像的主要数据结构之一。Mat类的构造函数之一是Mat(Size size, int type),其中size和type是两个重要的参数。下面是对这两个参数的详细解释和使用方法。📸 参数解释🔍 Size size: S…

[AI资讯·0618] 快手AI模型“可灵“在质量优于Sora,OpenAI和谷歌发布新技术推动AI视频推理发展,Gemini1.5Pro在该榜单中表现突出

AI资讯 陕西推出AI千亿级发展计划,五大产业集群,智算超3000P试了快手的视频AI,竟然有点领先“技术故障”背刺巴菲特,金融大模型到底靠不靠谱?Gemini视频推理遥遥领先GPT-4o,首个视频多模态基准Video-MME国…

dockerhub无法拉取镜像后,国内怎么拉取镜像?

一、比如你拉取的镜像在hub.docker 你要拉取的镜像前面加前缀: m.daocloud.io 这里比如我要拉取: nginx-ingress:latest 正常我们是 docker pull nginx/nginx-ingress 现在因为某些原因,我们需要下面这样写: docker pull …

重新定义DPU——中科驭数2024产品发布会,6月19日诚邀莅临!

数据中心正经历着前所未有的变革,DPU作为数据中心第三颗主力芯片,正引领行业步入一个高效、灵活的算力新时代。 中科驭数在业内率先完成三代DPU芯片研发迭代,并完成规模化商用落地。一路以来,我们衷心地感谢客户和合作伙伴的鼎力…

避雷!又6本期刊被On Hold!ELSEVIER旗下影响因子高达10+SSCI上榜

【SciencePub学术】继《INFORMATION SCIENCES》被On Hold 之后,又新增3本SCIE期刊、3本SSCI期刊被列入On Hold名单。其中包含ELSEVIER旗下影响因子高达10的《RESOURCES POLICY》。 官方现在对期刊质量的管控越来越严格了,被标记为On Hold后的期刊中&…

10.Python使用chromedriver加selenium模拟人工对浏览器进行操作

在使用python时如果需要对浏览器进行一些操作,我们会用到两个常用的框架,今天一起来看一下。 chromedriver 浏览器驱动,可以理解为一个没有界面的chrome浏览器. Chromedriver 是一个自动化测试工具,它允许开发者通过编程的方式控制 Google Chrome 浏览器,用于自动化测试…

【自动驾驶】串口通信控制与反馈

文章目录 串口通信控制与反馈通讯协议上行数据帧解析下行数据帧解析串口通信控制与反馈 通讯协议 上行数据指的是机器人底盘向上位机发送的状态数据, 下行数据指的是上位机向机器人底盘发送的控制信息。 上行数据帧解析 机器人运动底盘通过串口发送的数据包格式,如下表所…

具体使用Java注解的方式

具体使用Java注解的方式 1.使用预定义注解: 预定义注解是Java提供的一些内置注解,可以直接在代码中使用。例如,Override、Deprecated、SuppressWarnings等。 Override public void run() {// 重写父类的run()方法// ... }Deprecated public…

SQL Server入门-SSMS简单使用(2008R2版)-1

环境: win10,SQL Server 2008 R2 参考: SQL Server 新建数据库 - 菜鸟教程 https://www.cainiaoya.com/sqlserver/sql-server-create-db.html 第 2 课:编写 Transact-SQL | Microsoft Learn https://learn.microsoft.com/zh-cn/…

LabVIEW电池管理系统测试平台

随着混合动力汽车技术的快速发展,对电池管理系统(BMS)的测试需求显著增加。利用LabVIEW软件开发了一款电池管理系统测试平台,通过模拟电池行为验证BMS的控制策略,从而降低成本、缩短开发周期,并提高整车的能…

PostgreSQL内核开发——添加内核函数

在PostgreSQL内核的学习过程中,可以尝试向内核中添加一些函数,扩展PostgreSQL的功能。同时可以增加自己对PG内核的理解。这里我们以简单的添加一个helloworld函数为例,分析一下这个过程中涉及到的相关源码。 PostgreSQL添加pg_helloworld函数 这里总结一下如何向PostgreSQ…

如何零基础学办公软件?沈阳电脑办公软件培训

你说的办公软件是指常用办公软件吧,一般就是office三件套:Word、Excel、PowerPoint,建议直接上手开始完成几个稍微复杂一点的任务: word,建议排版一份毕业论文,找一个大学生的毕业论文,或者随便…