python中的excel操作

操作excel

在Python中,处理Excel文件的常用模块有xlrdxlwtopenpyxl。以下是对这些模块的简要介绍:

  1. xlrd:

    • xlrd是一个用于读取Excel(.xls.xlsx)文件数据的库。
    • 它提供了方便的API来访问Excel文件中的工作表、行、列和单元格。
    • xlrd支持旧版Excel格式(.xls, 即Excel 97-2003)。
  2. xlwt:

    • xlwt是一个用于写入数据到旧版Excel(.xls, 即Excel 97-2003)文件格式的库。
    • 它允许用户创建新的Excel文件并对其进行编辑,如添加样式、字体等。
  3. openpyxl:

    • openpyxl是一个专门用于读取和写入最新版本的Excel文件(.xlsx, 即从Office 2007开始使用的格式)。
    • 它支持更复杂操作,例如修改现有工作簿或创建新工作簿、插入公式、图表等。

使用 xlrd 读取 Excel 文件

import xlrd# 打开一个Workbook,只能打开旧的excel文件,不支持.xlsx文件
workbook = xlrd.open_workbook('./data/30/example.xls')# 获取所有sheet名称
sheets = workbook.sheet_names()
print(sheets)# 根据索引获取第一个sheet
sheet = workbook.sheet_by_index(0)# 获取行数和列数
rows = sheet.nrows
cols = sheet.ncols# 遍历所有行,并打印每一列值
for row_idx in range(rows):for col_idx in range(cols):cell_value = sheet.cell_value(row_idx, col_idx)print(cell_value, end='\t')print()

使用 xlwt 写入 Excel 文件

import xlwt# 创建Workbook对象
workbook = xlwt.Workbook()# 添加Sheet页,默认名为"testXLWTSheet"
worksheet = workbook.add_sheet('testXLWTSheet')# 写入数据到单元格(行号, 列号, 值)
worksheet.write(0, 0, 'Hello')
worksheet.write(1, 0, 'World')# 最后保存为.xls文件
workbook.save('./data/31/example.xlsx')
workbook.save('./data/31/example.xls')

使用 openpyxl 操作 Excel 文件

读取 .xlsx
from openpyxl import load_workbookfrom openpyxl.cell.cell import Cellwb = load_workbook('./data/32/example.xlsx')# 获取当前活跃的sheet,默认就是第一个sheet
sheet = wb.active
# 或者 wb.get_sheet_by_name('test_title测试标题') 【官方说过时!!】
# 或者 wb['test_title测试标题'] 【推荐方案】print(sheet.title)# 使用Type Hints:
# 为了提高代码清晰度和后续维护性,在编写函数或处理复杂数据结构时,推荐使用Type Hints(Python 3.5+ 引入)。
def process_cell(cell: Cell):# 现在你可以享受自动补全和类型检查print(cell.value)# print(type(cell))  # 打印 <class 'openpyxl.cell.cell.Cell'># print(dir(cell))  # 列出所有属性和方法# 将sheet结果转成list(list())
result = []# values_only参数为True时,只获取单元格的值,否则获取单元格对象Cell
for row in sheet.iter_rows(values_only=False):# print(row) # 打印每一行的单元格对象row_result = list()for cell in row:process_cell(cell)row_result.append(cell.value)result.append(row_result)print(result)# 将sheet结果转成list(tuple())
print([tuple(row) for row in sheet.iter_rows(values_only=True)])
写入 .xlsx
from openpyxl import Workbook
# from openpyxl.worksheet.worksheet import Worksheetwb = Workbook()
ws = wb.active  # 默认创建了名为'Sheet' 的sheet页.# 通过指定行列写入一格数据
ws['A1'] = "Hello"
ws['B1'] = "World!"
ws['A2'] = "test_new_line"# 通过append写入一行数据,注意append的参数是一个list
# 同时是在没有数据的行开始写入
ws.append([1, 2, 3])
ws.append(['中文', 'aaaa', 11111])# 通过行写入多行数据
rows = [['Number', 'Batch 1', 'Batch 2'],[2, 40, 30],[3, 40, 25],[4, 50, 30],[5, 30, 10],[6, 25, 5],[7, 50, 10],
]
for row in rows:ws.append(row)print(type(ws))# 保存
wb.save("./data/32/example2.xlsx")

安装

pip install xlrd xlwt openpyxl 

openpyxl

目前,openpyxl是处理Excel文件(尤其是.xlsx格式)的最常用Python库。这是因为它提供了对最新Excel文件格式的完整支持,并且可以很容易地读取和写入这些文件。与此同时,它也支持许多高级功能,如样式、过滤、图表、公式等。

虽然xlrdxlwt在以前非常流行,但由于以下原因,它们的使用已经减少:

  1. xlrd自版本2.0起不再支持.xlsx文件格式。
  2. xlwt只能用来创建.xls(Excel 97-2003)格式的文件,并不能创建或编辑.xlsx(Excel 2007及以后版本)格式。

如果你需要处理旧版的.xls文件,则可能还需要使用到这些库。但对于大多数现代应用程序而言,推荐使用如下库:

  • openpyxl:适合读写 .xlsx 文件。
  • pandas:一个强大的数据分析工具包,在内部也可以利用 openpyxl, xlrd, 或其他引擎来读写Excel文件。

在选择合适工具时,请考虑你所需处理的特定任务和数据类型。如果你正在开发新项目并且不受限于旧版Office软件,则建议优先选择 openpyxl 或者通过 pandas, 这两者都能更好地兼容现代 .xlsx 格式并提供更多功能。

1. 单元格样式

openpyxl允许你为单元格设置字体、边框、填充色、对齐方式等样式。

from openpyxl import Workbook
from openpyxl.styles import Font, Color, Alignment, Border, Sidewb = Workbook()
ws = wb.active# 设置字体样式
a1 = ws['A1']
a1.font = Font(name='Calibri', size=11, bold=True, italic=True, color='FF0000')
ws['A1'] = 'test_font'# 设置填充颜色
from openpyxl.styles import PatternFilla2 = ws['A2']
a2.fill = PatternFill(start_color="FFFF00", end_color="FFFF00", fill_type="solid")
ws['A2'] = 'test_font'# 设置对齐方式
a3 = ws['A3']
a3.alignment = Alignment(horizontal='center', vertical='center')
ws['A3'] = 'test_font'# 批量设置
for row in ws["A4:F4"]:for cell in row:cell.font = Font(name='Calibri', size=11, bold=True, italic=True, color='FF0000')cell.value = 'test_font'wb.save('./data/openpyxl_export/styled.xlsx')

2. 公式

可以直接在单元格中输入公式,就像在Excel中一样。

# 公式
ws['B1'] = 10
ws['B2'] = 20# 在B3中使用公式求和B1和B2的值。
ws['B3'] = '=SUM(B1:B2)'# 在B4中使用公式求积B1和B2的值。
ws['B4'] = '=PRODUCT(B1:B2)'# 在B5中使用公式求平均值B1和B2的值。
ws['B5'] = '=AVERAGE(B1:B2)'# 在B6中使用公式求最大值B1和B2的值。
ws['B6'] = '=MAX(B1:B2)'# 在B7中使用公式求最小值B1和B2的值。
ws['B7'] = '=MIN(B1:B2)'wb.save('./data/openpyxl_export/styled.xlsx')

3. 合并与拆分单元格

# 合并A4到D4区域的单元格。
ws.merge_cells('A4:D4')
ws.merge_cells('A5:D5')  # 合并后,单元格的值会显示在合并区域的第一个单元格中。# 拆分之前合并过的单元格。
ws.unmerge_cells('A4:D4')  # 拆分后,合并区域的值会显示在第一个单元格中。wb.save('./data/openpyxl_export/styled2.xlsx')

4. 插入与删除行/列

# 插入行和列。
ws.insert_rows(5)  # 在第5行之前插入一行。
ws.insert_cols(2)  # 在第2列之前插入一列。
wb.save('./data/openpyxl_export/styled4.xlsx')# 删除行和列。
ws.delete_rows(4)  # 删除第4行,删除后,往下的行会自动上移。
ws.delete_cols(2)  # 删除第1列,删除后,往右的列会自动左移。wb.save('./data/openpyxl_export/styled5.xlsx')

5. 调整行高与列宽

# 设置第一行的高度。
ws.row_dimensions[1].height = 200# 设置C列的宽度。
ws.column_dimensions['C'].width = 300wb.save('./data/openpyxl_export/styled6.xlsx')

6. 图表创建

可以创建各种图表(如柱状图、折线图等)并添加到工作簿中。

# 图表创建
from openpyxl.chart import BarChart, Referencevalues = Reference(ws, min_col=1, min_row=1, max_col=1, max_row=10)
chart = BarChart()
chart.add_data(values)ws.add_chart(chart, "E5")  # 将图表添加到E5位置wb.save('./data/openpyxl_export/styled7.xlsx')

7. 使用Pandas DataFrame读写数据

如果你正在处理大量数据,使用Pandas DataFrame进行读写可能更加方便。

# 使用pandas导出数据
import pandas as pd# 创建一个DataFrame
# Name和Age是列名
df = pd.DataFrame({'Name': ['John', 'Smith', 'Yirui'], 'Age': [30, 25, 15]})from openpyxl.utils.dataframe import dataframe_to_rows# 将DataFrame写入到ws中,index=False表示不写入索引列(在第一列,列名为空,索引数据从0开始),header=True表示写入列名。
for r in dataframe_to_rows(df, index=True, header=True):ws.append(r)wb.save('./data/openpyxl_export/styled8.xlsx')

以上只是openpyxl库提供功能的一部分。通过这些高级特性,你可以实现几乎所有常见的Excel操作,并能够创建非常复杂和动态化定制化程度很高的报告或数据集。为了深入学习更多细节及最佳实践,请参考openpyxl官方文档。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/756085.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Linux课程_____用户的管理

一、规则 用户至少属于一个组,在创建时如果不指定组,将会创建同名的组 用户只能有一个基本组(主组),但可以隶属于多个附加组 如果一个组作为某用户的基本组,此组将不能被删除 UID: 用户标识 GID: 组的标识 root管理员的uid及gid 都为0 二、用户的配置文件 1./etc/passwd …

3/19作业

select实现的TCP并发服务器 #include <myhead.h> #define SER_PORT 8888 #define SER_IP "192.168.47.130"int main(int argc, const char *argv[]) {int sfd -1;sfd socket(AF_INET,SOCK_STREAM,0);if(sfd -1){perror("socket");return -1;}pri…

resize-observer源码解读

resize-observer github 地址&#xff1a;https://github.com/devrelm/resize-observer 本地启动 npm installnpm startnode 18.16.0 (npm 9.5.1) 启动失败报错 node:internal/crypto/hash:71this[kHandle] new _Hash(algorithm, xofLen);^Error: error:0308010C:digital …

深入挖掘C语言之——枚举

目录 1. 枚举的定义 2. 枚举常量的赋值 3. 枚举的使用示例 4. 注意事项 在C语言中&#xff0c;枚举&#xff08;Enum&#xff09;是一种用户定义的数据类型&#xff0c;用于定义一组具名的整型常量。枚举常常用于提高代码的可读性和可维护性&#xff0c;使程序更易于理解。…

【Py/Java/C++三种语言OD2023C卷真题】20天拿下华为OD笔试之【模拟】2023C-攀登者2【欧弟算法】全网注释最详细分类最全的华为OD真题题解

有LeetCode算法/华为OD考试扣扣交流群可加 948025485 可上全网独家的 欧弟OJ系统 练习华子OD、大厂真题 绿色聊天软件戳 od1336了解算法冲刺训练 文章目录 题目描述与示例题目描述输入描述输出描述 示例输入输出 解题思路原路返回和非原路返回原路返回走过的总路程从左边空地出…

流畅的Python(二十一)-类元编程

一、核心要义 1.类元编程时指在运行时创建或定制类的技艺 2.类是一等对象,因此任何时候都可以使用函数新建类&#xff0c;而无需使用class关键字 3.类装饰器也是函数&#xff0c;不过能够审查、修改&#xff0c;甚至把被装饰的类替换为其它类。 4.元类(type类的子类)类编程…

FDU 2019 | 3. 有向树形态

文章目录 1. 题目描述2. 我的尝试1. 卡特兰数2. 动态规划 1. 题目描述 求 N 个结点能够组成的二叉树的个数。 输入格式 一个整数 N 。 输出格式 输出能组成的二叉树的个数。 数据范围 1 ≤ N ≤ 20 1≤N≤20 1≤N≤20 输入样例 3输出样例 52. 我的尝试 1. 卡特兰数 直接…

分布式锁的详细解释

什么是分布式锁 分布式锁是一种用于协调分布式系统中多个进程或线程之间访问共享资源的机制。在分布式系统中&#xff0c;多个进程或线程可能同时竞争访问某个共享资源&#xff0c;为了避免并发访问导致的数据不一致或冲突&#xff0c;需要使用分布式锁来保证资源的独占性。 分…

5.1.1、【AI技术新纪元:Spring AI解码】Openai chat

OpenAI 聊天 Spring AI 支持由 OpenAI 开发的人工智能语言模型 ChatGPT。ChatGPT 在激发人们对 AI 驱动文本生成的兴趣方面发挥了重要作用,这归功于它创建的行业领先的文本生成模型和嵌入技术。 先决条件 您需要与 OpenAI 创建一个 API 来访问 ChatGPT 模型。在 OpenAI 注册页…

第十三届蓝桥杯省赛CC++ 研究生组

蓝桥杯2022年第十三届省赛真题-裁纸刀 蓝桥杯2022年第十三届省赛真题-灭鼠先锋 蓝桥杯2022年第十三届省赛真题-质因数个数 求个数&#xff0c;则只需要计数即可。求啥算啥&#xff0c;尽量不要搞多余操作 蓝桥杯2022年第十三届省赛真题-选数异或 蓝桥杯2022年第十三届省赛真题…

深入理解并优化Android中的文件描述符(FD)

一、文件描述符&#xff08;FD&#xff09;概述 文件描述符&#xff08;File Descriptor&#xff0c;简称FD&#xff09;是Unix和类Unix操作系统&#xff08;包括Android&#xff09;中的一个关键概念。它是一个非负整数&#xff0c;用于标识操作系统分配的文件或其他输入/输出…

内网渗透学习-环境搭建

1、环境搭建测试 虚拟机网络环境配置&#xff0c;模拟外网和内网 主机操作系统网络内网ip外网ip物理主机window10vmnet8192.168.70.1攻击机kali Linuxvmnet8192.168.70.134域控主机win server 2008 r2vmnet0192.168.52.138域成员主机win server 2k3vmnet0192.168.52.141服务器…

HarmonyOS NEXT应用开发之swiper指示器导航点位于swiper下方

介绍 本示例介绍通过分割swiper区域&#xff0c;实现指示器导航点位于swiper下方的效果。 效果预览图 使用说明 加载完成后swiper指示器导航点&#xff0c;位于显示内容下方。 实现思路 将swiper区域分割为两块区域&#xff0c;上方为内容区域&#xff0c;下方为空白区域。…

el-input添加keyup事件无响应

<el-input type"password" v-model"formData.password" keyup.enter"onSubmit"></el-input>使用 .native修饰符 有时&#xff0c;Vue 组件内部可能会处理某些事件&#xff0c;导致你不能直接在组件上监听这些事件。 在这种情况下&am…

【代码随想录Day28】

Day 28 回溯 Part04 今日任务 93.复原IP地址78.子集90.子集II 代码实现 今天的题出乎意料的简单 复原IP地址&#xff0c;和昨天的分割回文串比较像 一个是分割&#xff0c;一个是判断ip有效 List<String> result new ArrayList<>();List<String> path …

【数据结构】链表力扣刷题详解

前言 题目链接 移除链表元素 链表的中间结点 反转链表 分割链表 环形链表的约瑟夫问题 ​ 欢迎关注个人主页&#xff1a;逸狼 创造不易&#xff0c;可以点点赞吗~ 如有错误&#xff0c;欢迎指出~ 移除链表元素 题述 给你一个链表的头节点 head 和一个整数 val &#xff0c;请…

【Spring Cloud Gateway】路由配置uri三种方式及区别

websocket配置方式 ws:// 或 wss:// 开头的 URI&#xff0c;表示配置的是支持 Websocket 协议的目标地址。 这种方式适用于需要与客户端建立长连接、实现双向通信的场景&#xff0c;比如实时消息推送、即时聊天等。 使用 Websocket 配置方式可以让 Spring Cloud Gateway 能够…

从基础入门到学穿C++

前言知识 C简介 C是一门什么样的语言&#xff0c;它与C语言有着什么样的关系&#xff1f; C语言是结构化和模块化的语言&#xff0c;适合处理较小规模的程序。对于复杂的问题&#xff0c;规模较大的程序&#xff0c;需要高度的抽象和建模时&#xff0c;C语言则不合适。为了解…

代理IP品质对Tik Tok代理的重要性

随着Tik Tok的迅速崛起&#xff0c;越来越多的人开始关注如何透过Tik Tok进行行销和推广。其中&#xff0c;使用Tik Tok代理程式是常见的方法。 然而&#xff0c;在选择和使用代理时&#xff0c;IP品质是一个不可忽视的因素。本文将探讨IP品质对Tik Tok代理的重要性&#xff0…

鸿蒙Harmony应用开发—ArkTS声明式开发(容器组件:GridRow)

栅格布局可以为布局提供规律性的结构&#xff0c;解决多尺寸多设备的动态布局问题&#xff0c;保证不同设备上各个模块的布局一致性。 栅格容器组件&#xff0c;仅可以和栅格子组件(GridCol)在栅格布局场景中使用。 说明&#xff1a; 该组件从API Version 9开始支持。后续版本…