【Python如何将EXCEL拆分】

文章目录

    • Python将一个EXCEL表拆分多个excel表
    • Python将一个EXCEL表中一个sheet拆分多个sheet表

Python将一个EXCEL表拆分多个excel表

在Python中,你可以使用pandas库来读取Excel文件,并将一个大的Excel表格(工作表)拆分成多个单独的Excel文件。这通常基于某些条件,比如基于某列的唯一值或者按照行数的固定分割。

以下是一个基于某列唯一值来拆分Excel工作表的示例:

  1. 首先,你需要安装pandasopenpyxl(用于读写Excel文件):
pip install pandas openpyxl
  1. 使用Python脚本拆分Excel文件:
import pandas as pd# 读取原始Excel文件
original_file = 'original.xlsx'
sheet_name = 'Sheet1'  # 假设你要拆分的工作表名称是'Sheet1'
df = pd.read_excel(original_file, sheet_name=sheet_name)# 选择你要根据哪一列的唯一值来拆分工作表
split_column = 'column_to_split_by'  # 替换为你的列名
unique_values = df[split_column].unique()# 遍历唯一值并保存每个子DataFrame到新的Excel文件
for value in unique_values:# 筛选数据sub_df = df[df[split_column] == value]# 构造新的文件名new_file = f'split_{value}.xlsx'# 写入新的Excel文件with pd.ExcelWriter(new_file, engine='openpyxl') as writer:sub_df.to_excel(writer, index=False, sheet_name=sheet_name)print(f'Split into {len(unique_values)} files.')

在这个示例中,split_column是你希望根据其唯一值来拆分工作表的列的名称。unique_values是一个包含该列所有唯一值的列表。然后,脚本遍历这些唯一值,对于每个唯一值,它筛选出原始DataFrame中对应的行,并将这些行保存到一个新的Excel文件中。

请注意,这个示例假设你的原始Excel文件使用的是.xlsx格式,并且你希望保存拆分后的文件也为.xlsx格式。此外,如果你需要拆分的工作表不是第一个工作表(即不是’Sheet1’),你需要将sheet_name变量的值更改为正确的工作表名称。

如果你想要按照行数的固定分割来拆分工作表(例如,每100行一个文件),你可以稍微修改上面的脚本,使用range(0, len(df), 100)来迭代行索引,并使用.iloc来切片DataFrame。

Python将一个EXCEL表中一个sheet拆分多个sheet表

可以使用pandas结合openpyxlxlsxwriter来实现。但是,由于pandasExcelWriter在写入时不支持在同一个Excel文件中添加多个工作表(除非你一次写入所有工作表),需要使用openpyxlxlsxwriter来手动操作Excel文件。

以下是一个使用pandasopenpyxl来拆分一个工作表到多个工作表的示例:

import pandas as pd
from openpyxl import load_workbook# 读取原始Excel文件
original_file = 'original.xlsx'
sheet_name_to_split = 'Sheet1'  # 要拆分的工作表名称# 使用pandas读取工作表
df = pd.read_excel(original_file, sheet_name=sheet_name_to_split)# 假设你根据某列的值(例如'group_column')来拆分工作表
# 也可以根据需要使用其他逻辑,比如按行数拆分
groups = df['group_column'].unique()# 加载已存在的Excel文件以添加新的工作表
book = load_workbook(original_file)
writer = pd.ExcelWriter(original_file, engine='openpyxl') 
writer.book = book# 遍历每个组并将数据写入新的工作表
for group in groups:# 筛选数据sub_df = df[df['group_column'] == group]# 写入新的工作表,如果工作表已存在则先删除if group in book.sheetnames:book.remove(book[group])sub_df.to_excel(writer, sheet_name=group, index=False)# 保存Excel文件
writer.save()

在这个示例中,我们首先加载了原始的Excel文件,并使用pandas读取了要拆分的工作表。然后,我们根据某个列的唯一值将数据拆分成多个DataFrame。接下来,我们使用openpyxl加载原始的Excel工作簿,并遍历每个组。对于每个组,我们检查是否存在同名的工作表,如果存在则删除它,然后将筛选后的数据写入新的工作表。最后,我们保存了修改后的Excel文件。

请注意,这个示例会直接修改原始的Excel文件。如果你不希望修改原始文件,你可以将结果保存到一个新的Excel文件中。此外,如果你的数据量很大,或者拆分后的工作表很多,这个操作可能会比较耗时,因为它需要在内存中处理整个Excel文件。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/21202.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Writerside生成在线帮助文档或用户手册软件基础使用教程

Writerside是JetBrains出的一个技术文档工具,既能用在JetBrains IDE上,也能单独用。它能帮你轻松写、建、测、发技术文档,像产品说明、API参考、开发指南等都能搞定。 特点: 文档即代码:它让你像管代码一样管文档&…

【大数据Spark】常见面试题(万字!建议收藏)

文章目录 入门级中等难度中高级难度数据倾斜解决方法 入门级 什么是Apache Spark?它与传统的MapReduce有何不同? Apache Spark是一个开源的分布式计算系统,它提供了高效的数据处理和分析能力。与传统的MapReduce相比,Spark具有更快…

海光CPU:国产信创的“芯“动力解读

国产信创CPU-海光CPU CPU:信创根基,国之重器 国产CPU形成三大阵营:自主架构、x86及ARM。自主阵营中,龙芯和申威以LoongArch和SW-64为基石;ARM阵营由鲲鹏、飞腾主导,依托ARM授权研发处理器;x86阵…

红帽练习 之逻辑卷 pv lv gv

逻辑卷习题 1 在/dev/sdb 存储设备上创建物理设备分区 创建2个大小各为256MB的分区 并设置为linux lvm类型 使用first 和second 作为这些分区的名称 parted /dev/sdb mklabel gpt parted /dev/sdb primary mkpart first 1M 256M parted /dev/sdb set 1 …

【Linux|数据恢复】extundelete和ext4magic数据恢复工具使用

环境:Centos7.6_x86 一、extundelete工具 1、extundelete介绍 Extundelete 是一个数据恢复工具,用于从 ext3 或 ext4 分区中恢复删除文件。根据官网0.2.4版本介绍是支持ext4,但实际上使用发现ext4格式有些问题,会报以下错误&…

动态SQL IF语句

IF语句学习 第一种写法(标准) 我们先来看以下标准写法: select * from .. <where> <if test""> and ....... <if test""> and ....... <where> 我们用了一个where标签 , 内嵌if语句 第二种写法: 这是第二种写法:不用where标…

大降分!重邮计算机专硕复试线大降50分!重庆邮电计算机考研考情分析!

重庆邮电大学&#xff08;Chongqing University of Posts and Telecommunications&#xff09;简称重邮&#xff0c;坐落于中国重庆市主城区南山风景区内&#xff0c;是中华人民共和国工业和信息化部与重庆市人民政府共建的教学研究型大学&#xff0c;入选国家“中西部高校基础…

一篇文章搞懂Go语言切片底层原理(图文并茂+举例讲解)

1. 切片和数组的底层关系 Go语言切片的数据结构是一个结构体&#xff1a; type slice struct {array unsafe.Pointerlen intcap int }Go语言中切片的内部结构包含地址、大小和容量。将数组比喻成一个蛋糕&#xff0c;那么切片就是需要切的那一块&#xff0c;而那一块的的…

c++学生管理系统

想要实现的功能 1&#xff0c;可以增加学生的信息&#xff0c;包括&#xff08;姓名&#xff0c;学号,c成绩&#xff0c;高数成绩&#xff0c;英语成绩&#xff09; 2&#xff0c;可以删除学生信息 3&#xff0c;修改学生信息 4&#xff0c;显示所有学生信息 5&#xff0c…

支持AMD GPU的llm.c

anthonix/llm.c: LLM training in simple, raw C/HIP for AMD GPUs (github.com) llm.c for AMD devices This is a fork of Andrej Karpathys llm.c with support for AMD devices. 性能 在单个7900 XTX显卡上使用默认设置&#xff0c;目前的训练步骤耗时约为79毫秒&#x…

Docker的安装、启动和配置镜像加速

前言&#xff1a; Docker 分为 CE 和 EE 两大版本。CE 即社区版&#xff08;免费&#xff0c;支持周期 7 个月&#xff09;&#xff0c;EE 即企业版&#xff0c;强调安全&#xff0c;付费使用&#xff0c;支持周期 24 个月。 而企业部署一般都是采用Linux操作系统&#xff0c;而…

【软件设计师】2022年上半年真题解析

​​冯诺依曼计算机体系结构的基本特点是&#xff1a; A. 程序指令和数据都采用二进制表示 - 这是正确的&#xff0c;因为冯诺依曼架构下的计算机使用二进制形式来表示和处理所有信息&#xff0c;包括指令和数据。 B. 程序指令总是存储在主存中&#xff0c;而数据则存储在高速…

Java基础语法详解——入门学习教程

Java 基础 目录 一、数据类型 基本类型包装类型缓存池 二、String 概览不可变的好处String, StringBuffer and StringBuilder String Poolnew String(“abc”) 三、运算 参数传递float 与 double隐式类型转换switch 四、关键字 finalstatic 五、Object 通用方法 概览equals()ha…

深入解析 MongoDB Map-Reduce:强大数据聚合与分析的利器

Map-Reduce 是一种用于处理和生成大数据集的方法&#xff0c;MongoDB 支持 Map-Reduce 操作以执行复杂的数据聚合任务。Map-Reduce 操作由两个阶段组成&#xff1a;Map 阶段和 Reduce 阶段。 基本语法 在 MongoDB 中&#xff0c;可以使用 db.collection.mapReduce() 方法执行…

IsoBench:多模态基础模型性能的基准测试与优化

随着多模态基础模型的快速发展&#xff0c;如何准确评估这些模型在不同输入模态下的性能成为了一个重要课题。本文提出了IsoBench&#xff0c;一个基准数据集&#xff0c;旨在通过提供多种同构&#xff08;isomorphic&#xff09;表示形式的问题&#xff0c;来测试和评估多模态…

算法(十三)回溯算法---N皇后问题

文章目录 算法概念经典例子 - N皇后问题什么是N皇后问题&#xff1f;实现思路 算法概念 回溯算法是类似枚举的深度优先搜索尝试过程&#xff0c;主要是再搜索尝试中寻找问题的解&#xff0c;当发生不满足求解条件时&#xff0c;就会”回溯“返回&#xff08;也就是递归返回&am…

enum4linux一键查询SMB信息(KALI工具系列十六)

目录 1、KALI LINUX简介 2、enum4linux工具简介 3、在KALI中使用enum4linux 3.1 目标主机IP&#xff08;win&#xff09; ​编辑 3.2 KALI的IP 4、操作示例 4.1 运行工具 4.2 列出用户名 4.3 提取用户名 4.4 使用自定义RID范围 4.5 列出组 4.6 列出共享文件夹 4.7…

【笔记小记】掌握市场脉动:全营销解决方案的力量

前面虽然说了这个模型&#xff0c;而且是分章说的&#xff0c;那么在此以笔记小记的形式再说一下&#xff0c;企业面临的挑战与日俱增&#xff0c;消费者需求的多样化、技术的不断进步、全球化的深入以及社会责任的日益重要&#xff0c;这些因素共同塑造了市场的现状和未来&…

网络监听技术

网络监听技术 网络监听概述网络监听环境 流量劫持网络环境共享式网络监听原理交换式网络监听交换机的工作方式交换网络监听&#xff1a;交换机集线器交换网络监听&#xff1a;端口镜像交换网络监听&#xff1a;MAC洪泛交换网络监听&#xff1a;MAC洪泛交换网络监听&#xff1a;…

【Unix】消息类的格式与使用

本文给出一个MacOS操作系统中的消息类的使用过程示例&#xff08;结合gencat命令&#xff0c;<nl_types.h>头文件以及catopen,catgets,catclose3个函数&#xff09; 首先根据对应的操作系统&#xff0c;查看gencat命令 man gencat 可以详细看到其中对于输入文件&#x…