python合并word单元格_python之DataFrame实现excel合并单元格_python

这篇文章主要为大家详细介绍了python之DataFrame实现excel合并单元格,具有一定的参考价值,感兴趣的小伙伴们可以参考一下

在工作中经常遇到需要将数据输出到excel,且需要对其中一些单元格进行合并,比如如下表表格,需要根据A列的值,合并B、C列的对应单元格

65a8e87905614c3754af9f1793c27bad-0.png

pandas中的to_excel方法只能对索引进行合并,而xlsxwriter中,虽然提供有merge_range方法,但是这只是一个和基础的方法,每次都需要编写繁琐的测试才能最终调好,而且不能很好的重用。所以想自己写一个方法,结合dataframe和merge_range。大概思路是:

1、定义一个MY_DataFrame类,继承DataFrame类,这样能很好的利用pandas的很多特性,而不用自己重新组织数据结构。

2、定义一个my_mergewr_excel方法,参数分别为:输出excel的路径、用于判断是否需要合并的key_cols列表、用于指明哪些列上的单元格需要被合并的列表

3、将MY_DataFrame封装为一个My_Module模块,以备重用。

合并的算法如下:

1、根据给定参数的【关键列】,进行分组计数和排序,添加CN和RN两个辅助列

2、判断CN大于1的,该分组需要合并,否则该分组(行)无需合并(CN=1说明这个分组数据行是唯一的,无需合并)

3、对应需要合并的分组,判断当前列是不是在给定参数【合并列】中,是则用合并写excel单元格,否则就是普通的写excel单元格。

4、在需要合并的列中,如果对于的RN=1则调用merge_range,一次性写想下写CN个单元格,如果RN>1则跳过该单元格,因为在RN=1的时候,已经合并写了该单元格,若再重复调用erge_range,打开excel文档时会报错。

用图解释如下:

65a8e87905614c3754af9f1793c27bad-1.png

具体代码如下:

# -*- coding: utf-8 -*-

"""

Created on 20170301

@author: ARK-Z

"""

import xlsxwriter

import pandas as pd

class My_DataFrame(pd.DataFrame):

def __init__(self, data=None, index=None, columns=None, dtype=None, copy=False):

pd.DataFrame.__init__(self, data, index, columns, dtype, copy)

def my_mergewr_excel(self,path,key_cols=[],merge_cols=[]):

# sheet_name='Sheet1', na_rep='', float_format=None, columns=None, header=True, index=True, index_label=None, startrow=0, startcol=0, engine=None, merge_cells=True, encoding=None, inf_rep='inf', verbose=True):

self_copy=My_DataFrame(self,copy=True)

line_cn=self_copy.index.size

cols=list(self_copy.columns.values)

if all([v in cols for i,v in enumerate(key_cols)])==False: #校验key_cols中各元素 是否都包含与对象的列

print("key_cols is not completely include object's columns")

return False

if all([v in cols for i,v in enumerate(merge_cols)])==False: #校验merge_cols中各元素 是否都包含与对象的列

print("merge_cols is not completely include object's columns")

return False

wb2007 = xlsxwriter.Workbook(path)

worksheet2007 = wb2007.add_worksheet()

format_top = wb2007.add_format({'border':1,'bold':True,'text_wrap':True})

format_other = wb2007.add_format({'border':1,'valign':'vcenter'})

for i,value in enumerate(cols): #写表头

#print(value)

worksheet2007.write(0,i,value,format_top)

#merge_cols=['B','A','C']

#key_cols=['A','B']

if key_cols ==[]: #如果key_cols 参数不传值,则无需合并

self_copy['RN']=1

self_copy['CN']=1

else:

self_copy['RN']=self_copy.groupby(key_cols,as_index=False).rank(method='first').ix[:,0] #以key_cols作为是否合并的依据

self_copy['CN']=self_copy.groupby(key_cols,as_index=False).rank(method='max').ix[:,0]

#print(self)

for i in range(line_cn):

if self_copy.ix[i,'CN']>1:

#print('该行有需要合并的单元格')

for j,col in enumerate(cols):

#print(self_copy.ix[i,col])

if col in (merge_cols): #哪些列需要合并

if self_copy.ix[i,'RN']==1: #合并写第一个单元格,下一个第一个将不再写

worksheet2007.merge_range(i+1,j,i+int(self_copy.ix[i,'CN']),j, self_copy.ix[i,col],format_other) ##合并单元格,根据LINE_SET[7]判断需要合并几个

#worksheet2007.write(i+1,j,df.ix[i,col])

else:

pass

#worksheet2007.write(i+1,j,df.ix[i,j])

else:

worksheet2007.write(i+1,j,self_copy.ix[i,col],format_other)

#print(',')

else:

#print('该行无需要合并的单元格')

for j,col in enumerate(cols):

#print(df.ix[i,col])

worksheet2007.write(i+1,j,self_copy.ix[i,col],format_other)

wb2007.close()

self_copy.drop('CN', axis=1)

self_copy.drop('RN', axis=1)

调用代码:

import My_Module

DF=My_DataFrame({'A':[1,2,2,2,3,3],'B':[1,1,1,1,1,1],'C':[1,1,1,1,1,1],'D':[1,1,1,1,1,1]})

DF

Out[120]:

A B C D

0 1 1 1 1

1 2 1 1 1

2 2 1 1 1

3 2 1 1 1

4 3 1 1 1

5 3 1 1 1

DF.my_mergewr_excel('000_2.xlsx',['A'],['B','C'])

效果如下:

65a8e87905614c3754af9f1793c27bad-2.png

也可以设置合并A、B列:

DF.my_mergewr_excel('000_2.xlsx',['A'],['A','B'])

效果如下:

65a8e87905614c3754af9f1793c27bad-3.png

以上就是python之DataFrame实现excel合并单元格_python的详细内容,更多请关注php中文网其它相关文章!

article_wechat2021.jpg?1111

本文原创发布php中文网,转载请注明出处,感谢您的尊重!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/340162.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

java做服务器端给客户端传数据包_java 服务器怎样给客户端传输数据

展开全部服务器端源码:import java.io.BufferedReader;import java.io.File;import java.io.FileNotFoundException;import java.io.FileOutputStream;import java.io.IOException;import java.io.InputStream;import java.io.InputStreamReader;import java.net.Se…

pooled-jms_Hibernate隐藏的宝石:pooled-lo优化器

pooled-jms介绍 在这篇文章中,我们将揭示一个序列标识符生成器,​​它结合了标识符分配效率和与其他外部系统的互操作性(同时访问底层数据库系统)。 传统上,有两种序列标识符策略可供选择。 序列标识符,对…

apache geode项目结构_Apache Flink-基于Java项目模板创建Flink应用(流计算和批计算)...

Apache Flink创建模板项目有2种方式:1. 通过Maven archetype命令创建;2. 通过Flink 提供的Quickstart shell脚本创建;关于Apache Flink的环境搭建,请参考相关链接:Apache Flink快速入门-基本架构、核心概念和运行流程A…

使用UriBuilder快速创建URI

如果您有权访问JAX-RS API和项目中的实现(很多这样做),则可以使用JAX-RS的UriBuilder通过使用可解析占位符的构建器模式方便地创建URI。 看下面的例子: String host System.getProperty( "host" , "localhost&qu…

python中列表和元组的相同点和不同点_详解Python语言中元组和列表的区别

本篇介绍Python中的元组数据类型,文中会讨论元组与列表的区别,元组的声明、赋值及其相关运算。通过本篇的学习,可以达成如下目标。 ● 掌握元组和列表的区别 ● 掌握元组的声明和赋值 ● 掌握适用于元组的相关运算 Python元组和Python列表数据…

mysql的复制订阅_如何删除发布与复制订阅数据库 'distribuion' 的方法

之前因为从VFP数据库中把数据导入到SQL SERVER2000中,用DTS做了发布与复制数据库distribution ,现在要把它删除,当在企业管理器中执行删除时,提示下面的错误:Error 3724: cannot drop the database distribution becau…

matlabif语句怎么用_公益心 码客行(2)—— 简单语句

回顾与反思&#xff1a;cout语句的用法关于第一课的思考与实践问题&#xff0c;有答案了吗——请写出这个程序的输出结果。#include using namespace std;int main(){cout<<1<cout<<12<return 0;}提示&#xff1a;输出结果如下。13即&#xff1a;输出项为数值…

java 多线程 聊天_Java做一个多线程类似于QQ的聊天程序。

展开全部//时间关系,粗略的做了一下,一个模拟UDP协议的测试,图标,IP,以及端口都可以设成//发送者端的电脑参数32313133353236313431303231363533e78988e69d8331333366306533!import java.awt.BorderLayout;import java.awt.Color;import java.awt.GridLayout;import java.awt.e…

组织机构代码输入测试用例_测试代码以用于过大的输入

组织机构代码输入测试用例在编写单元测试时&#xff0c;我们主要关注业务的正确性。 我们将竭尽所能&#xff0c;开开心心地走在最前沿。 我们有时会进行微基准测试并衡量吞吐量。 但是经常遗漏的一个方面是当输入过大时我们的代码如何表现&#xff1f; 我们测试了如何处理正常…

python子进程关闭fd_python – 捕获崩溃的子进程的“分段错误”...

shell可能会生成“Segmentation fault”消息.要找出该过程是否被SIGSEGV杀死,请检查proc.returncode -signal.SIGSEGV.如果要查看消息,可以在shell中运行该命令&#xff1a;#!/usr/bin/env pythonfrom subprocess import Popen, PIPEproc Popen(shell_command, shellTrue, st…

layui 分页 固定底部_论layui的使用体验

layui这个东西有收费跟免费版本&#xff0c;当然我在工作当中用的是免费的版本。至于说我为什么要用这个东西了&#xff1f;原因是这样的&#xff0c;当时我们用的是datatables&#xff0c;由于前期工作上没有相关的需求说是要什么表格相关列固定啊&#xff0c;自动统计啊&…

巴特沃斯滤波器python_如何用Scipy.signal.bu实现带通巴特沃斯滤波器

您可以跳过button的使用&#xff0c;而只需为过滤器选择一个顺序&#xff0c;看看它是否符合您的过滤条件。要生成带通滤波器的滤波器系数&#xff0c;请将滤波器阶数、截止频率Wn[low, high]&#xff08;表示为奈奎斯特频率的分数&#xff0c;即采样频率的一半&#xff09;和频…

章鱼扫描仪:Java构建工具和恶意软件

Alvaro Munoz最近在GitHub Security Lab网站上发布了“ Octopus扫描程序恶意软件&#xff1a;攻击开源供应链 ”。 我发现这篇文章很有趣&#xff0c;原因有很多&#xff0c;其中包括对Octopus Scanner恶意软件如何工作以及如何被发现&#xff0c; GitHub安全事件报告团队 &…

java gnu_GNU/Linux下Java开发环境的安装和配置 | 学步园

首先下载JDK&#xff0c;在http://www.oracle.com/technetwork/java/javase/downloads/index.html下载最新版本的JDK&#xff0c;选择平台为linux&#xff0c;就会得到一个二进制文件&#xff0c;我得到的是jdk-6u23-linux-i586.bin&#xff0c;复制到需要安装的地方运行就会自…

css初始化_利用CSS变量实现炫酷的悬浮效果

这个动画是将鼠标移动到订阅按钮上移动光标会显示相应的彩色渐变。这个想法很简单&#xff0c;但是它能使这个按钮脱颖而出&#xff0c;人们一下子就注意到它了&#xff0c;增加了点击的概率。怎样才能达到这个效果&#xff0c;使我们的网站脱颖而出呢&#xff1f;其实&#xf…

glass fish_Glass Fish 4.0.1中的Jersey SSE功能

glass fishGlass Fish为各种Java EE规范捆绑了不同的参考实现&#xff0c;例如&#xff0c;CDI的Weld&#xff0c;JSF的Mojarra&#xff0c;WebSocket的Tyrus&#xff0c;JAX-RS的Jersey。 Glass Fish 4.0.1即将发布&#xff0c;并计划涵盖许多组件/模块的更新&#xff0c;这些…

java 区号_求您!JAVA作业,窗口查询区号!

窗口程序作业说明完成一个查询区号的窗口程序&#xff0c;功能要求如下(作业需要的数据见citycode.txt)程序打开时自动读取保存在文件中的数据信息程序至少提供一个输入及输出控件&#xff0c;一个查询按...窗口程序作业说明完成一个查询区号的窗口程序&#xff0c;功能要求如下…

css清除浮动的几种方法_web前端学习路线分享CSS浮动-清除浮动篇

web前端学习路线分享CSS浮动-清除浮动篇&#xff0c;为什么要清除浮动这里所说的清除浮动&#xff0c;并不是不要浮动了&#xff0c;而是清除浮动与浮动之间的影响。那么到底会有什么影响呢&#xff1f;1&#xff0e;高度塌陷举个例子我们看一下。我们在这里设置了div0是外容器…

AWS Lambda将数据保存在DynamoDB中

在本教程中&#xff0c;我们将看到如何使用AWS Lambda将数据保存在Dynamo DB中。 这是必需的步骤&#xff1a; – 在Dynamo数据库中创建一个名为Employee的表 –创建一个AWS Lambda函数&#xff0c;该函数可以使用Dynamo数据库中的Employee POJO保存雇员的名字和姓氏 –创建…

java 循环map 优雅写法_Java for循环Map集合优化实现解析

这篇文章主要介绍了java for循环map集合优化实现解析,文中通过示例代码介绍的非常详细&#xff0c;对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下在《for循环实战性能优化》中提出了五种提升for循环性能的优化策略&#xff0c;这次我们在其中嵌套循环优化小…