目录
一、 openpyxl库的由来
1、背景
2、起源
3、发展
4、特点
4-1、支持.xlsx格式
4-2、读写Excel文件
4-3、操作单元格
4-4、创建和修改工作表
4-5、样式设置
4-6、图表和公式
4-7、支持数字和日期格式
二、openpyxl库的优缺点
1、优点
1-1、支持现代Excel格式
1-2、功能丰富
1-3、易于使用
1-4、与Excel兼容性
1-5、性能良好
1-6、社区支持
1-7、跨平台
2、缺点
2-1、不支持旧版格式
2-2、某些特性支持有限
2-3、内存占用
2-4、文档和示例可能不足
2-5.、依赖关系
2-6、学习曲线
三、openpyxl库的用途
1、读取Excel文件
2、写入Excel文件
3、修改Excel文件
4、自动化
5、与Excel交互
6、数据迁移和转换
7、创建模板化的报告
四、如何学好openpyxl库?
1、获取openpyxl库的属性和方法
2、获取xlwt库的帮助信息
3、用法精讲
3-11、openpyxl.Workbook.remove方法
3-11-1、语法
3-11-2、参数
3-11-3、功能
3-11-4、返回值
3-11-5、说明
3-11-6、用法
3-12、openpyxl.Workbook.remove_sheet方法
3-12-1、语法
3-12-2、参数
3-12-3、功能
3-12-4、返回值
3-12-5、说明
3-12-6、用法
3-13、openpyxl.Workbook.save方法
3-13-1、语法
3-13-2、参数
3-13-3、功能
3-13-4、返回值
3-13-5、说明
3-13-6、用法
3-14、openpyxl.Workbook.create_named_range方法
3-14-1、语法
3-14-2、参数
3-14-3、功能
3-14-4、返回值
3-14-5、说明
3-14-6、用法
3-15、openpyxl.Workbook.create_sheet方法
3-15-1、语法
3-15-2、参数
3-15-3、功能
3-15-4、返回值
3-15-5、说明
3-15-6、用法
五、推荐阅读
1、Python筑基之旅
2、Python函数之旅
3、Python算法之旅
4、Python魔法之旅
5、博客个人主页
一、 openpyxl库的由来
openpyxl库的由来可以总结为以下几点:
1、背景
在openpyxl库诞生之前,Python中缺乏一个专门用于读取和编写Office Open XML格式(如Excel 2010及更高版本的.xlsx文件)的库。
2、起源
openpyxl库的创建是为了解决上述提到的Python在处理Excel文件时的不足,它的开发受到了PHPExcel团队的启发,因为openpyxl最初是基于PHPExcel的。
3、发展
随着时间的推移,openpyxl逐渐发展成为一个功能强大的Python库,专门用于处理Excel文件。它支持Excel 2010及更高版本的文件格式,并提供了丰富的API,用于读取、写入、修改Excel文件。
4、特点
4-1、支持.xlsx格式
openpyxl主要用于处理Excel 2010及更新版本的.xlsx文件。
4-2、读写Excel文件
使用openpyxl可以读取现有的Excel文件,获取数据,修改数据,并保存到新的文件中。
4-3、操作单元格
openpyxl允许用户按行、列或具体的单元格进行数据的读取和写入。
4-4、创建和修改工作表
用户可以创建新的工作表,复制和删除现有的工作表,设置工作表的属性等。
4-5、样式设置
openpyxl支持设置单元格的字体、颜色、边框等样式。
4-6、图表和公式
用户可以通过openpyxl创建图表、添加公式等。
4-7、支持数字和日期格式
openpyxl能够正确处理数字和日期格式,确保在Excel中显示正确的格式。
综上所述,openpyxl库的出现填补了Python在处理Excel文件时的空白,经过不断的发展和完善,成为了一个功能丰富、易于使用的Python库。
二、openpyxl库的优缺点
openpyxl库是一个用于读写Excel 2010 xlsx/xlsm/xltx/xltm文件的Python库,它基于Python,并且对于处理Excel文件提供了很多便利的功能,其主要优缺点有:
1、优点
1-1、支持现代Excel格式
openpyxl支持.xlsx格式的Excel文件,这是Excel 2010及更高版本使用的格式,也是目前广泛使用的格式。
1-2、功能丰富
openpyxl提供了创建、修改和保存Excel工作簿、工作表、单元格、图表、公式、图像等功能。
1-3、易于使用
openpyxl的API设计得相对直观,使得Python开发者能够很容易地掌握和使用。
1-4、与Excel兼容性
openpyxl能够处理Excel文件中的很多复杂特性,如公式、样式、条件格式等,这确保了与Excel的良好兼容性。
1-5、性能良好
在处理大型Excel文件时,openpyxl通常能够保持较好的性能。
1-6、社区支持
openpyxl是一个开源项目,拥有活跃的社区支持和维护,这意味着开发者可以获得帮助和修复错误的快速响应。
1-7、跨平台
openpyxl可以在不同的操作系统上运行,包括Windows、Linux和macOS等。
2、缺点
2-1、不支持旧版格式
openpyxl不支持较旧的.xls格式(Excel 97-2003)。如果需要处理这种格式的文件,需要使用其他库如xlrd和xlwt(尽管这些库也面临一些兼容性和维护问题)。
2-2、某些特性支持有限
虽然openpyxl支持许多Excel特性,但可能对于某些高级或特定的Excel功能支持有限或不支持。
2-3、内存占用
在处理大型Excel文件时,openpyxl可能会占用较多的内存。这是因为openpyxl会将整个工作簿加载到内存中。
2-4、文档和示例可能不足
尽管openpyxl的文档相对完整,但对于某些高级功能或特定用例,可能缺乏足够的示例或详细解释。
2-5.、依赖关系
openpyxl依赖于lxml和et_xmlfile这两个Python库来处理XML和Excel文件,在某些环境中,可能需要额外安装这些依赖项。
2-6、学习曲线
虽然openpyxl的API设计得相对直观,但对于初学者来说,可能需要一些时间来熟悉和掌握其用法。
三、openpyxl库的用途
openpyxl是一个用于读写Excel 2010 xlsx/xlsm/xltx/xltm文件的Python库。它是用Python编写的,不需要Microsoft Excel,并且支持多种Excel数据类型,包括图表、图像、公式等,其主要用途有:
1、读取Excel文件
你可以使用openpyxl来读取 Excel 文件中的数据,如单元格值、工作表名称、公式等,它支持多种数据类型,如字符串、数字、日期等。
2、写入Excel文件
使用openpyxl,你可以创建新的Excel文件或向现有文件添加数据,你可以设置单元格的字体、颜色、边框等样式,你还可以添加图表、图像和其他复杂的Excel功能。
3、修改Excel文件
你可以使用openpyxl来修改现有的Excel文件,如更改单元格值、添加或删除工作表等,这对于自动化数据处理和报告生成非常有用。
4、自动化
openpyxl可以与其他Python库和框架(如 pandas、numpy、matplotlib 等)结合使用,以自动化数据处理和分析任务。你可以编写脚本来从多个数据源收集数据,将数据整合到 Excel 文件中,并执行各种数据分析任务。
5、与Excel交互
如果你正在开发需要与Excel交互的应用程序或工具,openpyxl可以提供一个强大的API来处理Excel文件,它允许你读取和写入Excel文件,而无需依赖Microsoft Excel或其他第三方库。
6、数据迁移和转换
使用openpyxl,你可以轻松地将数据从Excel文件迁移到其他数据库或文件格式,或将其他数据源的数据导入到Excel文件中。
7、创建模板化的报告
你可以使用openpyxl来创建模板化的Excel报告,并在需要时填充数据,这对于需要定期生成具有一致格式和布局的报告的场景非常有用。
总之,openpyxl是一个功能强大的库,可用于在Python中处理Excel文件,它提供了灵活的API来读取、写入、修改和自动化Excel文件的各个方面。
四、如何学好openpyxl库?
1、获取openpyxl库的属性和方法
用print()和dir()两个函数获取openpyxl库所有属性和方法的列表
# ['DEBUG', 'DEFUSEDXML', 'LXML', 'NUMPY', 'Workbook', '__author__', '__author_email__', '__builtins__', '__cached__',
# '__doc__', '__file__', '__license__', '__loader__', '__maintainer_email__', '__name__', '__package__', '__path__',
# '__spec__', '__url__', '__version__', '_constants', 'cell', 'chart', 'chartsheet', 'comments', 'compat', 'constants',
# 'descriptors', 'drawing', 'formatting', 'formula', 'load_workbook', 'open', 'packaging', 'pivot', 'reader', 'styles',
# 'utils', 'workbook', 'worksheet', 'writer', 'xml']
2、获取xlwt库的帮助信息
用help()函数获取openpyxl库的帮助信息
Help on package openpyxl:NAMEopenpyxl - # Copyright (c) 2010-2024 openpyxlPACKAGE CONTENTS_constantscell (package)chart (package)chartsheet (package)comments (package)compat (package)descriptors (package)drawing (package)formatting (package)formula (package)packaging (package)pivot (package)reader (package)styles (package)utils (package)workbook (package)worksheet (package)writer (package)xml (package)SUBMODULESconstantsDATADEBUG = FalseDEFUSEDXML = FalseLXML = TrueNUMPY = True__author_email__ = 'charlie.clark@clark-consulting.eu'__license__ = 'MIT'__maintainer_email__ = 'openpyxl-users@googlegroups.com'__url__ = 'https://openpyxl.readthedocs.io'VERSION3.1.3AUTHORSee AUTHORSFILEe:\python_workspace\pythonproject\lib\site-packages\openpyxl\__init__.py
3、用法精讲
3-11、openpyxl.Workbook.remove方法
3-11-1、语法
remove(self, worksheet)Remove `worksheet` from this workbook.
3-11-2、参数
3-11-2-1、self(必须):一个对实例对象本身的引用,在类的所有方法中都会自动传递。
3-11-2-2、worksheet(必须):一个worksheet对象,表示需要删除的工作表对象。
3-11-3、功能
用于从工作簿中删除指定的工作表。
3-11-4、返回值
该方法没有返回值,但会直接从工作簿中删除指定的工作表。
3-11-5、说明
3-11-5-1、引用:确保传入的worksheet对象是当前工作簿中的有效工作表。如果传入一个不属于当前工作簿的工作表对象,会引发ValueError异常。
3-11-5-2、不可恢复:一旦删除工作表,这个操作是不可恢复的,请确保你真的要删除这个工作表,或者提前备份重要的数据。
3-11-5-3、最少工作表:工作簿中至少要保留一个工作表,不能全部删除。如果尝试删除最后一个工作表,会引发ValueError异常。
3-11-6、用法
# 11、openpyxl.Workbook.remove方法
from openpyxl import Workbook
# 创建一个新的工作簿
wb = Workbook()
# 创建多个工作表
ws1 = wb.create_sheet(title="Sheet1")
ws2 = wb.create_sheet(title="Sheet2")
ws3 = wb.create_sheet(title="Sheet3")
# 初始工作表顺序
print([sheet.title for sheet in wb.worksheets])
# 删除 "Sheet2" 工作表
wb.remove(ws2)
# 删除后的工作表顺序
print([sheet.title for sheet in wb.worksheets])
3-12、openpyxl.Workbook.remove_sheet方法
3-12-1、语法
remove_sheet(self, worksheet)Remove `worksheet` from this workbook... note::Deprecated: Use wb.remove(worksheet) or del wb[sheetname]
3-12-2、参数
3-12-2-1、self(必须):一个对实例对象本身的引用,在类的所有方法中都会自动传递。
3-12-2-2、worksheet(必须):一个worksheet对象,表示需要删除的工作表对象。
3-12-3、功能
用于从工作簿中删除指定的工作表。
3-12-4、返回值
该方法没有返回值,但会直接从工作簿中删除指定的工作表。
3-12-5、说明
从openpyxl 2.5版本开始,这个方法已经被弃用,推荐使用remove方法代替。
3-12-6、用法
# 12、openpyxl.Workbook.remove_sheet方法
from openpyxl import Workbook
# 创建一个新的工作簿
wb = Workbook()
# 创建多个工作表
ws1 = wb.create_sheet(title="Sheet1")
ws2 = wb.create_sheet(title="Sheet2")
ws3 = wb.create_sheet(title="Sheet3")
# 初始工作表顺序
print([sheet.title for sheet in wb.worksheets])
# 删除 "Sheet2" 工作表 (不推荐使用的旧方法)
wb.remove_sheet(ws2)
# 删除 "Sheet2" 工作表 (推荐的现代方法)
# wb.remove(ws2)
# 删除后的工作表顺序
print([sheet.title for sheet in wb.worksheets])
3-13、openpyxl.Workbook.save方法
3-13-1、语法
save(self, filename)Save the current workbook under the given `filename`.Use this function instead of using an `ExcelWriter`... warning::When creating your workbook using `write_only` set to True,you will only be able to call this function once. Subsequent attempts tomodify or save the file will raise an :class:`openpyxl.shared.exc.WorkbookAlreadySaved` exception.
3-13-2、参数
3-13-2-1、self(必须):一个对实例对象本身的引用,在类的所有方法中都会自动传递。
3-13-2-2、filename(必须):一个字符串或二进制模式下保存的类似文件的对象,表示要保存的Excel文件的路径或类似文件的对象。
3-13-3、功能
用于将工作簿保存到文件中。
3-13-4、返回值
没有返回值(或者返回None),它的主要目的是执行保存操作。
3-13-5、说明
3-13-5-1、文件格式:确保文件名的后缀为.xlsx,因为openpyxl主要处理这种格式。如果使用其他后缀,可能会引发兼容性问题。
3-13-5-2、覆盖文件:如果指定的文件已经存在,save方法会覆盖该文件而不会警告。因此,保存之前要确保不会误覆盖重要文件。
3-13-5-3、路径问题:可以传入相对路径或绝对路径。如果是相对路径,文件会保存在当前工作目录下,可以使用pathlib.Path来更方便地处理路径。
3-13-6、用法
# 13、openpyxl.Workbook.save方法
# 13-1、保存在当前目录下
from openpyxl import Workbook
# 创建一个新的工作簿
wb = Workbook()
# 设置文件名
filename = "example.xlsx"
# 保存工作簿
wb.save(filename)# 13-2、使用pathlib.Path灵活处理路径,可根据需求指定
from openpyxl import Workbook
from pathlib import Path
# 创建一个新的工作簿
wb = Workbook()
# 使用 Path 设置文件路径
file_path = Path("example.xlsx")
# 保存工作簿
wb.save(file_path)
3-14、openpyxl.Workbook.create_named_range方法
3-14-1、语法
create_named_range(self, name, worksheet=None, value=None, scope=None)Create a new named_range on a worksheet.. note::Deprecated: Assign scoped named ranges directly to worksheets or global ones to the workbook. Deprecated in 3.1
3-14-2、参数
3-14-2-1、self(必须):一个对实例对象本身的引用,在类的所有方法中都会自动传递。
3-14-2-2、name(可选):一个字符串,表示命名范围的名称。
3-14-2-3、worksheet(可选):一个worksheet对象,表示命名范围所属的工作表。
3-14-2-4、value(可选):字符串、元组或CellRange等,表示
命名范围对应的单元格范围。可以是一个字符串形式的范围(如 "A1:B2"),也可是一个包含起始和结束单元格的元组(如 ("A1"
, "B2"
)),还可以是一个CellRange对象。
3-14-2-5、scope(可选):一个整数,表示命名范围的作用域。作用域决定了命名范围的可见性,如果不提供,命名范围将全局可见。
3-14-3、功能
用于在工作簿中创建命名范围。
3-14-4、返回值
没有返回值。它的作用是将命名范围添加到工作簿中,因此它不会返回任何值。
3-14-5、说明
3-14-5-1、名称唯一性:确保命名范围的名称在整个工作簿中是唯一的。
3-14-5-2、范围有效性:确保指定的单元格范围在工作表中是有效的。
3-14-5-3、作用域:默认情况下,命名范围在全局范围内可见。如果需要在特定工作表中限定命名范围,可以使用scope参数。
3-14-6、用法
# 14、openpyxl.Workbook.create_named_range方法
from openpyxl import Workbook
from openpyxl.worksheet.cell_range import CellRange
# 创建一个新的工作簿和工作表
wb = Workbook()
ws = wb.active
# 填充一些数据
ws['A1'] = 10
ws['B1'] = 20
# 创建命名范围
wb.create_named_range(name="MyNamedRange",worksheet=ws,value="A1:B1"
)
# 或者使用 CellRange 对象
range_obj = CellRange("A1", "B1")
wb.create_named_range(name="AnotherNamedRange",worksheet=ws,value=range_obj
)
# 保存工作簿
wb.save("example.xlsx")
3-15、openpyxl.Workbook.create_sheet方法
3-15-1、语法
create_sheet(self, title=None, index=None)Create a worksheet (at an optional index).:param title: optional title of the sheet:type title: str:param index: optional position at which the sheet will be inserted:type index: int
3-15-2、参数
3-15-2-1、self(必须):一个对实例对象本身的引用,在类的所有方法中都会自动传递。
3-15-2-2、title(可选):一个字符串(默认值为None),表示工作表的标题。
3-15-2-3、index(可选):一个整数(默认值为None),表示用于指定新工作表应该被插入的位置索引。
3-15-3、功能
用于在当前的工作簿中创建一个新的工作表。
3-15-4、返回值
返回一个代表新创建的工作表的对象。
3-15-5、说明
针对参数index,相关说明如下:
3-15-5-1、不提供index参数,新工作表将默认添加到工作簿的末尾。
3-15-5-2、基于0开始,第一个工作表的索引是0,第二个工作表的索引是1,依此类推。
3-15-5-3、如果提供的索引值已经存在对应的工作表,新工作表将被插入到该位置,并可能导致其他工作表的位置发生变动。
3-15-6、用法
# 15、openpyxl.Workbook.create_sheet方法
from openpyxl import Workbook
# 创建一个新的工作簿
wb = Workbook()
# 创建一个没有指定标题和索引的新工作表(将默认添加到末尾,标题为 "Sheet" 后跟数字)
ws1 = wb.create_sheet()
# 创建一个标题为 "Data" 的新工作表,并指定它应该被插入到索引为 0 的位置(即作为第一个工作表)
ws2 = wb.create_sheet(title="Data", index=1)
# 创建一个标题为 "Report" 的新工作表,并默认添加到末尾(因为未指定索引)
ws3 = wb.create_sheet(title="Report")
# 保存工作簿
wb.save("example.xlsx")