文章目录
- python操作EXCEL
- Pandas 操作 Excel 的 DataFrame
- 总结
python操作EXCEL
在 Python 中,操作 Excel 文件通常使用以下几个库:
Pandas:强大的数据分析库,支持读取和写入 Excel 文件。
Openpyxl:专门用于读写 Excel 2010 xlsx/xlsm/xltx/xltm 文件。
xlrd:用于读取旧的 Excel 文件格式(.xls)。
xlwt:用于写入旧的 Excel 文件格式(.xls)。
pandas 可以处理两种格式,但需要依赖相应的库来处理不同的格式。
Pandas 操作 Excel 的 DataFrame
读取 Excel 文件
import pandas as pd# 读取 Excel 文件中的第一个表格
df = pd.read_excel('example.xlsx')# 若文件有多个表格,可以指定表格名称或索引
df = pd.read_excel('example.xlsx', sheet_name='Sheet1')
df = pd.read_excel('example.xlsx', sheet_name=0)
写入 Excel 文件
import pandas as pd# 创建一个 DataFrame
data = {'Name': ['John', 'Anna', 'Peter', 'Linda'],'Age': [28, 24, 35, 32]}
df = pd.DataFrame(data)# 写入 Excel 文件
df.to_excel('output.xlsx', index=False)
读取 .xls 文件
import pandas as pd# 读取 .xls 文件
df = pd.read_excel('example.xls', engine='xlrd')
写入 .xls 文件
import pandas as pd# 创建一个 DataFrame
data = {'Name': ['John', 'Anna', 'Peter', 'Linda'],'Age': [28, 24, 35, 32]}
df = pd.DataFrame(data)# 写入 .xls 文件
df.to_excel('output.xls', engine='xlwt', index=False)
总结
Pandas:适合处理日常数据分析任务,支持读取和写入 .xls 和 .xlsx 文件。
Openpyxl:专门处理 .xlsx 文件。
xlrd 和 xlwt:分别用于读取和写入 .xls 文件。
使用 Pandas 操作 Excel 文件时,Pandas 会根据文件后缀自动选择合适的引擎来处理文件格式。