锋哥原创的Pandas2 Python数据处理与分析 视频教程:
2025版 Pandas2 Python数据处理与分析 视频教程(无废话版) 玩命更新中~_哔哩哔哩_bilibili
Excel格式文件是办公使用和处理最多的文件格式之一,相比CSV文件,Excel是有样式的。Pandas2提供的read_excel()方法来读取excel文件,提供了很多强大的功能参数支持,让我们开发非常方便。
首先我们去看下read_excel()的方法的参数定义,很大一部分和csv参数一样。
def read_excel(io,sheet_name: str | int | list[IntStrT] | None = 0,*,header: int | Sequence[int] | None = 0,names: SequenceNotStr[Hashable] | range | None = None,index_col: int | str | Sequence[int] | None = None,usecols: int| str| Sequence[int]| Sequence[str]| Callable[[str], bool]| None = None,dtype: DtypeArg | None = None,engine: Literal["xlrd", "openpyxl", "odf", "pyxlsb", "calamine"] | None = None,converters: dict[str, Callable] | dict[int, Callable] | None = None,true_values: Iterable[Hashable] | None = None,false_values: Iterable[Hashable] | None = None,skiprows: Sequence[int] | int | Callable[[int], object] | None = None,nrows: int | None = None,na_values=None,keep_default_na: bool = True,na_filter: bool = True,verbose: bool = False,parse_dates: list | dict | bool = False,date_parser: Callable | lib.NoDefault = lib.no_default,date_format: dict[Hashable, str] | str | None = None,thousands: str | None = None,decimal: str = ".",comment: str | None = None,skipfooter: int = 0,storage_options: StorageOptions | None = None,dtype_backend: DtypeBackend | lib.NoDefault = lib.no_default,engine_kwargs: dict | None = None,
)
所以我们这里讲解一些read_excel独有的方法参数:
-
io:
-
类型: str, bytes, ExcelFile, xlrd.Book, path object, 或 file-like object
-
作用: Excel 文件的路径或文件对象
-
-
sheet_name:
-
类型: str, int, list, 或 None (默认 0)
-
作用: 指定要读取的工作表
-
示例:
-
0
: 读取第一个工作表 -
"Sheet1"
: 读取名为"Sheet1"的工作表 -
[0, 1]
: 读取前两个工作表,返回字典 -
None
: 读取所有工作表,返回字典
-
-
参考代码:
# 导入pandas库,去别名pd
import pandas as pd
df = pd.read_excel('student_scores.xlsx', sheet_name="Sheet2") # 指定第二个标签Sheet页
# df = pd.read_excel('student_scores.xlsx', sheet_name=1) # 指定第二个标签Sheet页
# df = pd.read_excel('student_scores.xlsx', sheet_name=[0, 1]) # 读取前两个工作页,返回字典
# df = pd.read_excel('student_scores.xlsx', sheet_name=None) # 读取所有工作页
运行输出: