要查看数据集中某个特征(列)为 NA 的所有行,可以使用 Pandas 库中的 isna()
或 isnull()
函数来识别缺失值,然后使用布尔索引来筛选这些行。以下我举个例子:
假设数据集存储在一个名为 data.csv
的 CSV 文件中,我们想要查找其中名为 feature_name
的列中缺失值的所有行。
首先,我们需要导入 Pandas 库并读取数据:
import pandas as pd# 读取数据
df = pd.read_csv('data.csv')
然后,我们可以使用 isna()
函数来创建一个布尔索引,这个索引会标记出 feature_name
列中值为 NA 的行:
# 找到 feature_name 列中值为 NA 的行
na_rows = df[df['feature_name'].isna()]
最后,查看这些包含 NA 值的行:
# 显示这些行
print(na_rows)