案例 5: 数据过滤 - 使用条件过滤数据
知识点讲解
数据过滤是数据分析中的常见需求,它允许你基于一定条件从数据集中筛选出感兴趣的数据子集。
示例代码
基于单个条件过滤
# 筛选出某列值大于特定值的所有行
filtered_data = df[df['Column'] > 10]
print(filtered_data.head())
基于多个条件过滤
# 使用 & 运算符结合多个条件
filtered_data_multiple = df[(df['Column1'] > 10) & (df['Column2'] < 20)]
print(filtered_data_multiple.head())# 使用 | 运算符结合多个条件
filtered_data_or = df[(df['Column1'] > 10) | (df['Column2'] < 20)]
print(filtered_data_or.head())
使用 isin
方法过滤
# 筛选出列值在特定列表中的行
filtered_isin = df[df['Column'].isin([10, 20, 30])]
print(filtered_isin.head())
使用 query
方法过滤
# 使用 query 方法进行过滤
filtered_query = df.query('Column > 10')
print(filtered_query.head())
代码解释:
- 使用布尔索引过滤满足条件的行。
&
和|
运算符分别用于结合多个条件。isin
方法用于检查列值是否在指定的列表中。query
方法提供了一种更为灵活的方式来过滤数据。
通过这些过滤技巧,你可以轻松地从复杂的数据集中提取出有用的信息。