一、每日一题
+-------------+---------+ | Column Name | Type | +-------------+---------+ | product_id | int | | store1 | int | | store2 | int | | store3 | int | +-------------+---------+ 在 SQL 中,这张表的主键是 product_id(产品Id)。 每行存储了这一产品在不同商店 store1, store2, store3 的价格。 如果这一产品在商店里没有出售,则值将为 null。
请你重构 Products
表,查询每个产品在不同商店的价格,使得输出的格式变为(product_id, store, price)
。如果这一产品在商店里没有出售,则不输出这一行。
输出结果表中的 顺序不作要求 。
查询输出格式请参考下面示例。
示例 1:
输入: Products table: +------------+--------+--------+--------+ | product_id | store1 | store2 | store3 | +------------+--------+--------+--------+ | 0 | 95 | 100 | 105 | | 1 | 70 | null | 80 | +------------+--------+--------+--------+ 输出: +------------+--------+-------+ | product_id | store | price | +------------+--------+-------+ | 0 | store1 | 95 | | 0 | store2 | 100 | | 0 | store3 | 105 | | 1 | store1 | 70 | | 1 | store3 | 80 | +------------+--------+-------+ 解释: 产品 0 在 store1、store2、store3 的价格分别为 95、100、105。 产品 1 在 store1、store3 的价格分别为 70、80。在 store2 无法买到。
解答:
# 该代码可直接运行
import pandas as pd# 创建示例 DataFrame
data = {'product_id': [0, 1],'store1': [95, 70],'store2': [100, None],'store3': [105, 80]}products_df = pd.DataFrame(data)# 使用melt函数将宽表格转换为长表格
melted_of = products_df.melt(id_vars='product_id', var_name='store', value_name='price')# 过滤掉price为null的行
result_df = melted_of.dropna(subset=['price'])# 重置索引以便更好地展示效果
result_df.reset_index(drop=True, inplace= True)# 打印结果 DataFrame
print(result_df)
题源:Leetcode
二、总结
本题考察数据重塑,需要知道melt的用法,详情使用方法之前有提到:
每日一题12:Pandas:数据重塑-融合
2024.6.1