一、chipotle tsv
数据集:chipotle.tsv-数据集
代码:https://download.csdn.net/download/Albert233333/88508819
1 导入数据
# order_id这一列相同的数字表示 一个消费者同一次进行的交易
# 表格中的每一行表示 用户一次购买的某一个品类 购买的数量
# 消费者可能一次购买很多个不同种类的东西,所以你会发现有好几行的item_name不同,但是order_id完全相同。
# 这都是同一个用户在同一个时间购买的(所以order_id完全相同),只不过购买的物品的种类不同(item_name不同)import pandas as pd
d = pd.read_csv("chipotle.tsv",delimiter="\t")
d
2 找出下单数最多的 item
# 这里仅仅统计的是单个
d.sort_values('quantity',ascending=False)
d.groupby("item_name").sum()[["quantity"]].head()
# 按照销售量最高排序
d.groupby("item_name").sum()[["quantity"]].sort_values(by="quantity", ascending=False)