1,高订单tag的top1-10的tag-id,作为user的单侧共10维特征的value
即一个list作为user单侧特征
缺点:丢失了user对每个tag的订单数量和tag-rank10以外的tag信息
2,高订单tag的top1-10的订单量,和高订单tag的top1-10的tag-id,一起作为user的单侧共20维特征的value
相当于一个map作为user单侧特征
缺点:丢失了tag-rank10以外的tag信息,所以也可以把所有不止top10-tag都放进Map,做成key有序的map,map的value-list作为特征值,tag种类/维度 太多可以想办法合并一下
优点:相当于模型判断user对一个item/tag是否感兴趣时,user单侧有比较完整的user对top10-tag的历史订单信息
3,作为共1维交叉特征,即存下user对(item的)每个tag的订单量,在模型训练时,每条训练数据有user列和tag列,tag列的每个值是user对该tag订单量,在模型预测时,输入user和tag,取到user对该tag的订单量 输入模型
缺点:相当于模型判断user对一个item/tag是否感兴趣时,user侧只有user对这一个tag的历史订单信息