2月9日在洛杉矶举行的第11届网络搜索与数据挖掘国际会议(WSDM 2018)上,公布了今年的WSDM Cup竞赛成绩,来自阿里巴巴的AliOS团队凭借优秀的算法能力,摘得榜眼。
这是该赛事举办11届以来,中国企业在该赛事上首次取得的最高名次。阿里技术同学受邀赴美做Oral报告并领奖。
图:阿里技术同学受邀做Oracl报告并领奖
WSDM被誉为信息检索领域最顶级的会议之一,本次WSDM Cup挑战赛有来自全球575只队伍参赛,包括中国科学技术大学、北京大学、巴黎综合理工学校、微软等全球知名高校和企业参加。
此次比赛出题方是一家名为KKBOX的流媒体音乐公司,赛题内容是预测3月订阅到期的用户中,哪些会流失。
具体是参赛者要利用KKBOX数据集建立智能算法来预测订阅用户是否会流失。对于依赖订阅业务的KKBOX来说,准确预测流失率是业务成功的关键。通过结果分析,以便KKBOX进一步了解用户需求,在保持用户活跃度上进一步采取营销行动。
为解决该题,阿里巴巴算法团队使用了两层Stacking Model,第一层采用逻辑回归、随机森林、XGBoost算法,第二层又采用XGBoost算法把第一层的结果融合,最终实现了精准预测。WSDM会议同时收录了技术团队提交的名为《A Practical Pipeline with Stacking Models for KKBox’s Churn Prediction Challenge》的论文。
其实早在KDD Cup2016的时候,阿里巴巴就开始尝试使用Stacking Model,经过两年的优化,如今该模型已经是一个比较完备的算法模型。
流失用户预测,对有会员体系的业务场景都可以使用,其中会员付费为主要收入的业务就更为关键,比如像Apple Music、虾米音乐。
多层Stacking Model由AliOS神灯研发,极大提升了分类预测的准确率,已广泛应用于AliOS多项业务中。