人物志 | KDD Cup 2017双料冠军燕鹏

2017年数据挖掘领域最有影响力的赛事KDD Cup近日揭晓，Convolution队从全球70个国家的3582支队伍里脱颖而出，包揽两项任务的冠军。这支双料冠军队成员名单里，有一个我们熟悉的名字——美团点评高级技术专家燕鹏。

说燕鹏可能大家并不一定知道，但提起燕鹏的网名Eureka，玩算法竞赛的同学一定不会陌生。是的，燕鹏同学就是在世界最大的算法竞赛平台Kaggle总排名第5的Eureka，目前在所有中国同学里排名最高，历史总成绩是16金13银3铜。

现在，就让我们一起来认识一下这位身边的大神吧。

对话燕鹏

Q：Hi燕鹏，请先简单介绍一下自己。

燕鹏：2002年清华硕士毕业，主要做模式识别。2002-2005在创业公司做计算机视觉相关工作，2005-2008年自己创业，2008-2016年在网易做广告相关的事情。2016年4月来到美团，主要负责酒旅排序的工作，现在到了金融服务平台，做机器学习相关的工作。

这几份工作都和数据挖掘专业相关，都是用机器学习来解决不同的问题，前期主要偏向图像，后期偏向数据相关。

Q：那说说你的KDD Cup经历吧。

燕鹏：这个大赛在圈子里还是很有名的，20年悠久历史了。算上这次我已经参加三次了。

第一次是2015年，当时我是队长，和7个不同国家（小编查了一下有美国日本韩国奥地利新加坡……）的人加上另外一个清华的同学，我们9个人组了队伍。队名就叫InterContinental Ensemble（洲际天团）哈哈。

大家在各个国家，用Skype，然后不同的时差，最后在一个时间点上等待着最终成绩的发布，最后我们第一名，这个让我印象很深刻。

等待成绩的时候一开始很忐忑，因为并不知道自己第几名。我们前几名的差距非常非常小，谁都可能是第一名，所以当时知道自己是第一名的时候，我们几个都炸掉了！

Q：所以你已经拿过一次冠军了啊。

燕鹏：是啊。其实这次你们要是不说，也就过去了。这次我不是队长，只是队里的老大哥。

Q：那第二次呢？好像没成绩？

燕鹏：2016年第二次也做完了，但由于算错了时差，答案提交得较晚，错过了获奖机会。

Q：说说这次冠军之路吧。

燕鹏：说实话，第一次赢了之后还是很高兴的。这次就没有那么强感觉了。相当于找人打了一局王者荣耀，赢了也没有值得炫耀的事情，输了也就输了。

另外第一次的前几名都是外国人，这一次比赛多是中国人，基本也没什么好说的。

Q：还是说说细节和感受吧。（小编心理活动：不然我怎么写稿子啊）

燕鹏：今年组队的同学里，有两个微软的（胡可和黄攀），一个是北航的研究生（陈欢），其中微软的小伙子是队长。我们线下认识，就商量说一起玩一下吧。我们几个人都有Kaggle比赛的冠军经验，所以实力还是很强的。

我是抱着玩儿的心态去的，他们比我更想赢，毕竟还没有赢过嘛。很多玩数据挖掘的人，都想赢一次KDD，它是一个相对于知名度较高的比赛，夸张的说，这个比赛是这个圈子里的奥林匹克。

本次大赛的题目，还是有一定挑战性的。具体可以看胡可的分享。

小编从胡可分享Slides里找到这幅图

这次数据比较少，意味着你的方法结果会不稳定，这种不稳定会意味着最后要靠一些运气来争夺输赢。应该是实力+运气的组合，这两个的组合不太好量化，其实很多比赛到了最后比1、2、3名的时候，都会靠一点点运气。曾经我有一次比赛，在十万分位的比别人高一点点，赢了。

Q：你们几个人是怎么合作的？

燕鹏：我们会先从自己的技术积累出发，充分讨论技术点和可能的方案。然后自由探索，分别给出自己的解决思路。这样做的好处是，不会一上来就把思路限制住。最后再进行充分融合。

Q：你觉得在KDD这种比赛取得好成绩，需要哪些能力和素质？

燕鹏：首先数学得好。

第二是实践实践实践。经验很重要，用数据挖掘、机器学习的方法来解决各种各样的问题的经验。多做，多用机器学习解决各种各样的问题，那么你再来一个新问题，哪怕是以前都没有从来没有做过的问题，可能都会做得出来。

在这个比赛之前，我也参加过各种各样的比赛，一方面是看时间，一方面是看问题。我以前喜欢做我擅长的，如广告，后来就越来越杂，比如这次的是交通的问题，我也做过金融、教育、医疗的问题。这个就是兴趣，你可能看到一个新的东西，你就会要解决他，觉得这个还挺高兴的。

除了数学好，对数据得敏感，这个不知道怎么更好的描述，有些人先天看到数据就会很感兴趣，就会找到规律，我们经常会用数据来说明情况。

Q：你是怎么加入美团点评的？

燕鹏：噢，原来的公司搬家了，搬远了。我家就在望京，美团点评离家很近，就来了。（小编心理活动：能不能别尽说大实话啊。）

Q：那来了美团点评以后感觉怎么样？

燕鹏：各方面都挺好的，对公司很满意。Leader对我很信任，能给我一些空间，让我做一些探索性的事情。

Q：对从事算法工作的同学，有什么建议？

燕鹏：我一直的观点，Paper+方法都要有。

机器学习发展的速度非常快，从事算法的同学应该更多的去Follow学术界和工业界的最新研究成果，想办法把这些研究成果运用到自己的工作中去。

另外，我觉得搞数据挖掘的同学可以多参加KDD这样的比赛，这是一个不错的学习的方式。大家从论文能学到东西，确实有很多新的方法，但是这种比赛里面会有很多技巧性的东西，这种技巧性的东西往往可能不是特别的深奥，写不出paper来，但也是非常有用的。

所以这两者不会重叠，会有一些互补。

Q：最后一个问题，有什么优秀的学习资料可以推荐给大家？

燕鹏：我推荐《The Elements of Statistical Learning》，比较难，但我非常喜欢。初级一点的同学，可以去学台大林轩田教授的机器学习课程。

低调，实在，但其实挺牛、挺靠谱。嗯，这就是我们美团点评技术团队。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/478493.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！