6月29日,由阿里巴巴集团、中国中文信息学会、KDD China联合主办的数据挖掘前沿发展与未来论坛在杭州举行,会议吸引了来自国际顶级高校和知名企业的近300名专家学者到场参会、近30000人在线观看。论坛除了分享最新的数据挖掘领域最新科研成果及研发思路外,来自国际知名企业、高校的代表还针对学术与产业如何互动合作展开了热烈的讨论。
中国中文信息学会社会媒体处理专委会主任、哈尔滨工业大学计算机学院刘挺教授现场表示,前沿技术落地一个很重要的方式就是通过校企合作,高校没有大数据,没有和用户交互的宝贵数据,如果闭门造车,研究成果并不能对企业产生帮助,不能很好的落地。如果企业和高校能共同研究,甚至一起承担国家级项目,可以达到双赢的目的,通过校企合作共同推进发展。
图为中国中文信息学会社会媒体处理专委会主任、哈尔滨工业大学教授、计算机学院副院长刘挺
事实上,校企双方在做前沿技术研究时正在面临不同维度的问题,这也是产学研一体化目标提出的基础。蚂蚁金服人工智能部技术总监李小龙表示,从工业界讲,深度学习目前还有一些难以克服的问题,比如风险模型,为什么不给这个人贷款,用深度学习没法做到,还有芝麻信用分,为什么他的高,为什么他的低,这个也是实际应用中必须认识到深度学习还是有缺陷的。清华大学计算机科学与技术系副教授崔鹏认为,深度学习之外其他的一些前沿方法,之所以没有在产业界推广开,一方面可能的原因是理论门槛过高,怎么在可控的条件内去调整它,不容易标准化;另一方面是技术发展到一定程度,比如说刷榜刷到顶了,就需要具备其他理论基础的人来进一步研究。阿里巴巴iDST(Institute of Data Science & Technologies,数据科学与技术研究院)负责人金榕现场分享了将Robust优化理论和双边匹配理论应用于阿里电子商务平台中的技术商业化案例,引起了广泛讨论。
图为阿里巴巴iDST负责人金榕与现场观众互动
近些年,随着阿里业务场景的不断丰富、业务体量的不断攀升,数据已经成为阿里技术中最关键的环节,如何用技术处理海量的数据,完成实时的业务需求,以及人货场的数据匹配,保护好数据安全,是阿里业务发展中的关键问题。在2017国际知识发现与数据挖掘大会(KDD)阿里集团和蚂蚁金服共有5篇论文中选被收录,涵盖深度学习、大规模图计算、商品智能排序等多个研究领域,这些前沿的学术成果正是在解决阿里商业体运转过程中出现的各类数据问题而凝结沉淀的。阿里在用技术拓展商业边界的同时,也在反哺学术界,开拓学术界技术创新的视野。
图为阿里巴巴集团技术发展部总监刘湘雯
当前,阿里正在积极探索产学研一体化并取得了系列成果,5月和浙江大学签署战略合作,成立“阿里巴巴-浙江大学前沿技术联合研究中心”,以双聘制引入学界人才配合阿里在人工智能、泛在信息安全、无障碍感知互联等前沿技术领域开展研究;引进国立台湾大学卓越教授、IEEE FELLOW、AAAI FELLOW以及ACM FELLOW林智仁作为技术顾问一起参与前沿技术的研发。阿里巴巴集团技术发展部总监刘湘雯在数据挖掘前沿发展与未来论坛上透露,阿里将在7月正式启动AIR计划,把未来1-2年阿里关注的话题和项目公开出去,期待老师们用学术力量来支持这些技术的发展。专家认为,阿里此番启动AIR计划,将吸引更多高端人才聚合到这家商业巨无霸周围,对促进前沿技术走出实验室,加速商业化落地,推动产学研一体化发展起到重大作用。