简介: 近期杭州云栖大会上出现了一个“数据博物馆”,最吸引眼球的“展品”,竟是行业大规模开源数据集。不仅数量多达上百个,还覆盖零售、文娱、工业、医疗、自然科学等数十个行业。既有来自真实业务场景的商品数据,也不乏跟产业界、学术界深入合作获得的宝贵科研数据。
当前,人工智能已成为引领新一轮科技革命与产业变革的重要驱动力,而数据则是人工智能时代必不可少的生产资料。
近期杭州云栖大会上出现了一个“数据博物馆”,最吸引眼球的“展品”,竟是行业大规模开源数据集。不仅数量多达上百个,还覆盖零售、文娱、工业、医疗、自然科学等数十个行业。既有来自真实业务场景的商品数据,也不乏跟产业界、学术界深入合作获得的宝贵科研数据。
还吸引到中国科学院国家天文台台长常进院士、创新工场首席科学家周明博士、阿里巴巴集团副总裁贾扬清、阿里巴巴青橙奖获得者王权等学者大咖纷纷前往围观。
更厉害的是,基于这些数据集产出的学术论文,已经有超过700篇。
你或许想不到,这家“博物馆”是由阿里云天池平台在今年的杭州云栖发起的。
对于阿里云天池,最初是以“中国数据类赛事第一品牌”的形象被业界和开发者所熟知。天池主打业务包括天池大赛、天池数据科研、天池AI实训等,为AI爱好者提供了分享、互动、成长的社区阵地,孵化了面向AI教学的实训平台。
作为中国最大的数据众智平台,天池希望通过提供工业界的最真实的业务数据,降低青年开发者接触和使用科研数据的门槛。
2021年,天池2.0全新升级,启动数据集开源计划,面向社会开放上百个行业稀缺的AI数据集。此次令人耳目一新的数据博物馆,也是天池2.0品牌升级后,首次在云栖大会亮相,目前已有4300多所研究机构基于天池数据集展开研究工作,累计产出了700多篇论文。
如果说「数据博物馆」让我们直观地看到了大数据的应用前景,那么「天池数据青年团聚」则带着我们展望了AI行业的未来。
10月20日云栖大会期间,一群心怀梦想,勇于创新的青年开发者齐聚云栖大会,共话AI未来。他们中既有高校教授学者、阿里星&达摩院学长、阿里HR以及技术KOL,也有高校计算机相关专业的硕博学生及青年开发者。作为一群AI青年,他们有鸿鹄之志,也同样有年轻人的困惑。
学AI必须读博吗?
想要继续深造,出国是否有必要?
技术人才未来的从业方向改如何选择?
AI技术的未来发展趋势与行业前景是怎样的?
学校学习的技术与企业实际的开发场景如何无缝衔接?
搞学术,搞技术和搞钱之间该如何兼顾与取舍?
……
这些数据青年们关心的问题,也同样是学术界和工业界所经常讨论的话题。
此次「天池数据青年团聚」活动中,邀请到浙大研究员赵俊博,杭电教授贾刚勇、张桦,达摩院算法专家罗浩,菜鸟算法专家康嘉元,阿里招聘专家白晶晶,阿里云技术运营专家王听,阿里云技术服务运营专家王可心,datawhale创始人范晶晶等相关技术领域的教授学者及行业专家,与数据青年们共同深入探讨成长与困惑,用年青人的方式谈创新、看未来。
AI行业内卷?恰恰说明热度不减
很多人在学习和未来的从业方向选择上,不免有些迷茫。如今AI技术发展日趋成熟,行业竞争日益激烈,现在进入这个行业是否能有一个良好的发展呢。
在团聚活动中,康嘉元博士提到,大家所认为的AI行业内卷,恰恰证明AI行业热度不减,并聚集了众多企业的资本投入和越来越多的优秀技术人才。这正是一个行业不断调优,健康发展的表现。对于AI行业的未来发展来说,还是有很大向上空间的。
AI技术的发展是否会替代人的价值?
在大数据的哺喂下,AI愈加智能化,所以很多人都有一个顾虑,会不会有一天人工智能可以替代人类劳动,让人们都面临失业的风险。
基于这个问题,王可心提到,作为一个AI从业者,将研发目标定在如何用智能削减人工成本上,这本身就是一种小聪明,无法长足发展。人工智能发展的目的绝不是取代人类,而是更好地服务人类。
对于AI从业者来说,我们是通过技术手段创造更多就业岗位和机会,发挥人类独有的创造力,开辟更多新的领域和战场。AI的对立面不会是人类,而是帮助人类共同面对和解决难题,让人们从机械化、低效能、高人工成本的工作中解放出来,投入到更有创造力,更有意义的工作中。
校园学习与真实业务场景脱节,纸上谈兵如何变成真刀真枪的实战?
数据是人工智能时代必不可少的生产资料,但高校学生很难接触到真实有效的企业数据和真实的业务场景,所以在AI学习中非常受限。这也是活动当天,以在校学生为代表的青年开发者反馈的普遍问题。
针对这些问题,在场的阿里技术专家提到,天池开启大规模数据集开源计划,通过提供工业界的最真实的业务数据,降低青年开发者接触和使用科研数据的门槛。再结合行业实际的竞赛,使开发者能真正研究和解决实际的工业场景中所面临的的问题。
搞学术,搞技术和搞钱之间该如何兼顾与取舍?
搞学术,搞技术和搞钱之间,犹如鱼和熊掌不可兼得,总要有取舍,其实这个问题的本质也是产学界之间的差异性和目的不同决定的。
学术界和产业界在研究目标上往往不同。学术界可能更加关注一些确定条件下的确定指标,而产业界则更多会从成本和收益的角度去思考问题。
张桦教授和罗浩博士则进一步解释了学术界和产业界对于AI的不同需求与相互关系。学术界在追求技术的创新,产业界在追求技术的稳定可靠;学术界在思考技术的未来发展,产业界在不断找寻技术更多的应用场景和持续变现的能力;而只有产研联动,才会让开发者生态更健康地发展。
天池数据青年团聚活动上,除了对技术问题的探讨,与会的教授专家与企业技术大咖们也就“如何选择第一份工作”“该选择高薪工作,还是继续深造”等内容,给青年开发者很多个人成长建议。这场数据青年团聚成为了一场很棒的技术公益活动,不仅让青年开发者与技术专家们共同聚合能量,共谋AI发展,更重要的是将这份能量传递出去,推进人工智能领域的学术交流、人才培养、技术发展以及跨界应用与融合。
作为一个普惠AI技术的公益性平台,未来阿里云天池将积极参与并致力于数据标准制定和行业标准数据集的建设,也将邀请更多的科研数据提供单位加入到天池科研数据集开源计划中,一起服务社会和促进AI技术的进步。
原文链接
本文为阿里云原创内容,未经允许不得转载。