摘要:2017云栖大会北京峰会期间,云栖社区即将重磅发布首份《2017中国开发者调查报告》,历时3个月的调研,7032人参与调查问卷,最终呈现出一份集开发者画像与能力的完整描绘。本文就让大家先睹为快,分享其中关于人工智能的部分内容。
12月20日,2017云栖大会北京峰会期间,云栖社区即将重磅发布首份《2017中国开发者调查报告》,历时3个月的调研,7032人参与调查问卷,最终呈现出一份集开发者画像与能力的完整描绘。《2017中国开发者调查报告》(下称《报告》)中总结概括了中国八大开发技术领域特征,涵盖了Web开发、前端开发、云计算、大数据、人工智能、移动开发、区块链以及安全等技术领域。
对于当下最火的人工智能技术而言,中国的开发者会选择从哪个角度入手?目前AI技术中应用最为广泛的视觉技术、语音识别技术和自然语言处理技术在2017年中的发展情况究竟如何?与此同时,这些技术又面临着什么样的困难和挑战?在当下的中国,人工智能技术的哪些应用场景最为开发者所青睐?未来,人工智能的应用又将走向何方?这些问题的答案尽在《报告》中,本文就让大家先睹为快,分享《报告》中关于人工智能的部分调查结果。
《报告》发现,中国的AI开发者多数先从难度相对较低的感知智能技术上手人工智能,比如计算机视觉和语音相关技术等。此外,在相对较难的认知智能技术中,自然语言处理技术也占据了较高的比例。
在视觉技术方面,中国的开发者更倾向于图像检测和分类,而辅助驾驶和无人驾驶也成为了最受关注的应用场景,互联网公司和传统汽车制造商两大阵营都在这一方面进行大力投入,这将帮助视觉技术快速落地实现。但是视觉技术依旧面临着诸多问题,比如算法不成熟,没有达到商用水平、场景复杂,数据难以收集以及计算成本太高等。
在语音识别的实际应用场景中,以智能家居、智能音箱为代表的远场语音技术应用占据着压倒性优势。但是面对海量的语音信息,其实能被开发者调用的资源非常有限,大量的语音识别技术和基础资源也不够开放,技术垄断现象严重。
在自然语言处理技术方面,中文分词与命名实体识别令中国开发者“上火”,中文自然语言处理问题的难度令世界顶级自然语言处理专家也望而生畏。对于NLP的应用而言,“链接” 多应用场景成开放式对话机器人应用NLP的高价值体现。总体而言,认知智能级别的NLP, 相比感知智能级别的AI任务,难度呈几何级增加。
对于潜力应用行业而言,人工智能对劳动密集型行业是替代性颠覆,对知识密集型行业更多体现“助理”角色。未来,AI将会对制造业、金融、教育以及医疗等多行业产生重大影响。
中国的AI开发者多数先从感知智能技术上手人工智能
2016、2017年人工智能成为中国开发者重点关注的技术领域。在中国,计算机视觉、自然语言处理、语音相关技术成为开发者渗透最广的三个AI技术领域。
AI的两个重要技术方向一个是感知智能、一个是认知智能,据调研得到的数据统计结果显示,中国的AI开发者首先入手的技术按照占比高低依次为计算机视觉、自然语言处理和语音相关技术,其中计算机视觉和语音相关技术均属于感知智能技术,而自然语言处理则属于认知智能技术,这是因为认知智能的难度要高于感知智能,所以多数开发者选择相对容易入手的计算机视觉和语音相关的感知智能领域,作为上手AI的敲门砖。
辅助/无人驾驶成为最受关注的视觉技术价值场景
在国内,目前关注度最高的视觉技术应用场景主要是无人驾驶/辅助驾驶领域,数据统计结果显示,无人驾驶/辅助驾驶场景的关注度占约37%。
无论是传统汽车制造商还是互联网公司,都将智能汽车列为未来重要的技术与工业发展路径,因此在无人车、辅助驾驶领域投入更多的关注和资源。传统汽车制造商更偏向于渐进式的智能汽车制造技术——辅助驾驶,而包括BAT在内的互联网公司,更偏向于颠覆式的智能汽车制造技术——无人驾驶。并且由于两大阵营对智能汽车的大力投入,也很快让两种殊途同归的技术快速实现落地,对开发者而言,技术的成熟和可商业化的特征产生了积极的推动效应。
算法问题已经让视觉技术道路崎岖,而复杂场景的数据收集问题又让开发者负重前行
视觉技术依然是一个非常前沿的技术学科,对中国开发者而言依然有很多障碍需要克服,首当其冲的就是算法成熟度问题,其次则是场景的复杂度过高,数据较难收集;而成本问题相比前两个问题,似乎对中国开发者而言就显得并不是关键性问题。
算法是视觉技术的基础,而算法的核心是数学,因此也就给很多开发者树立了天然的门槛,许多顶尖的开发者如果缺少了顶尖数学的能力,很难将难以理解的数学逻辑用代码的形式表达出来,这个问题已经成为包括中国开发者在内的全球视觉技术开发者的共同阻碍。其次则是复杂场景的数据收集问题,尽管中国在传感器部署方面数量众多,但由于数据安全性问题,开发者很难获取海量公共信息,因此面对复杂场景时,只能进行有限的数据收集,这也成为开发者应用视觉技术时的另一个重要问题。
中文分词与命名实体识别令中国开发者“上火”
现阶段自然语言处理(NLP)是所有人工智能领域最难的技术方向,没有之一。鉴于中国国情,自然语言处理的难度更大,由于中国语言的博大精深,不仅是在语言组合方面的难度不可想象,甚至在同义词理解上,也令世界顶级自然语言处理学家望而生畏。这就不难理解NLP在中国的发展对底层架构的需求更复杂、难度更高,中国开发者最关注的底层技术是中文分词技术与命名实体识别不分伯仲,其次则是句法分析。
AI对劳动密集型行业是替代性颠覆, 对知识密集型行业更多体现“助理”角色
显然人工智能的出现对很多行业产生非常大的触动,特别是那些劳动密集型产业,对待AI的冲击可谓是无还击之力。以汽车制造、3C制造为代表的大批企业已经开始大量应用机器人及AI能力来进行设计、生产、物流;对劳动密集型行业而言,AI带来的是替代性颠覆。而面对医疗行业,AI更多的体现是辅助性服务,这种知识密集型、对专业诉求很高的行业,AI更多扮演助理、辅助的角色。
中国拥有世界上数量最多的开发者群体,并且这个群体非常年轻,面对这样一个庞大群体,似乎总有人想给他们做一个画像;这个从二进制到十六进制来回摇摆的群体不再那么神秘,但似乎还是有一层朦胧令大家又看得不够清晰,而云栖社区希望通过全面的研究分析为大家破除这层朦胧的壁障,透视这个特别群体如何成长至今,如何面向未来…12月20日,2017云栖大会北京峰会期间,云栖社区即将重磅发布首份《2017中国开发者调查报告》,历时3个月的调研,7032人参与调查问卷,最终呈现出一份集开发者画像与能力的完整描绘。以下为报告目录:
《2017中国开发者调研报告》全版PDF将在云栖大会发布后第一时间放出,敬请期待!