来源:网易智能
在10月19日上午举办的IDC中国数字化转型年度盛典的“人工智能与大数据”分论坛上,IDC(国际数据公司,International Data Corporation)联合旷视科技发布“AI+手机”行业白皮书报告——《IDC手机行业白皮书:“视”界革命》(以下简称“报告”)。下面,智能菌就对AI手机报告和AI手机的发展做详细梳理。
一、智能手机行业已经进入转折点
手机是承载人类数字化生活于工作最重要的设备,更是近20年来对人类社会改变最大的工具。移动互联网的蓬勃发展,让手机从单纯的通信工具成为人们生活和工作的入口。未来手机不仅将成为我们身体的延伸,更将帮助人们简化生活、分担工作,成为人类的“个人智能助理”。
经过十年的黄金发展期,2017年智能手机行业遇到了发展的重要转折点。根据IDC的统计数据显示,2017年全球智能手机出货量为14.7亿台,同比下降0.3%。首次出现同比下跌的情况。而中国市场的变化趋势更为明显。2017年,中国智能手机出货量为4.4亿部,同比下降4.9%。这意味着传统的智能手机市场已经呈现饱和,手机厂商必须从拼销量、拼价格向拼品质、拼体验转型。
二、何谓真正的“AI手机”
据报告显示,从2017年开始,越来越多的手机厂商意识到了AI给智能手机行业带来的价值,纷纷推出了“AI手机”,2018年主流手机厂商更是在各自的旗舰机型中全面引入AI技术,甚至搭载AI芯片的手机正在成为市场的主流。
不过,目前的“AI+手机”还处在较为初级的阶段,很多的功能应用还具有局限性,只是在部分特定场景下才能发挥作用,距离真正的AI手机普及还有不小的技术门槛。
旷视科技副总裁谢忆楠对目前的“AI手机”发表了看法,他认为,现在很多的手机还不能叫“AI手机”,更多应该称作“AI Camera”。现在AI应用提升较多的是在摄像头上,无论是拍照、解锁,还是认知、优化、分析等都是基于这个“AI Camera”。最浅层的AI Camera即人脸解锁,再往上则可能是AI的智能优化。
三、计算机视觉给手机带来的三大应用方向和三种解决方案
视觉应用是手机AI应用中最主要的诉求。在2017年《IDCConsumercape360°》调研中,当你购买手机时,影响你采购决定的七个最重要的因素,73%的用户会考虑电池续航时间,51%的用户考虑拍照效果。
从图中我们可以明显地看到,目前主流的手机应用大多与视觉应用相关(蓝色柱状图),可以说,提升视觉技术在当前是改善用户体验的最直接和最有效的手段。
目前,AI手机基于计算机视觉开发的人脸解锁、人像美颜功能在手机应用中渗透率分别高达75%与90%。与此同时,AI视觉需求的日益强烈对产业链因此提出了更高的要求,应用、算法、解决方案、硬件将会环环相扣、缺一不可。
想要给用户带来超预期的视觉体验,需要产业链的协同发展。视觉技术的推陈出新与产业链的发展紧密相连。IDC将计算机视觉技术对安手机的影响分为四个层面,每一个层面的创新既相对独立又相互促进。利用新器件、新算法打造新方案探索新应用,改善用户体验,提升用户粘性是AI手机快速普及的重要助推力。
从上图可以看到,计算机视觉技术在手机种的应用主要可以分为三大方向:识别与认证、AI摄影、3D感知。
1、识别与认证。通过高效的人脸识别算法,手机可以实现毫秒级的人脸解锁和金融级的人脸支付。目前,这项技术在手机上已经广泛应用于互联网金融风控、共享出行司机和乘客验证、社保等行业,用于甄别欺诈行为。
2、AI摄影。人工智能可以智能分析出用户的年龄、肤色、体型等特征,通过人脸检测、关键点检测、场景识别等AI算法对画质进行精准提升,让成像更加自然,为用户带来更完美的体验。
3、3D感知全栈方案。IDC认为3D感知将实现计算机视觉在手机领域的重大突破,为手机应用打开了更为广阔的空间,例如AR游戏虚拟、试穿等应用。但是,目前基于3D的感知应用还不普及。
以上这些应用都离不开摄像头上的解决方案,目前市场上的方案有双摄、三摄、深摄三类方案。
| 目前市场上的双摄方案主要分为三种:
1、景深方案。一般是采用两枚像素不同的传感器来进行拍摄,主摄像头像素极高,负责拍摄整体画面副摄像头像素稍低,负责记录景深信息。主要卖点是突出主体,背景虚化。
2、黑白+彩色方案。利用两枚后置摄像头在结构上的细微差异,经算法融合呈现优于传统单枚摄像头的成像效果,可以有效提高像素细节相近,颜色的过度也会更加自然。整体在层次感上有着不错的提升,它的最大卖点是成像更加清晰,适应夜拍。
3、定焦双摄方案(广角+长焦方案)。在不同的光照条件下,手机能够自主选择合适的摄像头来进行自拍。在光线充足的场景中选用长焦镜头进行拍摄,并且能实现两倍无损变焦。当光线不足时则启用广角镜头为主摄像头,能更好地保证亮度,主要卖点是变焦拍摄更容易。
| 三摄方案也主要分为三种:
1、在彩色镜头+黑白镜头基础上,加长焦镜头的组合。拥有高倍无损变焦能力,能够在低光性能变焦高分辨率,景深,虚化等方面提供更优质的体验。
2、在彩色镜头+黑白镜头基础上,加入一颗COMS辅助成像,能够带来更好的宽容度。
3、在广角+长焦的方案的基础上,加入一颗鱼眼镜头,实现超级变焦功能,提供更多视角。
总之,三摄可以同时具备光学变焦及黑白镜头无损远摄的同时,还能够利用黑白镜头的补光优势保证更出色的成像质量,这就为人像模式等需要模拟大光圈背景虚化的场景提供了更多可能性。弥补面部曝光不足的同时,多一颗摄像头就有可能得到更全面的景深数据,从而让背景虚化更加完美。
| 深摄摄像头按技术分类可以分为以下三类:
1、主流技术。
2、双目结构光。
3、飞行时间算法(TOF)。
四、AI视觉方案对手机产业链的革新需求
随着人工智能视觉需求的日益强烈,AI视觉解决方案整合将加速,对产业链提出了更高的要求。
首先,随着AI应用场景的不断扩展,视觉应用需求更加强烈,但是过于复杂的产业链将延长开发周期,抑制性应用的快速商用,同时,过高的门槛将大大提高应用的成本。
其次,由于手机设计的特殊要求,如轻薄,省电,产品迭代快,使用环境多样化等。要求产业链可以根据手机厂商需求,提供端到端的一站式解决方案。可以高效定制于快速迭代视觉技术的产业整合势在必行。
报告指出,计算机视觉技术封装将成为手机产业链的关键环节,可见计算机视觉技术在手机领域的应用正在趋于成熟,但就技术本身来讲还有太多应用场景尚未被开发出来。当前市场关注度、渗透率及技术采用度相对较高的应用场景,如人脸识别、物体识别、物体检测等还停留在较为基础的物体探测阶段,在更具体的事件检测、更灵活的人机交互及更复杂的信息重组、自主行为等方面的应用明显不足。
目前,AI视觉产业生态的整合正在发生。以高通、联发科、紫光展锐等公司为代表的芯片厂商,以及以奥比中光、艾迈斯、舜宇光学、欧菲科技为代表的光学器件和模组厂商正在通过战略合作资本等形式与上层算法和应用公司进行深度合作。
报告预测,未来AI视觉产品的生态将更加聚合,从单一的产品竞争将向平台生态转变,只有多方供应商紧密配合,才能将用户体验做到极致。并且,拥有生态平台的企业才能在行业洗礼中脱颖而出。
未来,无论是计算机视觉技术本身还是“AI手机”行业的市场前景,都还具有非常大的想象空间。
五、如何面对AI手机发展带来的问题
AI在行业落地的关键,是要找到AI与这个行业的重合点是什么,以及能够解决的行业的潜在或显著性问题是什么。
谈及用户数据保护问题,谢忆楠分享了旷视科技的做法。他说,公司从最开始就通过“数据脱敏”这种不可逆的方式进行数据保护,假设发生数据被窃,在没有拿到算法的源代码的情况下也不可能把脱敏后的数据还原成人脸,这样它对用户隐私造成的影响就不大。旷视是一家提供技术服务的平台,做人脸识别对比之后只会反馈一个相似度的结果,并不做数据的存储。
在谈及未来AI手机的发展,谢忆楠认为,数据的缺乏是一个很大的问题,因此有两件事情要解决,首先是在时间上,能否快速地通过一小部分的数据直接产生标注,其次则是数据标注如何“去人力化”的问题。
未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。
未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。
如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”