AI手机报告 | 揭秘手机行业未来AI之路

xmwebp

来源:网易智能


在10月19日上午举办的IDC中国数字化转型年度盛典的“人工智能与大数据”分论坛上,IDC(国际数据公司,International Data Corporation)联合旷视科技发布“AI+手机”行业白皮书报告——《IDC手机行业白皮书:“视”界革命》(以下简称“报告”)。下面,智能菌就对AI手机报告和AI手机的发展做详细梳理。


一、智能手机行业已经进入转折点


手机是承载人类数字化生活于工作最重要的设备,更是近20年来对人类社会改变最大的工具。移动互联网的蓬勃发展,让手机从单纯的通信工具成为人们生活和工作的入口。未来手机不仅将成为我们身体的延伸,更将帮助人们简化生活、分担工作,成为人类的“个人智能助理”。


经过十年的黄金发展期,2017年智能手机行业遇到了发展的重要转折点。根据IDC的统计数据显示,2017年全球智能手机出货量为14.7亿台,同比下降0.3%。首次出现同比下跌的情况。而中国市场的变化趋势更为明显。2017年,中国智能手机出货量为4.4亿部,同比下降4.9%。这意味着传统的智能手机市场已经呈现饱和,手机厂商必须从拼销量、拼价格向拼品质、拼体验转型。


640?wx_fmt=jpeg


二、何谓真正的“AI手机”


据报告显示,从2017年开始,越来越多的手机厂商意识到了AI给智能手机行业带来的价值,纷纷推出了“AI手机”,2018年主流手机厂商更是在各自的旗舰机型中全面引入AI技术,甚至搭载AI芯片的手机正在成为市场的主流。


不过,目前的“AI+手机”还处在较为初级的阶段,很多的功能应用还具有局限性,只是在部分特定场景下才能发挥作用,距离真正的AI手机普及还有不小的技术门槛。


旷视科技副总裁谢忆楠对目前的“AI手机”发表了看法,他认为,现在很多的手机还不能叫“AI手机”,更多应该称作“AI Camera”。现在AI应用提升较多的是在摄像头上,无论是拍照、解锁,还是认知、优化、分析等都是基于这个“AI Camera”。最浅层的AI Camera即人脸解锁,再往上则可能是AI的智能优化。


三、计算机视觉给手机带来的三大应用方向和三种解决方案


视觉应用是手机AI应用中最主要的诉求。在2017年《IDCConsumercape360°》调研中,当你购买手机时,影响你采购决定的七个最重要的因素,73%的用户会考虑电池续航时间,51%的用户考虑拍照效果。


从图中我们可以明显地看到,目前主流的手机应用大多与视觉应用相关(蓝色柱状图),可以说,提升视觉技术在当前是改善用户体验的最直接和最有效的手段。


xmwebp


目前,AI手机基于计算机视觉开发的人脸解锁、人像美颜功能在手机应用中渗透率分别高达75%与90%。与此同时,AI视觉需求的日益强烈对产业链因此提出了更高的要求,应用、算法、解决方案、硬件将会环环相扣、缺一不可。


想要给用户带来超预期的视觉体验,需要产业链的协同发展。视觉技术的推陈出新与产业链的发展紧密相连。IDC将计算机视觉技术对安手机的影响分为四个层面,每一个层面的创新既相对独立又相互促进。利用新器件、新算法打造新方案探索新应用,改善用户体验,提升用户粘性是AI手机快速普及的重要助推力。


640?wx_fmt=jpegwebp


从上图可以看到,计算机视觉技术在手机种的应用主要可以分为三大方向:识别与认证、AI摄影、3D感知。


1、识别与认证。通过高效的人脸识别算法,手机可以实现毫秒级的人脸解锁和金融级的人脸支付。目前,这项技术在手机上已经广泛应用于互联网金融风控、共享出行司机和乘客验证、社保等行业,用于甄别欺诈行为。


2、AI摄影。人工智能可以智能分析出用户的年龄、肤色、体型等特征,通过人脸检测、关键点检测、场景识别等AI算法对画质进行精准提升,让成像更加自然,为用户带来更完美的体验。


640?wx_fmt=jpegwebp


3、3D感知全栈方案。IDC认为3D感知将实现计算机视觉在手机领域的重大突破,为手机应用打开了更为广阔的空间,例如AR游戏虚拟、试穿等应用。但是,目前基于3D的感知应用还不普及。


以上这些应用都离不开摄像头上的解决方案,目前市场上的方案有双摄、三摄、深摄三类方案。


| 目前市场上的双摄方案主要分为三种:


640?wx_fmt=jpegwebp


1、景深方案。一般是采用两枚像素不同的传感器来进行拍摄,主摄像头像素极高,负责拍摄整体画面副摄像头像素稍低,负责记录景深信息。主要卖点是突出主体,背景虚化。


2、黑白+彩色方案。利用两枚后置摄像头在结构上的细微差异,经算法融合呈现优于传统单枚摄像头的成像效果,可以有效提高像素细节相近,颜色的过度也会更加自然。整体在层次感上有着不错的提升,它的最大卖点是成像更加清晰,适应夜拍。


3、定焦双摄方案(广角+长焦方案)。在不同的光照条件下,手机能够自主选择合适的摄像头来进行自拍。在光线充足的场景中选用长焦镜头进行拍摄,并且能实现两倍无损变焦。当光线不足时则启用广角镜头为主摄像头,能更好地保证亮度,主要卖点是变焦拍摄更容易。


| 三摄方案也主要分为三种:


640?wx_fmt=jpegwebp


1、在彩色镜头+黑白镜头基础上,加长焦镜头的组合。拥有高倍无损变焦能力,能够在低光性能变焦高分辨率,景深,虚化等方面提供更优质的体验。


2、在彩色镜头+黑白镜头基础上,加入一颗COMS辅助成像,能够带来更好的宽容度。


3、在广角+长焦的方案的基础上,加入一颗鱼眼镜头,实现超级变焦功能,提供更多视角。


总之,三摄可以同时具备光学变焦及黑白镜头无损远摄的同时,还能够利用黑白镜头的补光优势保证更出色的成像质量,这就为人像模式等需要模拟大光圈背景虚化的场景提供了更多可能性。弥补面部曝光不足的同时,多一颗摄像头就有可能得到更全面的景深数据,从而让背景虚化更加完美。


| 深摄摄像头按技术分类可以分为以下三类:


1、主流技术。


2、双目结构光。


3、飞行时间算法(TOF)。


四、AI视觉方案对手机产业链的革新需求


随着人工智能视觉需求的日益强烈,AI视觉解决方案整合将加速,对产业链提出了更高的要求。


首先,随着AI应用场景的不断扩展,视觉应用需求更加强烈,但是过于复杂的产业链将延长开发周期,抑制性应用的快速商用,同时,过高的门槛将大大提高应用的成本。


其次,由于手机设计的特殊要求,如轻薄,省电,产品迭代快,使用环境多样化等。要求产业链可以根据手机厂商需求,提供端到端的一站式解决方案。可以高效定制于快速迭代视觉技术的产业整合势在必行。


报告指出,计算机视觉技术封装将成为手机产业链的关键环节,可见计算机视觉技术在手机领域的应用正在趋于成熟,但就技术本身来讲还有太多应用场景尚未被开发出来。当前市场关注度、渗透率及技术采用度相对较高的应用场景,如人脸识别、物体识别、物体检测等还停留在较为基础的物体探测阶段,在更具体的事件检测、更灵活的人机交互及更复杂的信息重组、自主行为等方面的应用明显不足。


xmwebp


目前,AI视觉产业生态的整合正在发生。以高通、联发科、紫光展锐等公司为代表的芯片厂商,以及以奥比中光、艾迈斯、舜宇光学、欧菲科技为代表的光学器件和模组厂商正在通过战略合作资本等形式与上层算法和应用公司进行深度合作。


报告预测,未来AI视觉产品的生态将更加聚合,从单一的产品竞争将向平台生态转变,只有多方供应商紧密配合,才能将用户体验做到极致。并且,拥有生态平台的企业才能在行业洗礼中脱颖而出。


未来,无论是计算机视觉技术本身还是“AI手机”行业的市场前景,都还具有非常大的想象空间。


五、如何面对AI手机发展带来的问题


AI在行业落地的关键,是要找到AI与这个行业的重合点是什么,以及能够解决的行业的潜在或显著性问题是什么。


谈及用户数据保护问题,谢忆楠分享了旷视科技的做法。他说,公司从最开始就通过“数据脱敏”这种不可逆的方式进行数据保护,假设发生数据被窃,在没有拿到算法的源代码的情况下也不可能把脱敏后的数据还原成人脸,这样它对用户隐私造成的影响就不大。旷视是一家提供技术服务的平台,做人脸识别对比之后只会反馈一个相似度的结果,并不做数据的存储。


在谈及未来AI手机的发展,谢忆楠认为,数据的缺乏是一个很大的问题,因此有两件事情要解决,首先是在时间上,能否快速地通过一小部分的数据直接产生标注,其次则是数据标注如何“去人力化”的问题。


未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。


未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

640?wx_fmt=jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/493888.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Flex 学习笔记------FLACC Crossbridge

FLACC & Crossbridge 前段时间在研究如何在Flex项目中处理图片的一些信息,比如获取图片的颜色通道,DPI信息等,搜索了半天还是一无所获。图像处理是一个比较复杂的过程,不过想来前端处理图像也是一个必然的趋势。 看看这个腾讯…

IOS之计算器实现

本文利用ios实现计算器app,后期将用mvc结构重构 import UIKitclass CalculViewController: UIViewController {IBOutlet weak var display: UILabel!var userIsInTheMiddleOFTypingANumber:BoolfalseIBAction func appendDigit(sender: UIButton) {let digitsender…

AI进军新药发现研究?这99页slides了解一下

来源:专知摘要:近些年,深度学习对许多研究领域产生了深远的影响,应用场景也十分宽泛。我们都知道在医疗领域,新药发现研究是高成本,低产出的,但是对推进医疗领域的发展起到至关重要的作用。今天…

HDU 4651 数论 partition 求自然数的拆分数

别人的解题报告&#xff1a; http://blog.csdn.net/zstu_zlj/article/details/9796087 我的代码&#xff1a; 1 #include <cstdio>2 #define N 1000203 const int mod 1e97;4 int p[N];5 void Partition()6 {7 p[0] 1;8 for(int n1; n < 1e5; n)9 { 10 …

IOS之笑脸app

ios笑脸app实现 import UIKitIBDesignable class FaceView: UIView {IBInspectablevar lineWidth:CGFloat3{didSet{setNeedsLayout()}}IBInspectablevar color:UIColor UIColor.blueColor(){didSet{setNeedsLayout()}}IBInspectablevar scale:CGFloat0.9{didSet{setNeedsLay…

15年来,自然语言处理发展史上的8大里程碑

来源&#xff1a;Deep Tech深科技自然语言是人类独有的智慧结晶。自然语言处理&#xff08;Natural Language Processing&#xff0c;NLP&#xff09;是计算机科学领域与人工智能领域中的一个重要方向&#xff0c;旨在研究能实现人与计算机之间用自然语言进行有效通信的各种理…

最短路径实现

主要工具 QGIS建立拓扑关系 Postgres存储数据表 Geoserver发布相关服务 QGIS建立拓扑关系 使用v.clean运行&#xff0c;并用DBManager即可以建立拓扑关系并导入数据库。 注意 QGIS2.16有数据溢出问题&#xff0c;使用QGIS2.14可以解决这个问题 Postgres存储数据表 导…

2019将成机器学习关键年:中美AI或有一战

作者 | Hussain Fakhruddin译者 | 大小非编辑 | Vincent 来源 | AI前线(ID&#xff1a;ai-front)导读&#xff1a;2019 年将是机器学习关键的一年。ML 已经成为全球数字转型的关键要素之一——到 2021 年底&#xff0c;累计投资预计将达到 580 亿美元。在企业应用领域&#xff…

深度 | IBM长文解读人工智能、机器学习和认知计算

来源&#xff1a;人工智能产业链联盟人工智能的发展曾经经历过几次起起伏伏&#xff0c;近来在深度学习技术的推动下又迎来了一波新的前所未有的高潮。近日&#xff0c;IBM 官网发表了一篇概述文章&#xff0c;对人工智能技术的发展过程进行了简单梳理&#xff0c;同时还图文并…

多变量线性回归

目前为止,我们探讨了单变量/特征的回归模型,现在我们对房价模型增加更多的特征, 例如房间数楼层等,构成一个含有多个变量的模型,模型中的特征为(x1,x2,…,xn) 增添更多特征后,我们引入一系列新的注释: n 代表特征的数量 x(i)代表第 i 个训练实例,是特征矩阵中的第 i 行,是一…

人工智能乌托邦 迪拜认为2071年人类应该这样生活!

来源&#xff1a;网易智能不同于硅谷老牌的科技力量&#xff0c;迪拜一直是独特的存在。他们日益崛起的科技实力正在被验证&#xff0c;无论是全面AI化的基础建设和城市治安力量&#xff0c;还是频频登上全球科技头条的机器人警察和空中出租车&#xff0c;迪拜试图摆脱很多人眼…

逻辑回归与正则化

在分类问题中,你要预测的变量 y 是离散的值,我们将学习一种叫做逻辑回归 (Logistic Regression) 的算法,这是目前最流行使用最广泛的一种学习算法。 在分类问题中,我们尝试预测的是结果是否属于某一个类(例如正确或错误)。分类问 题的例子有:判断一封电子邮件是否是垃圾邮件;判…

万字报告!一文看懂全球车厂的技术家底模块化平台

来源&#xff1a;智东西摘要&#xff1a;介绍模块化平台以及该平台对车企的重要意义&#xff0c;详解车企模块化平台布局。汽车的研发制造方式经历了手工作坊式到标准化流水线再到平台化&#xff0c;目前主流车企纷纷采取模块化平台方式。汽车模块化平台研发制造是指车企基于通…

西湖大学全披露:68位顶级科学家加盟,已获捐资35亿,最小捐赠者12岁

来源&#xff1a;量子位最终&#xff0c;2018年10月20日&#xff0c;成为了西湖大学的成立日。在刚结束的成立大会上&#xff0c;5名诺贝尔奖得主、70余位国内外校长及代表、近百位捐赠人齐聚。可谓少长咸集&#xff0c;高朋满座&#xff0c;生而备受期待。而且就在创立大会上&…

字体大宝库:设计师必备的专业免费英文字体

字体绝对是每一个设计非常重要的部分&#xff0c;设计者总是希望有最好的免费字体&#xff0c;以保持他们字体库的更新。所以今天我要向设计师们分享一个专业的免费英文字体集合。这些免费的字体是适用于任何类型的图形设计&#xff1a;Web&#xff0c;打印&#xff0c;动态图形…

神经网络学习

代价函数 首先引入一些便于稍后讨论的新标记方法: 假设神经网络的训练样本有 m 个,每个包含一组输入 x 和一组输出信号 y,L 表示神经 网络层数,Sl表示每层的 neuron 个数(SL表示输出层神经元个数),SL代表最后一层中处理 单元的个数。 将神经网络的分类定义为两种情况:二类分…

干货|深度!“人工智能+制造”产业发展研究报告

来源&#xff1a;&#xff1a;腾讯研究院工业革命以后的“自动化”概念追求的是机器自动生产&#xff0c;本质是“机器替人”&#xff0c;强调在完全不需要人的情况下进行不间断的大规模机器生产&#xff1b;而“智能化”追求的是机器的柔性生产&#xff0c;本质是“人机协同”…

机器学习系统设计与建议

当我们在运用训练好了的模型来预测未知数据的时候发现有较大的误差,我们下一步可以 做什么? 1. 获得更多的训练实例——通常是有效的,但代价较大,下面的方法也可能有效,可 考虑先采用下面的几种方法。 2. 尝试减少特征的数量 3. 尝试获得更多的特征 4. 尝试增加多项式特征…

李飞飞重返斯坦福后的大动作:开启「以人为中心的AI计划」

来源&#xff1a;网络大数据刚刚&#xff0c;李飞飞宣布斯坦福开启「以人为中心的 AI 计划」(Human-Centered AI Initiative&#xff0c;HAI)&#xff0c;该项目由李飞飞和斯坦福大学前教务长 John Etchemendy 共同主导&#xff0c;Chris Manning 也参与其中。李飞飞在 twitter…

支持向量机学习

与逻辑回归和神经网络相比,支持向量机,或者简称 SVM,在学习复杂的非线性 方程时 供了一种更为清晰,更加强大的方式 如果我们用一个新的代价函数来代替,即这条从 0 点开始的水平直线,然后是一条斜 线,像上图。那么,现在让我给这两个方程命名,左边的函数,我称之为cost1(z),同时,…