腾讯杰出科学家写给2029的信:计算机视觉AI技术的爆点在哪里?

640?wx_fmt=jpeg

文 |腾讯杰出科学家、腾讯优图实验室负责人 贾佳亚 

腾讯优图实验室总监 戴宇荣博士 郑冶枫博士

近年来,计算机视觉AI技术发展迅速,尤其是人工智能的引入大大提升了算法的能力和实用性。在数不清的视觉AI应用中,我们认为未来技术的爆发点可能来自三个方面:信息的整合和提取、医疗和自动驾驶。


编者按:


本期杂志封面人物沈南鹏说过,投资人要思考十年后的情况。不光是投资人,在迷雾重重、混沌不明的当下,市场中的每一个理性人都需要放长眼量,将锚抛在时间之河中较远的地方,以未来丈量现在,才能站立得更坚实安稳。《中国企业家》为此推出特别策划《商业宏宝书·写给2029的信》,组织9位企业家、科学家、经济学家及艺术家,请他们每人写下一封给2029年的信,预测他们眼中10年后的世界,希望能对读者有所裨益。


近年来,计算机视觉AI技术发展迅速,尤其是人工智能的引入大大提升了算法的能力和实用性。在数不清的视觉AI应用中,我们认为未来技术的爆发点可能来自三个方面:信息的整合和提取、医疗和自动驾驶。腾讯优图实验室的AI技术布局也可大致分为上述的三个模块。


信息的整合和提取,主要指内容分析,包括人物识别、行为分析、场景识别、物体检测、语义分割等能够从丰富的图像或视频中提取有意义和结构化的信息,结合落地场景的应用,产生有价值的数据,给予用户或消费者精准的建议。这个领域在近几年进展迅速。举例来说,通过分析用户的点击或搜索行为,建立用户画像,让内容服务平台能够更精准地推荐用户感兴趣的内容。这是Google、Facebook等大公司正在做的事情。在视觉AI技术成熟前,他们的用户画像主要以文字搜索记录的分析为主。但随着视觉AI技术的发展,往后将会有更多的用户行为是从多媒体内容直接提取。并且,信息的整合和提取不会只局限于线上的行为。在大数据和5G普及的未来,将会产生大量的线下数据。通过提炼线下的数据,能够更有效地分析人们的行为,小至商品推荐,大至城市规划,均会使用视觉AI技术,让人们的生活更方便、舒适和安全。


医疗AI的宗旨在于辅助诊断,在人口众多、医师资源分配不均的时代,减少医生的重复性劳动,帮助基层疾病筛查的覆盖。临床上,疾病治疗秉持的观点是:早诊断、早治疗、疾病筛查、及时就医以及精准微创型治疗对整个社会以及人类医疗水平的提高有着前所未有的重大意义。未来十年,智能问诊、智能挂号指引、医疗影像上的自动筛查,如X光肺炎自动检测、心脏影像结构自动分析等将会大量减少医生的工作,让医生更专注解决和处理危疾病人的需求。并且,医疗AI有望实现大部分疾病初筛普及,大数据化以及智能分析有望改变传统就医繁杂的过程,虚拟手术的发展增加医师手术经验,智能手术机器人实现更多疾病的精准微创手术治疗。


自动驾驶是在未来十年必定会到来的技术。当中核心需要解决的问题在于环境识别。目前,在自动驾驶的落地测试中,因为环境识别的错误产生的交通意外,占了90%以上。简单地解释一下,如果自动驾驶是发生在游戏世界,所有环境的数据都能够精准地反馈到负责车控的AI,而AI只需要做决策,那么在这个问题之上,AI的决策能力绝对在人类之上。这个从AlphaGo战胜人类的案例中可以看出,在完全的封闭环境之下,AI的决策能力已经超越人类。而自动驾驶目前还处于测试阶段的原因,是因为对环境信息的不完全理解,因而做成决策错误。而解决这个环境识别的问题,是会随着在路上行车测试数据的不断增加而趋于完美的。这样考虑下来,自动驾驶就是一个必定会到来的技术。同时,基于自动驾驶所产生的应用,为人们带来生活的便利,将会越来越多。


未来十年,首先确定无疑的是,AI算法的各项指标会越来越高,计算机视觉的算法也会在实用的道路上越走越深入:更贴近使用场景、效果更精准。软硬件的进步让基于AI的视觉算法不再受限于特定的计算硬件,而且将成为计算设备看懂世界的常用工具。如今的“多媒体计算机”能够记录并播放多种媒体,未来的计算机将能够读懂多种媒体信息的含义。


计算机视觉AI技术的发展也势必会直接影响我们衣食住行的方方面面。


畅想一下,2029年,商店自动推断出顾客的体型、肤色、年龄,进而推荐合适的穿衣搭配;吃东西之前,自动帮你判断新鲜程度、营养成分、推荐健康的膳食搭配;智能家居进入千家万户,语音、手势可以自由地控制家电,智能安防摄像头帮你照料家中小孩的活动;在医疗方面,疾病检查过程简便化,基层医疗设备更加完善,少数医护人员就可建立疾病筛查点;对某些疾病,便携式的成像设备涌现,傻瓜式的操作、筛查过程进入寻常百姓家,让患者实现自我筛查。十年后的就医,我们不用再为“肚子疼”应该挂哪个科室而烦恼,智能对话分析助手可以通过简单的对话帮患者确定疾病范围、选择科室、做出最佳的检查时间、就医时间安排,简化就医流程。智能手术机器人变得更加智能化、微细化,术后愈合快,减少手术带来的痛苦。


无人驾驶汽车的普及,将会大量释放物流业的人力成本,让B to C的生意更容易和快捷,物价将会因为人力成本的减少变得更合理。泊车时将不再需要忙于寻找车位,长途汽车旅游将会有更多的休息时间,无人计程车让人们能够即叫即走,女士晚上叫车将会更安全,城市交通也会因为更好的路线规划而减少阻塞。


AI将赋予计算机理解世界的能力,计算机能更好地帮助人类分析规划,作出决策。当然,计算机视觉AI技术的想象空间无限大。但是从技术研究到实际落地应用还有很长的路要走,这也是所有相关研究人员努力的方向和愿景。


未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。


未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。


  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”


640?wx_fmt=jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/493269.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

pytorch实现Dropout与正则化防止过拟合

numpy实现dropout与L1,L2正则化请参考我另一篇博客 https://blog.csdn.net/fanzonghao/article/details/81079757 pytorch使用dropout与L2 import torch import matplotlib.pyplot as plt torch.manual_seed(1) # Sets the seed for generating random numbers.reproduc…

“蚁人”不再是科幻!MIT最新研究,能把任何材料物体缩小1000倍 | Science

来源:量子位科学加速,科幻成真也在加速。漫威世界中,蚁人是蚂蚁大小的超级英雄,靠一件“变身服”,人类就能在更微观的世界里大干一场。现在,类似的科幻想象,被MIT变成现实。丨小小小&#xff0c…

Android ARM指令学习

在逆向分析Android APK的时候,往往需要分析它的.so文件。这个.so文件就是Linux的动态链接库,只不过是在ARM-cpu下编译的。所以学习Android下的ARM指令很重要。目前,市面上的ARM-cpu基本都支持一种叫做THUMB的指令集模式。这个THUMB指令集可以…

cuda基础知识

nvidia-cuda 手册:https://docs.nvidia.com/cuda/cuda-c-programming-guide/index.html#kernels nvidia cuda 教学视频 https://www.nvidia.cn/object/cuda_education_cn_old.html 介绍: CUDA编程模型是一个异构模型,需要CPU和GPU协同工作。在CUDA中,…

苹果着手自研调制解调器,以应对高通天价专利费

来源:DeepTech深科技近日,苹果官方发布一份招聘信息,其中有一个职位就非常惹人注意,根据信息,苹果准备招募两名蜂窝调制解调器系统架构师,一名构架师的工作地点在圣克拉拉,另一名构架师的工作地…

labelme标注文件转coco json,coco json转yolo txt格式,coco json转xml, labelme标注文件转分割,boxes转labelme json

参考:https://github.com/wkentaro/labelme 一.labelme标注文件转coco json 1.标注时带图片ImageData信息,将一个文件夹下的照片和labelme的标注文件,分成了train和val的coco json文件和照片, (COCO的格式: [x1,y1,…

“深度学习之父”大谈AI:寒冬不会出现,论文评审机制有损创新

来源: AI科技大本营整理:琥珀近日《连线》杂志发表了一篇文章,记录了与“深度学习之父” Geoffrey Hinton 围绕人工智能伦理、技术、学术等领域的采访实录。当被问到如今人工智能是否将走进寒冬时,Hinton 的回答非常坚决&#xff…

GDataXML解析XML文档

一、GDataXMLNode说明GDataXMLNode是Google提供的用于XML数据处理的类集。该类集对libxml2--DOM处理方式进行了封装,能对较小或中等的xml文档进行读写操作且支持XPath语法。 使用方法:1、获取GDataXMLNode.h/m文件,将GDataXMLNode.h/m文件添加…

RetinaNet+focal loss

one stage 精度不高,一个主要原因是正负样本的不平衡,以YOLO为例,每个grid cell有5个预测,本来正负样本的数量就有差距,再相当于进行5倍放大后,这种数量上的差异更会被放大。 文中提出新的分类损失函数Foca…

真实用户首次披露Waymo无人车服务体验: 为避开左转, 故意绕路

来源 :Ars Technica编译 :机器之能 高璇外国网友炸了:「就像看了一部大导演导的烂片一样。」在过去的 18 个月里,Waymo 的汽车一直在凤凰城的东南角运送乘客。该公司在合同中明确规定禁止乘客讨论用户体验,对项目信息进…

“横平竖直”进行连线+将相邻框进行合并

一.横平竖直”进行连线 解法1.将一些坐标点按照x相等,y相等连起来 解法1.根据 x或y总有一个相等的,用np.sum来找出和为1的点,然后在连起来,存在重复连线的问题. import numpy as npcoord np.array([[10, 60],[10, 20],[20, 20],[40, 40],[40, 60],[20, 40]])img np.zeros(…

一文看透汽车芯片!巨头布局技术路线全解密【附下载】| 智东西内参

来源:智东西摘要:一文看透汽车芯片!巨头布局技术路线全解密智能驾驶涉及人机交互、视觉处理、智能决策等,核心是 AI 算法和芯片。伴随汽车电子化提速,汽车半导体加速成长,2017 年全球市场规模 288 亿美元&a…

详细介绍软件架构设计的三个维度

如果你对项目管理、系统架构有兴趣,请加微信订阅号“softjg”,加入这个PM、架构师的大家庭 架构设计是一个非常大的话题,不管写几篇文章,接触到的始终只是冰山一角,更多的是实践中去体会。这篇文章主要介绍面向对象OO、…

中国智能语音行业研究

报告来源:中信证券作者:刘雯蜀 杨泽原 张若海智能语音作为人机交互的新型方式,有望大规模推广,中国市场是更适合语音交互的市场。2017年中国人工智能市场规模达约220亿元,智能语音占中国人工智能市场份额的22%&#…

SQL2012 附加数据库提示5120错误解决方法

在win8.1 x64系统上使用sql2012进行附加数据库(包括在x86系统正在使用的数据库文件,直接拷贝附加在X64系统中)时,提示无法打开文件,5120错误。 这个错误是因为没有操作权限,所以附加的时候出错,…

pytorch利用rnn通过sin预测cos 利用lstm预测手写数字

一.利用rnn通过sin预测cos 1.首先可视化一下数据 import numpy as np from matplotlib import pyplot as plt def show(sin_np,cos_np):plt.figure()plt.title(Sin and Cos, fontsize18)plt.plot(steps, sin_np, r-, labelsin)plt.plot(steps, cos_np, b-, labelcos)plt.lege…

高德纳咨询公司(Gartner)预测:2019年七大人工智能科技趋势

来源:创新研究摘要:人工智能技术对我们的工作环境、工作种类等等正在产生日益深刻的影响,其结果或好或坏都有可能。为应对这种改变,特别是负面的变化,高德纳咨询公司(Gartner)于2018年12月13日发…

美爆!《自然》公布2018年19张最震撼的科学图片

来源:前瞻网 摘要:2018年注定将载入科学史册:气候上,从加利福尼亚烧到开普敦的致命野火和极端干旱、历史罕见;医学上,克隆和成像技术的进步既带来希望,也产生了争议;生物上,一系列事件让人们意识…

python实现Trie 树+朴素匹配字符串+RK算法匹配字符串+kmp算法匹配字符串

一.trie树应用: 相应leetcode 常用于搜索提示,如当输入一个网址,可以自动搜索出可能的选择。当没有完全匹配的搜索结果,可以返回前缀最相似的可能。 例如三个单词app, apple, add,我们按照以下规则创建了一颗Trie树.对于从树的根…

天才也勤奋!DeepMind哈萨比斯自述:领导400名博士向前,每天工作至凌晨4点

来源:量子位你见过凌晨4点的伦敦吗?哈萨比斯天天见。这位DeepMind创始人、AlphaGo之父,一直是全球赞颂的当世天才,但每天要到凌晨4点,才能睡下。这是哈萨比斯最新采访中透露的作息时间,他告诉《星期日泰晤士…