深度学习仍是视觉大数据领域的最好分析方法之一

640?wx_fmt=jpeg

在这个数据为王的时代,深度学习擅于发掘多维数据中错综复杂的关系。基于大数据的深度学习算法在计算机视觉、自然语言处理以及信息检索等多个领域不断刷新着记录。

来源: AI科技评论

AI 科技评论注:本文作者为中国科学院信息工程研究所张晓宇副研究员和电子科技大学李长升研究员。

随着移动互联网和物联网的快速普及,全球数据总量呈指数级增长。据雷锋网统计,我们每天创造约2.3万亿GB数据。

过去,人们对海量数据无从下手。随着大数据与人工智能、云计算、物联网、区块链等前沿技术的紧密融合以及硬件基础设施的快速发展,这些新兴技术为数据增值提供了强有力保障,由此带来了巨大商业应用价值,并逐渐成为各国抢占下一步发展机遇的战略性技术。

最近,美国政府启动了大数据研究计划,致力于提升大数据分析算法和系统的效率;同时,日本对信息产业提出新的战略规划,将大数据作为重点发展的科技领域,着重强调数据采集与分析;近年来,我国大数据产业蓬勃发展。中国信通院在2018年发布的《大数据白皮书》进一步调动了全国各地发展大数据的积极性,各行各业开始利用大数据进行智能升级转型。

在大数据技术中,数据分析逐渐成为其核心技术,包括对数据处理的实时性成为工业界的主要需求。当前,各种数据分析技术层出不穷。其中,最为引人关注的当属深度学习技术。

一、深度学习是最好的方法之一

深度学习仍是目前大数据处理与分析的最好方法之一。

深度学习擅于发掘多维数据中错综复杂的关系。基于大数据的深度学习算法在计算机视觉、自然语言处理以及信息检索等多个领域不断刷新着记录。

在这个数据为王的时代,深度学习中的监督/半监督学习与数据规模、数据质量等有很大关系,因此数据标注是在现实场景中提升模型性能的最直接有效的方法。

但由于传统的数据集数量/质量有限,在解决新的问题或是想要获得更好的效果时,往往需要进行额外的数据标注。因此,对于数据要求不那么高的半监督/弱监督学习一直是视觉大数据处理中的热点问题。同时,当使用某数据集训练了一个很好的模型,但在实际应用时,往往由于“领域鸿沟”(domain gap)的存在,模型性能大幅度下降,迁移学习是这一问题的常用解决思路。

此外,由于移动设备或物联网设备的存储和计算资源有限,无法像服务器一样轻松地运行训练好的模型,限制了深度学习技术在大数据领域的应用落地,针对此问题,目前有效的解决方案包括模型压缩、计算加速。

生成对抗网络Generative Adversarial Networks (GANs)的提出,为神经网络添加了一个新的分支。该网络结构能极大提高图像生成的质量,进一步推动了计算机视觉领域的发展。

近几年,计算机视觉正在向视频理解领域延伸,而视频比图像多了一维时序信息,如何有效建模并利用这一时序信息是处理这类问题的关键。

深度强化学习是大数据时代的另一研究热点,强化学习是主体通过与外部环境交互来进行学习的过程。目前已经取得了实质性的突破,2017年DeepMind公司的提出的AlphaGo Zero通过自我博弈的强化深度学习算法进行训练,经过3天的学习,以100:0的成绩超越了AlphaGo Lee的实力(以4:1战胜李世石的版本),21天后达到了AlphaGo Master的水平,并在40天内超过了所有之前的版本。

自2017年以来,AutoML(Automated machine learning)迅速兴起,AutoML试图将特征提取、模型优化、参数调节等重要步骤进行自动化地学习,使得机器学习模型无需人工干预即可被应用。但目前其在搜索效率、实际应用等方面有待进一步探索。

二、计算机视觉

计算机视觉是人工智能领域最为成熟的技术之一,其主旨在于利用计算机模拟人类视觉,是人工智能中的‘看’,进而为后续的应用目标提供判别信息。计算机视觉研究和应用非常广泛,近几年取得了快速的发展,其应用已经在政府、金融、互联网等行业市场率先落地。

此外,利用大数据可以对实体经济行业进行市场需求分析,优化生产流程、供应链与物流能源管理,以及提供智能客户服务等。虽然大数据已经服务于众多行业,但是在实际应用中还有很多局限,仍旧有很多问题没有解决。

近年来,国家对人工智能行业的大力支持为计算机视觉的发展提供了有利环境,极大促进了计算机视觉的商业化落地。目前我国共有100余家计算机视觉企业,涉猎身份认证、安防影像、医疗影像等众多领域。

目前CV公司比较集中的技术赛道有:人脸识别、自动驾驶、医疗图像等,目前商业化落地最快的仍是人脸识别及其业务相关的一些技术。

纵观计算机视觉发展,可以看到中国与西方国家的演进路线的不同。国际上前沿的技术主要集中在深度学习的基础研究层面,而中国的计算机视觉技术更倾向于产业落地。经过多年的沉淀,中国已经在人才、数据、场景和政策层面做了比较多的储备,为中国计算机视觉技术的发展提供了丰沃的土壤。

尤其是在应用方面。计算机视觉领域一定要通过落地应用才能更好推动学术的发展,而中国在这方面具有巨大的优势。

* 封面图来源:https://ask.hellobi.com/blog/mantgh/3532

640?wx_fmt=jpeg

张亚勤、刘慈欣、周鸿祎、王飞跃、约翰.翰兹联合推荐

这是一部力图破解21世纪前沿科技大爆发背后的规律与秘密,深度解读数十亿群体智能与数百亿机器智能如何经过50年形成互联网大脑模型,详细阐述互联网大脑为代表的超级智能如何深刻影响人类社会、产业与科技未来的最新著作。

《崛起的超级智能;互联网大脑如何影响科技未来》2019年7月中信出版社出版。刘锋著。了解详情请点击:【新书】崛起的超级智能:互联网大脑如何影响科技未来

未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

640?wx_fmt=jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/490659.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

matplotlib调节colorbar的大小

调节plt.colorbar的fraction系数即可调节colorbar的大小 weight np.random.random([8, 8]) plt.imshow(weight) plt.colorbar(fraction0.05, pad0.05) plt.savefig(tjn.png, bbox_inchestight) plt.show()

学习opencv 英文版_B站上适合程序员的学习资源【赶紧收藏!】

“二次元,鬼畜,动漫”是大家提到B站,最容易冒出来的关键词!然而央视网一条微博却表示:过去一年有近2000万人在B站学习,相当于去年高考人数的2倍!B站正在成为年轻人学习的首要阵地。下面整理一些…

Matlab读取json文件

Matlab读取json文件 在matlab中,可以将数据写入json文件,却没发现读取json的函数,网上查了一下,大部分是个人写的函数,再可执行性上可能会有一些问题。最终,还是发现了一个matlab解析json文件的工具包&…

追问人工智能

来源:人机与认知实验室前段时间,英国公司登记处的一份文件披露了 DeepMind 2018 年的财务状况:这家 AI 科技公司的净亏损由 2017 年的 3.41 亿美元增加至 2018 年的 5.72 亿美元,今年到期的债务高达 12.656 亿美元。如此巨额的亏损…

安卓系统挂载NTFS格式硬盘_苹果电脑挥之不去的烦恼!怎样兼容NTFS格式的U盘移动硬盘?...

[PConline 应i用]很多用苹果电脑的朋友,都经常会遇到这样的烦恼:插入某个U盘或者移动硬盘,发现只能读取文件,没法把文件复制进去!这是因为这个U盘或者移动硬盘,使用的是NTFS格式,这也是Windows御…

dubbo工作原理

part -- 外挂1.dubbo借助spring的schema启动和初始化 1.1 spring扫描所有jar下META-INF的spring.handlers和spring.schemas。 1.2 运行spring.handlers下定义的DubboNamespaceHandler的init方法。 1.3 spring加载xml,执行DubboBeanDefinitionParser的parse方法&…

问题:AttributeError: 'Tensor' object has no attribute 'creator'

AttributeError: Tensor object has no attribute creator 根据pytorch官方文档的说法,变量具有如上的三个属性,在获取y操作的creator属性时,却出现没有该属性的错误。 import torch from torch.autograd import Variable x Variable(torch…

ACL 2019年度回顾:自然语言处理发展趋势

大数据文摘出品来源:mihaileric编译:赵伟、邢畅、张秋玥今年7月底,计算语言学协会年会(ACL)在风景优美的佛罗伦萨召开。会场设在了一座古老的Medici家族的城堡中。作为NLP研究最大规模的会议之一,ACL 2019的…

Python基础:获取迭代器下一项目的常见操作

目录 获取迭代器下一项目通常有三种方法 python3中最常见的一种错误使用 获取迭代器下一项目通常有三种方法 next()函数iterator.__next__()属性for循环 next()函数 iterator iter([1,2,3,4,5,6]) a next(iterator) print(a) b next(iterator) print(b) 输出&#xff1…

电商项目的并发量一般是多少_掌握这些,高并发秒杀系统就不用担心了!

很多小伙伴反馈说,高并发专题学了那么久,但是,在真正做项目时,仍然不知道如何下手处理高并发业务场景!图片来自 Pexels甚至很多小伙伴仍然停留在只是简单的提供接口(CRUD)阶段,不知道学习的并发知识如何运用到实际项目…

matplotlib的colorbar设置显示的刻度个数和指定的刻度值

通过matplotlib.ticker.MaxNLocator(nbinsn)来设置colorbar上的刻度值个数 import matplotlib.ticker as ticker fig plt.figure() ax fig.gca() im ax.imshow(np.random.random([10, 10])) cb1 plt.colorbar(im, fraction0.03, pad0.05) tick_locator ticker.MaxNLocato…

Windows下MySQL数据库更改数据存储位置

Windows下MySQL数据库更改数据存储位置 1、创建一个新的存储数据文件 比如,我创建了一个文件 E:\MySQL_Service ,用来放mysql数据。 2、找到配置文件my.ini和mysql原本数据存放位置 之前用的是默认安装位置,我的电脑数据存放的默认路径为…

华为5G手机芯片被唱衰:美研究机构拆解6款量产机,不谈能力对标高通骁龙X50...

来源:凹非寺全球5G手机芯片到底哪家强?能力上来看,量产的华为巴龙5000参数超过骁龙X50,但最近英国研究机构IHS Markit拆解6款5G手机后给出另一面结论:华为手机5G,没高通骁龙有竞争力。IHS的结论&#xff0c…

CSS3-06 样式 5

浮动(Float) 关于浮动,要说的可能就是:一个设置了浮动的元素会尽量向左移动或向右移动,且会对其后的元素造成影响,其后的元素会排列在其围绕在其左下或右下部。似乎就这么简单,但是在实际开发中…

量子纠缠为什么不能用于瞬时通讯?

来源:数学职业家什么是信息? 信息的一个比较被认可的定义是1948年数学家香农在论文中提出的:信息是用来消除随机不定性的东西。比如,盒子里有一个硬币,它可以是正面向上,也可以是反面向上,在打开…

第二次冲刺每日站立会议03

会议照片: 会议内容: 祖浩然: 昨天:学习要进行优化的相关知识 今天:对前两个界面进行界面的修改 遇到的问题:设置背景图片之后按钮无法显示 刘洋: 昨天:学习要进行优化的相关知识 今…

cad菜单栏快捷键_天正建筑菜单栏不见了怎么调出来

在使用天正建筑得出时候,可能会因为不小心,把菜单栏关闭了,却一时不知道怎样打开,下面使用三种方式,教你将不见了的菜单栏调出来。方法一:使用键盘快捷键1.在界面中,我们可以看到,这…

图说报告 | “智能+”的终极版图:数字孪生世界

来源:阿里研究院数字孪生(Digital Twin)是近几年兴起的非常前沿的新技术,进入Gartner2019年十大战略技术趋势行列。今天,从300万个波音777零部件到人类心脏,其数字孪生体都可以复制。在未来的医疗领域&…

MATLAB画频率响应曲线(幅频特性和相频特性)并将横坐标转换为赫兹hz单位

matlab画频率响应曲线的函数为: [h,w] freqz(b,a,n) b,a:传递函数系数 h:频率响应 w:角频率,0~π 更多参数解释参考官方链接https://ww2.mathworks.cn/help/signal/ref/freqz.html?requesteddomaintrue 用freqz…

python3.6配置环境变量_python安裝及环境变量配置

一、安装 1.python下载 进入官网后选择download,选择windows进入如下页面1.1 python3.6.6版本下载 首先我们下载python3.6.6版本,下滑页面找到此位置,64位系统选择红色框框,32位选择蓝色框框点击进行下载 1.2 python2.7版本下载 下…