从基础设施的演变,看人工智能到底需要什么样的底层平台

来源:亿欧

概要:大数据、大容量存储、弹性计算和各类算法的发展,尤其是在深度学习领域的发展,带来了各类脑洞大开的创新应用。


机器学习和人工智能的时代已经到来。大数据、大容量存储、弹性计算和各类算法的发展,尤其是在深度学习领域的发展,带来了各类脑洞大开的创新应用。


在围棋这样的复杂策略游戏中,机器已经胜过人类。图像识别、语音识别等应用更是不在话下。语音智能助手开始普及,全自动驾驶汽车上路测试。然而对于近期机器学习/人工智能的这些发展,许多讨论围绕的都是算法和应用,很少有讨论涉及底层基础设施。


在计算技术的发展早期,只有汇编语言专家、编译器专家和操作系统专家才能开发简单的应用。目前的情况也很类似,只有获得统计学或分布式系统专业的博士学位,你才能知道如何开发人工智能系统并大规模部署。缺失的环节在于加速人工智能开发的抽象化工具。因此,只有最精英的工程团队才有完整的能力去做这方面工作。


另一方面,相对于机器学习技术的创新,基础设施的发展也很落后。简单来说,作为当前机器学习应用基础的系统和工具实际上并不适合未来智能应用的演进。面向未来,业内需要新工具去释放人工智能的潜力,让人工智能更加平易近人、更加实用。所以在基础设施创业领域,提供智能系统开发所需的模块,这将是未来的一座大金矿。


从基础设施1.0到基础设施2.0


应用和基础设施之间的关系很微妙,相互限制、相互推动。


硬件和系统软件的发展带来了新一类应用。这些应用不断完善和成熟,从而对底层资源提出更高的要求,倒逼底层基础设施去创新。反过来,基础设施的优化、创新、性价比提升也会带来颠覆式应用,给用户提供前所未有的体验。一个典型的例子就是从幻灯片到PPT,再到各种在线图片社交平台,例如Pinterest。


本世纪初,商业互联网的发展基于来自英特尔的x86指令集,来自微软的标准化操作系统,来自甲骨文的关系数据库,来自思科的以太网设备,以及来自EMC的网络存储工具。亚马逊、eBay、雅虎,甚至最初版本的谷歌和Facebook都基于这些基础设施。这就是科技行业的“基础设施1.0”。


然而随着网络的逐渐成熟,网民总数从1995年的1600万增长至2015年底的30多亿,应用对规模和性能的要求也大幅提升。“客户端/服务器”时代的技术不再适合互联网巨头的需要,无论是从可行性上来看还是从性价比上来看。


因此,互联网公司开始自力更生。凭借自身的技术专业能力以及学术界进展,谷歌、Facebook和亚马逊定义了全新一类基础设施。这样的基础设施具备如下特点:规模可扩展、可编程、通常是开源的、成本低。相关技术,包括Linux、KVM、Xen、Docker、Kubernetes、Mesos、MySQL、MongoDB、Kafka、Hadoop和Spark,定义了云计算的时代。这也被称作科技行业的“基础设施2.0”。


最核心的,这代技术的设计目标在于,让互联网可以覆盖数十亿终端用户,并以高效的方式去获取并储存来自这么多用户的信息。因此,“基础设施2.0”的创新导致了数据量的大幅增长。配合并行计算技术和算法的发展,我们就看到了当前机器学习的发展。


基础设施3.0:走向智能系统


“基础设施2.0”时代的终极问题是:“我们如何连接世界?”而当前的问题更多的是:“我们如何理解世界?”


这其中的差别,即“连接”和“认知”,可以解释人工智能与上代软件的关键不同。代码自身的“认知能力”颠覆了传统编程模式。在传统应用中,程序逻辑是写死的,而在人工智能应用中,算法通过对大数据的分析自己得出逻辑。随后,这些逻辑被用于决策和预测。


这样做的结果就是“智能”应用。但实际上,这类应用的诞生需要大量数据,并且耗费巨大的计算资源。这些限制因素导致人工智能很难被通用化,从而符合70年前冯·诺依曼提出的计算范式。所以,人工智能代表了一种基础性的新架构,要求我们重新思考基础设施、工具和开发实践。


到目前为止,人工智能领域的研究和创新仍集中于新算法、模型训练技术和优化方法。此外,人工智能系统中只有很少一部分的代码用于学习和预测,而最麻烦的部分在于准备数据、开发功能,让分布式的基础设施能够运行,从而规模化地执行任务。

如果想要成功开发并部署人工智能应用,那么就需要协调多个离散的系统,设计精密的流程。首先,你需要消化数据,去芜存菁,给数据打上标签。随后,为了实现预测,你必须确定适当的特性。最后,开发者必须训练模型并验证、部署、持续优化。整个过程可能需要几个月时间,即使是技术最专业的组织也是如此。


如果想要让人工智能发挥最大的潜力,那么就必须从当前的学术理念中提炼出可以实际操作的要点。在实践中,这意味着需要进行新抽象、设计新界面、系统和工具,帮助开发者更方便地开发和部署智能应用。


这很可能不会是渐进式的改变,而将是颠覆性的、基础性的变革。设计方式和开发方式都将发生巨变。


对应地,在整个体系的每个层面,我们都在看到新平台和工具出现,尝试对人工智能开发范式做出优化。机会确实很多:


1. 集成多个计算核心,支持高带宽存储的专用硬件正在出现。这些芯片针对高并发数值计算进行优化,更适合神经网络所需的快速、低精度、浮点计算任务。


2. 系统软件将针对硬件配置提升效率,甚至充分发挥每个晶体管的能力。


3. 无论是用于训练还是推理,分布式计算框架可以有效地扩大跨多个节点的模型运行。


4. 数据和元数据管理系统带来了可靠、统一、可复制的数据储备,为训练和预测提供并管理大数据集。


5. 基于实时数据和内容,超低时延的服务基础设施让机器可以迅速执行智能操作。


6. 模型表达、问答、调试和监控工具有助于大规模地监控、调试和优化模型和应用。


7. 端到端平台可以将整个人工智能工作流封装起来并抽象化,简化终端开发者面临的复杂性。这方面的例子包括Uber的Michelangelo和Facebook的FBLearner,已经商用的则包括Determined AI。


过去10年,我们在技术方面看到了“云计算物种”的兴起。类似的,未来几年,我们将看到,围绕机器学习和人工智能将诞生全新的基础设施和工具生态。


这些创新的集合就是“基础设施3.0”,而这也将充分释放人工智能的能力,给智能系统的建设提供模块化工具。我们将看到新的项目和平台,以及新公司的崛起。




未来智能实验室致力于研究互联网与人工智能未来发展趋势,观察评估人工智能发展水平,由中国科学院虚拟经济与数据科学研究中心刘锋、石勇、和刘颖创建。


未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;构建互联网(城市)云脑架构,形成科技趋势标杆企业库并应用与行业与智慧城市的智能提升。


  如果您对实验室的研究感兴趣,欢迎支持和加入我们。扫描以下二维码或点击本文左下角“阅读原文”







本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/498046.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如何看屈曲因子_Abaqus 非线性屈曲分析方法

通常情况下,我们只用关注产品结构本身的强度和刚度满足一定的要求或标准即可。但实际工程中,对于像细长类的结构、薄壁结构,我们还得考虑它的稳定性问题,这也就是我们通常所说的失稳问题或者塌陷问题。在有限元分析中,…

人类首张脑电波连接全图问世

来源:科技日报 概要:美国宾夕法尼亚大学的神经学家根据300名接受神经外科手术患者大脑中30000个电极的数据,绘制出第一张脑电波连接全图。 美国国防部高级研究计划局(DARPA)资助的、与“恢复活跃记忆”相关的大脑研究项…

全球半导体产业迁移 中国的机遇与挑战

来源:36氪 概要:商务部24日发布公告说,以附加“限制性条件”的形式批准了日月光半导体收购矽品精密股权案。 商务部24日发布公告说,以附加“限制性条件”的形式批准了日月光半导体收购矽品精密股权案。这个附加的“限制性条件”&…

阿里智能对话交互实践与创新

来源:人工智能头条 作者 :孙健,李永彬,陈海青,邱明辉 概要:过去 20 多年,互联网及移动互联网将人类带到了一个全新的时代,如果用一个词来总结和概括这个时代的话,「连接」…

IDC Future Scape : 2018年全球物联网十大趋势性预测,5G将加速IoT发展

作者:Dudu 概要:预计到2021年前后,5G、物联网数据分析、物联网支出管理、区块链、物联网服务将成为市场主流。 2019年,IoT行业中,边缘基础设施将成为市场主流,多用于单个部门的业务板块中。 到了2020年&am…

mysql 解释 游标赋值_Mysql_游标

MySQL中的游标是一个十分重要的概念。游标提供了一种对从表中检索出的数据进行操作的灵活手段,就本质而言,游标实际上是一种能从包括多条数据记录的结果集中每次提取一条记录的机制。MySQL中的游标的语法如下:DECLARE cursor-name CURSOR FOR…

意见征集,世界AI智商评测量标准2018年新版讨论方案

来源:未来智能实验室 对于本次2018年世界AI智商评测的量表更新 ,有两个问题希望得到您的意见:1.如果按上述智力因素进行增加,您认为他们的权重应该是多少,其他已有的智力因素权重应该调整为多少;2.您认为考…

人工智能的价值地图:AI产业增强革命的模式与路径

来源:腾讯研究院 概要:人工智能所蕴含的力量让人向往又恐惧。2016年的两次人机大战第一次让公众认识到人工智能的强大力量。 “智造”并不是一个新词,几年前,我们可以看到数字技术从虚拟世界向实体世界渗透。3D打印、激光切割等一…

那么多GAN哪个好?谷歌大脑泼来冷水:都和原版差不多

来源:量子位 概要:从2014年诞生至今,生成对抗网络(GAN)热度只增不减,各种各样的变体层出不穷。 从2014年诞生至今,生成对抗网络(GAN)热度只增不减,各种各样的…

java 中获取file的长度为0_Java核心技术梳理-IO

一、引言IO(输入/输出),输入是指允许程序读取外部数据(包括来自磁盘、光盘等存储设备的数据)、用户输入数据。输出是指允许程序记录运行状态,将程序数据输出到磁盘、光盘等存储设备中。IO的主要内容包括输入、输出两种IO流,这两种流中又分为字…

福布斯:2018年将改变世界的九股科技大趋势

来源:咕噜网 概要:2018年又会有哪些重要科技趋势会改变世界呢?《福布斯》杂志今天发表文章,公布了将会在明年及日后改变世界的9股科技大趋势。 据《福布斯》杂志北京时间12月4日报道,2017年即将结束。这一年&#xff0…

BigDecimal 运用示例 与 DecimalFormat

代码: BigDecimal bd new BigDecimal( "99.11" );System.out.println( "scale" bd.scale() );System.out.println(bd);bd new BigDecimal( 5526 );bd bd.divide( new BigDecimal (1000) );System.out.println( "scale" bd.scale…

NIPS 2017上演:Google大神们将带来哪些「精彩」?

来源:雷克世界 作者:Christian Howard 编译:嗯~阿童木呀、我是卡布达 概要:Google在2017年NIPS大会将展现出色的影响力,约有450多名Google员工将会通过技术讲座、海报、研讨会、比赛以及教程等方式向更广泛的学术研究…

dict keys 取最后一个_一步一步学Python3(小学生也适用) 第十三篇: 字典Dict类型

前面我们已经学习了Python的字符串,列表,元组,这一篇我们将学习字典,字典的使用频率是非常高,跟前面几篇一样,只要你用Python编程,就避不开Python字典。一、创建字典字典由键(key&am…

三份研究报告,聚焦 AI 的三大主要话题

来源:36氪 概要:随着人工智能技术呈现出势不可挡的发展之势,围绕 AI 进行的相关研究数量也越来越多。 随着人工智能技术呈现出势不可挡的发展之势,围绕 AI 进行的相关研究数量也越来越多。 关于人工智能及其对经济的影响方面&…

adams打不开提示msc license_adams安装后打不开

虽然要支持正版……但是安装后打不开,借鉴了adams2017安装教程后台留言图片发自简书App1.首先我这么做是因为其实在安装过程中就有一次没找到路径 。所以该方法仅供参考。图片发自简书App此时我直接在“此电脑”内搜索“MSC.Software”了图片发自简书App耐心等待………

李彦宏乌镇谈人工智能:百度会很快和雄安宣布一个大的智能城市计划

来源:亿欧 概要:百度董事长兼CEO李彦宏谈到了人工智能给C端、B端以及供给侧等方面带来的影响和变革。 12月4日,2017世界互联网大会在乌镇如火如荼地进行,在主题为“人工智能:让生活更美好”的分论坛上,百度…

android studio 制作表格_红爆网络的旅游排行榜视频制作其实很简单,赶快动手尝试...

随着手机短视频的蓬勃发展,在网络上出现了多种类型的红极一时的爆款视频,这其中很具有代表性的一种就是排行榜视频,旅游领域的排行榜视频自然也少不了。这些个排行榜视频看起来挺高大上,配上稍有激情的背景音乐,播放起…

2017全球大数据产业八领域典型公司盘点分析

来源:黑科技数据 概要:从微观视角细分领域分析大数据行业。 今天带大家从微观视角细分领域分析大数据行业。 大数据分析 大数据可视化 BI商业智能分析 大数据检索 产品大数据分析 大数据预测、咨询 大数据服务支撑平台 机器学习技术 “大数据分析、可视化…

mysql profile 调试sql_SQL Server profile使用技巧

介绍经常会有人问profile工具该怎么使用?有没有方法获取性能差的sql的问题。自从转mysql我自己也差不多2年没有使用profile,忽然profile变得有点生疏不得不重新熟悉一下。这篇文章主要对profile工具做一个详细的介绍;包括工具的用途和使用方法…