这几家公司有个梦想:开发AI操作系统,让外行也成为人工智能大师

来源:科技行者

概要:未来几年人工智能会如何发展?除了阿尔法狗令人叹为观止的表现,人工智能确实也正在改变整个行业。但有一点我们是需要注意的,有必要让AI从总体上变得更加易于使用。


严格的说,Scot Barton似乎不像是一名人工智能先驱。他并没有在建造自动驾驶车辆,也没有训练电脑如何在电脑游戏中击败人类。但是值得注意的是,在其所就职的农夫保险公司(Farmers Insurance)里,他正在为某技术开创道路。


Barton领导着一个分析数据的团队,主要回答关于客户行为和不同政策设计等问题。从深层神经网络到决策树,他的团队现在正在使用各种尖端的机器学习技术。但是Barton并没有雇用一批人工智能魔法师来实现这一点。他的团队使用了一个被称为DataRobot的平台,它可以将所涉及的很多困难工作自动化。


未来几年人工智能会如何发展。除了阿尔法狗令人叹为观止的表现,人工智能确实也正在改变整个行业。但有一点我们是需要注意的,有必要让AI从总体上变得更加易于使用。


问题是,现有的人工智能技术涉及到的许多步骤目前都需要大量的专业知识。而且,这不像是在表面上搭建一个友好的界面那么简单,因为工程师们在编写和调整代码的时候经常需要进行判断并需要使用到专门的技术。


但是,人工智能研究人员和公司正在通过将这项技术应用于自身来解决这个问题,利用机器学习将人工智能算法开发中棘手的问题自动化。一些专家甚至建立了相当于人工智能支持的操作系统,旨在使该技术的应用程序与今天的微软Excel一样简单易用。


DataRobot是朝着这个方向迈出的一步。你提供原始数据,平台对其进行自动清理并重新格式化。然后,它一次运行数十种不同的算法,并对其性能进行排名。与标准的手工统计方法相比,所选择的模型的错误率降低了20%。他表示,“开箱即用,按一个按钮;这实在是非常令人印象深刻。”


DataRobot是一家把建立机器学习模式的过程变成自动化的平台公司。在DataRobot平台上有数百个开源机器学习算法。通过提供快速、准确和自动化的程序,DataRobot可帮助企业级用户做出更智能、更快速的商业决策。DataRobot通过改变预测分析的速度和经济学,解决了数据科学家严重短缺的问题。


DataRobot致力于……(图片来自DataRobot官网)


人工智能技能缺口


今年六月,咨询公司麦肯锡发布了一份报告,披露了人工智能应用的现实。这份报告的结论是,人工智能——特别是机器学习,可能会彻底改变包括制造业、金融业和医疗保健行业在内的大型行业,到2025年可能会在美国经济中总共占到1260亿美元的规模。但是,报告有一个严重的警告:关键人才的短缺。


培养尽可能多的人使用人工智能当然是非常有帮助的。但是这需要时间,而且不是每个人都能成为人工智能大师的。对于任何一种技术来说,要想最大限度地发挥它的影响,就要让它能够尽可能方便地被使用。只有当人工智能能够渗透进入普通的办公室和工作场所,才能实现这一点。DataRobot已经被用于一些这样的场合了。


一天下午,坐落于波士顿金融区的DataRobot办公室空荡荡的,一大批工程师围着一台大型显示器乱转。该公司的咨询师Jonathan Dahlberg给我做了一个演示,该公司的解决方案真的是令人印象深刻。他加载了一个贷款申请和付款的公共数据集,然后他让系统开发出一堆模型,看看关于为什么人们会违约是否有什么模式。


几秒钟后,屏幕上出现了数十种竞争算法;在顶部是一种被称为XGBoost的、相对无趣但被广泛使用的梯度提升技术。很快,屏幕上就显示申请人的收入特别重要,但他们想要贷款的原因也是如此。它发现,在申请中提及“创办企业”的人是一个特别糟糕的群体。


Dahlberg表示,DataRobot可能会在专业知识和技能方面,与一个非常好的数据科学家旗鼓相当,但它可以提供更广泛的视角。一个人可能会太依赖某种技术,而DataRobot可以自动地找到一种从根本上更好的方法。用户还可以使用Python或R编程语言手动修改底层算法。不经过仔细的检查,很难知道该系统在自动化数据科学的一些棘手问题方面到底做得如何,如数据清理和功能工程,但它似乎对付了一个惊人的数量。


该公司的首席执行官Jeremy Achin在观看了《社交网络》(《The Social Network》)之后备受激励,萌生了想要创办一家企业的想法,当我们在麻省理工学院附近的咖啡馆会面时,他承认当时还有点懦弱。但是,他在数据科学比赛中获得了DataRobot的灵感,这些竞赛是由众包平台Kaggle举办的,该平台在今年早些时候被谷歌收购了。Kaggle为从大型数据集中进行特定预测时表现最佳的算法提供奖品。这一任务通常涉及开发一种机器学习算法,用于对数据进行处理。作为Kaggle最早的参赛选手之一,Achin意识到自己已经在每场比赛中自动化了很多步骤。 他表示,“我认为,如果我们收集了足够多的数据集,足够多的问题,并且运行了足够多的实验,我们就可以在机器学习上进行机器学习。这是就是最初的想法。”


这个想法显然引发了投资者的共鸣。DataRobot自2012年创办开始,已经筹集了超过1亿美元,其中包括今年3月份筹集到的5400万美元,与此同时,Kaggle被谷歌收购了。该公司表示目前已经拥有一百多个客户。Achin表示,这个概念在很多数据科学家那里并不是那么受欢迎,他们要么认为自己的技能无法被自动化,要么则是担心这些技能会被自动化。但是他相信,对绝大部分企业来说,如果想要使用人工智能,就没有别的选择。他表示,“我不在乎有多少人在LinkedIn上将他们的头衔改为‘数据科学家’”。他表示,“你不会有很大改观。”


自我学习系统


数据科学家的短缺激发了许多其他的人开始致力于自动化机器学习方面的工作。越来越多的研究论文正在使用技术将越来越多人工智能方面的工作自动化。


谷歌是全球最大的玩家之一,该公司也将注意力转向了这个想法。谷歌已经大笔投入,开发了强大的人工智能算法并将其部署到其服务中。但该公司也热衷于为其云服务添加更多的人工智能。除了简单的图像或文本分类工具之外,还意味将更多机器学习模型训练工作自动化。


负责领导谷歌人工智能工作的计算机工程师John Giannandrea表示:“目标是使这项技术更易于使用” 。他表示,“然后任何人都可以说‘为我建立一个预测模型’,然后它就会去做一个模型。”



今年早些时候,该公司宣布了围绕着这一目标的一些重大进展,展示了一种能自动化地调整深度学习神经网络的实验性的方式。 这些可能是最强大的机器学习算法,它们显着提高了图像和语音识别领域的最高技术水平。但它们也很难工程化。Giannandrea表示,这项工作正在产生一些非常有希望的结果,在某些情况下与手动开发的系统的性能不相上下。 而且他希望谷歌能够在未来几个月内发布更多的结果。


其他人甚至还做出了更宏大的设计。例如,卡内基梅隆大学教授Eric Xing正在开发相当于是由不同机器学习组件构建的操作系统。该操作系统使用虚拟化和机器学习来抽象设计和训练人工智能工作中的大部分复杂性。它甚至配备了一个图形用户界面,可用于训练特定数据集上的机器学习模型。


Eric Xing在中国受过教育,并在加州大学伯克利分校(UC Berkeley)与Andrew Ng一起学习,他现在是世界知名人士的知名人物。他非常有礼貌,而且令人意外的是,他想要改变人们使用电脑的方式。Eric Xing设想他的人工智能操作系统会非常简单易用,就像微软的电子表格软件——Excel一样。他表示,“这是整个人工智能行业的核心问题”。他表示,“进入的门槛太高了。”


Eric Xing已经创办了一家公司——Petuum,来开发这个操作系统,并且已经开发了一系列工具,旨在将机器学习引入医学领域。他表示,“医生需要一个界面和医疗记录、图像——每一种图像都需要不同的机器学习方法。” Petuum正在加紧准备发布平台。


Petuum目前正在针对深度学习(如CNN/RNN)、预测性分析(如回归分析)、知识萃取(如主题模型) 、内容概括(如稀疏编码)和集成方法(如梯度增长树状图)创建一个新一代人工智能和机器学习平台。平台可适用于于多种不同应用,比如自然语言处理、图片和视频分析以及交易数据中的异常检测。


图片来自Petuum官网


Petuum的操作系统和其他一些人工智能自动化工具将面临一些独特的挑战。已经有关于机器学习算法无意中吸收了训练数据的偏差的担心出现,而有些模型太不透明,无法进行仔细检查(参见《人工智能核心中的黑暗秘密》“The Dark Secret at the Heart of AI”)。如果人工智能变得更加容易使用,这些问题可能会变得更加广泛和更加根深蒂固。


微软高级研究员Rich Caruana表示:“要想把机器学习做得很好,你需要博士学位和大约五年的经验。”他表示,“有很多陷阱。您的算法是否在六个月后过期,它是否可以解释?”


数据科学家为防范这些问题而必须采取一些步骤,Caruana相信这些步骤中的一部分应该是有可能自动化的——这类似于飞行员在飞行前的检查清单。但是他对于过分地信任承诺自动化一切的系统心存警惕。他表示,“我知道这一点是因为一路走来,我一直磕磕绊绊。”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/498409.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

mysql耦合_内聚与耦合

简单理解一下内聚和耦合。什么是模块模块就是从逻辑上将系统分解为更细微的部分,分而治之。复杂问题因为复杂性的问题,比较难解决,但是可以将复杂问题拆解为若干简单问题,逐个击破地解决这些简单问题,最后实现解决复杂…

Google CEO Sundar Pichai :“谷歌最大的威胁就是自身的成功”

作者:Dude 概要:10月9日,低调的皮柴哥接受了英国卫报的访问,在访谈期间,他分享了谷歌在人工智能上发展,也表达了对谷歌近年来发展的隐忧。 10月9日,低调的皮柴哥接受了英国卫报的访问&#xff0…

国防科技大学教授:殷建平——计算机科学理论的过去、现在与未来

来源:图灵人工智能殷建平 教授,博士生导师,国防科学技术大学计算机系主任。研究方向有:模式识别与人工智能、网络算法与信息安全。享受国务院政府特殊津贴。2015年被评为“万人计划”国家级教学名师。2009年被评为“全国优秀教师”…

《自然》杂志:关于人类未来的工作,有三个最紧迫的问题

来源:36氪 概要:机器学习会淘汰工人吗?零工经济(Gig Economy)会增加对工人的剥削吗?技能的差距能够弥补吗? 机器学习会淘汰工人吗?零工经济(Gig Economy)会增…

有史以来影响世界的颠覆性技术 | 未来的高附加值颠覆性技术产业

来源:DeepTech深科技(ID:mit-tr) 概要:没有工具,人类就是一个脆弱的物种,没有任何人种可以手无寸铁面对自然。技术伴随人类成长,从野蛮走向文明。人类历史就是一部技术史。 人类发展…

一文详解脑科学研究与产业发展方向

来源:神经科技、脑计划 概要:大脑是人体最复杂的器官,破译大脑运转密码、揭开生命之谜,是令无数科学家殚精竭虑的艰难课题。脑科学已成为21世纪最前沿的研究领域,尤其与信息科学进行交叉研究已成为脑科学发展的一个重要…

ef生成mysql字段注释_EFcore+MySql 数据迁移的时候,怎么给表结构加注释?

前言:CodeFirst运用的场景比较少,不代表CodeFirst不好,也不能和DbFirst去作比较,本来就是两个东西。吐槽:MySql.Data.EntityFrameworkCore 作为Oracle官方维护的组件,居然对EF很多API不支持或者无效&#x…

10秒一部电影,全球首个5G数据连接完成

作者:李赓 概要:2017年10月17日、也就是上周二,高通在香港高调宣布——其面向移动终端的5G调制解调器芯片组,骁龙X50 5G调制解调器芯片组完成了全球首个5G连接,同时实现了千兆级速率并在28GHz毫米波频段上的数据连接。…

idea 不打开文件提示错误_解决IDEA误删out目录下的文件导致404无法访问的问题

前言有时候IDEA下写Web项目时可能会遇到如下问题:误删out目录下的文件导致开启服务器后无法访问页面的问题新增加一个页面或添加一张图片,在项目编译运行后,未能自动更新到out\artifacts\目录下,从而导致页面无法访问,或者图片未能…

华为生态链的全方位解读

来源: 本翼资本CapitalWings 概要:华为作为目前国内ICT行业的融合性创新龙头企业,其多年经营探索的经营模式和宝贵经验使得其成为传统制造业转型的标杆,而对于新兴企业,能够越过坎坷的探索之路,直接嫁接华…

洪小文:以科学的方式赤裸裸地剖析人工智能

来源: 微软研究院AI头条 概要:要想在未来实现人工智能这项“新”技术的最大化利用,必须清楚认识到人工智能到底是什么,过去我们做了什么,今天能做什么,未来又能有什么新的发展可能。 近两年来,人…

人工智能如何驱动实体经济?六大领域展望

来源:腾讯研究院 概要:科技进步正在成为推进经济发展的重要推动力,对中国经济发展的贡献率已经上升到56.2%。面对正在兴起的人工智能浪潮,如何占据行业发展制高点,如何促进与实体经济深度融合,形成新增长点…

《浪潮之巅》作者吴军最新演讲:超级人工智能

来源:亿欧 概要:10月22日,AMINO硅谷中国“新”大会在南京经济技术开发区举行。《浪潮之巅》作者、AMINO资本合伙人吴军发表了以《超级人工智能》为主题的演讲。 人工智能起源 我知道很多人都想听我讲人工智能是怎么回事儿?最近有…

mysql慢sql增加读写分离_MySQL主从同步+读写分离

MySQL主从同步读写分离实验拓扑:三台mysql数据库:192.168.80.101 主服务器 mysql192.168.80.102 从1服务器 mysql192.168.80.103 从2服务器 mysql192.168.80.104 调度器Amoeba服务器 jdk、amoeba192.168.80.105 mysql客户端 mysql第一部分:三…

Google公布OpenFermion:量子计算机的开源软件包

来源:转载自公众号「雷克世界」微信号:ROBO_AI 作者:Ryan Babbush、Jarrod McClean 编译:嗯~阿童木呀、多啦A亮 概要:OpenFermion是一个用于模拟电子(费米子)相互作用系统的库,它能够…

java 类集合_java集合类详解

一、集合类与数组的区别1.集合的长度可变,数组的长度固定;2.集合用来存放对象引用,数组用来存放基本类型的数据;二、集合类的关系1.Collection接口存储一组不唯一、无序的对象。2.List接口存储一组不唯一、有序(插入顺序)的对象。…

英特尔宣布推出“Nervana”神经网络处理器

原作者:Ryan Whitwam 译者:彭婷 概要:Nervana NNP就是基于这种计算设计的。这也是所谓的专用集成电路(ASIC),所以它无法应用于一般的计算任务。 科幻小说家和现代科技大型公司一致认为AI可以开辟出一条康庄…

java爬取button_学习使用Java的webmagic框架爬取网页内容

(一)使用前的配置:2,(1)添加依赖:us.codecraftwebmagic-core0.7.3us.codecraftwebmagic-extension0.7.3us.codecraftwebmagic-selenium0.7.3(2)从GitHub官网下载webmagic的压缩包(https://codeload.github.com/code4craft/webmagic/zip/maste…

异构智能吴韧:物联网是“伪命题”?智联网才是未来

概要:“咨询机构预测,在未来人工智能的市场上12%的比例的资金将用在人工智能芯片上。”吴韧表示,异构智能瞄准的就是人工智能本地芯片市场。 Novumind异构智能(以下简称异构智能)在火热的人工智能新闻里出现的次数屈指…

java栈编程题_Java实现栈和队列面试题

面试的时候,栈和队列经常会成对出现来考察。本文包含栈和队列的如下考试内容:(1)栈的创建(2)队列的创建(3)两个栈实现一个队列(4)两个队列实现一个栈(5)设计含最小函数min()的栈,要求min、push、pop、的时间复杂度都是O(1)(6)判断栈的push和p…