深度|机器学习到底能替人干哪些工作?《科学》列出了8条评估标准

来源: 机器人大讲堂


对于AI会取代哪些人类工作的猜测,也许可以暂时停一停了。


最近,两位来自MIT和CMU的研究者在一篇论文中提出了一种预测那些“脆弱“工作的方式。他们认为,机器学习并不代表人类工作的终结,但它会对经济和人类工作的方式产生极大影响。


根据自己对于机器学习系统当下和未来能力的理解,这两位研究者列出了8条主要标准,来评估一项任务是否适合机器学习。他们的文章发表在周四的《科学》上。


△ Erik Brynjolfsson

文章的共同作者之一、MIT斯隆管理学院教授Brynjolfsson在接受CNBC采访时说,高管们可以用这些标准来对自己机构内的任何一项工作进行评估,而政策的制定者们同样可以根据这些问题来判断哪些职业最容易受到自动化影响。CMU计算机科学教授Tom Mitchell是另一位作者。


△ Tom Mitchell

“整个工作都适合或不适合机器学习的情况非常少见,但在某种工作之中,或许有几项任务是适合的。” Brynjolfsson说。论文的主要前提之一就是,我们离所谓“通用人工智能”还差得很远,机器不能把人类能干的所有事都办了。


Brynjolfsson还说,老板们将要面临的挑战是,如何将那些工作“解绑”,依据是否能被自动化将它们进行归类,然后“重新绑定”成全新的工作。


这些问题中列出的条件,包括“不需要复杂、抽象推理的任务”、“不需要与人类进行细致、广泛对话式交互的任务”、“为了完成任务不需要长期计划”等等。使用者根据这些条件来判断符合或不符合的程度,最后加在一起算总分。


那么,究竟哪些任务最适合由机器完成?主要看这些因素:


标记了界定明确的输入和输出,能学习函数将其对应起来的任务


这些任务包括分类(比如标记狗的品种或根据可能的癌症种类标记医疗记录)和预测(分析一份贷款申请来预测未来的违约可能性)。不过机器在这里学会的只是一种统计学关联,而未必是因果关系。


存在大型数据集,或可以创建包含输入-输出对的大型数据集的任务


可获取的训练样本越多,学习结果就越精确。DNN有一个值得注意的特性,在很多领域里,它的性能并不会随着训练样本数量的增加而逼近完美。能在训练数据中抓出所有相关的输入特征尤为重要。虽然原则上任何任意函数都能用DNN来表示,但电脑应付不好两样东西:一是训练数据中模拟的、持续的多余偏见,二是会忽略包含了机器观测不到变量的规律。不过,还有不少创造数据的方法,比如监测已有过程和交互行为、雇佣人类来对部分数据进行明确标注或是创建一个完整的全新数据集,或是模拟问题相关的场景。


有着明确的目标和度量标准、提供清晰反馈的任务


当我们可以明确地描述目标时——即便我们未必能确定达成目标的最佳过程——机器学习能做得非常不错。这与早期达成自动化的途径形成了鲜明对比。抓取个人输入-输出决策的能力(即便模仿这些个人的学习过程被允许)可能不会导致最佳的全系统表现,因为人类本身就会做出不完美的决策。因而,有明确界定的全系统表现(比如优化全城范围内而不是某个交叉路口的交通流量)度量标准就为机器学习系统提供了黄金准则。当训练数据是根据这种黄金准则来进行标注并以此确定目标时,机器学习的威力特别大。


不需要依靠广泛背景知识或常识的长逻辑链或推理过程的任务


在学习数据中的经验性联系时,机器学习系统非常强大;但当任务需要依赖于常识或背景知识的长推理链条或复杂计划时,它就变得不那么好使。吴恩达的“一秒钟原则”表明,机器学习在需要快速反应和提供即时反馈的电子游戏上做得非常好,但在需要依靠对于世界的背景知识、以及对于久远事件的记忆来做出最优选择的游戏上就做得没那么好。


此类事件的例外是围棋和国际象棋,因为这些智力性游戏可以以完美的准确度快速模拟,数百万完美自标注的训练样本可以被自动采集。然而,在真实世界的大多数领域,完美的模拟太少了。


不需要对于决策过程进行细致解释的任务


数亿数值权重与它们的人工神经元相连,大型神经网络根据它们进行细微调整来学习决策。要对人类解释这种决策的原因会十分困难,因为DNN通常不会像人类一样使用中间抽象过程。虽然对于可自主解释AI系统的研究工作正在进行中,但现在这一领域的系统在这方面做得依然比较差。


举个例子,虽然计算机在诊断癌症或肺炎种类上可以比人类专家做得更好,与人类医生相比,它们解释得出诊断结果原因的能力要差得多。而对于很多可感知的任务,人类则并不善于解释,比如,他们如何从听到的声音中识别出词语。


能够容忍错误、不需要可证实的正确度或最优解决方案的任务


几乎所有的机器学习算法都是从统计学和概率上得出解决方案的。因而,要把它们训练到百分之百的准确度几乎不可能。即使是最好的语音识别、物体识别和疾病诊断系统也会犯错误。对于错误的容忍度是一条非常重要的标准。


不会随时间迅速变化的任务


一般而言,机器学习算法只会在未来的测试样本分布于训练样本分布近似时才会干得漂亮。如果这些分布发生变化,再训练就不可避免,因而,相对于新训练数据的获取率,最终的成功更依赖于变化率(比如,垃圾邮件过滤器在过滤商业垃圾邮件上做得很好,部分是因为收到新邮件的比率要高于垃圾邮件变化的比率)。


不需要专业的灵巧、运动技能或机动性的任务


与人类相比,在非结构化环境和任务中处理体力操作上,机器人仍然十分笨拙。这其实大部分不是机器学习的问题,而是最新机器人机械化控制器的成果。


在机器学习将会如何影响劳动和工资方面,这篇论文同样考虑了其中经济因素的潜在影响。比如,在一些案例中,计算机将会取代人类。


在一些任务上,自动化的价格可能会降低,这可能会影响需求、雇佣和总投入。


作者指出机器学习的影响可能会超过一些之前已经被广泛应用的发明,比如电力和内燃机。这些进步提高了总生产力,解放了互补性创新的浪潮。


“进行了正确互补性投入(如技能、资源和基础设施)的个人、商业和社会最终将会繁荣起来。“作者写道,”而其他人不只失去了分一杯羹的机会,在某些情况下,他们还会过得越来越糟。“


未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。由互联网进化论作者,计算机博士刘锋与中国科学院虚拟经济与数据科学研究中心石勇、刘颖教授创建。


未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/497744.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

南开大学计算机原理在线作业,南开大学20秋《计算机原理》在线作业-1(参考答案)...

计算机软件是指()。A.操作系统B.汇编程序C.用户程序D.所有程序及文档的统称查看答案参考答案8086微机系统的地址总线是()。A.8位B.16位C.20位D.32位查看答案参考答案单地址指令中为了完成两个数的算术运算,除地址码指明一个操作数外,另一个数采用()方式。…

2017影响世界的十大颠覆性技术 | 2018年改变世界的四大技术趋势

来源:本文转载自星河互联(ID:xinghehulian)概要:2017年即将过去,在这一年中出现了很多激动人心的技术进步,也出现了很多颠覆传统的初创企业。2017影响世界的十大颠覆性技术2017年即将过去&#…

链接网络计算机提示请检查名称,绝地求生高端辅助如果win7设置了共享文件提示“请检查名称拼写”怎么办...

win7开机提示“计算机中丢失ActiveDetect32.dll”解决方法最近有用户反映win7设置了共享文件提示“请检查名称拼写。否则,网络可能会有问题。尝试识别并解决网络问题。”怎么回事?由此可见,网络环境可能存在问题。为了解决这个问题&#xff0…

《自然》网站盘点2017年重大科技事件

来源:科技日报概要:近日,《自然》杂志网站为我们盘点了2017年重大科技事件,正是这些事件,塑造了2017年的面貌。从天上到人间,2017年注定是不平凡的一年。所谓“金风玉露一相逢,胜却人间无数”&a…

在计算机网络中软件资源共享是指,在计算机网络中,软件资源共享指的是什么...

在计算机领域,共享资源(shared resource)或网络共享(network share)是指使同一个计算机网络上的其他计算机可使用的某台计算机的计算机资源的行为。换而言之,是使计算机上的一种设备或某些信息可通过另一台计算机以局域网或内部网进行远程访问&#xff0…

如何用Python和深度神经网络识别图像?

来源:王树义科学网博客概要:只需要10几行Python代码,你就能自己构建机器视觉模型,对图片做出准确辨识和分类。快来试试吧!只需要10几行Python代码,你就能自己构建机器视觉模型,对图片做出准确辨…

单招湖南工业技术学院计算机难吗,解读湖南三一工业职业技术学院单招考试难吗...

走单招的竞争不会太激烈,因此学生们可以用不高的分数去一个比较好的专科学校。对于成绩不好的学生来说,选择单招的学生上大学的几率比较大。来我们了解一下解读湖南三一工业职业技术学院单招考试难吗什么是高职分类考试招生高职分类考试招生是普通高等教…

2017回顾:哪些领域被过度炒作,哪些领域又需要更多关注?

来源:全球创新论坛概要:不管是虚拟现实、增强现实,还是可穿戴设备,其炒作高峰似乎已经是明日黄花,已经是过去两年的事情,不知为何仍然排在炒作榜高位。不管是虚拟现实、增强现实,还是可穿戴设备…

重庆高职高专计算机排名,重庆十大大专排名(含分数线2021年参考)-重庆最好的全日制专科学校...

选择科目测一测我能上哪些大学选择科目领取你的专属报告>选择省份关闭请选择科目确定v>对于重庆考生来说,重庆专科院校的排名一直都是比较关注的话题。那么,本期圆梦志愿小编就带大家来了解一下“重庆十大大专排名及分数线”以及“重庆最好的大专全日制专科学…

无法初始化链接服务器 (null) 的 OLE DB 访问接口 Microsoft.Jet.OLEDB.4.0 的数据源对象。

SQL Server 与 Excel之间导数据时候执行SQL遇到问题 执行如下SQL语句 select * from openrowset(Microsoft.Jet.OLEDB.4.0,Excel 8.0;HDRYes;IMEX1;Databased:\sysuser.xlsx,[Sheet1$]) 提示错误: 第一步:保证Excel 文件与 SQL Server 数据库服务器在…

2018新年感谢,写在互联网类脑架构研究十年的前夜

概要:明天,是新的一年,也是我们研究互联网类脑架构,发表第一篇文章《互联网大脑进化示意图》正好10年的的日期。2018年1月1日,是新一年的第一天,也是我们研究互联网类脑架构,发表第一篇文章《互…

在SQL Server数据库之间进行数据导入导出

来源:http://kb.cnblogs.com/page/94464/ 在SQL Server数据库之间进行数据导入导出 (1).使用SELECT INTO导出数据 在SQL Server中使用最广泛的就是通过SELECT INTO语句导出数据,SELECT INTO语句同时具备两个功能: 1、根据SELECT后跟的字段…

计算机考研没奖,备战考研本科期间没有什么奖项,考研复试会有影响吗?

原标题:备战考研本科期间没有什么奖项,考研复试会有影响吗?考研复试是考研的最后阶段,因为复试采用的是差额复试,也就是进入复试人员大于拟录取人员。所以,复试还是有很大的竞争的。如何在复试中取得良好的…

HT中特殊字符φ的显示问题

HT中特殊字符φ如下才能正常显示 <text mode"1" size"1" x"1" y"9">名称:</text><text mode"1" size"1" x"6" y"9"><s:property escape"false" escapeXml&q…

2018年人工智能和机器学习路在何方?听听美国公司怎么做

来源&#xff1a;可译网翻译 | 言午二二、Amanda沈概要&#xff1a;与DevOps&#xff08;开发运营&#xff09;不同的是&#xff0c;它涉及到更多的人员和方法&#xff0c;因为新技术正在给商业管理战略带来变革。本文为美国著名数据分析网站DZone分析师Tom Smith与Exaptive的副…

2017 • AI芯片元年

本文转载自公众号&#xff1a;StarryHeavensAbove概要&#xff1a;2017年&#xff0c;AI芯片是半导体产业的亮点&#xff0c;而它受到的关注又远远超出半导体的圈子。2017年&#xff0c;AI芯片是半导体产业的亮点&#xff0c;而它受到的关注又远远超出半导体的圈子。这一年&…

河北二本计算机专业排名,河北省最好的二本财经类大学有哪些

河北省最好的二本财经类大学有哪些2020-06-20 17:01:20文/刘思琪河北省是我国高考大省&#xff0c;2019年高考报名人数创近十年新高&#xff0c;报名人数达55.96万人。高考人数的增加会导致竞争更加激烈&#xff0c;那么对于分数不是很高的同学而言选择本省的一些高校是比较不错…

为什么大家都不戳破深度学习的本质?

来源&#xff1a; 36大数据概要&#xff1a;人类正在慢慢接近世界的本质——物质只是承载信息模式的载体。人脑之外的器官都只是保障这一使命的给养舰队。人类正在慢慢接近世界的本质——物质只是承载信息模式的载体。人脑之外的器官都只是保障这一使命的给养舰队。自从去年 Al…

致研究者:2018 AI 研究趋势

来源&#xff1a;网络大数据概要&#xff1a;2017 年是机器学习领域最有成效、最具创意的一年。现在已经有很多博文以及官方报道总结了学界和业界的重大突破。2017 年是机器学习领域最有成效、最具创意的一年。现在已经有很多博文以及官方报道总结了学界和业界的重大突破。本文…

css怎样定义div大小,css如何设置div大小

在css中&#xff0c;可以使用width属性和height属性来设置div大小&#xff0c;只需要给div元素设置“width:值”和“height:值”样式即可。width属性定义元素内容区的宽度&#xff0c;height属性定义元素内容区的高度。本教程操作环境&#xff1a;windows7系统、CSS3&&…