杨强 : 迁移学习——人工智能的最后一公里

来源:智能系统学报

11月30日上午,第九届吴文俊人工智能科学技术奖颁奖典礼暨2019中国人工智能产业年会在苏州广电大厦演播厅隆重举行。本届大会主题是“突破关键技术·赋能产业落地”。大会邀请到国家部委专家、两院院士和产业领军人士,围绕77场主题报告,17个核心话题,10场尖峰对话,就人工智能在核心关键技术的落地展开观点碰撞,通过权威学者、顶级专家和企业精英开坛论道,解读行业痛点,剖析发展瓶颈,探讨场景壁垒,深究真问题。本届产业大会重点聚焦知识智能及其应用、智能芯片、智能无人机、智能网联汽车、智能机器人、智能金融和智能医疗等优势产业。在本次人工智能产业年会上,邀请了深圳前海微众银行股份有限公司首席人工智能官、中国人工智能学会名誉副理事长杨强教授带来了题为“迁移学习——人工智能的最后一公里”的精彩报告。

以下是杨强院士的报告实录

大家下午好,我今天主题是“人工智能最后一公里”,这也是我一直在研究的主要方向。我们先看一下深度学习的一些限制,大家现在都在大数据领域有很大的突破,一个代表性突破就是AlphaGo,AlphaGo在19乘19的棋盘上可以说是举世无双。但是只要换一下棋盘的大小,或者换一下棋盘的种类,原来的模型就完全无能为力了,就得重新做一个训练,这个例子引起了我们的深思。

当前人工智能领域需要大数据的推动,这个推动如果换一个新的领域的话很可能只有小数据。小数据的场景是不是也可以用深度学习来解决呢?我们认为是很有困难的,因为依据深度学习现在的进展,还没有很多的算法能够在小数据情况下发挥作用。

有很多原因造成我们面对小数据这种状态,比方说由于行业性质使得不同部门之间没有办法交换数据,加之考虑到用户隐私、商业利益、监管的要求等,我们面临的是小数据和一个一个数据孤岛。把小数据变成大数据,又需要做很多数据标注,比方说在医疗或者金融方面,时间不允许我们很快把小数据变成大数据。

针对小数据的问题,我和团队长期做的研究是迁移学习。迁移学习就是像人类一样,能够进行举一反三,把模型从一个场景迁移到另外一个场景的动作。目标是突破传统机器学习必须有大数据作为前提的要求。人类是怎么做的呢?我们在解决一个新问题的时候,会利用联想能力想一下:过去遇到过类似的场景吗?那么能不能将一个模型通过小小的改动,让其在当前的场景下使用?这种联想能力是我们举一反三的迁移能力的关键。

什么叫具有迁移能力?以这两条曲线为例,在一定的数据量下,学习效果像红线所示,有迁移学习的话学习效果会更好一些,同时它的增长会更快一些,这就是迁移学习所带来的两个好处。因此我们说,一个领域它的迁移效果好不好,是由多个指标来衡量的。像这两条曲线所示,在数据一定和效果一定的情况下,迁移学习的指标都好。

我们针对这样的情况提出了一个迁移学习的理论算法框架,这个算法框架的目标是模拟人类小样本的快速学习能力。我们可以通过样本与样本的分布来做迁移,同时还可以基于特征来做迁移。即便是两个领域,比如说一个是计算机视觉,一个是自然语言处理,它们只要语义上有沟通的话,还是可以做迁移,这是基于特征的迁移。

我们还可以基于模型来做迁移,比如说我们可以做一个预训练模型,在一个新的领域下,我们可以在某一个预训练的层次上做小的改动,就把这个模型做迁移。甚至我们在任务上也可以做迁移,这样就可以实现零样本或者单一样本的学习能力。

在此基础上,我们还可以把迁移学习在时间维度上加以扩展,使得我们能够形成一个传递式的迁移学习,就好像我们踩着石头过河,一步步地走。我们也可以先把一个领域的模型迁移到第二个领域,再从第二个领域迁移到第三个领域,依此类推。

我们还可以依赖于一个深度学习和一系列的中间领域来做传递式的迁移。传递式迁移有一个很好的例子,这个是斯坦福大学和世界银行一起合作的,利用卫星图像来取得经济状况,尤其是像这种贫困地区的经济状况。通过将ImageNet的数据迁移到夜空图像,再通过夜空图像迁移到白天图像,经过这两步的迁移,我们就能自动得到一个对于卫星图像的二维图的经济状况的估算,这个估算也是非常准的。

迁移学习也可以用在舆情分析上。比如说我们已经获得了一个很好的自然语言分类器,只要给一个书评或者是影评,我们就可以对它的正负取向进行一个估算。那么在已经有了这样的一个模型以后,我们假设给一个新的领域,这个新的领域有一些数据是我们没有见过的,但是通过两个领域之间的相似性、共性,我们还是可以很快地得到一个迁移学习模型,使得在第二个领域能很快地建立起一个舆情模型。

那么具体怎么去实现?最近的一个做法是通过多层的注意力网络机制。这个注意力机制的网络有两个任务,第一个任务是在本领域能够获得越来越高的准确度。第二个是在跨领域的任务当中,希望能够最少地区分两个领域,使得能够混淆两个领域里面所取的特征词,那些特征词往往是既能告诉我们舆情特征的,又能告诉我们与领域无关的这种共性,这种特征词取得的效果也是相当的好。

同时迁移学习也可以用在一个非常有商业价值的领域,就是对话系统。我们知道对话系统需要进行大量的对话的标注。我们如果换一个领域,比如说从一个卖咖啡的领域到一个卖股票的领域,这个里面虽然有很多具体的、商业的领域知识,但是它的逻辑结构还是有共通性。在这种情况下我们可以通过强化学习的迁移机制来区分一个领域里面的策略:它是本领域的特殊策略,还是一个通用的对话策略,把这两种策略区分开,学习通用策略,就能使得我们很快地得到一个基于RNN的迁移学习模型。

还有一个例子挺有意思,是智慧城市,这也是我们和一些公司合作的成果。比如说在一个城市有很多车辆出行,根据车辆的状态我们可以区分这是网约车还是私家车,这样的一个分类器是可以根据两个城市的相似度把它迁移到一个新的领域的。还有城市的PM2.5预测,也可以做这种迁移,所以这是非常通用的一个做法。

总结起来说,迁移学习有千千万万种,但是我们能不能只做一个通用的算法,就可以适用于很多领域?这是我们的一个终极目标。现在这个目标终于有希望了,现在众多的迹象表明,如果我们在源领域有足够多的数据,可以形成一个非常大的预训练模型,那么我们遇到一个新的领域的时候,往往就可以很快地进行成功的迁移。所以迁移学习的成功与否,在于我们能不能把同一类的问题都给挖掘出来,建立一个巨大的预训练模型,往小数据领域、新领域做迁移。

这个例子在最近Facebook的一项工作上得到了印证,他们就是逐字地增加在源领域的数据,增加100倍在ImageNet数据的基础上。这样就能发现,在数据很少的情况下,迁移还是可以得到非常好的效果。与此同时,NLP的领域也得到了类似的印证,还有像BERT这样的领域,这使得机器学习的工作者非常兴奋。

我们知道,Automated learning是用AI来设计AI,用人工智能来自动地设计部分的人工智能步骤。那么我们迁移学习同样可以达到这个效果,我们可以用一个人工智能的模型来设计一个迁移学习模型,这是我们最近的一项工作。这个工作叫“learning to transfer”,也是一个非常有希望,能够自动化迁移学习过程的一个例子。所以这个就是我们在迁移学习方面的努力,从大数据到很多很多的小数据领域。

我最近的一项工作和迁移学习类似,但是还有不一样的地方,它更多的是解决“数据孤岛”的问题。我们知道如果我们有很多的部门,有很多的传感器,但是每个传感器都只能收集一部分的数据。如果我们没有办法把这些传感数据打通,那么每一个地方的数据都不足以来训练一个好的模型。为什么会发生这样的事?因为现在社会对隐私、安全的要求越来越严格,我们看到在国外,在欧洲有这种法律,在国内也有很多非常严格的个人隐私保护法律,而且趋于严格化和全面化。

举个例子,我们如果养一只羊,这只羊就是一个模型,那么如何建立起这个模型?我们过去的方法是把各家的草买过来,喂这只羊。这就相当于我们到各处去买数据、采购数据、收集数据。但是这个方法现在不行了,数据要求不能出本地,也就是说草不能出草场,那么农民的羊是不是就会饿死?不会的,农民会采取另外一种方法,他会让这个羊在各处的草场走动,草不出草场,那么这只羊可以走。就好像数据不动,模型在数据库之间走。

这由此引发了一个新的领域,叫做联邦学习。我们有各个机构,每一个机构都有自己的数据,他们联合起来是一个完整的、很大的数据库,可以用来训练一个大数据模型。但是现在因为隐私、利益的关系,每一个机构都不想或者不能把数据和别人共享。那么,我们可以让他们结成一个联盟,让他们共同遵循一个规则,使得这个模型的参数可以在他们之间沟通,在沟通的时候,这个参数也是加密的,使得一个机构没有办法通过它得到的参数包来反拆对方的数据和模型。最后每一个地方的部分模型都得到了成长,加起来就是一个总的模型。联邦学习是这样的一个概念。

所以联邦学习具有很多优点,比如说数据隐私得到保护,参数也能得到保护,那么建模的效果也会非常得好。我们把联邦学习理论化了一下,建立了一个数学的基础。这个数学基础基于一个假设,假设这个数据拥有的各方,有足够多的特征方面的重叠,那么我们称之为“纵向联邦学习”。如果它们特征是重叠的,但是它们的样本不重叠,这个称为“横向联邦学习”。如果两边都不重叠,我们还可以用迁移学习把它们都给迁移到另外一个状态空间,在那个空间找它们的共性,同时用联邦学习来解决。

所以联邦学习+迁移学习,就形成了一个既能保护隐私,又能共同联合建模的机制,这个机制在工业界获得强烈反响。我们发现这个机制在跨领域不同的企业/机构之间尤其有用。比如说银行和监管(机构)可以联合起来,更好地建立一个反洗钱的模型;互联网(公司)和银行可以建立一个小微企业的风控模型;互联网公司和零售公司可以建立更好的新零售模型等等。这样的建立取决于一个数学基础,一个非常有效、高效可计算的加密机制,其中数学的演化、硬件的演化和分布式安全算法的演化要一起进行。

另外一个非常特别的领域是城市管理。在这里我要举的例子是工地的安全监管,每个工地有很多摄像头去监管工人的安全状况,比如说戴安全帽、火灾的状况。那么如果不同的工地之间的数据能够打通的话,这样的一个模型将是非常有效的,我们恰恰把联邦学习用在这里。

联邦学习加上迁移学习也用在很多的领域。这里我要特别说明的是,建立这一系列联盟离不开一个标准。因为这是多个企业之间在沟通,企业之间一定要遵循同样的标准。所以我们一直在建立一个IEEE的联邦学习国际标准。同时我们通过和经济学教授合作,建立起一个公平的利益分配机制,来帮助大家自愿地在这个联盟里使用联邦学习。另外,我们还发布了世界上第一套联邦学习开源软件。

总结一下就是,迁移学习是模仿人类举一反三的能力,它有一整套的理论和工业应用的算法,已经在各个方面得到了很好的印证。联邦学习是我们正在进行的一项研究工作,它在合作、建模的基础上引入隐私保护的概念,我们也期待它在工业界将会有很大的应用发展。谢谢大家。

未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/488932.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

直接点oracle表编辑器,DbForge Studio for Oracle入门教程:如何在表编辑器中创建表...

dbForge Studio for Oracle是一个功能强大的集成开发环境(IDE),它提供了通用的数据编辑工具来管理数据库内和外部数据,能够帮助Oracle开发者提高PL/SQL的编码速度。【dbForge Studio for Oracle 最新试用版下载】在本文示例中,我们将创建一个…

设置窗口置顶_这三个应用,每一个都能让你置顶。

| 当你有多个窗口同时打开,置顶其中某个或某些,能够方便你对比、学习、抄写……但不是所有软件都有这个功能,所以你需要今天的小干货。|-----------你的高效生活视频书。将窗口置顶,可以方便我们对比、写作、修改文案或代码&#…

汽车传感器科普

来源:湖杉资本先进驾驶辅助系统(Advanced Driver Assistant System),简称ADAS,是利用安装于车上的各式各样的传感器, 在第一时间收集车内外的环境数据, 进行静、动态物体的辨识、侦测与追踪等技…

人工智能的现状与未来

来源: CIO之家几十年来计算速度飞速提高,从最初的科学数学计算演变到了现代的各种计算机应用领域,诸如多媒体应用,计算机辅助设计,数据库,数据通信,自动控制等等,人工智能是计算机科…

php分页技术的作用,分页原理技术细节剖析(php+mysql)实例

提到分页,大家都不陌生,在我们日常浏览网页时常遇到,尤其新闻文章列表等都有分页,如下图所示:分页实例下面,通过一个实例为大家剖析一下分页原理上技术细节。一、功能开发思路在分页功能的实现前&#xff0…

2020年物联网发展现状与趋势预测

来源:北京物联网智能技术应用协会一、综述物联网源于互联网领域,是信息科学技术产业的第三次革命。物联网是基于互联网,让所有物体能够独立寻址的普通物理对象实现互联互通的网络。简单说,就是通过安装信息传感设备,如…

shell中执行某条语句失败能不能重复执行_如何理解Mysql中的事务隔离级别?

要说清楚Mysql中的事务隔离级别,我们先从事务的定义说起。事务,是一个或一组sql语句组成的一个执行单元,这个执行单元要么全部执行,要么全部不执行。整个单独单元作为一个不可分割的整体,如果单元中某条sql语句一旦执行…

oracle 试图访问已经在使用的事物处理临时表,解决ORA-14450:试图访问已经在使用的事务处理临时表...

在开发使用过程中,一个存储过程用到表TMP_DA_GMS,允许程序的时候报错,后台查询到错误原因是因为表里有个字段需要设置为可以为N在开发使用过程中,一个存储过程用到表TMP_DA_GMS,允许程序的时候报错,后台查询到错误原因是因为表里有…

《数字孪生体技术白皮书(2019)》(简版)全文

来源:《数字孪生体实验室原创》12月27日,数字孪生体实验室与安世亚太联合正式发布了《数字孪生体技术白皮书(2019)》。白皮书的第一部分关注对数字孪生体的抽象和总结。无论是参考架构、成熟度模型还是关键技术,都以“…

sql 删除字段中下划线_SQL基础教程知识点总结

1. ●列 ●字段 ●行 ●记录 2. SQL 语句及其种类 DDL DDL(Data Definition Language,数据定义语言)用来创建或者删除存储 数据用的数据库以及数据库中的表等对象。DDL 包含以下几种指令。 CREATE:创建数据库和表等对象 DROP: 删除数据库和表等对象 ALTER: 修改数据…

王恩东院士:AI计算是未来的核心生产力

来源:蓝海长青智库12月27日,以“超算无界、智创未来”为主题的2019国际超级计算产业博览会在济南召开。中国工程院院士、浪潮集团首席科学家王恩东在大会发表《智慧计算 未来动力》主题演讲。王恩东指出,人工智能正在驱动前所未有的社会变革&…

​采访了14位技术公司的创始人,他们如何看待2020年的AI行业?

来源:KDnuggets编译:木槿、张大笔茹、楚阳科幻元年2020年马上就要来了。对于技术行业来说,这一年会有哪些值得期待的变化?KDnuggets采访了14位科技前沿的技术公司创始人,并汇总了他们眼中的2020年:关于人工…

前端编程基础

网页前端编程基础 HTML 是用来描述网页的一种语言。HTML 指的是超文本标记语言 (Hyper Text Markup Language)HTML 不是一种编程语言&#xff0c;而是一种标记语言 (markup language)标记语言是一套标记标签 (markup tag)HTML 使用标记标签来描述网页<html> <body>…

spark sql合并小文件_Spark SQL小文件问题在OPPO的解决方案

Spark SQL小文件是指文件大小显著小于hdfs block块大小的的文件。过于繁多的小文件会给HDFS带来很严重的性能瓶颈&#xff0c;对任务的稳定和集群的维护会带来极大的挑战。一般来说&#xff0c;通过Hive调度的MR任务都可以简单设置如下几个小文件合并的参数来解决任务产生的小文…

白春礼:探究物质世界奥秘的一把金钥匙——纪念元素周期表发表150周年

来源&#xff1a;中国科学报联合国大会宣布2019年为国际化学元素周期表年&#xff0c;旨在纪念俄罗斯化学家门捷列夫在150年前发表元素周期表这一科学发展史上的重大成就。世界万物是由什么最基本的物质构成的&#xff1f;这些最基本的物质又是怎样变成万物世界的&#xff1f;这…

莫名的证书错误...ERROR ITMS-90035:Invalid Signature.

请删除 .DS_Store 这种类似的文件再尝试转载于:https://www.cnblogs.com/decode1234/p/6529601.html

linux里工作目录的字体变蓝,netterm访问Linux时字体和背景颜色随目录发生改变的问题解决...

方法很多&#xff0c;除了改用其他仿真终端程序外&#xff0c;继续使用netterm可用下面方法解决。方法1&#xff1a;修改netterm参数&#xff0c;最简单选项-->屏幕颜色-->允许图形编译码 重置颜色至默认值点选上&#xff0c;见下图&#xff1a;这种方法的最大特点是目录…

因果关系:真的存在吗?

来源&#xff1a;白驹静夜思学图灵奖获得者、贝叶斯网络之父 Judea Pearl 和他的同事在 2018 年完成了的著作《The Book of Why: The New Science of Cause and Effect》&#xff08;中文名《为什么》&#xff09;中认为&#xff1a;机器学习不过是在拟合数据和概率分布曲线。变…

ThinkPhp知识大全(非常详细)

php框架 发瑞 一、真实项目开发步骤&#xff1a; 多人同时开发项目&#xff0c;协作开发项目、分工合理、效率有提高&#xff08;代码风格不一样、分工不好&#xff09;测试阶段上线运行对项目进行维护、修改、升级&#xff08;单个人维护项目&#xff0c;十分困难&#xff…

盘点2019年336起机器人及相关领域投融资事件!注重细分领域深耕行业复苏趋势显现...

来源&#xff1a;机器人大讲堂2019年的投资就像是随着季节气候变化的&#xff0c;现在到了冬季&#xff0c;或许有些人等不到明年春天的回暖&#xff0c;但终究春天还是会来。机器人是继互联网热潮逐渐褪去后&#xff0c;投资人寻找到的新投资项目&#xff0c;科创板使得机器人…