大数据时代下的迁移学习_继深度学习后,下一个热点技术是迁移学习

最早提出大数据时代到来的是知名咨询公司麦肯锡,麦肯锡称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”

其实大数据无论在哪一领域都存在已有时日,却在近年来的互联网和信息产业的发展之下得以聚合、得以提炼分析。

要做到人工智能,背后需要有丰富的大数据做支撑。亿欧8月12日在CCF GAIR全球人工智能与机器人峰会上听取了香港科技大学教授、人工智能和数据挖掘专家杨强的主题分享,有关“人工智能成功的几个条件”,其中分享了几个很有意思的观点,亿欧对其进行整理补充,分享如下。

AI成功的5大必要条件

1、清晰的目标,商业模式,离不开领域对目标很好的理解;

2、需要高质量的大数据,这个数据要持续反馈,这使得学习不断提高,推的数据质量高,要与算法不断匹配,样本要针对算法手机,要持续得到,数据的标记是非常昂贵;

3、清晰的问题定义和领域边界;

4、懂人工智能的跨界人才,懂智能懂商业,身边善于学习的人,可以将两个不同的垂直领域链接到一起,擅长应用和算法;

5、计算能力。

把人工智能往前推一步,继深度学习之后哪些技术会是下一个热点?

互联网泡沫、大数据的驱动下,机器学习以及人工智能领域在后台的支撑力度越来越大。深度学习之后会有哪些技术是下一个热点?杨强提出了三明治结构学习法,分别为递归深度神经网络RNN、强化学习RL、以及迁移学习TL。

递归深度神经网络RNN最早是在1992年由施米德林(DeepMind联合创始人、深度学习四大巨头之一)和他的学生团队提出的,非监督学习时间递归神经网络,为语音识别和自然语言翻译提供了重要的模型。

强化学习(ReinforcementLearing),就是智能系统从环境到行为映射的学习,以使奖励信号(强化信号)函数值最大,强化学习不同于连接主义学习中的监督学习,主要表现在教师信号上,强化学习中由环境提供的强化信号是对产生动作的好坏作一种评价(通常为标量信号),而不是告诉强化学习系统RLS(reinforcement learning system)如何去产生正确的动作。由于外部环境提供的信息很少,RLS必须靠自身的经历进行学习。通过这种方式,RLS在行动-评价的环境中获得知识,改进行动方案以适应环境。什么是迁移学习?即在源领域已经拥有大量数据,并且在源领域能对数据进行很好的应用建立了模型后,我们换一个领域也能让它使用,这样既节省了资源,又达到时间和效果的好处,就叫做迁移学习。这就很像人的举一反三的学习能力,比如我们学会骑自行车以后,我们又去学摩托车,发现很简单,我们打球、学语言、学物理化学也有很多这样的例子。

实现迁移学习的方法有四种:1)样本迁移;2)特征迁移;3)基于模型的迁移学习;4)通过关系进行迁移,比如社交网络。

第一种就是我们在数据集里面找到跟目标领域相似的数据,把这个数据放大多倍,这个叫做样本迁移,通过样本来达到迁移的目的。其次我们可以观察到有些相似的特征,然后利用这些特征,在不同的层次的特征,来进行自动的迁移,这种叫做特征迁移。然后我们还可以做到基于模型的迁移,这是这样的一个工作。利用上千万的图象来训练一个图象识别的系统,我们遇到一个新的图象领域,我们就不用再去找几千万个图象来训练了,我们就把原来的那个迁移到新的领域,所以在新的领域只用几万张图片就够,同样可以得到很高的效果,这叫做模型迁移,模型迁移的一个好处是我们可以区分,就是可以和深度学习结合起来,我们可以区分不同层次可迁移的度,相似度比较高的那些层次他们被迁移的可能性就大一些。最后我们也可以通过关系来进行迁移,比方说社会网络,社交网络之间的迁移。

一个不争的事实,大数据只有富人才能得到

深度学习是离不开大数据的,大数据又离不开大公司,我们所熟知的大公司都是大数据的拥有者,而中小型的公司是没有大数据的,也没有获取大数据的能力。

要做到深度学习,离不开对特征的选取,特征的选取又离不开大数据,而这些大数据只有富人才能得到。

数据在哪里?领域到底有没有大数据?钱在哪里?

“数据在的地方,我们要看有没有钱来驱动我们去做人工智能的研究工作。哪些领域的钱已经准备好了?这里我要提出一个概念叫封闭系统,刚才我讲边界清晰问题定义非常清晰就是指的这样一个封闭系统,就是说整个的商业流程都有数据的脚印,全部的留下来,我们看一下,我们今天在教育领域到底有没有这样的数据,我们在出行的领域有没有这样的数据,我们在金融、医疗的领域,所以在这些领域里面我觉得比较看好的一个是金融的领域,因为在金融里面每一步都太关键太重要了,所以在很早以前就有很多人把所有的整个的商业流程全部的记录在案,用数字化的方法,只不过存在那里没有在用。虽然有很多不同的政治、经济角度在来影响它,但是大家不要忘记人工智能的商业成功只要系统比人好一点点就可以了,就像在奥运会里面我们得到的金牌比银牌好一点点就可以了,所以在信息的处理和未来的预测方面,如果在一个封闭系统里面,在有大数据的前提,又有资金推动的影响下,我觉得这个领域差不多就会成功了。”

人工智能不能关在象牙塔里面

早在2013年香港科技大学和张小龙的微信一起成立了一个联合实验室。“微信为我们提供非常好的平台,我们做人工智能不能关在屋子里,不能拿一个象牙塔的姿态来做,一定要放开胸怀,让我们做的东西能够铺会越多的人去用,去让他们能够受益越好。”杨强说到,“微信提供了平台,特别难的学术问题我们会自己留下来,我们会给微信提供资源,我们有十几个教授,我们实验室从机器人到自然语言处理、语音识别、图像处理、图像识别、包括对话系统等等。在这样互相受益的情况下做这样一个实验室我们才觉得是一个双赢,是一个有很好的情景。”

看好的下一个商业方向

人工智能到现在为止最成功的一个领域就是机器学习。

机器学习的基本概念就是从数据里面经常重复的现象学出规律来,人工智能在商业上面应用的一个很强烈的特征,就是,我们要去观察我们商业活动当中哪一些数据能够让我们替代掉人类简单、重复、繁琐的这类工作。然后那些奇思妙想、创新的东西就交给人类, 人类能给人工智能当老师。

在杨强看来,下一个最看好的商业方向,便是将人和机器进行有机结合的领域。

本文作者吴妙芸,亿欧专栏作者。本文转载自 亿欧网

天云大数据

天云大数据是专注于大数据分布式计算平台软件、AI算法的国家高新科技企业。孵化并成长于北京云基地的天云大数据是北京祥云工程代表企业,作为秘书长或理事成员参与了中国云产业联盟,中关村大数据产业联盟,国家统计局大数据战略合作企业,中关村-滨海大数据产业技术创新战略联盟,上海大数据产业技术创新战略联盟的筹建。被硅谷GigaOM大数据先锋评论冠以改变中国云计算最有影响力的企业;帮助某全国性股份制商业银行获得了国际化组织IDC的“2014年度中国金融行业最佳创新项目”大奖;2016年荣选由毕马威评选的中国领先金融科技公司50强企业。

更多精彩内容请关注微信公众号:BeagleData_

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/260034.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

手机广告投放(phone advertising)唯一标识

手机标示,为了识别用户,方面advertising。 使用设备id,相当于暴露用户隐私。慢慢已不允许使用。、 (长时间跟踪用户无异于暴露用户隐私,虽然大量数据适合兴趣建模,广告个性化推荐。但复杂多样会降低总体的准…

android分辨率比例成像,像素不是唯一 决定成像效果你必知的真相

像素并不是唯一如今不少人在选购一部手机时,非常重视手机摄像头的像素大小,因为一部高像素的手机可以为不少喜爱拍照的人省去买单反的费用,而且携带起来也非常方便。不过,手机并不能与专业的单反相机相比,成像效果并不…

vim——打开多个文件、同时显示多个文件、在文件之间切换

打开多个文件: 1.vim还没有启动的时候: 在终端里输入 vim file1 file2 ... filen便可以打开所有想要打开的文件 2.vim已经启动 输入 :open file 可以再打开一个文件,并且此时vim里会显示出file文件的内容。 同时显示多个文件: :s…

Android底部导航栏实现(一)之BottomNavigationBar

BottomNavigationBar这个控件的使用之前已经写过,这里不再赘述,详情请参考BottomNavigationBar的使用。 下面直接上代码: 初始化及相关设置: mBottomNavigationBar (BottomNavigationBar) view.findViewById(R.id.bottom_navigat…

jq 组装数组_Jquery 数组操作

1、数组的创建var arrayObj new Array(); //创建一个数组var arrayObj new Array([size]); //创建一个数组并指定长度,注意不是上限,是长度var arrayObj new Array([element0[, element1[, ...[, elementN]]]]); 创建一个数组并赋值要说明的是&…

android 官方说明文档,Android官方文档翻译-Accessibility

标签元素向用户提供解释每个可互动元素的意义和目的有用且形象的标签是非常重要的。这些标签允许屏幕阅读者(比如 TalkBack )正确向用户解释每个控制器的功能。你可以使用一下两个方法提供元素的标签:当展示在 Activity 的整个生命周期中都不会改变样式的静态元素时…

USACO 2.4.1 The Tamworth Two

牛和农夫按照固定的走法在10x10的地图中走,每分钟走一步,求经过几分钟相遇。永远不能相遇输出0. 纯模拟的题。 判断永远不能相遇的方法是如果遇到了一个先前的状态,那么肯定存在循环,必定不能相遇。 程序中把状态表示为牛和农夫的…

013,spring boot下JedisCluster客户端的配置,连接Redis集群

2019独角兽企业重金招聘Python工程师标准>>> 1&#xff0c;pom依赖添加&#xff1a; <dependency> <groupId>redis.clients</groupId> <artifactId>jedis</artifactId> <type>jar</typ…

android控件使用大全,Android常见控件使用详解

本文实例为大家分享了六种Android常见控件的使用方法&#xff0c;供大家参考&#xff0c;具体内容如下1、TextView 主要用于界面上显示一段文本信息2、Button 用于和用户交互的一个按钮控件//为Button点击事件注册一个监听器public class Click extends Activity{private Butto…

Ubuntu 12.10使用apt安装Oracle/Sun JDK

Ubuntu 12.10使用apt安装Oracle/Sun JDK apt-get install python-software-properties sudo add-apt-repository ppa:webupd8team/java sudo apt-get update sudo apt-get install oracle-java6-installerposted on 2014-09-05 13:30 fastdream 阅读(...) 评论(...) 编辑 收藏 …

Afterthought 原来是这样的啊。。。。

$(ProjectDir)Libs\Afterthought\Afterthought.Amender.exe "$(TargetPath)" "$(TargetDir)EntityFramework.Patterns.dll" 我实际上分析代码好久&#xff0c;也没整明白它是怎么运行的&#xff0c;看一下官方文档明白了&#xff0c;原来。。。 Next, add …

查询

增加文本1. create database test删除文本2. drop database test3. create table info( code int primary key, name varchar(20) not null)auto_increment 自增长列foreign key(列名) references 主表名(列名) 外键关系4. drop table infoCRUD:增加语法1.insert into 表…

android 监听界面变化,Android之页面有变化用onWindowFocusChanged来监听权限是否开启...

1 问题我们需要在Activity里面监听网络变化、热点是否开启和关闭、GPS服务是否开启、位置权限是否开启等一些列行为。2 思路方法一&#xff1a;如果是需要启动activity进行权限申请&#xff0c;我们可以用如下组合模式var intent Intent(Settings.ACTION_LOCATION_SOURCE_SETT…

逐步优化求解最大子序列和

求解最大子序列和 tag&#xff1a; 数据结构与算法 最大子序列和问题&#xff1a; 给定序列A1, A2&#xff0c;... AN&#xff0c; 求最大的子序列和。 例如 &#xff1a;   对于序列4, -3, 5, -2, -1, 2, 6, -2&#xff0c; 最大序列和为11&#xff08;4 -3 5 - 2 - 1 2 …

POJ 1228 —— “稳定”凸包

POJ 1228 Grandpas Estate 这是个好题目&#xff0c;同时也是个不和谐的题目&#xff08;不和谐原因是题目出的存在漏洞&#xff0c;数据弱&#xff0c;而且有些条件没给清楚&#xff0c;为了一个SB错误无限WA之后&#xff0c;终于AC&#xff09; 题意就废了我好长时间&#xf…

pythonflaskmock数据_Flask实现简单Mock Server

Mock Server充当的角色&#xff1a;Mock server在实际项目中的意义就相当于数据库。将我想要的数据返回给我就行&#xff0c;我并不关心你怎么逻辑处理的。一般的应用程序请求方式是GET和POST。Flask自带的request使用:request.url获取当前的请求url全路径地址&#xff0c;requ…

在Application_Error事件中获取当前的Action和Control

ASP.NET MVC程序处理异常时&#xff0c;方法有很多&#xff0c;网上也有列举了6种&#xff0c;下面是使用全局处理在Global.asax文件的Application_Error事件中实现。既然是ASP.NET MVC,我需要捕捉到Controller和Action名称。怎样实现可以参考下面代码&#xff1a; 程序运行结果…

android 真机 sqlite3,在android真机上使用sqlite3

#zijun#2013.10.29#QQ:223663737在android真机上使用sqlite3前期准备:1:保证手机已经ROOT操作步骤:1 : 打开CMD2 : 进入android linuxadb shell3 :切换到root权限su - root4 : 修改system目录为可读写权限mount -oremount,rw -t yaffs2 /dev/block/mtdblock3 /system5 :拷贝文件…

【ORACLE技术嘉年华PPT】MySQL压力测试经验

这是2013.11.18在第三届ORACLE技术嘉年华上的主题演讲PPT。点击这里&#xff1a;本地下载PPT。--------------------------------------分割线--------------------------------------知数堂 &#xff08;http://zhishuedu.com&#xff09;培训是由资深MySQL专家叶金荣、吴炳锡…

EditText 空指针问题

今天在Android中碰到了这样一个问题&#xff0c;其实应该很少人会碰到&#xff0c;因为只有像我这种奇葩才会犯这种错误。 但既然解决了&#xff0c;我就想在这里跟大家分享一下&#xff0c;毕竟它困扰了我一个白天啊。。。不多说了&#xff0c;看下面。。。 其实问题很简单&am…