该如何对「半监督学习算法」实际性应用进行评估?Google给出了新答案

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

原文来源:arXiv  

作者:Avital Oliver、Augustus Odena、Colin Raffel、Ekin D. Cubuk、Ian J. Goodfellow

「雷克世界」编译:KABUDA、EVA


半监督学习(Semi-supervised learning,SSL)提供了一个强大的框架,可以在标记有限或昂贵的情况下利用无标记数据。近期,基于深度神经网络的SSL算法已被证明在标准基准任务上是成功的。然而,我们认为,这些基准无法解决这些算法在实际应用程序中遇到的许多问题。在对各种广泛使用的SSL技术进行了统一重新实现(unified reimplemention)之后,我们在一组旨在解决这些问题的实验中对它们进行了测试。我们发现:不使用无标记数据的简单基线的性能经常被低估;SSL方法对标记数据和无标记数据数量的敏感性不同;当无标记数据集包含类外的样本时,其性能会大幅降低。为了帮助指导SSL研究在现实世界的实际应用,我们开源了我们的统一重新实现和评估平台。


深度神经网络已经一再被表明,可以通过利用大量标记数据,在某些监督学习问题上达到人类水平或超越人类水平的性能。然而,这些成功有着不同的代价;也就是说,创建这些大型数据集通常需要大量的人力(以手工对样本增添标记)、痛苦或风险(对于涉及侵入性测试的医疗数据集)或财务费用(用于雇佣标记标注者或构建在特定领域收集数据所需的基础设施)。对于许多实际问题和应用程序来说,没有足够的资源来创建足够大的标记数据集,这限制了深度学习技术的广泛采用。


有一个具有吸引力的方法可以缓解这个问题,就是半监督学习(semi-supervised learning,SSL)框架。与需要所有样本都有标记的监督学习(supervised learning)算法相反,SSL算法可以通过使用无标记样本来提高其性能。SSL算法通常提供一种从无标记样本中学习数据结构的方法,这可以减轻对标记的需求。最近的一些研究结果表明,在某些情况下,SSL能够接近纯粹监督学习的性能,即使在给定的数据集中有很大一部分的标记被丢弃。


640?wx_fmt=png

每种SSL技术在CIFAR-10(六类动物)上的测试误差,其中,在标记数据与无标记数据之间,存在不同程度的重叠。例如,“25%”是指来自不同类的4种无标记数据之一,而非来自标记数据的6类。“监督”是指不使用无标记数据。阴影区域表示5次试验的标准偏差。


这些最近的成功引出了一个自然的问题:SSL方法是否适用于“现实世界”的环境?在本文中,我们认为,当前评估SSL技术的实际方法并不能以令人满意的方式解决这个问题。具体而言,采用大型标记数据集并丢弃许多标记的标准评估程序没有考虑到SSL应用程序的各种常见特征。我们的目标是通过提出一种新的实验方法来更直接地解决这个问题,我们认为该方法能够更好地测量对现实世界问题的适应性。我们的一些发现包括:


•当给予调优超参数(hyperparameter)相同预算时,使用SSL和使用标记数据之间的性能差距比通常记录的差距要小。


•此外,使用无标记数据的大型、高度正则化的分类器的强大性能证明了在同一个基础模型上评估不同SSL算法的重要性。


•在不同的标记数据集上对分类器进行预先训练,然后仅在利益相关数据集中的标记数据上进行再训练,这可以胜过所有我们研究过的SSL算法。


•当无标记数据包含与标记数据不同的类分布时,SSL技术的性能可能会急剧下降。


•不同的方法对标记数据和无标记数据数量的敏感度有很大不同。


•实际的小型验证集(validation set)会妨碍对不同方法、模型和超参数设置进行可靠的比较。


640?wx_fmt=png

在SVHN和CIFAR-10中,每种SSL技术的测试误差都随标记数据量的变化而变化。阴影区域表示5次实验的标准偏差。X轴采用对数形式表示


此外,与机器学习中的许多领域一样,对超参数、模型结构及训练的微小调整,都会对方法的直接比较构成混淆,并对结果产生重大影响。为了改善这一问题,我们提出了关于各种SSL方法的统一的、模块化的重新实现,这些方法也使得我们的评估技术成为现实。


结论与建议


我们的实验提供了有力的证据,证明SSL的标准评估实践是不现实的。为了更好地反应在现实世界中的应用,我们应该对评估进行哪些改进呢?我们对SSL算法的评估有以下建议:


•在比较不同的SSL方法时,使用完全相同的基础模型。因为模型结构或实现细节的差异会对结果产生很大影响。


•报告需认真评估对完全监督精确度和迁移学习性能的要求,以将其作为基准。SSL的目标应该定为,显著优于完全监督环境下的综合表现。


•对类分布失协情况的系统性变化的结果进行报告。 我们表明,当采用是不同类的无标记数据,而非标记数据时,我们对SSL技术的研究受到了影响。据我们了解,这一现实问题被严重忽略了。


•在评估性能时,应调整标记数据和无标记数据的数量。理想的SSL算法即使在标记数据很少的情况下也是非常有效的,并且它还可以从额外的无标记数据中受益。具体而言,我们建议将SVHN和SVHN-extract相结合,来测试大型无标记数据机制的性能。


•注意,不要在非真实的大型验证集上过度调节超参数。如果验证集非常小,那么为了获得理想的性能而在每个模型或每个任务基础上,对超参数进行重大调整的SSL方法将不可用。


我们的研究还表明,面对以下情况时,SSL或许是研究人员最正确的选择:


•当没有来自类似域的高质量标记数据集用于微调时。


•当标记数据是通过独立同分布(i.i.d)采样,从无标记数据集中采集得到,而不是从不同分布中收集得来时。


•当标记的数据集足够大,能够准确计算验证精确度时(这是进行模型选择和超参数调优所必须的条件)。


近来,SSL收获了巨大的成功。我们希望我们的研究成果,以及公开可用的统一实现,能够让成功之花在现实世界中遍地绽放。


未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。


未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

640?wx_fmt=jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/495806.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Python PyQt5 教程

PyQt5教程 :http://code.py40.com/face 教程翻译自:http://zetcode.com/gui/pyqt5/ PyQt5 的 核心API 以及 扩展应用(CSDN 学院收费视频):https://edu.csdn.net/course/play/9870/222942 pyqt5 - 对文本样式进行操作&…

Silverlight中全屏处理

Silverlight插件支持全屏模式,这个没什么好说的,只需要用设置IsFullScreen属性即可,问题在于全屏模式中,尽管屏幕变大了,但是页面中的控件并未相应的变大,下面是我在网上找到的解决这个问题的两种方式。 第…

人工智能的过去、现在和未来

来源: 人工智能和大数据 作者: 腾讯 AI Lab 主任 张潼在回答人工智能达到了什么程度这个问题之前,需先了解人工智能的概念是什么?人工智能(Artificial Intelligence,AI)是指计算机像人一样拥有智…

Dom4j完整教程~DOM4J简介

DOM4J是 dom4j.org 出品的一个开源 XML 解析包。DOM4J应用于 Java 平台,采用了 Java 集合框架并完全支持 DOM,SAX 和 JAXP。 DOM4J 使用起来非常简单。只要你了解基本的 XML-DOM 模型,就能使用。 Dom:把整个文档作为一个对象。 DO…

除了芯片 我们还应关注哪些核心技术

来源:传感器技术(公众号)最近的“中兴封杀”事件,让国人深深领略了缺少核心技术给企业乃至行业和国家带来的巨痛。除了我们知道的芯片技术之外,还有哪些核心技术需要我们重点关注呢?超级计算终端 超级计算终…

Python PyInstaller 安装 和 使用教程( 打包生成 exe )

From:http://c.biancheng.net/view/2690.html Python zipapp打包教程:http://c.biancheng.net/view/2687.html 在创建了独立应用(自包含该应用的依赖包)之后,还可以使用 PyInstaller 将 Python 程序生成可直接运行的程…

Yann LeCun:距离“真正的” AI,我们还缺什么?

来源: AI科技大本营(ID;rgznai100)GMIC Beijing 2018 大会第一天,首个演讲者是 Facebook 首席 AI 科学家 Yann LeCun。他讲述了关于深度学习的最新研究成果,同时也描述了深度学习的未来,以及机…

Python 使用 smtp ssl 模式 发送邮件与附件

参考 : 发送邮件简单入门 ( 以qq邮箱,163邮箱为例 ) :https://blog.csdn.net/qq_38661599/article/details/81013834 smtp ssl 模式 发送邮件 与 附件:https://www.cnblogs.com/SunshineKimi/p/10629342.html Python…

Unity.Interception System (2.0)

转载于:https://www.cnblogs.com/artech/archive/2010/08/27/1810010.html

卷积神经网络为什么能称霸计算机视觉领域?

来源:图灵人工智能摘要:在机器视觉和其他很多问题上,卷积神经网络取得了当前最好的效果,它的成功促使我们思考一个问题,卷积神经网络为什么会这么有效?在本文中,将为大家分析卷积神经网络背后的…

Python3.2+ 的 concurrent.futures 模块

concurrent.futures 官方文档:https://docs.python.org/3/library/concurrent.futures.html concurrent.futures: 线程池, 并发的处理任务:https://www.h3399.cn/201906/703751.html IO 密集型 vs 计算密集型: IO密集型:读取文件…

C# 判断一字符串是否为合法数字(正则表达式)

代码 ///<summary>///判断一个字符串是否为合法整数(不限制长度) ///</summary>///<param name"s">字符串</param>///<returns></returns>publicstaticboolIsInteger(strings) { stringpattern "…

关于现在人工智能预测的一些冷水

来源&#xff1a;人工智能和大数据 作者&#xff1a;田渊栋最近有关人工智能和深度学习的各种预测满天飞&#xff0c;作为圈内人&#xff0c;我来泼点冷水。我们常说科技树科技树&#xff0c;这个比喻是非常贴切的&#xff0c;现代科技的基础理论并不复杂&#xff0c;做个摘要…

Windows10 下搭建汇编语言开发环境( 利用 DOSBOX 和 MASM32 )

Windows10下搭建汇编语言开发环境&#xff08;利用DOSBOX和MASM32&#xff09;&#xff1a;https://www.cnblogs.com/zyever/p/7919007.html 如何在win10 64位下搭载汇编环境&#xff08;包含汇编dosbox和masm文件&#xff09;&#xff1a;https://blog.csdn.net/xyisv/articl…

一文解读“边缘计算” 和物联网的亲密关系!

来源&#xff1a;IT技术之家摘要&#xff1a;物联网的最终目标是万物互联&#xff0c;而边缘计算是解决当前云计算所面对的数据传输问题所应用的主要方式&#xff0c;相对于云计算&#xff0c;有更大的优势。物联网的最终目标是万物互联&#xff0c;而当前对于宽带水平来说&…

寄存器 和 存储器

From&#xff1a;https://blog.csdn.net/menshu1892/article/details/79912090 一、计算机硬件 先说内核&#xff1a;内核是操作系统最基本的部分。它是为众多应用程序提供对计算机硬件的安全访问的一部分软件&#xff0c;这种访问是有限的&#xff0c;并且内核决定一个程序在什…

博文视点大讲堂36期——让Oracle跑得更快 成功举办

博文视点大讲堂36期——让Oracle跑得更快 成功举办 电子工业出版社博文视点公司于2010年9月日在西单图书大厦成功举办“博文视点大讲堂36期——让Oracle跑得更快”讲座。8月22日&#xff0c;博文视点大讲堂为配合《让Oracle跑得更快—Oracle 10g性能分析与优化思路》的全国热销…

NLP 解决方案是如何被深度学习改写的?

作者&#xff1a;杨晓凡摘要&#xff1a;英特尔人工智能产品事业部&#xff0c;数据科学主任 Yinyin Liu 近日撰写了一篇文章&#xff0c;介绍了深度学习为自然语言处理带来的种种变化。有趣的大趋势是首先产生在 CV 领域的技术也不断用于 NLP&#xff0c;而深度学习解决方案的…

CompletableFuture详解~思维导图

#原图 System.out.println("https://www.processon.com/view/621a1b361e08533fc3afaa44?fromnew1");

如何在SharePoint 2010项目中引用UserProfiles.dll

如果需要进行SharePoint的UserProfile开发的话&#xff0c;我们需要引用以下程序集&#xff1a; C:\Program Files\Common Files\Microsoft Shared\Web Server Extensions\14\ISAPI\Microsoft.Office.Server.UserProfiles.dll在添加引用的时候&#xff0c;Visual Studio 2010会…