什么是小样本学习？这篇综述文章用166篇参考文献告诉你答案

news/2025/4/26 19:54:57/文章来源:https://blog.csdn.net/xixiaoyaoww/article/details/106110801

一只小狐狸带你解锁炼丹术&NLP 秘籍

来源：机器之心

什么是小样本学习？它与弱监督学习等问题有何差异？其核心问题是什么？来自港科大和第四范式的这篇综述论文提供了解答。

数据是机器学习领域的重要资源，在数据缺少的情况下如何训练模型呢？小样本学习是其中一个解决方案。来自香港科技大学和第四范式的研究人员综述了该领域的研究发展，并提出了未来的研究方向。

这篇综述论文已被 ACM Computing Surveys 接收，作者还建立了 GitHub repo，用于更新该领域的发展。

论文地址：https://arxiv.org/pdf/1904.05046.pdf
GitHub 地址：https://github.com/tata1661/FewShotPapers

机器学习在数据密集型应用中取得了很大成功，但在面临小数据集的情况下往往捉襟见肘。近期出现的小样本学习（Few-Shot Learning，FSL）方法旨在解决该问题。FSL 利用先验知识，能够快速泛化至仅包含少量具备监督信息的样本的新任务中。

这篇论文对 FSL 方法进行了综述。首先，该论文给出了 FSL 的正式定义，并厘清了它与相关机器学习问题（弱监督学习、不平衡学习、迁移学习和元学习）的关联和差异。然后指出 FSL 的核心问题，即经验风险最小化方法不可靠。

基于各个方法利用先验知识处理核心问题的方式，该研究将 FSL 方法分为三大类：

数据：利用先验知识增强监督信号；
模型：利用先验知识缩小假设空间的大小；
算法：利用先验知识更改给定假设空间中对最优假设的搜索。

最后，这篇文章提出了 FSL 的未来研究方向：FSL 问题设置、技术、应用和理论。

论文概览

该综述论文所覆盖的主题见下图：

我们选取介绍了该综述论文中的部分内容，详情参见原论文。

什么是小样本学习

FSL 是机器学习的子领域。

我们先来看机器学习的定义：

计算机程序基于与任务 T 相关的经验 E 学习，并得到性能改进（性能度量指标为 P）。

基于此，该研究将 FSL 定义为：

小样本学习是一类机器学习问题，其经验 E 中仅包含有限数量的监督信息。

下图对比了具备充足训练样本和少量训练样本的学习算法：

FSL方法分类

根据先验知识的利用方式，FSL方法可分为三类：

FSL 方法解决少样本问题的不同角度。

基于此，该研究将现有的 FSL 方法纳入此框架，得到如下分类体系：

数据

此类 FSL 方法利用先验知识增强数据 D_train，从而扩充监督信息，利用充足数据来实现可靠的经验风险最小化。

如上图所示，根据增强数据的来源，这类 FSL 方法可分为以下三个类别：

模型

基于所用先验知识的类型，这类方法可分为如下四个类别：

算法

根据先验知识对搜索策略的影响，此类方法可分为三个类别：

文章最后从问题设置、技术、应用和理论四个层面探讨了小样本学习领域的未来发展方向。

可

能

喜

欢

在深度学习顶会ICLR 2020上，Transformer模型有什么新进展？
算法工程师的效率神器——vim篇
推荐系统的价值观
硬核推导Google AdaFactor：一个省显存的宝藏优化器
卖萌屋上线Arxiv论文速刷神器，直达学术最前沿！

夕小瑶的卖萌屋

关注&星标小夕，带你解锁AI秘籍

订阅号主页下方「撩一下」有惊喜哦

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/480547.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

CCKS 2018 | 前沿技术讲习班

CCKS 2018 | 前沿技术讲习班

时间：8月14日-15日地点：南开大学泰达学院大报告厅日程安排时间主题特邀讲者8月14日上午（8:30 – 10:00）Deep Knowledge Graph Reasoning（10:30-12:00）Exploiting and Reasoning With Open Knowledge GraphW…

阅读更多...

Java必考题目之JVM面试题目和答案

Java必考题目之JVM面试题目和答案

JVM内存模型首先我们来了解一下JVM的内存模型的怎么样的： 1.堆：存放对象实例，几乎所有的对象实例都在这里分配内存堆得内存由-Xms指定，默认是物理内存的1/64；最大的内存由-Xmx指定，默认是物理内存的1/4…

阅读更多...

语言资源的类别、搜索与搭建策略

语言资源的类别、搜索与搭建策略

语言资源的类别、搜索与搭建策略一、引言语言资源，本身是一个宽泛的概念，即语言资源，语言指的是资源的限定域，资源资源，是资料的来源或者汇总，加在一起，也就形成了这样一种界定：任…

阅读更多...

听说读论文也有trick？这篇文章告诉你深度学习论文阅读最佳姿势

听说读论文也有trick？这篇文章告诉你深度学习论文阅读最佳姿势

2020年的今天，我们的专业是deep learning，但是我们要keep learning，每天早上一睁眼，arxiv每天更新上百篇的论文，著名微博博主爱可可-爱生活保持也在推送最新的deep learning资讯和论文。我们不缺少计算机视觉论文&…

阅读更多...

屏幕Screen类文件编写

屏幕Screen类文件编写

注意： inline 定义的函数必须放在 .h 文件中，否则编译器报错！ 其次，注意写全称在 .h 里，如 std:: screen.h 头文件 #ifndef SCREEN_H #define SCREEN_H #include<string> #include<iostream>class Scre…

阅读更多...

机器翻译自动评估-BLEU算法详解

机器翻译自动评估-BLEU算法详解

机器翻译自动评估-BLEU算法详解版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/qq_31584157/article/details/77709454 </div><link rel"stylesheet" href"https://csdnimg.cn/re…

阅读更多...

论文浅尝 | 利用Lattice LSTM的最优中文命名实体识别方法

论文浅尝 | 利用Lattice LSTM的最优中文命名实体识别方法

本文转载自公众号：机器之心。选自arXiv作者：Yue Zhang、Jie Yang机器之心编译参与：路、王淑婷近日，来自新加坡科技设计大学的研究者在 arXiv 上发布了一篇论文，介绍了一种新型中文命名实体识别方法，该方法利…

阅读更多...

最全MySQL面试60题和答案

最全MySQL面试60题和答案

Mysql中有哪几种锁？ 1.表级锁：开销小，加锁快；不会出现死锁；锁定粒度大，发生锁冲突的概率最高，并发度最低。 2.行级锁：开销大，加锁慢；会出现死锁；…

阅读更多...

中文幽默语料库构建与计算项目(幽默等级识别,幽默类型识别,隐喻类型识别,隐喻情绪识别)

中文幽默语料库构建与计算项目(幽默等级识别,幽默类型识别,隐喻类型识别,隐喻情绪识别)

ChineseHumorSentiment chinese Humor Detection or Computation based on corpus and nlp methods, 基于语料库与NLP方法的中文幽默计算与检测项目项目地址:https://github.com/liuhuanyong/ChineseHumorSentiment 项目介绍幽默多指令人发笑的品质或者具有发笑的能力&…

阅读更多...

账户Account类文件编写（static成员使用）

账户Account类文件编写（static成员使用）

static类成员是该类所有成员共享一份的数据，一处修改了，全部变更； static成员函数只能调用static成员数据； static const整形int，char，可以在类内声明和初始化，类外不必再声明（跟编译…

阅读更多...

百度机器阅读理解比赛赛后总结

百度机器阅读理解比赛赛后总结

百度机器阅读理解比赛赛后总结 <div data-note-content"" class"show-content"><div class"show-content-free"><p>2018年4-5月间，笔者参加了百度举办的<a href"https://links.jia…

阅读更多...

课程 | 《知识图谱》第二期重磅来袭！

课程 | 《知识图谱》第二期重磅来袭！

参团，咨询，查看课程，请点击【阅读原文】↓↓

阅读更多...

All in Linux：一个算法工程师的IDE断奶之路

All in Linux：一个算法工程师的IDE断奶之路

一只小狐狸带你解锁炼丹术&NLP 秘籍在合格的炼丹师面前，python可能被各种嫌弃前不久卖萌屋的lulu写了一篇vim的分享《算法工程师的效率神器——vim篇》，突然想起来自己也有一篇攒了几年灰的稿子，在小伙伴的怂恿下跟小夕强行翻新了一下&a…

阅读更多...

2019 阿里Java 4轮面试题，含必考题答案参考！

2019 阿里Java 4轮面试题，含必考题答案参考！

Java一面 hashmap源码问题 HashMap底层结构 put操作讲一下 HashMap、HashMap如何保证线程安全、ConcurrentHashMap JVM有哪些回收算法，对应的收集器有哪些？ jvm g1的内存模型讲一下，G1和CMS收集器的区别？以及G1收集器对CMS的改…

阅读更多...

SiameseSentenceSimilarity相似句子匹配分类项目

SiameseSentenceSimilarity相似句子匹配分类项目

SiameseSentenceSimilarity SiameseSentenceSimilarity,个人实现的基于Siamese bilstm模型的相似句子判定模型,提供训练数据集和测试数据集. 项目地址:https://github.com/liuhuanyong/SiameseSentenceSimilarity 项目介绍句子相似度计算是自然语言处理中的一个重要技术手段…

阅读更多...

技术动态 | 自底向上构建知识图谱全过程

技术动态 | 自底向上构建知识图谱全过程

本文转载自公众号：阿里技术。“The world is not made of strings , but is made of things.”——辛格博士，from Google.知识图谱，是结构化的语义知识库，用于迅速描述物理世界中的概念及其相互关系，通过将数据粒度从d…

阅读更多...

数据结构--单链表single linked list数据结构C++实现

数据结构--单链表single linked list数据结构C++实现

2018年2月开始学习的 C Primer，到今天2019年3月已经整整一年了，非常感谢在一起交流的小伙伴，是你们的无私帮助和分享使得我能跨越很多技术的坑，感谢你们！期待我们2019年一起拿下《数据结构与算法》以及Python入门。 …

阅读更多...

搜索中的 Query 理解及应用

搜索中的 Query 理解及应用

本文转载自公众号“夕小瑶的卖萌屋”，专业带逛互联网算法圈的神操作 -----》我是传送门关注后，回复以下口令： 回复【789】 ：领取深度学习全栈手册（含NLP、CV海量综述、必刷论文解读） 回复【入群】&#xf…

阅读更多...

GAN原理，优缺点、应用总结

GAN原理，优缺点、应用总结

<h1 class"csdn_top" id"gan原理优缺点应用总结"><a name"t0"></a>GAN原理，优缺点、应用总结</h1> <br> 本文已投稿至微信公众号–机器学习算法全栈工程师，欢迎关注</article><p&…

阅读更多...

java程序员进阶必读书单

java程序员进阶必读书单

以下是我推荐给Java开发者们的一些值得一看的好书，从java基础开始到高级，以及从高级进阶到架构等的书单。基本都是经典之作，可以利用工作闲暇的时间，系统阅读。本文作者，优知学院创始人陈睿优知学院是IT人在线进…

阅读更多...

最新文章