论文浅尝 | 用图网络做小样本学习

论文浅尝 | 用图网络做小样本学习

news/2025/4/11 14:15:25/文章来源:https://blog.csdn.net/TgqDT3gGaMdkHasLZv/article/details/80879097

640?wx_fmt=png

链接： https://arxiv.org/abs/1711.04043

本文提出了用 GNN(GraphNeural Network) 来解决 Few-Shot Learning 场景的分类问题。在 Few-Shot Learning 中，每个类别的训练样本数据较少，如果直接训练一个多分类模型，会由于每个类别的样本较少而无法训练充分。而 GNN 的一个优点在于可以通过节点之间的连接来做信息扩散，如果把每个样本视作图中一个节点，节点之间的边是它们的某种距离度量，那么，就可以把已有label的样本的 label 信息根据节点之间相似性的强弱，有选择的扩散到与之最相似的，需要预测的样本上。这样，新样本在预测的时候，可以利用到各个类别的标注数据，类似于迁移学习，从而缓解了 Few-Shot Learning 中每个类别训练样本较少的问题。

640?wx_fmt=png

基于以上思路，本文利用 GNN 在小样本 Few-Shot Learning 数据集上，对 Few-Shot Learning, Semi-supervised Learning 以及 Active Learning 三个任务都做了实验，验证了GNN利用信息传播做预测的有效性。

模型的基本结构是常见的 GNN，流程如下：

（1）初始化：将每个样本视作图中的节点，随机初始化每个节点的表示。初始化方式为：利用CNN得到的图片（实验数据集是图片分类）的向量表示，以及样本的label的onehot表示，拼接得到。对于半监督的情形，未标注样本的label的onehot表示是随机生成的。

（2）信息传播：计算节点之间的相似性，得到节点两两之间的相似性矩阵。然后以每个节点的邻居节点的表示和自己当前的表示来更新下一步的表示，即：自己的表示+ sum(相似性 * 邻居节点的表示)，是一个常用的加权平均更新方式

（3）对于需要预测label的节点，利用其最终的表示，通过softmax做分类。

实验结果：

相比已有的一些利用样本间相似性做 Few-Shot Learning 的模型，如 Siamese Net, Matching Network,Prototypical Network，都有提升。另外，论文中证明了后续这三种模型都是 GNN 模型的特例。

（1） Few-Shot Learning：

640?wx_fmt=png

（2） Semi-supervised Learning:

640?wx_fmt=png

(3) Active Learning:

640?wx_fmt=png

本文作者: 王梁，浙江大学硕士，研究方向为知识图谱，自然语言处理.

OpenKG.CN

中文开放知识图谱（简称OpenKG.CN）旨在促进中文知识图谱数据的开放与互联，促进知识图谱和语义技术的普及和广泛应用。

640?wx_fmt=jpeg

转载须知：转载需注明来源“OpenKG.CN”、作者及原文链接。如需修改标题，请注明原标题。

点击阅读原文，进入 OpenKG 博客。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/480602.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

10种C++排序算法

10种C++排序算法

文章目录1.插入排序2.冒泡排序3.选择排序4.希尔排序5.归并排序6.快速排序6.1.快速排序（改进）7.堆排序8.计数排序9.桶排序9.1.桶排序（改进）10.基数排序题目：LeetCode 912. 排序数组（10种排序） 下…

阅读更多...

史上最强Dubbo面试28题答案详解：核心功能+服务治理+架构设计等

史上最强Dubbo面试28题答案详解：核心功能+服务治理+架构设计等

1.Dubbo是什么？ Dubbo 是一个分布式、高性能、透明化的 RPC 服务框架，提供服务自动注册、自动发现等高效服务治理方案， 可以和 Spring 框架无缝集成。 RPC 指的是远程调用协议，也就是说两个服务器交互数据。 2.Dubbo的由来&…

阅读更多...

文档主题分析项目

文档主题分析项目

TopiCluster 基于Kmeans与Lda模型的多文档主题聚类,输入多篇文档,输出每个主题的关键词与相应文本,可用于主题发现与热点分析。项目地址：https://github.com/liuhuanyong/TopicCluster If any question about the project or me ,see https://liuhuanyong.github…

阅读更多...

数据缺失、混乱、重复怎么办？最全数据清洗指南让你所向披靡

数据缺失、混乱、重复怎么办？最全数据清洗指南让你所向披靡

一只小狐狸带你解锁炼丹术&NLP 秘籍正文来源：机器之心前言要获得优秀的模型，首先需要清洗数据。这是一篇如何在 Python 中执行数据清洗的分步指南。在拟合机器学习或统计模型之前，我们通常需要清洗数据。用杂乱数据训练出的模型无法输出…

阅读更多...

深度学习技术在机器阅读理解应用的研究进展

深度学习技术在机器阅读理解应用的研究进展

深度学习解决机器阅读理解任务的研究进展:https://blog.csdn.net/malefactor/article/details/52832134 深度学习技术在机器阅读理解应用的研究进展:https://www.imooc.com/article/30060 /* 版权声明：可以任意转载，转载时请标明文章原始出处和作者信息 …

阅读更多...

论文浅尝 | 基于开放世界的知识图谱补全

论文浅尝 | 基于开放世界的知识图谱补全

Citation: Baoxu Shi and Tim Weninger (2017). Open-World Knowledge Graph Completion 6, AAAI 2018传统的知识库补全算法如TransE等都是基于Close world assumption 的，也是就说补全的实体必须在知识图谱内。然而事实上大规模的知识图谱是一直进化的，…

阅读更多...

CCKS2018参会总结项目

CCKS2018参会总结项目

CCKS2018Summary 项目地址：https://github.com/liuhuanyong/CCKS2018Summary self summary after attending ccks2018 (2018全国知识图谱与语义计算大会) 介绍全国知识图谱与语义计算大会（CCKS: China Conference on Knowledge Graph and Semantic C…

阅读更多...

快速排序quicksort算法优化

快速排序quicksort算法优化

1.基本想想快速排序使用分治的思想通过一趟排序将待排序列分割成两部分，其中一部分所有元素均比基准大，另一部分均比基准小分别对这两部分元素继续进行排序，以达到整个序列有序 2.快排的步骤 1.选择基准在待排序列中，按…

阅读更多...

阿里P8架构师谈：Dubbo的详细介绍、设计思路、以及4大适用场景

阿里P8架构师谈：Dubbo的详细介绍、设计思路、以及4大适用场景

Dubbo是什么？ Dubbo是一个分布式服务框架，致力于提供高性能和透明化的RPC远程服务调用方案，以及SOA服务治理方案。简单的说，dubbo就是个服务框架，如果没有分布式的需求，其实是不需要用的，只有…

阅读更多...

巨省显存的重计算技巧在TF、Keras中的正确打开方式

巨省显存的重计算技巧在TF、Keras中的正确打开方式

一只小狐狸带你解锁炼丹术&NLP 秘籍作者：苏剑林（来自追一科技，人称“苏神”）前言在前不久的文章《BERT重计算：用22.5%的训练时间节省5倍的显存开销（附代码）》中介绍了一个叫做“重计算”的…

阅读更多...

论文浅尝 | 用可微的逻辑规则学习完成知识库推理

论文浅尝 | 用可微的逻辑规则学习完成知识库推理

Citation：Fan Yang,Zhilin Yang, William W. Cohen. Differentiable Learning of Logical Rules for Knowledge Base Reasoning. ICLR 2017.动机本文提出了一个可微的基于知识库的逻辑规则学习模型。现在有很多人工智能和机器学习的工作在研究如何学习一阶逻辑规则&…

阅读更多...

一点关于cloze-style问题的简谈

一点关于cloze-style问题的简谈

一个小任务：给出一个问题和诺干个候选句子，从候选句子中选出答案，有没有好的实现方案？ 一个小任务：类似于：“中国最大的内陆湖是哪个？”给出候选句子1.”中国最大的内陆湖，就是青海湖…

阅读更多...

中文词语概念上下位图谱项目

中文词语概念上下位图谱项目

HyponymyExtraction 项目地址：https://github.com/liuhuanyong/HyponymyExtraction HyponymyExtraction and Graph based on KB Schema, Baike-kb and online text extract, 基于知识概念体系，百科知识库，以及在线搜索结构化方式的词语上下位…

阅读更多...

POJ 1007 DNA排序解题

POJ 1007 DNA排序解题

题目链接 http://poj.org/problem?id1007 C代码实现 #include<string> #include<iostream> using namespace std; struct DNAdata //定义结构体 {char name[51];double sum;DNAdata(){sum 0;} }; void swapDNA(DNAdata *a, DNAdata *b) {DNAdata tempDNA;tempDN…

阅读更多...

DeepMatch：用于推荐广告的深度召回匹配算法库

DeepMatch：用于推荐广告的深度召回匹配算法库

一只小狐狸带你解锁炼丹术&NLP 秘籍前言今天介绍一下我们的一个开源项目DeepMatch，提供了若干主流的深度召回匹配算法的实现，并支持快速导出用户和物品向量进行ANN检索。非常适合同学们进行快速实验和学习，解放算法工程师的双手&#xf…

阅读更多...

史上最全Spring面试71题与答案

史上最全Spring面试71题与答案

1.什么是spring? Spring是个java企业级应用的开源开发框架。Spring主要用来开发Java应用，但是有些扩展是针对构建J2EE平台的web应用。Spring框架目标是简化Java企业级应用开发，并通过POJO为基础的编程模型促进良好的编程习惯。 2.使用Spring框架的好处…

阅读更多...

论文浅尝 | 近期论文精选

论文浅尝 | 近期论文精选

本文转载自公众号 PaperWeekly, 对我们近期的论文浅尝进行了精选整理并附上了相应的源码链接，感谢 PaperWeekly！TheWebConf 2018■ 链接 | https://www.paperweekly.site/papers/1956■ 解读 | 花云程，东南大学博士，研究方向为自然…

阅读更多...

海马体what where记忆推理模型

海马体what where记忆推理模型

Generalisation of structural knowledge in theHippocampal-Entorhinal systemhttps://www.groundai.com/project/generalisation-of-structural-knowledge-in-the-hippocampal-entorhinal-system/海马 - 内嗅系统结构知识的泛化实体概念信息和位置及虚拟位置信息组成记忆保存…

阅读更多...

基于裁判文书与犯罪案例文本挖掘项目

基于裁判文书与犯罪案例文本挖掘项目

LawCrimeMining Law Crime Mining Based on Corpus build and content analysis by NLP methods. 基于领域语料库构建与NLP方法的裁判文书与犯罪案例文本挖掘项目项目地址：https://github.com/liuhuanyong/LawCrimeMining 项目介绍正邪不两立，法律与…

阅读更多...

快速排序quicksort算法细节优化（一次申请内存/无额外内存排序）

快速排序quicksort算法细节优化（一次申请内存/无额外内存排序）

文章目录1.只申请一次内存，避免多次递归调用时反复的申请和释放内存，提高程序运行效率2.不申请内存，在原数组上直接排序优化比较总结对链接中快速排序进行代码优化 https://blog.csdn.net/qq_21201267/article/details/80993672#t6 1.只申请…

阅读更多...

最新文章