论文浅尝 | ICLR 2020 - 图神经网络的预训练策略

论文浅尝 | ICLR 2020 - 图神经网络的预训练策略

news/2025/4/22 9:37:52/文章来源:https://blog.csdn.net/TgqDT3gGaMdkHasLZv/article/details/105479572

论文笔记整理：杨帆，浙江大学计算机学院。

动机

现有的用于图结构的预训练方法要么只关注node-level，导致在图表示空间没有区分度，要么只关注graph-level，导致在节点表示空间没有区分度。一种优质的节点表示应该保证不仅在节点层面有良好的区分度，而且由这些节点表示生成的图的表示在全图层面也有良好的区分度，所以预训练过程应同时考虑到node-level和graph-level。

模型

本文提出的模型主要包括node-level预训练和graph-level预训练两部分，其中node-level预训练包括context prediction和attribute masking两种实现方法。

Node-level pre-training
1. Context prediction

该方法定义了Neighborhood和Context graph两个概念，利用两个GNN分别对每个节点的Neighborhood和Context graph进行编码，然后通过负采样技术，训练一个二分类器判断一个Neighborhood表示和一个Context graph表示是否对应相同的节点，以此聚合周围节点的属性信息和邻近的图结构信息。

1. Attribute masking

该方法首先随机选取某些节点的属性将其MASK（把原始属性用特殊的标识符替换掉），然后使用GNN对节点编码生成节点表示，最后通过线性模型预测被MASK的属性值。

2. Graph-level pre-training

首先将节点的表示聚合起来得到图的表示，然后在图上进行多个二分类任务的联合训练。

实验

数据集

数据集包括生物和化学两个领域，生物领域的任务是蛋白质功能预测，化学领域的任务是分子属性预测。

实验结果
1. ROC-AUC performance

1. Negative transfer

加入graph-level预训练后，可以很好地防止Negative transfer（使用预训练效果反而差于不使用预训练的效果）的出现。

c. 收敛性

采用本文中的预训练策略能够有效加快收敛速度。

OpenKG

开放知识图谱（简称 OpenKG）旨在促进中文知识图谱数据的开放与互联，促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文，进入 OpenKG 博客。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/479149.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

常见的距离算法和相似度计算方法

常见的距离算法和相似度计算方法

原文链接：https://zhuanlan.zhihu.com/p/138107999 首发于算法加油站写文章常见的距离算法和相似度计算方法奋发的菜鸟酱华东师范大学计算机技术博士在读91 人赞同了该文章注：不定时更新1.常见的距离算法1.1 欧几里得距离（Euclidean Dista…

阅读更多...

美团AI全景图：吃喝玩乐背后的黑科技

美团AI全景图：吃喝玩乐背后的黑科技

很多人都会发现日常生活已经越来越离不开美团了，这个互联网平台涵盖了吃、住、行、游、购、娱……能帮我们做很多事情，非常接地气。黄色的美团外卖骑手，橙色的摩拜单车，还有美团和大众点评的Logo……会不时出现在各个角落&#xf…

阅读更多...

Android官方开发文档Training系列课程中文版：打印内容之自定义文档打印

Android官方开发文档Training系列课程中文版：打印内容之自定义文档打印

原文地址：http://android.xsoftlab.net/training/printing/custom-docs.html 对于一些应用，比如绘图类APP，版面设计类APP以及其它APP，这些APP都关注图形的输出，有一个漂亮的打印页面是它们的关键特性。在这种情况下&a…

阅读更多...

LeetCode 547. 朋友圈（图的遍历BFS DFS）

LeetCode 547. 朋友圈（图的遍历BFS DFS）

文章目录1. 题目2. 解题2.1 BFS 广度优先2.2 DFS 深度优先1. 题目问有几个连通网络 2. 解题 2.1 BFS 广度优先参考图的数据结构 class Solution { public:int findCircleNum(vector<vector<int>>& M) {int n M.size(), groups 0, i;bool visited[n] …

阅读更多...

开源开放 | 《大词林》开源 75 万核心实体和围绕核心实体的细粒度概念、关系列表...

开源开放 | 《大词林》开源 75 万核心实体和围绕核心实体的细粒度概念、关系列表...

1《大词林》简介《大词林》(http://101.200.120.155/)是由哈尔滨工业大学社会计算与信息检索研究中心推出，由我中心秦兵教授和刘铭副教授主持开发，是一个自动构建的大规模开放域中文知识库。自2014年11月推出第一版《大词林》，《大词林》共经…

阅读更多...

推荐几个不错的CUDA入门教程（非广告）

推荐几个不错的CUDA入门教程（非广告）

文 | godweiyang最近因为项目需要，入坑了CUDA，又要开始写很久没碰的C了。对于CUDA编程以及它所需要的GPU、计算机组成、操作系统等基础知识，我基本上都忘光了，因此也翻了不少教程。这里简单整理一下，给同样有入门需求的…

阅读更多...

logging.getLogger(logger)

logging.getLogger(logger)

https://www.cnblogs.com/bjdxy/archive/2012/12/03/2799322.html logging模块学习笔记：logger 对象、日志等级 logger：日志对象，logging模块中最基础的对象，用logging.getLogger(name)方法进行初始化，name可以不填。通…

阅读更多...

Android官方开发文档Training系列课程中文版：高效显示位图之加载大位图

Android官方开发文档Training系列课程中文版：高效显示位图之加载大位图

原文地址：http://android.xsoftlab.net/training/displaying-bitmaps/index.html 引言学习如何使用一种常规的手段来处理及加载Bitmap对象，这种方式除了使用户界面是可响应的之外，还会避免超出内存的限制。如果你不小心点的话，…

阅读更多...

美团DB数据同步到数据仓库的架构与实践

美团DB数据同步到数据仓库的架构与实践

背景在数据仓库建模中，未经任何加工处理的原始业务层数据，我们称之为ODS(Operational Data Store)数据。在互联网企业中，常见的ODS数据有业务日志数据（Log）和业务DB数据（DB）两类。对于业务DB数…

阅读更多...

论文浅尝 | AAAI2020 - 基于生成对抗的知识图谱零样本关系学习

论文浅尝 | AAAI2020 - 基于生成对抗的知识图谱零样本关系学习

论文笔记整理：耿玉霞，浙江大学直博生。研究方向：知识图谱，零样本学习等。来源：AAAI2020论文链接：https://arxiv.org/pdf/2001.02332.pdf本文是发表在AAAI2020上的一篇基于生成对抗网络进行知识图谱零样本关…

阅读更多...

LeetCode 1184. 公交站间的距离

LeetCode 1184. 公交站间的距离

1. 题目环形公交路线上有 n 个站，按次序从 0 到 n - 1 进行编号。我们已知每一对相邻公交站之间的距离，distance[i] 表示编号为 i 的车站和编号为 (i 1) % n 的车站之间的距离。环线上的公交车都可以按顺时针和逆时针的方向行驶。返回乘客从出发点…

阅读更多...

【python】详解类class的继承、__init__初始化、super方法

【python】详解类class的继承、init初始化、super方法

原文链接; https://blog.csdn.net/brucewong0516/article/details/79121179?utm_mediumdistribute.pc_relevant_t0.none-task-blog-BlogCommendFromBaidu-1.control&depth_1-utm_sourcedistribute.pc_relevant_t0.none-task-blog-BlogCommendFromBaidu-1.control 通过之前…

阅读更多...

追剧计划第三弹！UC Berkeley出品，全栈深度学习！

追剧计划第三弹！UC Berkeley出品，全栈深度学习！

关注卖萌屋比较早的小伙伴，大概还记得2020年初时我们组织的斯坦福大学CS224N自然语言处理公开课追剧计划，以及后来的斯坦福大学CS520知识图谱公开课追剧活动。尽管活动已经结束很长一段时间，但是仍然有小伙伴后台问“什么时候开始下一波追剧哇…

阅读更多...

Android官方开发文档Training系列课程中文版：高效显示位图之在非UI线程中处理图片

Android官方开发文档Training系列课程中文版：高效显示位图之在非UI线程中处理图片

原文地址：http://android.xsoftlab.net/training/displaying-bitmaps/process-bitmap.html 我们在上节课Load Large Bitmaps Efficiently中讨论了BitmapFactory.decode*方法，说到了不应该在UI线程中执行读取数据的过程，尤其是从磁盘或者网络…

阅读更多...

美团外卖iOS App冷启动治理

美团外卖iOS App冷启动治理

一、背景冷启动时长是App性能的重要指标，作为用户体验的第一道“门”，直接决定着用户对App的第一印象。美团外卖iOS客户端从2013年11月开始，历经几十个版本的迭代开发，产品形态不断完善，业务功能日趋复杂；…

阅读更多...

LeetCode 538. 把二叉搜索树转换为累加树（逆中序根右左）

LeetCode 538. 把二叉搜索树转换为累加树（逆中序根右左）

文章目录1. 题目2. 逆中序（根右左，降序循环遍历）1. 题目给定一个二叉搜索树（Binary Search Tree），把它转换成为累加树（Greater Tree)，使得每个节点的值是原来的节点值加上所有大于…

阅读更多...

应用实践 | 电商应用——一种基于强化学习的特定规则学习模型

应用实践 | 电商应用——一种基于强化学习的特定规则学习模型

本文转载自公众号：浙大KG。作者：汪寒，浙江大学硕士，主要研究方向为知识图谱和自然语言处理。应用场景在电商实际应用中，每个商品都会被挂载到若干个场景，以图结构中的节点形式存在。商品由结构化信息表示&a…

阅读更多...

20W奖金+实习机会：阿里巴巴达摩院最新时间序列赛事来了！

20W奖金+实习机会：阿里巴巴达摩院最新时间序列赛事来了！

Datawhale赛事赛事：2021“AI Earth”人工智能挑战赛2021“AI Earth”人工智能创新挑战赛，由阿里巴巴达摩院联合南京信息工程大学、国家气候中心、国家海洋环境预报中心、安徽省气象局共同创办。大赛以“AI助力精准气象和海洋预测”为主题，聚…

阅读更多...

关于python中带下划线的变量和函数的意义，class类带一个下划线和带两个下划线的定义

关于python中带下划线的变量和函数的意义，class类带一个下划线和带两个下划线的定义

总结:变量:1. 前带_的变量: 标明是一个私有变量, 只用于标明, 外部类还是可以访问到这个变量2. 前带两个_ ,后带两个_ 的变量: 标明是内置变量,3. 大写加下划线的变量: 标明是不会发生改变的全局变量函数:1. 前带_的变量: 标明是一个私有函数, 只用于标明,2. 前带两个_…

阅读更多...

Android官方开发文档Training系列课程中文版：高效显示位图之位图缓存

Android官方开发文档Training系列课程中文版：高效显示位图之位图缓存

原文地址：http://android.xsoftlab.net/training/displaying-bitmaps/cache-bitmap.html 往UI界面中加载单张图片的过程是很简单的，然而如果需要在某个时刻同时加载大量的图片，那么这事情就有些复杂了。在很多情况下，比如使用了L…

阅读更多...

最新文章