什么是图神经网络

当这两种技术融合在一起时,就可以创造出一些新颖、奇妙的东西——比如手机和浏览器融合在一起,产生了智能手机。

如今,科研人员正在将人工智能发现模式的能力应用于存储各种数据点之间关系信息的大型图数据库。与此同时,就产生了一种强大的新工具,称为图形神经网络。

什么是图神经网络?

图神经网络将深度学习的预测能力应用于丰富的数据结构上,这些数据结构将对象及对象之间的关系描述为图形中由线连接的点。

在GNN中,数据点被称为节点,连接这些点的线被称为边,将上述概念使用数学元素进行表达,机器学习算法就可以在节点、边或整个图的层次上做出有用的预测。

GNN能做什么?

越来越多的公司正在应用GNN来进行药物研发、欺诈检测和推荐系统。这些应用程序都需要查找数据点之间的关系模式。

研究人员正在探索GNN在计算机图形学、网络安全、基因组学和材料科学中的应用。最近的一篇论文报道了GNN如何使用交通地图作为图来改进对到达时间的预测。

许多科学和工业分支已经将有价值的数据存储在图数据库中。通过深度学习,他们可以训练预测模型,从图中挖掘出新的见解。

 

9cb7d7b4b7e5510fdb52f1872b2eb5b9.png

AWS高级首席科学家乔治·卡皮斯(George Karypis)在今年早些时候的一次演讲中表示:“GNN是深度学习研究中最热门的领域之一,我们看到越来越多的应用程序利用GNN来提高其性能。”。

其他人也同意。斯坦福大学副教授朱尔·莱斯科维奇(Jure Leskovec)在最近的一次演讲中表示,GNN“因其对复杂关系建模的灵活性而备受关注,这是传统神经网络无法做到的。”。

 

03e269844c2614d5c226ec0eab1c0fd4.png

谁在使用GNN?

亚马逊在2017年报告了其在欺诈检测中对于GNN的应用。2020年,它推出了一项公共GNN服务,其他人可以将其用于欺诈检测、推荐系统和其他应用。

为了保持客户的高度信任,亚马逊搜索使用GNN来检测恶意卖家、买家和产品。使用NVIDIA GPU,它能够探索具有数千万个节点和数亿条边的图形,同时将训练时间从24小时减少到5小时。

生物制药公司GSK工智能全球负责人金·布兰森(Kim Branson)在GNN研讨会的一个小组上表示,该公司维护着一个包含近5000亿个节点的知识图谱,这些节点用于其许多机器语言模型。

LinkedIn的高级软件工程师Jaewon Yang在研讨会上的另一个小组上表示,LinkedIn使用GNN进行社交推荐,并探索人们的技能与职位之间的关系。

GNN是如何工作的?

到目前为止,深度学习主要关注图像和文本,他们可以描述成词序列或像素网格的结构化数据。相比之下,图是非结构化的。它们可以采用任何形状或大小,并包含任何类型的数据,包括图像和文本。

GNN使用一个称为消息传递的过程来组织图,以便机器学习算法可以使用它们。

消息传递将有关其邻居的信息嵌入到每个节点中。人工智能模型利用嵌入的信息来发现潜在模式并做出预测。

 

a5d90b40e4dd876884d6fa912f94c667.png

 

例如,推荐系统使用一种节点嵌入的形式来匹配客户和产品。欺诈检测系统使用边缘嵌入来发现可疑交易,药物发现模型比较整个分子图以找出它们之间的反应。


GNN有两个独特的特性:它们使用稀疏数学,模型通常只有两到三层。其他人工智能模型通常使用密集数学,并具有数百个神经网络层。

 

99b575525dda3ead1367be876bb6b4eb.png

GNN的历史

一个意大利研究人员于2009年发表的一篇论文首次定义图神经网络。但阿姆斯特丹的两名研究人员花了八年时间才用一种称为图卷积网络(GCN)的变体展示了他们的能力,并成为当今最流行的GNN之一。

GCN的工作启发了莱斯科维奇和他的两名斯坦福研究生,以此创建了GraphSage,这是一个GNN,展示了消息传递功能的新工作方式。他于2017年夏天在Pinterest进行了测试,并担任首席科学家。

 

766cfbcbe0d847ddf469be44c905e0ec.png

他们的实现:PinSage是一个推荐系统,它包含了30亿个节点和180亿个边缘,性能超过当时的其他人工智能模型。

与此同时,出现了其他变体和混合体,包括图递归网络和图注意力网络。GAT借鉴了transformer模型中定义的注意力机制,帮助GNN专注于最感兴趣的数据集部分。

 

 

03bd896cfe577765f614940ec2d6df3e.png

Scaling Graph Neural Networks

展望未来,GNN需要在所有维度上进行扩展。

尚未维护图数据库的组织需要工具来简化创建这些复杂数据结构的工作。

使用图数据库的人知道,在某些情况下,他们正在迅速增长,在单个节点或边缘上嵌入了数千个特征。这带来了数据存储和传输的挑战。

伊顿表示:“我们提供的产品最大限度地提高了系统的内存、计算带宽和吞吐量,以解决数据加载和扩展问题。”。

作为这项工作的一部分,NVIDIA在GTC上宣布,除了深度图库(DGL)之外,它现在还支持PyTorch Geometric(PyG)。这是两个最流行的GNN软件框架。

 

0fec62e494b04e85a2cef2b1434aa3ab.png

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/157869.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

基金项目申请撰写思路

随着社会经济发展和科技进步,基金项目对创新性的要求越来越高。申请人需要提出独特且有前瞻性的研究问题,具备突破性的科学思路和方法。因此,基金项目申请往往需要进行跨学科的技术融合。申请人需要与不同领域结合,形成多学科交叉…

FreeRTOS源码阅读笔记4--semphr.h

信号量是特殊的队列--无法存储消息的队列,相关的接口函数声明在semphr.h中,通过宏定义替换队列函数实现。 4.1创建二值信号量xSemaphoreCreateBinary() 4.1.1函数原型 queueQUEUE_TYPE_BINARY_SEMAPHORE:一个宏,表示创建队列的…

这是一棵适合搜索二叉树

🎈个人主页:🎈 :✨✨✨初阶牛✨✨✨ 🐻强烈推荐优质专栏: 🍔🍟🌯C的世界(持续更新中) 🐻推荐专栏1: 🍔🍟🌯C语言初阶 🐻推荐专栏2: 🍔…

JAVA编程思想N刷

Random 默认是系统时间,所有每次随机数都不一样。给random添加一个种子,Random(2),多次调用生成的随机数是一样的对象继承时,类加载过程。先执行父类的静态属性,执行当前类静态属性,…

单链表OJ题--9.环形链表

9.环形链表 141. 环形链表 - 力扣(LeetCode) /* 解题思路: 定义快慢指针fast,slow, 如果链表确实有环,fast指针一定会在环内追上slow指针。 */typedef struct ListNode Node; bool hasCycle(struct ListNode *head) {Node* slow …

wsl-ubuntu 系统端口总被主机端口占用问题解决

wsl-ubuntu 系统端口总被主机端口占用问题解决 0. 问题描述1. 解决方法 0. 问题描述 wsl-ubuntu 子系统中的服务,总是启动失败,错误信息是端口被占用。 用一些命令查看,被占用的端口也没有用服务启动。 1. 解决方法 运行, ne…

硬技能之上的软技巧(三)

在硬技能的基础上,如何运用软技巧来进一步提升个人能力和职业发展。在之前的讨论中,我们提到了硬技能和软技巧的基本概念,以及如何运用软技巧来提升个人能力和职业发展。本篇文章将进一步探讨软技巧中的一些重要方面,包括自我管理…

全网最全Django面试题整理(二)

什么是 Django ORM?它的作用是什么? Django ORM(Object-Relational Mapping)是Django框架中的一个重要组成部分,用于简化与数据库的交互。它提供了一种将数据库中的数据映射到Python对象的方法,使得开发者…

深信服技术认证“SCSA-S”划重点:渗透测试工具使用

为帮助大家更加系统化的学习网络安全知识,尽快通过深信服安全服务认证工程师认证,深信服推出“SCSA-S认证备考秘笈”共十期内容,“考试重点”内容框架,帮助大家快速get重点知识~ 划重点来啦 深信服安全服务认证工程师(…

【开源】基于Vue和SpringBoot的创意工坊双创管理系统

项目编号: S 049 ,文末获取源码。 \color{red}{项目编号:S049,文末获取源码。} 项目编号:S049,文末获取源码。 目录 一、摘要1.1 项目介绍1.2 项目录屏 二、功能模块2.1 管理员端2.2 Web 端2.3 移动端 三、…

生物活性分子库

Pubchem web:https://pubchem.ncbi.nlm.nih.gov/ PubChem是美国国立卫生研究院(NIH)的开放化学数据库。 “开放”意味着您可以将科学数据存储在PubChem中,其他人也可以使用它。自2004年启动以来,PubChem已成为科学家,…

[SSD测试 1.1] SSD测试软件哪个好? 8 款固态硬盘软件对比

传送门: >>> 总目录 依公知及经验整理,原创保护,请勿转载。 专栏 《深入理解SSD》 软件推荐指数PCmark5 星CrystalSSDMark4 星安兔兔4 星AS SSD3 星ATTODisk3 星HDTune3 星AnvilsStorage Utilities3 星CrystalDiskInfo3 星TxBENCH3 星系统自带工具1 星前言 测试软件…

消息的并发处理

看一下实现消息并发处理的代码,并发处理会增大实现流量控制、保证消息顺序方面的难度。 1 并发处理过程 处理效率的高低是反应Consumer实现好坏的重要指标,本节以ConsumeMessageConcurrentlyService类为例来分析RocketMQ的实现方式。ConsumeMessageCon…

紧跟热点:教你如何快速掌握ChatGPT

2023年随着OpenAI开发者大会的召开,最重磅更新当属GPTs,多模态API,未来自定义专属的GPT。微软创始人比尔盖茨称ChatGPT的出现有着重大历史意义,不亚于互联网和个人电脑的问世。360创始人周鸿祎认为未来各行各业如果不能搭上这班车…

图解Spark Graphx基于connectedComponents函数实现连通图底层原理

原创/朱季谦 第一次写这么长的graphx源码解读,还是比较晦涩,有较多不足之处,争取改进。 一、连通图说明 连通图是指图中的任意两个顶点之间都存在路径相连而组成的一个子图。 用一个图来说明,例如,下面这个叫graph…

【教3妹学编程-算法题】最大异或乘积

3妹:2哥,你有没有看到新闻“18岁父亲为4岁儿子落户现身亲子鉴定” 2哥 : 啥?18岁就当爹啦? 3妹:确切的说是14岁好吧。 2哥 : 哎,想我30了, 还是个单身狗。 3妹:别急啊, 2…

已完结7个,再启动1个新项目,嘎嘎强!

作者:小傅哥 博客:https://bugstack.cn 沉淀、分享、成长,让自己和他人都能有所收获!😄 大家好,我是技术UP主小傅哥。 💐又到了启动新项目的时候,死鬼开心嘛。小傅哥的星球&#xf…

数据库课后习题加真题

文章目录 第二章第三章第四到六章某年真题 第二章 第三章 3.8 对于教学数据库的三个基本表: s( 学号 ‾ \underline{学号} 学号​,姓名,年龄, 性别) sc( 学号 , 课程号 ‾ \underline{学号, 课程号} 学号,课程号​, 成绩) c( 课程号 ‾ \un…

【C++】类与对象(中)

一、类的默认成员函数 如果一个类中什么成员都没有,简称为空类。 空类中真的什么都没有吗?并不是,任何类在什么都不写时,编译器会自动生成以下6个默认成员函数。 默认成员函数:用户没有显式实现,编译器会自…

[超详细]基于YOLO&OpenCV的人流量统计监测系统(源码&部署教程)

1.图片识别 2.视频识别 [YOLOv7]基于YOLO&Deepsort的人流量统计系统(源码&部署教程)_哔哩哔哩_bilibili 3.Deepsort目标追踪 (1)获取原始视频帧 (2)利用目标检测器对视频帧中的目标进行检测 &#xff08…