图谱实战 | 10 个前沿落地应用案例分享(附下载)

转载公众号 | DataFunSummit



导读:知识图谱和图学习都是这两年比较热门的研究方向。近年来,无论是工业界还是学术界,都陆续提出了自己的知识图谱构建平台,知识图谱被广泛应用在推荐、医疗等行业场景;各个公司、各个研究团队也都在不停地推出自己的图训练框架。

本文罗列了知识图谱和图机器学习两个方向中,应用得比较成熟的10个案例。

01

知识图谱精选案例

1. 《OPENBASE:知识众包平台解析》

  • 来源:《AI技术应用案例手册》,第166页

  • 作者:于阳|小米 知识图谱平台产品经理

  • 看点:Openbase 致力于打造中文开放域高质量免费知识图谱,目前已经收录了一亿多三元组,1151万的实体,九万多个属性,有四万七千多个标注任务的产出。Openbase 现在支持16个开放图谱的下载,包括KG4AI、农业、百科人物和佛学等,并以新冠图谱建设为例做详细的说明。除此之外,作者还分享了一些众包任务标注工具、提高标注效率的经验,以及OPENBASE众包数据质量建设实践。

2. 《知识图谱在美团推荐场景中的应用》

  • 来源:《AI技术应用案例手册》,第201页

  • 作者:杨玉基|美团 算法工程师

  • 看点:美团所涉足的生活服务领域需要大量知识。为了优化商家和用户体验,美团NLP中心从2018年开始着手构建了生活娱乐领域超大规模的知识图谱——美团大脑。美团在将知识图谱应用到推荐场景的过程中,主要面临着可解释性需求强烈,涉及领域多、差异大,数据稀疏,时空场景复杂四大难题。作者重点总结了美团在解决这四个难题的过程中形成的方法框架与具体实践经验。

3. 《自动化知识图谱表示学习:从三元组到子图》

  • 来源:《AI技术应用案例手册》,第140页

  • 作者:张永祺|第四范式 资深算法研究员

  • 看点:知识图谱逐渐被应用到QA问答系统、推荐系统、新药发现、股市预测等领域,在这个过程中,第四范式也建立了低门槛、全流程的知识图谱平台Sage Knowledge Base。作者从三元组到子图的维度来介绍自动化知识图谱表示学习的相关技术。

4. 《电力领域知识图谱技术进展与应用实践》

  • 来源:《AI技术应用案例手册》,第183页

  • 作者:谈元鹏|中国电力科学研究院 高级工程师

  • 看点:知识图谱相关技术在开发和应用过程中,通常需要跟行业或者业务领域进行高度融合。但是在行业知识图谱构建过程中,无法把传统行业和IT部门或知识图谱团队进行简单对接,导致数据标注及知识的消化理解比较困难,难以形成如图像识别一样的知识高能力应用。行业知识图谱的构建往往需要行业和技术人员双方彼此的沟通对接,中国电力科学研究院有限公司人工智能应用研究所就充当了一个行业和技术的对接桥梁角色,尝试构建了一套电力领域知识图谱。

5. 《基于逻辑规则学习的知识图谱推理》

  • 来源:《AI技术应用案例手册》,第127页

  • 作者:瞿锰|蒙特利尔大学 博士生

  • 看点:为了构造尽可能完备的图谱,知识图谱的推理工作也成为学术届和工业界的一个重要研究课题。来自Mila人工智能实验室的瞿锰博士,给大家分享了他们在图谱推理任务方向的一个研究:基于逻辑规则的图谱推理(RNNLogic: Learning Logic Rules for Reasoning on Knowledge Graphs),研究结果显示RNNLogic可以很好地兼顾图谱推理任务的模型效果和可解释性的问题。

02

图机器学习精选案例

1. 《图机器学习在智能反欺诈上的探索与实践》

  • 来源:《AI技术应用案例手册》,第107页

  • 作者:陈振兴|京东科技 算法工程师

  • 看点:作者重点向大家介绍了反欺诈模型体系、反欺诈建模痛点与图机器学习的优势、反欺诈中的常见四类图算法,以及图机器学习在营销场景中、线下交易场景中的实际应用。

2. 《基于图深度学习的自然语言处理方法和应用》

  • 来源:《AI技术应用案例手册》,第9页

  • 作者:郭晓洁|京东硅谷研究院 研究科学家

  • 看点:作者以Graph4NLP团队的一篇调研文章:Graph Neural Networks for Natural Language Processing:A Survery,以及团队所开发的Graph4NLP的python开源库和教程为基点,重点介绍了DLG4NLP方法和模型、DLG4NLP典型的应用,以及DLG4NLP Python开源库。

3. 《图深度学习系统DGL介绍和展望

  • 来源:《AI技术应用案例手册》,第72页

  • 作者:王敏捷|亚马逊云科技 资深应用科学家

  • 看点:图作为一个非常普适的数据结构存在于很多场景,随之而来的图神经网络也被用来挖掘图上有用的信息以增进下游任务的表现。但是根据现有工具,图神经网络的细粒度公式表达和粗粒度的张量实现存在着巨大的鸿沟。由此,亚马逊云科技构建了一座图算法与现有张量计算框架之间的桥梁:DGL,帮助用户更容易在现有DL框架上高效的执行相应的图算法。

4. 《GRAPH + AI 加速供应链数字化转型》

  • 来源:《AI技术应用案例手册》,第35页

  • 作者:周倚平 TigerGraph 售前总监

  • 看点:近几年来图计算(Graph)和人工智能(AI)在技术上都在飞速发展,商业应用中也各自发挥了重要作用。作者与大家探讨如何通过图计算(Graph)和人工智能(AI)的结合,来帮助企业推进供应链数字化转型。

5. 《视频人物社交关系图生成与应用》

  • 来源:《AI技术应用案例手册》,第92页

  • 作者:徐童 中国科学技术大学 副教授

  • 看点:在线社交媒体平台的发展,带来了细粒度检索、视频语义摘要等媒体智能服务的巨大需求。现有的视频理解技术缺乏深入的语义线索,结合视频中人物的社交关系才能更完整、准确地理解剧情,从而提升用户体验,支撑智能应用。作者主要介绍了动态分析和图机器学习的结合,围绕视频中的人物社交关系网络所开展的两个最新的工作。

以上是本次分享的全部案例。

这些案例均收录在DataFun202206期月刊《AI技术应用案例手册》中,感兴趣的读者可以扫描下方二维码,免费阅读或下载此手册。

d99d80ce0b3ddb173147d346133bdedc.png

03

资料目录

DataFun电子月刊是DataFun社区发布的月度资料汇总,免费向所有技术人员开放。

《AI技术应用案例手册》收录了图机器学习、知识图谱、自然语言处理、搜索推荐广告最新应用案例,包含24篇技术干货文章,文末赠送5、6月最新内推信息。

感兴趣的读者可以扫码或点击文末“阅读原文”免费下载。

0de6abdf78400b522792ed6f8fcbc881.png

3b6da6c0928f5ddb71d84fd7b0813bce.png

3b5423cbd071eb5948aecb0b5145c3b8.png

点击阅读原文,免费下载月刊。


OpenKG

OpenKG(中文开放知识图谱)旨在推动以中文为核心的知识图谱数据的开放、互联及众包,并促进知识图谱算法、工具及平台的开源开放。

f60db05e41f5e734fd0fc34eb1842e60.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/477628.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LeetCode 1080. 根到叶路径上的不足节点(递归)

1. 题目 给定一棵二叉树的根 root,请你考虑它所有 从根到叶的路径:从根到任何叶的路径。(所谓一个叶子节点,就是一个没有子节点的节点) 假如通过节点 node 的每种可能的 “根-叶” 路径上值的总和全都小于给定的 lim…

Spring Cloud构建微服务架构:分布式配置中心(加密解密)

在微服务架构中,我们通常都会采用DevOps的组织方式来降低因团队间沟通造成的巨大成本,以加速微服务应用的交付能力。这就使得原本由运维团队控制的线上信息将交由微服务所属组织的成员自行维护,其中将会包括大量的敏感信息,比如&a…

112页机器学习数学知识整理!数学基础回顾.pptx

机器学习的基础是数学,数学基础决定了机器学习从业人员的上限,想要学好机器学习,就必须学好数学。这么多数学知识,不管是硕士阶段还是博士阶段的研究生,是没法学完全的,必须有所取舍,黄海广博士…

LeetCode 274. H指数(排序,哈希)

1. 题目 给定一位研究者论文被引用次数的数组(被引用次数是非负整数)。编写一个方法,计算出研究者的 h 指数。 h 指数的定义: “h 代表“高引用次数”(high citations),一名科研人员的 h 指数是指他&…

论文浅尝 | 记忆推理:最近邻知识图谱嵌入

笔记整理:孙硕硕,东南大学硕士,研究方向为根因溯源。Citation: Zhang N, Xie X, Chen X, et al. Reasoning Through Memorization: Nearest Neighbor Knowledge Graph Embeddings[J]. arXiv preprint arXiv:2201.05575, 2022.动机大多数知识图…

LeetCode 275. H指数 II(二分查找)

1. 题目 给定一位研究者论文被引用次数的数组(被引用次数是非负整数),数组已经按照升序排列。编写一个方法,计算出研究者的 h 指数。 h 指数的定义: “h 代表“高引用次数”(high citations),…

Spring Cloud中Hystrix 线程隔离导致ThreadLocal数据丢失

在Spring Cloud中我们用Hystrix来实现断路器,Zuul中默认是用信号量(Hystrix默认是线程)来进行隔离的,我们可以通过配置使用线程方式隔离。 在使用线程隔离的时候,有个问题是必须要解决的,那就是在某些业务…

如果再这么玩下去,中国的科研就没戏了

文 | 知识分子编者按:今天编发的这篇文章,是某国立研究所所长的内心自白。他的一家之言,道出了许多人不愿意面对的现实——中国科研表面上看起来一片繁荣,实际深藏危机,如果继续跟班式搞科研,中国科研就没戏…

Spring Cloud Feign的文件上传实现

在Spring Cloud封装的Feign中并不直接支持传文件,但可以通过引入Feign的扩展包来实现,本来就来具体说说如何实现。 服务提供方(接收文件) 服务提供方的实现比较简单,就按Spring MVC的正常实现方式即可,比…

论文浅尝 | 开放知识图谱构建必读:封闭域VS开放知识抽取与4大类开放抽取常用方法概述...

转载公众号| 老刘说NLP最近社区抛出一个关于开放知识抽取的话题,也是当前知识图谱构建的一个热点,希望能够介绍相关的工作,而在之前也做过一些工作,借着这个机会,写一篇文章,来跟大家谈谈这个问题。开放知识…

别再双塔了!谷歌提出DSI索引,检索效果吊打双塔,零样本超BM25!

卖萌屋今日学术精选这篇论文展示了信息检索可以用一个Transformer来完成,其中,关于语料库的所有信息都被编码在Transformer模型的参数中。论文标题:Transformer Memory as a Differentiable Search Index链接:https://arxiv.org/a…

LeetCode 71. 简化路径(栈)

1. 题目 以 Unix 风格给出一个文件的绝对路径,你需要简化它。或者换句话说,将其转换为规范路径。 在 Unix 风格的文件系统中,一个点(.)表示当前目录本身;此外,两个点 (..&#xff…

我有一段很厉害的代码,不外传的那种

文 | 郭忠明知乎最近在知乎上看到一个问题,叫做“程序员有没有很厉害、不外传的代码”。​好像在这个遍地都是开源项目的时代,啥代码都藏不住。但其实,是有的,而且有不少!很多算法在没有公开前,普通程序员都…

开源开放 | OpenKG发布cnSchema重构版本

cnSchema网站:http://cnschema.openkg.cn/GitHub地址:https://github.com/cnschema/cnSchema开放许可协议:CC 0摘要cnSchema是由OpenKG管理和维护的面向中文知识图谱的Schema参考标准。结合中文语言特点和中文领域特点需求,cnSche…

Spring Cloud构建微服务架构:分布式服务跟踪(抽样收集)【Dalston版】

通过Trace ID和Span ID已经实现了对分布式系统中的请求跟踪,而这些记录的跟踪信息最终会被分析系统收集起来,并用来实现对分布式系统的监控和分析功能,比如:预警延迟过长的请求链路、查询请求链路的调用明细等。此时,我…

LeetCode 229. 求众数 II(摩尔投票)

1. 题目 给定一个大小为 n 的数组,找出其中所有出现超过 ⌊ n/3 ⌋ 次的元素。 说明: 要求算法的时间复杂度为 O(n),空间复杂度为 O(1)。 示例 1: 输入: [3,2,3] 输出: [3] 示例 2: 输入: [1,1,1,3,3,2,2,2] 输出: [1,2]来源:力扣&#xf…

95后CV工程师晒出工资单:狠补了这个,真香…

许多计算机视觉任务需要对图像进行智能分割,以理解图像中的内容,并使每个部分的分析更加容易。今天的图像分割技术使用计算机视觉深度学习模型来理解图像的每个像素所代表的真实物体,这在十年前是无法想象的。图像分割有助于确定目标之间的关…

论文浅尝 | CAKE:一个用于多视图知识图谱补全的可扩展性常识感知框架

笔记整理:陈子强,天津大学硕士链接:https://aclanthology.org/2022.acl-long.36.pdf动机以往的知识图谱补全仅仅依靠事实级别数据来预测实体之间缺失的关系,这样忽略了有价值的常识性知识。以往的知识图谱嵌入面临无效的负采样和事…

Spring Cloud构建微服务架构:分布式服务跟踪(收集原理)【Dalston版】

在本节内容之前,我们已经对如何引入Sleuth跟踪信息和搭建Zipkin服务端分析跟踪延迟的过程做了详细的介绍,相信大家对于Sleuth和Zipkin已经有了一定的感性认识。接下来,我们介绍一下关于Zipkin收集跟踪信息的过程细节,以帮助我们更…

LeetCode 263. 丑数 264. 丑数 II(DP)

文章目录1. LeetCode 263. 丑数解题2. LeetCode 264. 丑数 IIDP解题1. LeetCode 263. 丑数 编写一个程序判断给定的数是否为丑数。 丑数就是只包含质因数 2, 3, 5 的正整数。 示例 1: 输入: 6 输出: true 解释: 6 2 3示例 2: 输入: 8 输出: true 解释: 8 2 2 2示例 3: …