关于知识图谱,我们接下来该研究什么?斯坦福教授们给出了答案

星标/置顶小屋,带你解锁

最萌最前沿的NLP、搜索与推荐技术

文 | 舒意恒(南京大学硕士生,知识图谱方向)

编 |  北大小才女小轶


本文整理了斯坦福大学 CS 520 知识图谱研讨会课程的第 10 集的内容,主要是关于知识图谱未来的研究方向,推荐给研究知识图谱的同学们~

1 使用强化学习进行多跳知识图谱推理

第一位演讲者:Richard Sochar

Richard 认为知识图谱未来的一个重要研究方向是使用强化学习进行多跳知识图谱推理。

知识图谱的缺陷之一是不完整性,即知识图谱能存储的事实是有限的。对于知识图谱的重要应用——聊天机器人(Chatbot),也就是对话系统或者问答系统,其交互形式可以是文本或是图像。在对话过程中需要根据知识图谱进行推理,但知识图谱关于目标问题的知识可能是残缺或者有噪音的,所以算法应当具有一定的鲁棒性。对于知识图谱的不完整性,有以下解决方案:

知识图谱嵌入

知识图谱嵌入是一种发现缺失事实的有效方法。它将知识图谱中的所有实体或关系嵌入到连续向量空间中。采用强化学习进行推理时,可以使用知识图谱嵌入,便于神经网络对实体进行处理。但是知识图谱嵌入通常缺少可解释性。

多跳推理模型

现有的多跳推理模型通常采用序列决策的思路。从问题中提取实体,然后在知识图谱中学习如何在实体间进行推理。

强化学习框架

强化学习中需要关注五个要素:

  • 环境 environment:在该任务中,环境是一个知识图谱

  • 状态 state:例如,当前已经遍历过的一个子图

  • 动作 action:例如,选择一个结点进行扩展

  • 转换 transition:采取一个动作后,状态发生改变,直到一个定义的推理终点

  • 奖励 reward:在推理正确时获得奖励

使用强化学习进行推理可解释性较强,可以从算法给出的推理路径中分析结果的产生原因。

多跳推理是可解释的,但是准确较低。常常将知识图谱嵌入与强化学习框架结合使用,从而兼顾可解释性和准确性。

该方法还可以推广到联合知识图谱和文本的多跳推理上。

2 知识图谱到底知道什么?

第二位演讲者:Mark A. Musen 博士

Mark 想讨论的是非常根本的一个问题——我们知道了什么是图,但什么是知识?我们如何确保知识被存储到了图中?关于这个问题的答案,Mark从早年的研究历史开始谈起。

上世纪中叶,Stanford 想要开发一个专家系统,帮助医生做临床决策。他们先是考虑用语义网络来实现这一任务。还有一个早期用于帮助决策的专家系统,叫做MYCIN,出现于 70~80 年代。它是包含大量复杂的规则供专家进行决策。在这个年代,符号化的人工智能也被认为是医疗健康行业的未来。但是,对这类方法的质疑逐渐显现。包含大量规则的系统真的是可以维护的吗?语义网络(知识图谱)能够支持查找之外的任何形式的推理吗?什么样的知识表示可能可以支持一个最智能的系统呢?

Allen Newell 在 1980 年提出:我们应该停止争论如何表示知识,真正重要的是系统中有怎样的知识,而不是如何用计算机进行表示。知识是观察者赋予智能体的。知识是解决问题的能力。

  • 我们无法“看见”知识,或将它写下来。所谓“道可道,非常道。名可名,非常名。”

  • 我们永远无法得知智能体到底懂得了什么。所谓“子非鱼,安知鱼之乐。子非我,安知我不知鱼之乐。”

  • 我们只能认为智能体有知识的条件是:

    • 似乎有目标

    • 似乎能选择行为能实现目标

    • 似乎能理智地选择行为

语义网被认为有希望在 Web 级别的数据上解决问题。但Mark 认为相关研究者似乎忽视了本体论和 Web 服务的作用,只顾玩弄链接数据的概念。日益增长的链接数据被表示为知识图谱。正如上个世纪那样,我们又开始过分关注知识表示的状态,而越来越少地讨论如何利用它解决问题。只有图,我们仍然做不了任何事情。

我们又重新开始研究如何将知识表示为图。如今,庞大的知识图谱相比当年的语义网络,拥有更加丰富的信息。我们已经知道一些表示和生成智能行为的方法了,但还有很多应用没有开始研究,有很多行为还没有想到如何去建模——这是我们未来可以努力的方向。

3 Data Commons

第三位演讲者:RV Guha

数据正在驱动很多应用,政策、新闻、健康、科学等。目前的问题不在于数据的缺乏,而是数据有太多的格式和规范。我们搜寻数据源、清洗数据、搞定数据存储……在这个过程中存在启动成本高昂,生态系统不完整,工具较少的问题。我们如何使数据的使用变得更加简单?

Data Commons 是一个 Google 发起的项目,尝试解决知识图谱构建中的上述问题,从不同数据源合成一个开放知识图谱。Guha 团队想要做的是,从原本搜索数据集、下载、清洗、归一化、融合的繁琐流程,简化到直接搜索谷歌即可获得数据集。

该项目的优势在于,通过清洗、归一化和将多个数据集进行融合的方式,轻松构建一个知识图谱,无需清理和加入数据。

目前通过 Data Commons 构建的知识图谱包括按地理区域的美国人口普查公报、美国国家海洋和大气管理局提供的天气历史与预报、美国劳工统计局的就业与失业统计等。

以上是对课程的简单的笔记,并不足以涵盖课程中的细节,感兴趣的同学们可以刷起来啦~


喜欢本文的小伙伴,强烈建议加入卖萌屋的CS520追剧群,不仅可以认识众多志同道合的优秀小伙伴,而且还有若干卖萌屋美丽小姐姐(划掉)、顶会审稿人、大厂研究员、知乎大V等你来撩哦。

如果提示已满或过期,或希望加入领域大群(自然语言处理、搜索技术、推荐系统、算法岗求职等)或其他垂类讨论群,请在后台回复关键词【入群】获取入口哦。

记得扫描下方二维码关注并星标置顶,我才能来到你面前哦。

夕小瑶的卖萌屋

关注&星标小夕,带你解锁AI秘籍

订阅号主页下方「撩一下」有惊喜


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/480277.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

POJ 2967 (水题,考察putchar()按位输入)

题目链接:http://poj.org/problem?id2967 题目大意: 给定系列长度,求是否有规定的三角形 (不是所有的都可以组成三角形&&有至少一种组合可以组成三角形)-> 打印通过,否则打印拒绝。 题目有时…

四大银行(工建农中)大数据进展如何?

原文地址:https://cloud.tencent.com/developer/article/1052576 中国建设银行中国建设银行信息技术管理部资深经理林磊明▼▼1、银行压力越来越大从十二五走到十三五期间,银行业面临的各方面的压力越来越大,从我们的年报数字可以看出去年四大…

论文浅尝 | 多内容实体和关系联合抽取的对抗训练

链接:https://arxiv.org/pdf/1808.06876.pdf动机Szegedy 在 14 年发现,对于图像分类问题的神经网络,若是在输入中人为的添加很小尺度的扰动,会让已经训练好的神经网络做出错误的判断,并且可能以很高的置信度输出。很多…

BAT面试进阶:最全Memcached面试30题含答案

【memcached面试题目】 Memcached服务在企业集群架构中应用场景? Memcached服务在不同企业业务应用场景中的工作流程? Memcached服务分布式集群如何实现? Memcached服务特点及工作原理是什么? Memcached内存管理机制原理? Memcached的…

一份从入门到精通NLP的完整指南 | NLPer

该小博主介绍本人:笔名zenRRan,方向自然语言处理,方法主要是深度学习。未来的目标:人工智能之自然语言处理博士。写公众号目的:将知识变成开源,让每个渴求知识而难以入门人工智能的小白以及想进阶的小牛找到…

论文浅尝 | 基于知识库的类型实体和关系的联合抽取

链接:http://hanj.cs.illinois.edu/pdf/www17_xren.pdfGitHub项目地址:https://github.com/INK-USC/DS-RelationExtraction动机现有的利用远程监督进行实体关系抽取的方法中存在以下三个问题:1、依赖事先训练的命名实体识别工具,而…

POJ 2255 Tree Recovery(已知前序中序,求后序)

1. 题目链接:http://poj.org/problem?id2255 2. 题目大意: 给定二叉树的前序和中序序列,输出其后序序列 3. 思考过程: 4. AC代码 /*** description: 给出前序和中序二叉树节点序列,求后序二叉树节点输出序列* auth…

美团内推:java高级开发(一面+二面+三面),面试58题实拍!

美团内推(一面二面三面)面试题目 美团一面(电话) 自我介绍 项目介绍 Redis介绍 了解redis源码么 了解redis集群么 Hashmap的原理,增删的情况后端数据结构如何位移 hashmap容量为什么是2的幂次 hashset的源码 …

ACL20 best paper荣誉提名 | DO NOT STOP Pre-training!

星标/置顶小屋,带你解锁最萌最前沿的NLP、搜索与推荐技术文 | JayLou娄杰(NLP算法工程师,信息抽取方向)编 | 可盐可甜兔子酱在昨晚23点的best paper典礼上我惊了,这篇论文竟然获得了今年ACL2020 best paper荣誉提名..…

论文浅尝 | 对于知识图谱嵌入表示的几何形状理解

论文链接:http://anthology.aclweb.org/attachments/P/P18/P18-1012.Presentation.pdf发表会议:ACL 2018摘要知识图谱的嵌入表示在近几年已经成为一个非常活跃的研究领域,众多相关方法相继被提出,这些嵌入方法是将知识图谱中的实体…

数据结构--堆 Heap

文章目录1. 概念2. 操作和存储2.1 插入一个元素2.2 删除堆顶元素3. 堆排序(不稳定排序)3.1 建堆3.2 排序3.3 思考:为什么快速排序要比堆排序性能好?两者都是O(nlogn)4. 堆应用4.1 优先级队列4.2 用堆求 Top K(前K大数据…

金融时报:人工智能在银行中的应用—对全球30家大型银行的调查

原文地址:https://cloud.tencent.com/developer/article/1144829 (微信公众号 点滴科技资讯)尽管银行业对新技术感到兴奋,但仍采取比较谨慎的方式。德意志银行首席执行官约翰•克莱恩(John Cryan)曾经提出将…

百度Java三面:现场面试39题目实拍含答案!

百度一面(现场) 自我介绍 Java中的多态 为什么要同时重写hashcode和equals Hashmap的原理 Hashmap如何变线程安全,每种方式的优缺点 垃圾回收机制 Jvm的参数你知道的说一下 设计模式了解的说一下啊 手撕一个单例模式 算法题目 手撕算…

CCKS2020事理图谱应用工作:刘焕勇等.面向开放文本的逻辑推理知识抽取与事件影响推理探索

一、背景介绍 第十四届全国知识图谱与语义计算大会(CCKS 2020) 11 月 12 日至 15 日在江西南昌举行,CCKS(China Conference on Knowledge Graph and Semantic Computing)是由中国中文信息学会语言与知识计算专委会定期举办的全国年度学术会议…

ACL20 Best Paper揭晓!NLP模型评价体系或将迎来重大转折

星标/置顶小屋,带你解锁最萌最前沿的NLP、搜索与推荐技术文 | 北大小才女小轶昨晚ACL2020的Main Conference落下帷幕,今年的最佳论文颁给了这篇《Beyond Accuracy: Behavioral Testing of NLP Models with CHECKLIST》。在ACL录用的778篇论文中&#xff…

论文浅尝 | 基于多模态关联数据嵌入的知识库补全

链接&#xff1a;https://arxiv.org/pdf/1809.01341.pdf动机&#xff08;摘要&#xff09;当前的知识库补全的方法主要是将实体和关系嵌入到一个低维的向量空间&#xff0c;但是却只利用了知识库中的三元组结构 (<s,r,o>) 数据&#xff0c;而忽略了知识库中大量存在的文本…

智能投顾原理与主流产品分析

原作者 王希&#xff0c;CFA&#xff0c;中国光大银行。核心观点&#xff1a;1、智能投顾的模式是通过技术实现财富管理的流程自动化&#xff0c;为客户定制FOF产品来投资并赚取管理费。目前尚未看出大数据分析、人工智能等技术在其中发挥出关键作用。2、智能投顾在美国的快速…

POJ 1442 Black Box(大小堆,求第K小的元素)

文章目录1. 题目链接2. 题目解读3. 代码3.1 Runtime Error 代码1. 题目链接 http://poj.org/problem?id1442 2. 题目解读 可以利用大小堆&#xff0c;大堆长度从1开始&#xff0c;每次1 大堆元素都比小堆的小&#xff0c;那么大堆顶的元素就是第k小的元素 3. 代码 3.1 Run…

阿里java架构师面试128题含答案:分布式架构+Dubbo+多线程+Redis

一、Java基础和高级 1.String类为什么是final的。 2.HashMap的源码&#xff0c;实现原理&#xff0c;底层结构。 3.反射中&#xff0c;Class.forName和classloader的区别 4.session和cookie的区别和联系&#xff0c;session的生命周期&#xff0c;多个服务部署时session管理…

LightGBM——提升机器算法(图解+理论+安装方法+python代码)

原文地址&#xff1a;https://blog.csdn.net/huacha__/article/details/81057150 前言 LightGBM是个快速的&#xff0c;分布式的&#xff0c;高性能的基于决策树算法的梯度提升框架。可用于排序&#xff0c;分类&#xff0c;回归以及很多其他的机器学习任务中。 在竞赛题中&am…