漆桂林 | 人工智能的浪潮中,知识图谱何去何从?

本文转载自公众号:AI科技大本营。


              

640?wx_fmt=jpeg


近年来,随着人们对 AI 认知能力的积极探索,知识图谱因其表达能力强、拓展性好,基于知识进行推理等优势得到了学界与业界的高度关注。知识图谱,旨在描述客观世界概念、实体、事件及其之间关系,具备可解释性,而且可以用于解决复杂决策问题。这也意味着通过深度学习与知识图谱的结合,模型底层特征空间与人类自然语言之间巨大的语义鸿沟问题有望得以解决。在大数据和机器学习两大引擎下,大规模知识图谱的自动化构建成为现实,这就加快了知识图谱的落地与应用。


传统意义上,知识图谱可以划分为通用知识图谱和领域知识图谱。例如,国外的谷歌搜索引擎和国内的百度搜索引擎,这类通用领域知识图谱是最先被大家熟知的应用;而场景的不断丰富、需求不断增多、用户对体验与品质的要求不断提高,各行各业都亟需构建领域知识图谱。


那么,从趋势到实际需要,知识图谱已经取得了哪些学术与技术成果,产业与应用发生了哪些变化?当下知识图谱领域最关注的问题又是什么?未来,知识图谱又有哪些发展前景?近日,AI科技大本营采访到了东南大学教授、博士生导师,东南大学认知智能研究所所长漆桂林。


漆桂林认为,目前知识图谱整个领域最关注的问题还是如何能够高效、低成本构建知识图谱,而这个问题对于研究人员来说,仍是一个非常大的挑战,比如现在大家都在关注如何在少量甚至无标注场景下进行知识图谱构建。

从知识抽取到知识推理,大家在关注什么?

漆桂林表示,近两年知识图谱研究有一些值得关注的成果,比如:


  • 知识抽取,如何在少量甚至无标注场景下进行知识图谱构建是一个具有挑战性的问题。目前大家都在关注基于图神经网络、增强学习、交互式知识抽取等方法。

  • 知识融合,代表性工作有交互式知识融合以及基于表示学习的知识融合的工作。

  • 知识更新,针对百科类知识图谱的自动化更新技术取得了一些突破,从而可以对百科知识进行自动化更新。

  • 知识推理,最近两年有不少混合式推理的方法出现,也就是混合机器学习和符号推理的方法,这些方法的提出对于解决某些机器学习技术的不可解释性,以及提升知识图谱的推理能力都有作用。


与此同时,这些关键技术的应用也有一些突破性的进展,尤其是在知识抽取和知识融合方面:一是人机交互的商业化系统的出现,二是关于人机交互的信息抽取和知识融合的学术论文也开始。


在他看来,知识图谱表示学习与推理也取得了很多进展,大家开始研究知识表示学习在多模态数据上的应用,即结合文本、知识图谱、图像或者视频的知识表示学习,以及基于知识表示学习的推理。

从通用走向领域:广泛复杂的场景

知识图谱从以前研究与产业界脱钩,到现在领域知识图谱成为研究的重点,开始面向解决实际的问题。比如最近司法知识图谱的构建出现了不少研究成果。另外,知识图谱用于解决问答、推荐系统、图像理解方面的论文也不断在增加。


同时,知识图谱在不同行业也得到了广泛应用,领域知识图谱成为企业的迫切需求。例如,金融领域中的信用评估、风险控制、反欺诈问题;医疗领域中的智能问诊问题。从通用知识图谱到领域知识图谱,知识图谱开始在越来越广泛、复杂的场景中落地并解决实际问题。


“在医疗、电商、金融、军工、电力、司法、教育、公安、石油这几个领域知识图谱已经落地并且取得了突出成果。”漆桂林谈到。知识图谱可以帮助这些领域的公司或研究机构更好地处理多源异构数据,也就是说可以提供一个统一数据模型并且可以灵活地集成和关联这些数据,对这些数据进行关联分析。

知识图谱产学研相辅相成


“知识图谱的产学研需要有一个整体规划,这也是我一直在实践的。”漆桂林表示。


在他看来,首先需要了解产业界对知识图谱的需求,知道知识图谱可以解决什么应用问题,带来什么价值。


其次,通过了解知识图谱落地的挑战,确定知识图谱的研究课题。


从短期和长期来看,短期课题是要解决产业界急迫的问题,比如少量标注情况下的信息抽取方法的研究;而长期课题是面向三年之后可能对知识图谱落地有用的技术,比如无标注场景下的信息抽取技术。


最后,让知识图谱技术可以快速普及。为了进一步贯彻知识图谱的产学研,漆桂林还联合学界、工业界的专家共同成立了 OpenKG 联盟。


漆桂林简介

漆桂林,东南大学教授,博士生导师,东南大学认知智能研究所所长。现任中国中文信息学会语言与知识计算专业委员会副主任和中国科学技术情报学会知识组织专业委员会副主任。2006年,漆教授获得英国贝尔法斯特女皇大学计算机博士学位,导师为人工智能界著名专家 Weiru Liu 教授。2006年8月至2009年8月在德国Karlsruhe大学AIFB研究所做博士后研究,导师为语义 Web 界国际知名专家Rudi Studer教授。


目前,漆桂林的研究方向为:知识图谱的表示和推理、通用知识图谱构建、情感分析、智能问答、关系抽取、多模态图像处理。


在知识图谱的表示和推理,知识图谱融合和更新,通用知识图谱引擎构建,以及高效、低成本构建知识图谱方面取得了一些成果,包括:


  • 一套并行本体推理引擎和一套规则引擎,可高效处理千万级别本体推理,并且支持本体和规则的混合式推理;

  • 一个通用知识图谱系统,可针对百科数据进行抽取、融合、更新、推理,还可针对各种社交网站数据自动化构建知识分类体系;

  • 一个针对通用知识图谱的问答引擎,可处理复杂问句的问答;

  • 一套在少量标注情况下的知识抽取工具。




OpenKG


开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

640?wx_fmt=jpeg

点击阅读原文,进入 OpenKG 博客。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/479869.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LeetCode 102. 二叉树的层次遍历(BFS)

文章目录1. 题目信息2. 解题1. 题目信息 给定一个二叉树,返回其按层次遍历的节点值。 (即逐层地,从左到右访问所有节点)。 例如: 给定二叉树: [3,9,20,null,null,15,7],3/ \9 20/ \15 7 返回其层次遍历结果:[[3]…

阿里P8架构师谈:微服务Dubbo和SpringCloud架构设计、优劣势比较

本文主要围绕微服务的技术选型、通讯协议、服务依赖模式、开始模式、运行模式等几方面来综合比较Dubbo和Spring Cloud 这2种开发框架。架构师可以根据公司的技术实力并结合项目的特点来选择某个合适的微服务架构平台,以此稳妥地实施项目的微服务化改造或开发进程。 …

数码摄影(扫街)

快门速度: 快门速度是曝光控制的一个重要变量,能够控制光线进入的多少。 快门的速度越快,时间越短,通过的光线就越少,反之,则越多。 在很好光线下,1/125s就能清晰地捕捉到行走中的人物。 阴天…

论文浅尝 | 让“演进知识图谱”带你“瞻前顾后”看世界

本文转载自公众号:爱思美谱。 指导老师 | 傅洛伊 王新兵核心技术成员 | 刘佳琪导读在前面几期的内容中,小编已经为大家介绍了知识图谱的产生历史和基本概念。相信大家已经对知识图谱强大的信息结构化能力有所了解。但是,目前的大部分知识…

做过leader,会数仓,项目经验丰富,能值多少钱?

有个朋友,上个月准备从 Java 转做大数据,一个月过去了,一份面试都没约到,来问我怎么回事。我一看简历,期望年薪 40w,深度也不够,要大项目也没有。我们做大数据的,虽说是薪资高&#…

LeetCode 98. 验证二叉搜索树(中序遍历)

文章目录1. 题目信息2. 解题2.1 递归中序2.2 非递归中序1. 题目信息 给定一个二叉树,判断其是否是一个有效的二叉搜索树。 假设一个二叉搜索树具有如下特征: 节点的左子树只包含小于当前节点的数。 节点的右子树只包含大于当前节点的数。 所有左子树和…

阿里P8架构师谈:Zookeeper的原理和架构设计,以及应用场景

什么是 Zookeeper Zookeeper 分布式服务框架是Apache Hadoop 的一个子项目,它主要是用来解决分布式应用中经常遇到的一些数据管理问题,如: 统一命名服务 状态同步服务 集群管理 分布式应用配置项的管理等 Zookeeper已经成为Hadoop生态系统…

GNN学习一

一、为什么使用图卷积 传动的深度学习方法,比如卷积网络,效果很好,但是它研究的对象是Euclidean data,这种数据的特征就是有规则的空间结构,比如图片是规则的正方形格子,比如语音是规则的一维序列。这些数…

禁术级竞赛刷分技巧:找到跟测试集最接近的有标签样本

文 | 苏剑林单位 | 追一科技编 | 兔子酱不管是打比赛、做实验还是搞工程,我们经常会遇到训练集与测试集分布不一致的情况。一般来说我们会从训练集中划分出来一个验证集,通过这个验证集来调整一些超参数[1],比如控制模型的训练轮数…

论文浅尝 | 最新10篇《知识图谱》论文推荐(ICML, CVPR, ACL, KDD, IJCAI 2019)

本文转载自公众号:专知。【导读】知识图谱一直是研究热点,研究者近年来广泛关注知识图谱嵌入(Knowledge Graph Embedding,简称KGE)方法,在保留语义的同时,将知识图谱中的实体和关系映射到连续的…

详解RPC远程调用和消息队列MQ的区别

谈到分布式架构,就不得不谈到分布式架构的基石RPC。 什么是RPC RPC(Remote Procedure Call)远程过程调用,主要解决远程通信间的问题,不需要了解底层网络的通信机制。 RPC服务框架有哪些 知名度较高的有Thrift&#x…

GNN学习二

基于频谱的图卷积和基于空间的图卷积 (在图上做傅里叶变换?) 图时间空间网络-交通上车流速度和红绿灯

技术动态 | eBay开源分布式知识图谱存储Beam,支持类SPARQL查询

本文转载自公众号:AI前线。作者 | Diego Ongaro,Simon Fell 译者 | 盖磊 编辑 | Natalie AI 前线导读:eBay 工程人员于 5 月 1 日在 官方技术博客 上发布了开源的分布式知识图谱存储 Beam,Beam 实现了事实数据的 RDF 存储&#xf…

2020国内互联网公司的开源项目及Github地址部分汇总

2020国内互联网公司的开源项目及Github地址部分汇总 一、Alibaba 阿里巴巴 阿里巴巴的开源项目很多,都说国内Java公司的技术架构大部分来自阿里系,而且还有很多重量级的项目,例如LVS、Tengine,或者很有实践价值的中间件&#xf…

端到端问答新突破:百度提出RocketQA,登顶MSMARCO榜首

源 | 机器之心开放域问答(Open-domain QA)一直是自然语言处理领域的重要研究课题。百度从面向端到端问答的检索模型出发,提出了RocketQA训练方法,大幅提升了对偶式检索模型的效果,为实现端到端问答迈出了重要的一步。R…

深度剖析RPC框架的核心设计

做过分布式服务端的Java工程师,随着对技术底层的认知的加深,都会或多或少的会去想: 一个RPC框架需要考虑的问题有哪些,如何来解决? 下面我们围绕RPC通信框架,从如何实现这个角度做一个剖析,以及每个环节能…

LeetCode 200. 岛屿数量(图的遍历)

文章目录1. 题目信息2. 解题2.1 DFS2.2 BFS1. 题目信息 给定一个由 ‘1’(陆地)和 ‘0’(水)组成的的二维网格,计算岛屿的数量。一个岛被水包围,并且它是通过水平方向或垂直方向上相邻的陆地连接而成的。你…

论文浅尝 | 引入“引用”的语言模型

笔记整理:杨帆,浙江大学硕士,研究方向知识图谱.论文链接:https://arxiv.org/pdf/1611.01628.pdf动机Referring expression(RE)在自然语言中十分常见,并且在信息交流中扮演了十分重要的角色&…

短文本语义匹配/文本相似度框架(SimilarityNet, SimNet),基于bow_pairwise模式及框架原理介绍

用PaddlePaddle实现段文本语义匹配Simnet模型 https://aistudio.baidu.com/aistudio/projectdetail/124373 Hinge loss: https://blog.csdn.net/hustqb/article/details/78347713 原文链接:https://blog.csdn.net/qq_33187136/article/details/10677043…

卖萌屋招人啦!

萌萌的小夕突然出现~这次来寻找小伙伴一起建设小屋啦!本期提供四种通道可直达卖萌屋核心腹地!小编/作者日常:发现,拍脑袋,然后写写写外部投稿的审核与编辑基本条件:对NLP、CV、IR、Rec、Ads、DM…