知识图谱笔记

知识图谱

  • 知识分类
    • 陈述性知识
    • 过程性知识
  • 本体(Ontology)
  • 知识库(Knowledge Base)
  • 数据库(Database)
  • 语义网
  • 知识图谱
    • 详细解析
  • 知识图谱的生命周期
    • 知识建模(知识体系构建)
    • 知识获取
    • 知识融合(知识集成)
    • 知识存储、查询和推理(知识服务)
    • 知识推理
    • 知识应用
      • 领域知识图谱的应用
        • 金融证券领域
        • 医疗领域

知识分类

陈述性知识

描述客观事物的性状和关系等静态信息,主要分
为事物、概念、命题三个层次。

  • 事物指特定的事或物
  • 概念是对一类事物本质特征的反映
  • 命题是对事务之间关系的陈述
    • 非概括性命题表示特定事物之间关系
    • 概括性命题描述概念之间的普遍关系

过程性知识

描述问题如何求解等动态信息。

  • 规则描述事物的因果关系
  • 控制结构描述问题的求解步骤

本体(Ontology)

一套对客观世界进行描述的共享概念化体系,对特定领域中概念(对象类型)及其相互关系进行形式化表达。
共享概念化的规范,涉及概念、关系和公理三个要素。
用来进行领域建模或者推理。因此,重点是对数据的定义进行描述,而没有描述具体的实例数据。

树状结构,不同层节点之间是严格的IsA关系。
优点:可以适用于知识的推理。
缺点:无法表示概念的二义性(运动员:体育?人物?)

与此相反的有分类学(Taxonomy)
树状结构,上下位节点之间非严格的IsA关系。
优点:可以表示概念的二义性。(体育–>运动员)
缺点:不适用于推理,无法避免概念冗余(餐厅:美食?机构?地点?)

相当于蛋糕的模具。

知识库(Knowledge Base)

在对各种知识进行收集和整理的基础上,进行形式化表示,按照一定方法存储,并提供相应的知识查询手段,从而使知识有序化,是知识共享和应用的基础。

知识的编码化和数字化就形成知识库。
知识库是服从于本体控制的知识实例及其载体。

相当于蛋糕。

数据库(Database)

计算机科学家为了用电脑表示和存储计算机应用中所需要的数据所设计开发的产品。

相当于存放蛋糕的盒子。

语义网

语义网就是以Web数据的内容(即数据的语义)为核心,用机器能够理解和处理的方式链接起来的海量分布式数据库。
语义网是对现有Web增加了语义支持,它是现有万维网的延伸与变革,其目标是帮助机器在一定程度上理解Web信息的含义,使得高效的信息共享和机器智能协同成为可能。

三大关键技术:XML、RDF和Ontology

  • 可扩展标记语言XML
    一种标准的元数据语法规范
  • 资源描述框架RDF
    一种标准的元数据语义描述规范
  • 本体Ontology
    一种描述客观世界的概念化规范

知识图谱

知识图谱是谷歌公司用来支持从语义角度组织网络数据,从而提供智能搜索服务的知识库。从这个意义上讲,知识图谱是一种比较通用的语义知识的形式化描述框架,它用节点表示语义符号,用边表示符号之间的语义关系。

详细解析

各个具体实例数据只有在满足系统约定的“框架”约束下运用才能体现为“知识”,其中框架(Schema,或称“元知识”)就是对知识的描述和定义,知识框架和实例数据共同构成一个完整的知识系统。
在约定的框架下,对数据进行结构化,并与已有结构化数据进行关联,就形成了知识图谱。
为了将其付诸实现,知识图谱往往需要将自身的框架结构映射到某种数据库系统所支持的框架定义上,必要时可以对数据库进行专门扩展。

因此,知识是认知,图谱是载体,数据库是实现,知识图谱就是在数据库系统上利用图谱这种抽象载体表示知识这种认知内容。

知识图谱以结构化三元组的形式存储现实世界中的实体及其关系。三元组通常描述了一个特定领域中的事实,由头实体尾实体描述这两个实体之间的关系组成。
如:马云的国籍是中国。

  • 头实体:马云
  • 尾实体(有时候称属性值):中国
  • 关系(有时候称属性):国籍

从图结构的角度看,实体是知识图谱中的节点,关系是连接两个节点的有向边。

知识图谱的生命周期

知识建模(知识体系构建)

指采用什么样的方式表示知识,其核心是构建一个本体对目标知识进行描述。

  • 在这个本体中需要定义出知识的类别体系
  • 每个类别下所属的概念和实体
  • 某类概念和实体所具有的属性以及概念之间、实体之间的语义关系
  • 同时也包括定义在这个本体上的一些推理规则

输入:

  • 领域(医疗、金融)
  • 应用场景

输出:领域知识本体

  • 领域实体类别体系
  • 实体属性
  • 领域语义关系
  • 语义关系之间的关系

关键技术:Ontology Engineering

知识获取

知识获取目标是从海量的文本数据中通过信息抽取的方式获取知识,其方法根据所处理数据源的不同而不同。

知识图谱中数据的主要来源有:结构化数据,半结构化数据,非结构化文本数据(纯文本)。

输入:

  • 领域知识本体
  • 海量数据:文本、垂直站点、百科

输出:领域知识

  • 实体集合
  • 实体关系/属性

主要技术:

  • 信息抽取
  • 文本挖掘

知识融合(知识集成)

任务:对不同来源、不同语言或不同结构的知识进行融合,从而对于已有知识图谱进行补充、更新和去重。

输入:

  • 抽取出来的知识
  • 现有知识库
  • 知识本体
    输出:
  • 统一知识库
  • 知识置信度
    关键技术:
  • Ontology Matching
  • Entity Linking

知识存储、查询和推理(知识服务)

任务:研究采用何种方式将已有知识图谱进行存储。
目前大多数基于图的数据结构,存储方式主要有两种形式:RDF格式存储和图数据库。

输入:

  • 大规模知识库知识
    输出:
  • 知识库存储和查询服务
    主要技术:
  • 知识表示
  • 知识查询语言
  • 存储/检索引擎
  • 推理引擎

知识推理

由于处理数据的不完备性,知识图谱中肯定存在知识缺失现象(包括实体缺失、关系缺失)。我们也很难利用抽取或者融合的方法对于缺失的知识进行补齐。因此,需要采用推理的手段发现已有知识中隐含的知识。

知识应用

精准语义搜索,关系搜索,分类浏览,智能问答,推荐,推理。

领域知识图谱的应用

金融证券领域

企业风险评估,反欺诈。

医疗领域

中医药知识服务平台,Watson辅助诊断与治疗,Open PHACTS 新药物发现。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/333839.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

nslookup 包含在那个包中_nslookup命令详解

Nslookup 是一个监测网络中DNS服务器是否能正确实现域名解析的命令行工具。它在 Windows NT/2000/XP(在之后的windows系统也都可以用的,比如win7,win8等) 中均可使用,但在Windows 98中却没有集成这一个工具。Nslookup 必须要安装了TCP/IP 协议的网络环境之后才能使用…

java ee 8 api_Java EE 8安全性API:概述

java ee 8 api新的安全性API Java EE 8中添加的最重要的一项新功能可能就是新的安全性API。 此新API的主要动机是简化,标准化和现代化跨容器和实现处理安全性问题的方式。 他们做得很好。 由于三个新的注释使web.xml文件声明多余,Web身份验证的配置已实…

Linux 命令之 ln -- 为文件创建链接

文章目录一、命令介绍(一)符号链接的特点(二)硬链接的特点二、命令格式三、常用选项四、命令示例(一)创建硬链接(二)创建软链接一、命令介绍 Linux 具有为一个文件起多个名字的功能…

计算机网络笔记----概述

参考计算机网络自顶向下第七版和计算机网络谢希仁第七版计算机网络和Internet什么是互联网?具体构成描述互联网服务提供商(ISP)服务描述什么是协议?协议分层应用层(最高层)传输层(运输层)网络层:数据链路层和局域网物理层网络边缘接入网家庭接…

prima evb_用Priam设置Cassandra

prima evb前面已经解释了如何在AWS中设置Cassandra 。 所描述的设置有效,但在某些情况下可能还不够。 例如,它不能为您提供制作和还原备份的简便方法,添加新节点依赖于自定义python脚本,该脚本会随机选择一个种子。 因此&#xf…

Java 9:Process API的增强

Java 9对Process API进行了各种改进,用于控制和管理操作系统进程。 获取有关流程的信息 有一个新的ProcessHandle类,提供了进程的pid,父级和后代,以及有关开始时间和累积CPU时间的信息。 jshell> Process p new ProcessBui…

HTTP的操作过程

HTTP的操作过程 HTTP协议定义了浏览器(即万维网客户进程)怎样向万维网服务器请求万维网文档,以及服务器怎样把文档传送给浏览器。HTTP是面向事务(一系列的信息交换,不可分割的整体)的应用层协议,它是万维网上能够可靠…

什么是绝对值?

绝对值是指一个数在数轴上所对应点到原点的距离,用 | | 来表示。|b-a| 或 |a-b| 表示数轴上“表示a的点”和“表示b的点”的距离。 正数 x 的绝对值表达式:| x | x,负数 x 的绝对值表达式:| x | -x,0 绝对值表达式&…

viewer vue 文档_vue中使用viewerjs

项目创建vue init webpack mytest001安装viewerjsnpm install viewerjs删掉生成的项目里面的helloWord.vue 修改路由 创建一个index.vueindex.vue代码:import Viewer from viewerjs;import viewerjs/dist/viewer.css;export default {name: HelloWorld,data() {return {imgArr:…

junit junit_JSON的JUnit Hamcrest Matcher

junit junit这篇文章展示了如何编写JUnit测试来检查对象是否与JSON字符串匹配。 如果您要实现REST服务并想测试您的服务是否产生了预期的JSON响应,那么这非常重要。 JSONassert是比较JSON对象的有用库。 首先,您必须将Java对象转换为JSON字符串&#xf…

HTTP报文格式

HTTP报文格式 HTTP规范[RFC 1945;RFC 26167;RFC 7540:包含了对HTTP 报文格式的定义。HTTP 报文有两种:请求报文和响应报文。 HTTP请求报文 从客户向服务器发送请求报文。 结构如图: 开始行 第一行为开始行也叫做…

什么是公倍数

公倍数(common multiple)是指在两个或两个以上的自然数中,如果它们有相同的倍数,这些倍数就是它们的公倍数。公倍数中最小的,就称为这些整数的最小公倍数(lowest common multiple)。 A和B,A/BC&#xff0c…

代理服务器

代理服务器 是一种网络实体,又称万维网高速缓存。代理服务器把最近的一些请求和响应暂存在本地磁盘中。 当新请求到达时, 若代理服务器发现这个请求与暂时存放的请求相同, 就返回暂存的响应, 而不需要按URL的地址再次去互联网访问…

json解析对象时指定解析_不解析,使用解析对象

json解析对象时指定解析将面向对象的后端与外部系统集成的传统方式是通过数据传输对象 ,这些对象在外出之前先序列化为JSON,然后在返回时反序列化。 这种方法很流行,而且是错误的。 序列化部分应该由打印机代替,我在前面已经解释过…

centos7设置键盘类型_CentOS 7 系统区域(语言)和键盘设置

即使是在window中,平常说的语言设置这一项也是归类为系统区域,CentOS可以通过修改/etc/locale.conf配置文件或使用localectl命令来进行设置,一般在安装时设置为默认选择(英文、美式键盘)即可。 修改locale.conf [root@localhost ~]#vim /etc/locale.conf LANG="en_US.U…

什么是公约数/公因数

公约数,亦称“公因数”。它是指能同时整除几个整数的数。如果一个整数同时是几个整数的约数,称这个整数为它们的“公约数”;公约数中最大的称为最大公约数。对任意的若干个正整数,1总是它们的公因数。 例如: 12 和 15…

vue对象拼接_vue 俩个数组对象合并成一个

情况是这样的后端给了几个接口数据 我合成一个 前端小白 勿喷 data(){return{list:[{date:20201, mc : 1 }, {date:20202, mc : 2 }, {date:20203, mc : 3 }, {date:20204, mc : 4, } ], newlist:[ {date:20201, mc : 6, age:12 }, {date:20202, mc : 3, age:12 }, {date:20203…

jdk8 获取上一个月时间_JDK 10:FutureTask获取一个toString()

jdk8 获取上一个月时间我已经很长时间了,对于大多数具有独特属性的Java类,开发人员应该花些时间重写Object.toString() ,即使它仅是由IDE生成的实现或使用诸如Apache之类的库类来实现Commons Lang的ToStringBuilder 。…

什么是质数

质数是指在大于1的自然数中,除了1和它本身以外不再有其他因数的自然数。 质数又称素数。一个大于1的自然数,除了1和它自身外,不能被其他自然数整除的数叫做质数;否则称为合数(规定1既不是质数也不是合数)。…

计算机网络笔记----应用层

应用层应用层协议原理网络应用程序的体系结构客户-服务器体系结构P2P体系结构进程通信进程与计算机网络之间的接口进程寻址可供应用程序使用的运输服务可靠数据传输吞吐量定时安全性因特网提供的运输服务TCP服务面向连接的服务可靠的数据传送服务拥塞控制TCP安全UDP服务应用层协…