《人工智能导论》知识思维导图梳理【第6章节】

文章目录

  • 第六章 知识图谱
    • 1 知识图谱概述
    • 2 知识图谱相关概念
    • 3 知识图谱的逻辑结构
    • 4 知识图谱的数据存储
    • 5 知识图谱的构建过程
    • 6 例题
  • markdown内容的分享

第六章 知识图谱

在这里插入图片描述

1 知识图谱概述

在这里插入图片描述

2 知识图谱相关概念

在这里插入图片描述

3 知识图谱的逻辑结构

在这里插入图片描述

4 知识图谱的数据存储

在这里插入图片描述

5 知识图谱的构建过程

在这里插入图片描述
在这里插入图片描述

6 例题

在这里插入图片描述

markdown内容的分享

  • 需要的小伙伴,直接创建markdown文件导入xmind食用即可!
# 第六章 知识图谱## 1 知识图谱概述### 知识图谱本质上是一种结构化的语义网络- 其节点代表实体或概念- 边代表实体/概念之间的各种语义关系### 知识图谱(Knowledge Graph)也叫语义网络(Semantic NetWork)。其初衷是为了提升搜索引擎的能力,增强用户的搜索质量以及搜索体验。## 2 知识图谱相关概念### 知识图谱的定义- 知识图谱又称科学知识图谱,用各种不同的图形等可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互关系。- 知识图谱是用图谱的形式表示知识### 知识图谱可以看作一张图,节点表示实体或概念、边表示属性或关系构成- 实体:具有可区别性且独立存在的某种事物- 概念(语义类):具有同种特性的实体构成的集合- 内容:通常作为实体和语义类的名字、描述、解释等,可以由文本、图像、音视频等来表达- 属性值:描述资源之间的关系,即知识图谱中的关系- 关系:把k个图节点(实体、语义类、属性值)映射到布尔值的函数## 3 知识图谱的逻辑结构### 逻辑划分为两个层次- 数据层-  数据层主要由一系列的事实组成,知识以事实(fact)为单位存储在图数据库,通常以“实体1-关系-实体2”或者“实体-属性-属性值”三元组作为事实(fact)的基本表达方式。存储在图数据库中的所有数据将构成庞大的实体关系网络,形成知识的“图谱”。- 模式层- 模式层在数据层之上,是知识图谱的核心。在模式层存储的是经过提炼的知识,通常采用本体库来管理知识图谱的模式层。数据模型是按照本体论的思想勾画出来的数据组织模式,数据模型可以展示数据的组织方式和相互关系。例如:创建动植物的数据模型,可以按照动植物的通用分类标准,使用七个主要级别:界、门、纲、目、科、属、种 。### 逻辑结构的构建方式 - 根据是先确定数据模型再收集具体数据,还是先收集具体数据再确定数据模型,将知识图谱分为自顶向下和自下向上的构建方式- 自顶向下的构建方式,指先确定知识图谱的数据模型,再根据模型去填充具体数据。- 数据模型的设计,是知识图谱的顶层设计,根据知识图谱的特点确定数据模型,就相当于确定了知识图谱收集数据的范围,以及数据的组织方式。- 适用于行业知识图谱的构建,对于一个行业来说,数据内容,数据组织方式相对来说比较容易确定。比如对于法律领域的知识图谱,可能会以法律分类,法律条文,法律案例等的方式组织。- 自下向上的构建方式,是指先按照三元组的方式收集具体数据,然后根据数据内容来提炼数据模型。 - 一般公共领域的知识图谱采用这种方式。- 先把所有的数据收集起来,形成庞大的数据集,然后再根据数据内容,总结数据的特点,将数据进行整理、分析、归纳、总结,形成数据模型## 4 知识图谱的数据存储### 知识图谱的存储方式- 知识图谱的原始数据类型一般来说有三类- 结构化数据(Structed Data):如关系数据库- 半结构化数据(Semi-Structed Data):如XML、JSON、百科- 非结构化数据(UnStructed Data):如图片、音频、视频、文本- 如何存储这三类数据类型- 基于表结构的存储采用二维数据表的方式存储数据,例如三元组表、属性表以及关系数据库- 基于图结构的存储可以使用图数据库- RDF(Resource Description Framework)存储- RDF本质是一个数据模型,它提供了一个统一的标准,用于描述实体/资源。RDF形式上表示为主谓宾SPO三元组。表示实体与实体间的关系(实体1-关系-实体2),或者实体的某个属性的值是什么(实体-属性-属性值)- Subject:通常是实体、事实或者概念中的任何一个。- Predicate:通常是关系或者属性。- Object:既可以是实体、事件、概念,也可以是普通的值。- 图数据库存储- 图数据库的结构定义相比RDF数据库更为通用,实现了图结构中的节点\边以及属性来进行图数据的存储,典型的开源图数据库就是Neo4j。- 节点(node):通常表示实体,例如人员、账户、事件等,节点可以有属性和标签- 边(edge):又被称为关系(relationships),具有名字和方向,并有开始节点和一个结束节点,边是图数据库中最显著的一个特征,在RDBMS中没有对应实现。- 属性(properties):类似KV数据库中的键值对,节点和边都可以有属性## 5 视图图谱的构建过程### 从原始的数据到形成知识图谱,经历[知识抽取、知识表示、知识融合和知识推理]四个过程### 1 知识抽取- 从不同来源、不同结构的数据中进行知识提取,形成知识(结构化数据)存入到知识图谱- 结构化数据处理- 结构化数据,通常是关系型数据库的数据,把关系型数据库中的数据转换为RDF数据(linked data),普遍采用的技术是D2R技术。D2R主要包括D2R Server,D2RQ Engine和D2RRQ Mapping语言。- 半结构化数据处理- 采用包装器的方式进行处理- 包装器是一个能够将数据从HTML网页中抽取出来,并且将它们还原为结构化的数据的软件程序- 包装器归纳主要包括网页清洗、网页标注、包装器空间生成、包装器评估、包装器归纳结果等步骤- 非结构化数据处理- 实体抽取(命名实体识别):实体包括概念,人物,组织,地名,时间- 关系抽取:实体和实体之间的关系- 属性抽取:实体的属性信息### 2 知识融合- 将多个来源的关于同一个实体或概念的描述信息融合起来- 知识融合的目的就是将不同知识库对实体的描述进行整合,从而获得实体的完整描述。### 3 知识加工- 知识加工主要包括三方面内容:本体抽取、知识推理和质量评估- 本体抽取- 本体(ontology)是指公认的概念集合、概念框架,如“人”、“事”、“物”等- 人工编辑- 自动化本体构建- 实体并列关系相似度计算 → 实体上下位关系抽取 → 本体的生成。- 知识推理-  知识推理的对象也并不局限于实体间的关系,也可以是实体的属性值,本体的概念层次关系- 质量评估- 可以对知识的可信度进行量化,通过舍弃置信度较低的知识来保障知识库的质量## 6 例题### 1 在知识图谱的构建中,知识提取包括- [实体抽取]- [关系抽取]- [属性抽取]### 2 在知识图谱中先搜集数据然后建立本体的构建过程,采用了[自下向上]的构建方式 ### 3 知识图谱在逻辑上可以由“实体—关系—实体”三元组,或者“实体-属性—属性值”构成,实体间通过关系相互联结,构成网状的知识结构### 4 从知识图谱数据组织的架构来看,可以把知识图谱的数据分为两个层次,一个是[模式层],另一个是[数据层]

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/225911.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【LeetCode: 2415. 反转二叉树的奇数层 | BFS + DFS】

🚀 算法题 🚀 🌲 算法刷题专栏 | 面试必备算法 | 面试高频算法 🍀 🌲 越难的东西,越要努力坚持,因为它具有很高的价值,算法就是这样✨ 🌲 作者简介:硕风和炜,…

超过 1450 个 pfSense 服务器因错误链而遭受 RCE 攻击

在线暴露的大约 1450 个 pfSense 实例容易受到命令注入和跨站点脚本漏洞的攻击,这些漏洞如果链接起来,可能使攻击者能够在设备上执行远程代码。 pfSense 是一款流行的开源防火墙和路由器软件,允许广泛的定制和部署灵活性。 它是一种经济高效…

python 如何快速注释几行代码

在 Python 中,可以使用 # 符号来注释单行代码,也可以使用三重引号 """ 或单引号 来注释多行代码。但如果要注释掉多行代码,手动的添加注释符号可能会比较麻烦。以下是一些快速注释多行代码的方法: 方法一&#x…

在js中浮点数精度丢失问题及使用bignumber处理高精度小数的数学运算

一、精度丢失: 正常计算:0.1 0.2 0.3 js计算:0.1 0.2 0.30000000000000004 正常计算:1 - 0.9 0.1 js计算:1 - 0.9 0.09999999999999998 正常计算:0.0532 * 100 5.32 js计算:0.0532 * …

中国剩余定理

中国剩余定理 一、问题的引入 一个整数除以3余2、除以5余3、除以7余2,求这个整数?答案:23 所谓中国剩余定理基本思想:知道一个整数对于几个不同的模数的余数,那么可以推断出该整数对于这些模数的最小非负整数解。 …

ChatGPT在指尖跳舞: open-interpreter实现本地数据采集、处理一条龙

原文:ChatGPT在指尖跳舞: open-interpreter实现本地数据采集、处理一条龙 - 知乎 目录 收起 Part1 前言 Part2 Open - Interpreter 简介 Part3 安装与运行 Part4 工作场景 1获取网页内容 2 pdf 文件批量转换 3 excel 文件合并 Part5总结 参考资料 往期推…

算法基础十四

二叉树的最大深度 给定一个二叉树 root ,返回其最大深度。二叉树的 最大深度 是指从根节点到最远叶子节点的最长路径上的节点数。 示例 1: 输入:root [3,9,20,null,null,15,7] 输出:3 示例 2: 输入:root …

2023第十四届蓝桥杯国赛 C/C++ 大学 B 组

文章目录 前言试题 A: 子 2023作者思考题解答案 试题 B: 双子数作者思考题解 试题 C: 班级活动作者思考题解 试题 D: 合并数列作者思考题解 试题 E: 数三角作者思考题解 试题 F: 删边问题作者思考题解 试题 G: AB 路线作者思考题解 试题 H: 抓娃娃作者思考题解 试题 I: 拼数字试…

Android 14 应用适配指南

Android 14 应用适配指南:https://dev.mi.com/distribute/doc/details?pId1718 Android 14 功能和变更列表 | Android 开发者 | Android Developers 1.获取Android 14 1.1 谷歌发布时间表 https://developer.android.com/about/versions/14/overview#timeli…

事务--04---分布式系统唯一ID

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 分布式ID一、什么是分布式系统唯一ID2. 二、分布式系统唯一ID的特点 分布式ID-----实现方案1、使用UUID生成分布式ID2、基于数据库自增ID3、Redis生成ID4、号段模式…

【嵌入式开发 Linux 常用命令系列 14.1 -- .bashrc 定义函数】

上篇文章:【嵌入式开发 Linux 常用命令系列 14 – source hello.sh 和 ./hello.sh 的区别】 文章目录 .bashrc 定义函数 .bashrc 定义函数 在 .bashrc 文件中定义别名时,通常不能直接传递参数。别名是用于创建命令的简写形式,它们不支持参数…

人工智能联盟的首件神兵利器——“Purple Llama” 项目,旨为保护工智能模型安全性

Meta公司(Meta Platform Inc),原名Facebook,创立于2004年2月4日,市值5321.71亿美元。总部位于美国加利福尼亚州门洛帕克。 Meta 公司推出了名为“Purple Llama”的项目,旨在保护和加固其开源人工智能模型。…

WINCC8.0脚本调试方法

前言 WINCC是西门子推出的过程可视化系统(SCADA),是基于PC的HMI系统,兼容WINDOWS各种系统,除了强大的图形系统之外,WINCC还具有在线历史趋势、报警记录、用户管理、用户归档等高级功能,而且WINC…

华为OD机试真题-考古学家-2023年OD统一考试(C卷)

题目描述: 有一个考古学家发现一个石碑,但是很可惜,发现时其已经断成多段,原地发现n个断口整齐的石碑碎片。为了破解石碑内容,考古学家希望有程序能帮忙计算复原后的石碑文字组合数,你能帮忙吗? 输入描述: 第一行输入n,n表示石碑碎片的个数。 第二行依次输入石碑碎片上…

什么是PHP的SOLID原则?

SOLID 是面向对象编程(OOP)中的五个设计原则的首字母缩写,这些原则有助于创建可维护、灵活且可扩展的软件。以下是 SOLID 原则的概述: 单一职责原则(Single Responsibility Principle - SRP): 一…

[Angular] 笔记1:开发设置 , 双向绑定

1 设置开发环境 1.1 安装 node 下载 node,因为要使用 npm 工具,教程中使用 Angualr 14, 最新版 node 20 用不了,安装 node 16 就可以。 1.2 安装 Angular CLI Angular CLI 是用于创建 Angular 工程的工具集,使用如下命令&…

(第61天)多租户架构(CDB/PDB)

背景介绍 Oracle 的 CDB 和 PDB 是 Oracle 12C 及以上版本中引入的新概念,用于管理多租户数据库环境。 Oracle 数据库是商业数据库领域中的翘楚,其强大的功能和高可靠性备受企业用户追捧。而随着云计算和大数据时代的到来,Oracle 也不断推出新的技术以适应这些变化。CDB 技…

我为什么要当程序员?

阿七毕业于上海一所大学的管理学院,在读期间没写过一行 Java 代码。 管理学院,你出来能干啥呀?什么公司,会让你一个刚毕业的学生当管理呢?所有我们学院的同学,很多都跨科目考研、出国、创业。 家里没钱的…

【leetcode】链表总结

说明:本文内容来自于代码随想录 链表基本操作 https://leetcode.cn/problems/design-linked-list/ 删除节点 https://leetcode.cn/problems/remove-linked-list-elements/description/,删除节点,虚拟头节点。定义两个节点,分别…

『OPEN3D』1.5.2 动手实现点云栅格/体素最近邻

本专栏地址: https://blog.csdn.net/qq_41366026/category_12186023.html?spm=1001.2014.3001.5482 NEARBY6实现的voxel可视化 一种NEARBY14实现的可视化voxel