读图数据库实战笔记03_遍历

1. Gremlin Server只将数据存储在内存中

1.1. 如果停止Gremlin Server,将丢失数据库里的所有数据

2. 概念

2.1. 遍历(动词)

2.1.1. 当在图数据库中导航时,从顶点到边或从边到顶点的移动过程

2.1.2. 类似于在关系数据库中的查询行为

2.2. 遍历(名词)

2.2.1. 要在图数据库中执行的一个或多个操作

2.2.1.1. 要么返回数据,要么进行更改

2.2.2. 在关系数据库中与之对应的是实际的SQL查询

2.3. 遍历源(traversal source)

2.3.1. TinkerPop特有的概念

2.3.2. 表示遍历图操作的起点或基点

2.3.3. 通常用变量g表示,并且需要位于任何遍历的开头

2.3.4. 从遍历源开始遍历,通过每个分支发送一个遍历器来遍历图

2.4. 遍历器(traverser)

2.4.1. 与遍历执行特定分支相关联的计算过程

2.4.2. 遍历器维护相关图当前分支移动的所有元数据

2.4.2.1. 当前对象、循环信息、历史路径数据等

2.4.3. 唯一遍历器表示通过数据的每个分支

2.4.4. 可以被删除,也可以带着结果返回

3. 遍历图的过程

3.1. 找到起始顶点,确定要遍历的边,遍历该边,最后到达目标顶点完成遍历

3.2. 遍历图需要我们了解图的结构,我们任何时间在图中的位置,以及每个位置的相邻边、相邻顶点和可用属性

3.3. 遍历图数据库的重点是从一个元素遍历到另一个元素

3.3.1. 在清楚地陈述业务问题并彻底理解用例之后,应该会发现我们的逻辑模型和已识别出的相关模式元素有助于编写遍历

3.4. 通过多个并行进程遍历图

3.4.1. 每个并行进程都称为遍历器

3.5. 遍历是一系列操作

3.5.1. 遍历的每个操作都是从一个位置开始,并且(几乎总是)在不同的位置结束

3.5.2. 每个操作都从上一个操作结束的位置继续

3.6. 遍历需要知道我们在图中的位置

3.6.1. 在关系数据库中,SQL查询能够在查询的任意点连接任意两个表

3.6.2. 在图中,则只能使用图中当前位置旁边的边或顶点

3.6.3. 为了有效地在整个图中导航,必须跟踪我们在图数据模型结构中的位置

3.6.3.1. 最难掌握的技能

3.7. 边的方向很重要

3.7.1. 边的有向性是图数据库的一个关键能力,对于筛选或决定要遍历哪些边非常有用

3.7.2. 关系的这种方向性与关系数据库中不同,后者中的所有关系都是双向的

3.7.3. 在图数据库中,不仅要决定边的方向,还要确定我们希望如何遍历该边

3.7.3.1. 只遍历入边、出边,还是同时遍历两者

3.8. 遍历并不包含历史记录

3.8.1. 在图数据库中,从遍历返回的唯一值是结束顶点

4. 使用Gremlin编写遍历

4.1. TinkerPop允许在Gremlin代码中使用任何模式,因此本身完全避免了模式定义的问题

4.2. 所有图查询语言都普遍需要理解筛选及边的方向性才能在图中移动

4.3. 一旦从关系数据库转移到图数据库里这种根据当前位置来考虑遍历的思考方式,我们就养成了利用数据中关系的必备思维习惯

4.4. 遍历API

4.4.1. 按照惯例以变量g开头:g =graph.traversal()

4.5. 内部API

4.5.1. 专为创建图数据库引擎的开发人员而设计

4.5.2. 图API

4.5.2.1. 就像关系数据库中可以通过C/C++、C#或Java等编程语言直接操纵位于SQL语言抽象之下的具体数据库文件的API

4.5.3. 它是一个接口,用于为Vertex(顶点)、Edge(边)、VertexProperty(顶点属性)和Property(属性)对象的集合定义容器对象

4.5.4. 它也是一种数据结构,不能提供有效的导航方式,只能提供在图中定位单个数据元素的最基本能力

4.6. 谁是Ted的朋友

4.7. api

g.V().has('person', 'first_name', 'Ted').out('friends').values('first_name')
==>Josh

4.7.1. g

4.7.1.1. 表示图的遍历源
4.7.1.2. 是所有遍历的基石
4.7.1.3. 可以任意命名,但是TinkerPop图数据库在事务模式下的惯例是使用g
4.7.1.4. Gremlin的关键概念:g != graph
4.7.1.4.1. g指遍历源,而不是图

4.7.2. V()操作

4.7.2.1. 返回一个包含图中每个顶点的迭代器
4.7.2.2. 两个全局图操作之一
4.7.2.3. 另一个全局图操作是E()
4.7.2.3.1. 返回一个包含图中每条边的迭代器
4.7.2.3.2. 为了维护或基于数据完整性考虑时才使用
4.7.2.4. 遍历的第二个操作始终是这两个操作之一
4.7.2.5. 使用V()从顶点开始遍历是目前最常见的做法
4.7.2.5.1. 在遍历中,几乎总是从V()开始
4.7.2.6. 为事务操作编写的每次遍历几乎都是从一个或一组顶点开始的

4.7.3. has()操作

4.7.3.1. 筛选操作
4.7.3.2. 它只经过满足以下筛选条件的顶点或边
4.7.3.2.1. 匹配指定的标签(如果指定了)
4.7.3.2.2. 具有与指定键-值对匹配的键-值对
4.7.3.3. hasLabel(label):返回匹配指定标签类型的所有顶点或边
4.7.3.4. has(key,value):返回匹配指定键-值对的所有顶点或边
4.7.3.5. has(label,key,value):返回同时匹配标签类型和指定键-值对的所有顶点或边
4.7.3.5.1. g.V().hasLabel('person').has('first_name', 'Ted')
4.7.3.5.1.1. 等同
4.7.3.6. 出于负载和性能的考虑必须尽快缩减起始遍历器的数量
4.7.3.7. 起始位置越少通常意味着遍历图的总体工作量越少
4.7.3.7.1. 在遍历的第一个操作中将可能的顶点筛选为具有一个或多个has()操作的小子集是很常见的

4.7.4. out(label)操作

4.7.4.1. 遍历操作
4.7.4.2. 遍历所有出边到带有指定标签的相邻顶点(如果指定了标签)
4.7.4.3. 如果没有指定标签,那么就会遍历所有出边
4.7.4.4. 沿任一方向遍历关系的灵活性是图数据库的基本功能,但也可能是一把双刃剑
4.7.4.5. 方向性会筛选我们的遍历,虽然既有助于可读性又有助于性能,但也有局限性
4.7.4.6. 另一个常见的遍历操作是in(label),它将遍历所有入边到带有指定标签的相邻顶点(如果指定了标签)
4.7.4.7. both(label)
4.7.4.7.1. 沿着给定标签的边从一个顶点遍历到相邻顶点
4.7.4.7.2. 同时在入和出两个方向遍历边

4.7.5. values(keys...)操作

4.7.5.1. 值操作检索属性
4.7.5.2. 返回元素属性的值
4.7.5.3. 如果元素有N个属性,那么输出将包含N行
4.7.5.4. 如果指定了一个或多个键,则仅返回具有这些键的属性
4.7.5.5. valueMap(keys...),它返回匹配这些键的属性(包括键和值)

5. 递归遍历

5.1. 循环遍历

5.2. 处理需要连续多次执行遍历某些部分的问题

5.2.1. 物料清单

5.2.1.1. 标准物料清单由多个零件组成,每个零件又由多个零件组成,这些零件还是由多个零件组成

5.2.2. 地图导航

5.2.2.1. 给定地图上的两个位置,提供从起始位置到结束位置的街道和转弯的列表
5.2.2.2. 尽管这两个位置是相连的,但是无法提前预测所需的转弯次数

5.2.3. 任务依赖关系

5.2.3.1. 对于每一个项,都可以将其链接到任何它依赖的工作项,也就是说在图中将这些项连接到它们的依赖项,以此类推

5.3. 图数据库是为处理高度互连的数据而优化过的,因此图数据库的查询语言和底层数据结构也经过优化,能快速执行递归查询

5.3.1. 在关系数据库中,这可能会通过递归CTE来处理,很难编码和维护

6. 使用Gremlin编写递归遍历

6.1. 为Ted找到“朋友的朋友”

6.2. api

g.V().has('person', 'first_name', 'Ted').out('friends').out('friends').values('first_name')
==>Hank

6.3. api

 g.V().has('person','first_name','Ted').repeat(out()).until(has('person','first_name','Dave')).values('first_name')

6.3.1. repeat(traversal)

6.3.1.1. 重复循环遍历操作,直到接收到停止指示为止
6.3.1.2. traversal参数表示要在循环中重复的一组Gremlin操作

6.3.2. until(traversal)

6.3.2.1. repeat()循环的修饰符
6.3.2.2. traversal参数表示要为每次循环计算一遍的一组Gremlin操作
6.3.2.3. 当traversal参数里的计算结果为true时,退出repeat()操作
6.3.2.4. 对于不知道需要递归多少次的情况,使用until()操作
6.3.2.5. until()操作允许持续循环,直到满足指定的条件为止
6.3.2.6. 可能会产生性能问题,因为遍历会一直运行到满足条件为止
6.3.2.7. 如果条件从未满足,则继续执行,直到耗尽图中所有可能的路径
6.3.2.7.1. 无界遍历
6.3.2.8. 建议使用times()操作指定最大迭代次数,或者使用timeLimit()操作指定时间限制

6.3.3. 如果until()操作在repeat()操作之前,则循环作为while-do循环运行

6.3.3.1. 在循环开始就检查
6.3.3.2. 可能根本不执行
6.3.3.3. api
g.V().has('person', 'first_name', 'Ted').until(has('person', 'first_name', 'Hank')).repeat(out('friends')).values('first_name')
==>Hank

6.3.4. 如果until()操作在repeat()操作之后,则循环作为do-while循环运行

6.3.4.1. 在循环末尾才检查表达式
6.3.4.2. 总是至少执行一次

6.4. api

g.V().has('person', 'first_name', 'Ted').repeat(out('friends')).times(2).values('first_name')
==>Hank

6.4.1. times(integer)

6.4.1.1. repeat()循环的修饰符
6.4.1.2. integer参数表示要循环执行的次数

6.5. api

g.V().has('person', 'first_name', 'Ted').until(has('person', 'first_name', 'Hank')).repeat(out('friends')).emit().values('first_name')
==>Josh
==>Hank
==>Hank

6.5.1. emit()操作

6.5.1.1. emit()操作通知repeat()操作在循环当前位置发送值到控制台
6.5.1.2. emit()操作与until()操作类似,放在repeat()操作之前或之后会影响它的行为
6.5.1.3. 如果emit()放置在repeat()之前,会包含起始顶点
6.5.1.4. 如果emit()放置在repeat()之前,会包含起始顶点
6.5.1.5. 仅仅更改emit()操作的位置也会修改递归循环的结果
6.5.1.5.1. 灵活性是以增加复杂性为代价的

6.6. 如果将在图中编写递归查询的简单性与在SQL中回答相同类型问题的复杂性进行比较,你会开始注意到为什么图数据库擅长回答这类问题

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/123583.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Miniconda、Vscode下载和conda源、pip源设置

1、常用软件下载 1、Miniconda软件下载: windows网址:https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/?CS&OA 2、最新版Miniconda下载网址:https://docs.conda.io/projects/miniconda/en/latest/ 3、常用代码编辑器VsCode下…

IDE的组成

集成开发环境(IDE,Integrated Development Environment )是用于提供程序开发环境的应用程序,一般包括代码编辑器、编译器、调试器和图形用户界面等工具。集成了代码编写功能、分析功能、编译功能、调试功能等一体化的开发软件服务…

山西电力市场日前价格预测【2023-10-30】

日前价格预测 预测说明: 如上图所示,预测明日(2023-10-30)山西电力市场全天平均日前电价为309.35元/MWh。其中,最高日前电价为400.33元/MWh,预计出现在18:15。最低日前电价为0.00元/MWh,预计出…

Openssl数据安全传输平台014:OCCI的安装配置和使用:Centos8-Oracle19c代码跑通 + Window代码没跑通(不影响本项目)

文章目录 0 代码仓库1 启动Centos oracle数据库2 Winsows安装配置OCCI库2.1 下载文件2.2 VS 配置2.2.1 VC包含目录2.2.2 VC库目录2.2.3 连接器-附加依赖项2.2.4 代码测试-Oracle11g2.2.4.1 准备2.2.4.2 代码测试 3 Centos安装配置occi库3.1 下载instantclient库文件压缩包3.2 w…

Spring Cloud Gateway + Knife4j 4.3 实现微服务网关聚合接口文档

目录 前言Spring Cloud 整合 Knife4jpom.xmlapplication.ymlSwaggerConfig.java访问单服务接口文档 Spring Cloud Gateway 网关聚合pom.xmlapplication.yml访问网关聚合接口文档 接口测试登录认证获取登录用户信息 结语源码 前言 youlai-mall 开源微服务商城新版本基于 Spring…

考点之数据结构

概论 时间复杂度和空间复杂度是计算机科学中用来评估算法性能的重要指标。 时间复杂度: 时间复杂度衡量的是算法运行所需的时间。它表示算法执行所需的基本操作数量随着输入大小的增长而变化的趋势。 求法: 通常通过分析算法中基本操作执行的次数来…

国际阿里云CDN加速OSS资源教程!

当您需要加速OSS上的静态资源时,可以通过阿里云CDN加速OSS域名,实现静态资源的访问加速。本文详细介绍了通过CDN控制台实现OSS加速的操作流程和应用场景。 客户价值 阿里云OSS可提供低成本的存储,CDN可以实现静态资源加速分发。使用OSS作为C…

ESM蛋白质语言模型系列

模型总览 第一篇《Biological structure and function emerge from scaling unsupervised learning to 250 million protein sequences 》ESM-1b 第二篇《MSA Transformer》在ESM-1b的基础上作出改进,将模型的输入从单一蛋白质序列改为MSA矩阵,并在Tran…

使用设计模式基于easypoi优雅的设计通用excel导入功能

文章目录 概要整体架构流程代码设计配置类通用API分发器处理器业务逻辑处理service接口策略模型 小结 概要 基于java原生 easypoi结合适配器模式、策略模式、工厂模式设计一个通用的excel导入框架 整体架构流程 代码设计 由上到下,分别讲解代码 配置类 ExcelCon…

Go学习第十六章——Gin文件上传与下载

Go web框架——Gin文件上传与下载 1. 文件上传1.1 入门案例(单文件)1.2 服务端保存文件的几种方式SaveUploadedFileCreateCopy 1.3 读取上传的文件1.4 多文件上传 2. 文件下载2.1 快速入门2.2 前后端模式下的文件下载2.3 中文乱码问题 1. 文件上传 1.1 …

计算机毕业设计选题推荐-周边美食推荐微信小程序/安卓APP-项目实战

✨作者主页:IT毕设梦工厂✨ 个人简介:曾从事计算机专业培训教学,擅长Java、Python、微信小程序、Golang、安卓Android等项目实战。接项目定制开发、代码讲解、答辩教学、文档编写、降重等。 ☑文末获取源码☑ 精彩专栏推荐⬇⬇⬇ Java项目 Py…

kafka3.X基本概念和使用

kafka基本概念和使用 文章目录 kafka基本概念和使用 kafka的概念基本概念Kafka的使用 首先kafka的安装kafka的简单实用和理解搭建集群(3个节点)windows版本环境搭建 本文"kafka的概念"部分是在[初谈Kafka][ https://juejin.im/post/5a8e7f…

VulnHub DC-1

🍬 博主介绍👨‍🎓 博主介绍:大家好,我是 hacker-routing ,很高兴认识大家~ ✨主攻领域:【渗透领域】【应急响应】 【python】 【VulnHub靶场复现】【面试分析】 🎉点赞➕评论➕收藏…

微信小程序 - 页面继承(非完美解决方案)

微信小程序 - 面页继承(非完美解决方案) 废话思路首页 indexindex.jsindex.jsonindex.wxml 父页面 page-basepage-base.jspage-base.wxml 子页面 page-apage-a.jspage-a.wxml 子页面 page-bpage-b.jspage-b.wxml 其它app.jsapp.jsonapp.wxss 参考资料 废…

BI是什么?想要了解BI需要从哪些方面入手?

企业为了执行数字化战略,实行数字化转型,实现数据价值,除了需要相关数字化技术及理念、人才等,还需要借助数字化相关应用,例如商业世界中广受企业欢迎的ERP、OA、CRM等业务信息系统,以及上升势头非常迅猛的…

【STM32】STM32中断体系

一、STM32的NVIC和起始代码中的ISP 1.NVIC(嵌套向量中断控制器) (1)数据手册中相关部分浏览 (2)地址映射时0地址映射到Flash或SRAM (3)中断向量表可以被人为重新映射,一般用来IAP中 (4)STM32采用一维的中断向量表 (5)中断优先级设置有点复杂,后面细说 1…

【排序算法】 归并排序详解!分治思想!

🎥 屿小夏 : 个人主页 🔥个人专栏 : 算法—排序篇 🌄 莫道桑榆晚,为霞尚满天! 文章目录 📑前言🌤️归并排序的思想☁️基本思想☁️归并的思想实现☁️分治法 &#x1f3…

IOC课程整理-20 Spring 应用上下文生命周期

0.目录 1. Spring 应用上下文启动准备阶段 2. BeanFactory 创建阶段 3. BeanFactory 准备阶段 4. BeanFactory 后置处理阶段 5. BeanFactory 注册 BeanPostProcessor 阶段 6. 初始化內建 Bean:MessageSource 7. 初始化內建 Bean:Spring 事件广播器…

计算机毕业设计选题推荐-戏曲文化苑微信小程序/安卓APP-项目实战

✨作者主页:IT研究室✨ 个人简介:曾从事计算机专业培训教学,擅长Java、Python、微信小程序、Golang、安卓Android等项目实战。接项目定制开发、代码讲解、答辩教学、文档编写、降重等。 ☑文末获取源码☑ 精彩专栏推荐⬇⬇⬇ Java项目 Python…

Springboot 使用JavaMailSender发送邮件 + Excel附件

目录 1.生成Excel表格 1.依赖设置 2.代码: 2.邮件发送 1.邮件发送功能实现-带附件 2.踩过的坑 1.附件名中文乱码问题 3.参考文章: 需求描述:项目审批完毕后,需要发送邮件通知相关人员,并且要附带数据库表生成的…