知识图谱与LLMs:实时图分析(通过其关系的上下文理解数据点)

大型语言模型 (LLM) 极大地改变了普通人获取数据的方式。不到一年前,访问公司数据需要具备技术技能,包括熟练掌握各种仪表板工具,甚至深入研究数据库查询语言的复杂性。然而,随着 ChatGPT 等 LLM 的兴起,随着所谓的检索增强型 LLM 应用程序的兴起,隐藏在私人数据库中或可通过各种 API 访问的丰富知识现在比以往任何时候都更容易获得。

检索增强生成应用程序。

检索增强应用程序背后的想法是从各种来源检索更多信息,以便 LLM 生成更好、更准确的结果。OpenAI 似乎也注意到了这一趋势,他们最近推出了 OpenAI函数。新的 OpenAI 模型经过训练,可以使用为函数(或其他库所称的工具))提供参数,这些函数的签名和描述在上下文中传递,以便在查询时根据需要检索更多信息。

我们观察到,在检索增强应用中,向量相似性搜索具有很强的偏向性。如果您在过去三个月内打开过 Twitter 或 LinkedIn,您可能已经看到过各种“与 PDF 聊天”应用。在这些示例中,实现相对简单。文本从 PDF 中提取,根据需要拆分成块,最后连同其文本嵌入表示一起存储在向量数据库中。

这类应用的入门门槛很低,特别是当你处理少量数据时。如今发表的很多文章给人的印象是只有矢量数据库才适用于检索增强应用,这真是令人着迷。

虽然基于向量相似度的非结构化文本信息检索具有巨大的潜力,但我们相信结构化信息在 LLM 应用中发挥着重要作用。

上次我们写了关于多跳问答以及知识图谱如何帮助解决从多个文档中检索信息以生成准确答案的问题。此外,我们暗示向量相似性搜索不是为分析工作流设计的,因为我们依赖结构化信息。

例如,以下问题:

  • 谁可以把我介绍给 Emil Eifrém(Neo4j 的首席执行官)?
  • ALOX5 基因与克罗恩病有何关系?
  • 当我们的某个微服务出现中断时,它会对我们的产品产生什么影响?
  • 航班延误是如何在网络中传播的?
  • 哪些用户可以为社交媒体帖子的病毒式传播做出贡献?

所有这些问题都需要高度关联的信息才能准确回答问题。例如,要了解谁可以把你介绍给埃米尔,你需要有关人际关系的信息。

另一方面,您需要映射微服务和产品之间的依赖关系,以评估特定微服务故障的规模和严重程度。

在这篇博文中,我们将介绍一些您可能希望在 LLM 应用程序中实现的实时图形分析的常见用例。

寻找(最短)路径

关系是原生图形数据库中的头等公民。尽管知识图谱允许您执行典型的聚合和过滤来回答诸如“本周我们获得了多少客户?”之类的问题,但我们将更多地关注以遍历关系为主要组成部分的分析用例。一个这样的例子是找到数据点之间的最短或所有可能路径。例如,要回答这个问题:

谁可以把我介绍给 Emil Eifrem?

我们必须在图中找到我和埃米尔·艾弗莱姆之间的最短路径。

单一最短路径
单一最短路径

实时查找最短路径的另一个有用用例是任何类型的运输、物流或路线规划应用程序。在这些应用程序中,您可能需要评估前 N 条最短路径,以确保在发生意外情况时有某种后备计划。

罗马站点间最短的两条路径

此图显示了罗马两站之间的前 2 条最短路径。这些最短路径可针对距离、时间、成本或组合进行优化。

另一个在 LLM 申请中寻找数据点之间路径的领域是生物医学领域。在生物医学领域,你要处理基因、蛋白质、疾病、药物等。也许更重要的是,这些实体并不是孤立存在的,而是相互之间存在复杂的、通常是多层的关系。

例如,一个基因可能与多种疾病有关,一种蛋白质可能与许多其他蛋白质相互作用,一种疾病可能可以通过多种药物治疗,一种药物可能对不同的基因和蛋白质产生多种影响。

鉴于可用的生物医学数据量惊人,这些数据点之间的潜在关系数量是巨大的,非常适合以知识图谱的形式来表示。

使用Hetionet 数据集查找克罗恩病和 ALOX5 基因之间的所有最短路径。

生物医学知识图谱可以支持 LLM 应用程序,其中用户有兴趣回答以下问题

ALOX5 基因与克罗恩病有何关系?

虽然我们今天看到的大多数 LLM 应用程序都以自然语言生成答案,但也有一个绝佳的机会以线、条甚至网络可视化的形式返回响应。通常 LLM 甚至可以返回图表库所需的配置结构。

网络传播信息

另一个强大的知识图谱匹配是具有依赖关系网络的域。例如,您可以拥有一个包含系统完整微服务架构的知识图谱。这样的知识图谱将允许您为 DevOps 聊天机器人提供支持,使您能够实时评估架构并执行假设分析。

微服务与人员图表

 

我想到的另一个领域是供应链。

图片来自 Graph Databases for Automotive & Manufacturing Data

将供应链数据纳入知识图谱可以显著增强大型语言应用程序的功能。这种方法使我们能够将复杂的供应链信息结构化为节点和关系,从而生成材料、组件和产品如何从供应商流向客户的整体图景。内在的互连和依赖关系变得显而易见且易于分析。

对于语言应用程序,这可以实现更深入的上下文理解和知识生成。例如,像 ChatGPT 这样的人工智能模型可以利用这种数据结构来对供应链场景、中断或管理策略做出更准确、更有见地的响应。它可以理解和解释某个组件短缺的连锁反应,预测潜在的瓶颈,或提出优化策略。

通过将供应链动态的复杂性与人工智能的认知能力相结合,我们可以增强众多工业和商业环境中大型语言应用的功能和价值。

社会网络分析与数据科学

如果您的公司聊天机器人超越了文档范围,并作为人员分析的一部分帮助提供见解和建议,那会怎样?

图片来自 Neo4j as a Critical Aspect of Human Capital Management (HCM)。

HCM 中的知识图谱可以成为推动公司内部人员分析的宝贵工具,主要通过创建一个强大、互联的信息系统,可以深入、全面地了解员工的行为、技能、能力、互动和绩效。本质上,知识图谱捕获并链接复杂的员工数据(包括人口统计信息、角色历史、项目参与度、绩效指标和技能组合),从而进行多方面的分析。

这种互联数据和机器学习工具的结合使人力资源和团队领导者能够发现隐藏的模式、识别高潜力人才、预测未来表现、评估技能差距并告知培训需求,从而推动数据驱动的决策。通过利用知识图谱,公司可以简化人才管理和发展流程,提高整体组织效率并培养持续学习和改进的文化。

将聊天机器人界面整合到这个知识图谱驱动的人员分析系统中,可能会彻底改变公司处理人力资源和人才管理的方式。具体方法如下:

方便用户访问复杂数据

聊天机器人界面为用户提供了一种直观的对话方式来与复杂的数据集进行交互。员工、经理或人力资源人员无需了解复杂的数据库或分析工具;他们只​​需向聊天机器人询问有关员工绩效、技能或团队动态的问题即可。

该聊天机器人具有自然语言处理能力,可以解释问题,从知识图谱中检索相关信息,并以可理解的格式提供答复。

实时洞察

聊天机器人界面可以提供即时访问数据洞察的功能,从而实现及时决策。

如果经理想知道有多少个项目正在进行中,以及哪些人适合且可以参与特定项目,他们可以询问聊天机器人并实时获得答案,而不必等待全面的报告。

可扩展的培训和支持

聊天机器人可以为员工提供个性化支持,回答有关公司政策、程序或职业发展机会的问题。

它甚至可以根据个人的角色、技能和职业目标提供个性化的培训建议(甚至实际培训本身)。这将使学习和发展资源的获取更加民主化,使员工更容易提高技能或重新学习技能。

预测分析

先进的人工智能聊天机器人可以分析知识图谱中的模式和趋势,从而做出预测,例如哪些员工可能面临离职风险,或者未来哪些技能可能会受到追捧。这些预测分析功能可以帮助公司在人力资源战略方面采取主动而不是被动的态度。

从本质上讲,将聊天机器人界面与知识图谱驱动的人员分析系统相结合,将使复杂的员工数据更易于访问、可操作且对组织的所有成员都更有用。这将彻底改变人才管理和发展,推动人力资源采用更加数据化、主动性和个性化的方法。

总结

总之,随着我们深入大型语言模型时代,我们必须牢记知识图谱在这些应用程序中构建、组织和检索信息的巨大潜力。结构化和非结构化数据检索的结合为更准确、更可靠、更有影响力的结果铺平了道路,超越了自然语言答案,延伸到视觉呈现信息的领域。

尽管基于向量相似性的数据检索(召回率)非常流行,但我们不应低估结构化信息的作用及其为 LLM 应用带来的巨大价值。无论是寻找最短路径、理解复杂的生物医学关系、分析供应链场景,还是通过人员分析彻底改变人力资源,知识图谱的应用都是广泛而深远的。我们相信基于 LLM 的应用的未来是向量相似性搜索方法与 Cypher 等数据库查询语言的结合。

通过这篇博文,我们探索了一些令人兴奋的实时图形分析用例,这些用例可以实现到您的 LLM 应用程序中。这只是一个开始。我们预计未来大型语言模型将与知识图谱更加紧密地协同工作,为现实世界的问题带来更多创新的解决方案。

项目开源地址

NaLLM项目开源地址:GitHub - neo4j/NaLLM: Repository for the NaLLM project

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/45183.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Ubuntu系统安装mysql之后进行远程连接

1.首先要配置数据库允许进行远程连接 1.1 打开MySQL配置文件 /etc/mysql/mysql.conf.d/mysqld.cnf sudo vim /etc/mysql/mysql.conf.d/mysqld.cnf1.2 修改 bind-address 行 #按i进入插入模式 bind-address 0.0.0.0 #按 Esc 键退出插入模式。 #输入:wq 然后按 Enter 保存并退…

React学习笔记02-----

一、React简介 想实现页面的局部刷新,而不是整个网页的刷新。AJAXDOM可以实现局部刷新 1.特点 (1)虚拟DOM 开发者通过React来操作原生DOM,从而构建页面。 React通过虚拟DOM来实现,可以解决DOM的兼容性问题&#x…

Window10下安装WSL-Ubuntu20.04

1.开启并更新WSL 1.1开启WSL 首先先来看一下电脑是否能够开启WSL:待补充... 然后再来看一下如何开启WSL:win->设置->应用->应用和功能->程序和功能,如下所示: 最后选择启用或关闭Windows功能,开启两个选项:1.Hyper-V…

工具推荐|语音轻松记笔记,AI帮你识别和润色

# 你日常有没有遇到这样的场景? 偶尔有一些奇思妙想想要记录下来,但没有一个轻量的工具,往往会想着想着就把这个想法抛之脑后。特别是搞短视频的,你也许希望把当时的想法录下来,稍微剪辑下就能出一条不错的口播视频。…

springboot的JWT令牌

生成JWT令牌 依赖 <!--jwt令牌--> <dependency> <groupId>io.jsonwebtoken</groupId> <artifactId>jjwt</artifactId> <version>0.9.1</version> </dependency> <dependency> <groupId>javax.xml.bind<…

pico+unity预设配置

picosdk中有很多预设的配置、使用预设配置的方法有 1、创建 XR Origin、展开 XR Origin > Camera Offset&#xff0c;选中 LeftHand Controller。点击 XR Controller (Action-Based) 面板右上角的 预设 按钮 2、打开Assets\Samples\XR Interaction Toolkit\2.5.2\Starter A…

Linux--YUM仓库部署及NFS共享存储

目录 一、YUM仓库服务 1.1 YUM介绍 1.2 yum 常用的命令 1.3 YUM 源的提供方式 1.3.1 配置本地 yum 源仓库 1.3.2 配置 ftp 源 1.3.3 配置http服务源 二、NFS 共享存储 2.1 NFS基本概述 2.2 为什么使用 NFS 共享存储 2.3 NFS 应用场景 2.4 NFS 实现原理 2.5 NFS文件…

gitlab 搭建使用

1. 硬件要求 ##CPU 4 核心500用户 8 核心1000用户 ##内存 4 G内存500用户 8 G内存1000用户 2. 下载 链接 3. 安装依赖 yum -y install curl openssh-server postfix wget 4. 安装gitlab组件 yum -y localinstall gitlab-ce-15.9.3-ce.0.el7.x86_64.rpm 5. 修改配置文…

Qt Quick qml自定义控件:qml实现电池控件

qml入门进阶专栏地址:https://blog.csdn.net/yao_hou/category_9951228.html?spm=1001.2014.3001.5482 本篇博客介绍如何使用qml来实现电池控件,效果图如下: 下面给出实现代码 Battery.qml /*电池组件*/import QtQuick 2.15 import QtQuick.Controls 2.15Rectangle {id: b…

音视频开发—使用FFmpeg将YUV文件编码成H264裸流文件 C语言实现

文章目录 1.准备工作2.压缩编码工作流程3.详细步骤1. 初始化日志和参数检查2. 输入/输出文件的打开3. 查找和初始化编码器4. 打开编码器5. 帧内存的分配和初始化6. 设置转换上下文&#xff08;SWS&#xff09;7. 读取和转换数据8. 编码过程9. 资源清理 4.完整示例代码 1.准备工…

熊海CMS漏洞练习平台的一次xss、sql注入、越权黑盒思路分析

简介 熊海CMS是由熊海开发的一款功能丰富的网站综合管理系统&#xff0c;广泛应用于个人博客、个人网站以及企业网站&#xff0c;本文章用于黑盒测试&#xff0c;如果需要「源码审计」后台回复【「CMS」】获取即可&#xff0c;精心准备了40多个cms源码漏洞平台&#xff0c;供宝…

在浏览器控制台中输出js对象,为什么颜色不同,有深有浅

打开console&#xff0c;输入自定义的javascript对象的时候&#xff0c;打开看发现对象的属性是深紫色&#xff0c;后面有一些对象是浅紫色的&#xff0c;比如Array对象和一堆SVG,HTML,CSS开头的对象&#xff0c;常用的prototype和__proto__也是浅紫色的。 请问这里深紫和浅紫…

什么是Maven以及如何配置Maven

T04BF &#x1f44b;专栏: 算法|JAVA|MySQL|C语言 &#x1faf5; 今天你敲代码了吗 文章目录 1.Maven1.1什么是Maven1.2Maven的好处1.3使用idea创建一个Maven项目1.4Maven的核心功能1.4.1项目构建 1.5Maven仓库1.5.2 中央仓库1.5.3 私有服务器(私服) 1.6Maven设置国内源 1.Mave…

[pytorch]常用函数(自用)

一、公共部分 1、torch.linespace 返回一维张量&#xff0c;在start和end之间&#xff08;包括start也包括end&#xff09;的均匀间隔的steps个点&#xff0c;长度为steps。 print(torch.linspace(1,10,3)) #输出tensor([ 1.0000, 5.5000, 10.0000]) print(torch.linspace…

文本分类--NLP-AI(八)

文本分类任务 任务简介1.字符数值化方式1方式2 2.池化&#xff08;pooling&#xff09;3.全连接层4.归一化函数&#xff08;Sigmoid&#xff09;5.总结 从任务抽象新的技术点Embedding层池化层 任务简介 任务介绍&#xff1a; 字符串分类&#xff0c;根据一句话的含妈量&#…

伊利25届校招24年社招网申入职北森测评题库全攻略!一文通!

伊利校招社招网申测评全攻略&#x1f680; 亲爱的求职小伙伴们&#xff0c;今天我要分享一份伊利校招社招网申测评的全攻略&#xff0c;希望能助你们一臂之力&#xff01; 测评概览 伊利的网申测评分为六个部分&#xff0c;总共约60分钟的答题时间&#xff0c;涵盖了言语逻辑、…

【微信小程序开发】如何定义公共的js函数,其它页面可以调用

在微信小程序开发中&#xff0c;可以通过以下步骤定义和使用公共的 JS 函数&#xff0c;使得其它页面可以调用&#xff1a; 1. 创建一个公共的 JS 文件&#xff1a;在项目的 utils 目录下创建一个 JS 文件&#xff0c;例如 utils/util.js。 2. 定义公共函数&#xff1a;在 uti…

在word中删除endnote参考文献之间的空行

如图&#xff0c;在References中&#xff0c;每个文献之间都有空行。不建议手动删除。打开Endnote。 打开style manager 删除layout中的换行符。保存&#xff0c;在word中更新参考文献即可。

Python和C++全球导航卫星系统和机器人姿态触觉感知二分图算法

&#x1f3af;要点 &#x1f3af;马尔可夫随机场网格推理学习 | &#x1f3af;二维伊辛模型四连网格模型推理 | &#x1f3af;统计物理学模型扰动与最大乘积二值反卷积 | &#x1f3af;受限玻尔兹曼机扰动和最大乘积采样 | &#x1f3af;视觉概率生成模型测试图像 &#x1f3…

从课本上面开始学习的51单片机究竟有什么特点,在现在的市场上还有应用吗?

引言 51单片机&#xff0c;作为一种经典的微控制器&#xff0c;被广泛应用于各种嵌入式系统中。尽管如今ARM架构的高性能低成本单片机在市场上占据主导地位&#xff0c;但51单片机凭借其独特的优势依然在某些领域保持着应用价值。本文将深入探讨51单片机的特点、架构、应用以及…