PrimeKG:为精准医学分析设计的多模态知识图谱

PrimeKG:为精准医学分析设计的多模态知识图谱

    • PrimeKG简介
    • 数据资源和覆盖范围
    • 构建方法和技术细节
      • PrimeKG多模态知识图谱的概览
      • 构建PrimeKG的过程
      • PrimeKG 数据
    • 多模态特性和临床应用
    • PrimeKG 设计逻辑

 


论文:https://www.nature.com/articles/s41597-023-01960-3

 

PrimeKG简介

PrimeKG,一个面向精准医学的知识图谱,它提供了疾病的整体视图。

PrimeKG整合了20个高质量资源,以4050249种关系描述了17080种疾病,这些关系代表了10个主要的生物学尺度,包括疾病相关的蛋白质扰动、生物学过程和途径、解剖学和表型尺度,以及所有已批准和试验性药物及其治疗作用。

他们将PrimeKG的图形结构与药物和疾病临床指南的文本描述相结合,以实现多模式分析。

与其他知识图谱不同的是,PrimeKG特别强调了包括药物的适应症、禁忌症和非标签用途等通常缺失的药物-疾病关系。

数据资源和覆盖范围

PrimeKG的构建基于包括Bgee基因表达知识库、DisGeNET基因-疾病关联数据库、DrugBank药物数据库在内的20种主要数据资源。

这些资源提供了包括蛋白质、基因、药物、疾病、解剖学结构和生物过程等广泛的生物医学实体数据,确保了知识图谱的丰富性和多样性。

构建方法和技术细节

在构建PrimeKG过程中,我们采用了一系列技术步骤来标准化和整合各种数据资源。

这包括选择适合每种节点的本体、协调数据集到统一格式,并解决不同数据源之间的重叠问题。

此外,我们还对药物和疾病节点进行了临床特征的补充,包括药物的作用机理和疾病的临床描述,以增强图谱的实用性和信息的完整性。

PrimeKG多模态知识图谱的概览

在这里插入图片描述
在子图a中,显示了知识图谱中不同类型的节点及其相互之间的关系。

例如,药物、疾病、基因等节点之间是如何通过不同类型的边相连的。

子图b展示了所有疾病节点在PrimeKG中与其他节点类型的关系。

在子图c中,提供了一个具体案例,展示了自闭症(Autism)和利培酮(Risperidone)之间的路径,以及对应药物和疾病节点的文本描述,这显示了知识图谱的多模态特性。

 

构建PrimeKG的过程


子图a列出了为PrimeKG策划的20种主要数据资源,以及它们如何用于确定不同节点类型的唯一标识符。

子图b和c展示了如何确定节点类型,并从各个数据源中提取不同类型节点之间的关系。

最后,子图d描绘了整个PrimeKG,以及药物和疾病节点的临床特征是如何被集成的。

PrimeKG 数据


PrimeKG中不同类型节点的数量和所占的百分比,以及每种节点类型所对应的数据来源。

例如,疾病节点由来自多个数据源(如CTD、DisGeNET、Disease Ontology等)的信息组成。

多模态特性和临床应用

PrimeKG不仅是一个生物医学数据的集合,它还融合了临床意义深远的文本描述,使其成为一个真正多模态的知识图谱。

这一特性使PrimeKG能够在科研和临床应用中发挥重要作用,特别是通过自闭症谱系障碍的案例研究,我们验证了其在解释疾病临床表现方面的相关性和有效性。

PrimeKG 设计逻辑

问题1: 如何在单一平台上整合分散在不同数据源的生物医学信息?

解法: 数据集成和标准化

  • 子解法1: 选择适合每种节点类型的本体

    • 特征: 确保知识图谱中不同数据源的信息能够相互对应。
    • 例子: 使用MONDO本体统一疾病信息,因为它融合了多个疾病相关的本体,确保了数据的一致性。
  • 子解法2: 将数据格式化为标准化的格式并解决重叠问题

    • 特征: 使不同来源的数据能够兼容并减少重复。
    • 例子: 对药物-疾病关系中的数据进行重叠检查,确保每一种药物或疾病在图谱中只对应一个唯一的节点。
  • 子解法3: 构建一个包含所有关系的网络图

    • 特征: 显示不同生物医学实体之间的关联性。
    • 例子: 在知识图谱中,疾病节点被密集地连接到药物、基因、表型等其他节点类型,揭示了潜在的生物学机制。

 

问题2: 如何使知识图谱支持临床决策和科研?

解法: 加入多模态临床信息

  • 子解法1: 融合文本描述和数值数据

    • 特征: 提供对药物和疾病更全面的理解。
    • 例子: 药物节点不仅包含作用机理的描述,还有分子重量等量化信息,这有助于研究药物动力学和药效学。
  • 子解法2: 更新和维护知识图谱

    • 特征: 确保知识图谱反映最新的科研发现和临床指南。
    • 例子: 通过定期整合新的临床试验数据和治疗指南,PrimeKG能够支持最新的精准医疗研究。

这样的解法组合不仅解决了数据分散和标准化的问题,还确保了知识图谱的实用性和时效性,使其能够适应快速发展的医学领域的需求。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/812824.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

最齐全,最简单的免费SSL证书获取方法——实现HTTPS访问

一:阿里云 优势:大平台,在站长中知名度最高,提供20张免费单域名SSL证书 缺点:数量有限,并且只有单域名证书,通配符以及多域名没有免费版本。并且提供的单域名证书只有三个月的期限。 二&#…

GPDB技术内幕 - SEMI JOIN浅析

GPDB技术内幕 - SEMI JOIN浅析 SEMI JOIN顾名思义,半连接,相对于join字段来说,针对外表的一行记录,内表只要有一条满足,就输出外表记录。注意,这里是仅输出外表记录。GPDB中有几种实现方式,本文…

编译 c++ 编译的艮,一个编译回合下来 的需要换电脑!

研究这些ui 组件。 这的单独给他准备一台电脑了。 不是cmake 版本对不对。就是qt 版本不对。或者vs 版本太低。 sdk 没有包,编译包,需要组件,组件需要 qt5.5 但是 安装6.5.3 一个回和下来, 电脑坏了。随后旧项目 不能编译了&…

实战要求下,如何做好资产安全信息管理

文章目录 一、资产安全信息管理的重要性二、资产安全信息管理的痛点三、如何做好资产安全信息管理1、提升资产安全信息自动化、集约化管理能力,做到资产全过程管理2、做好资产的安全风险识别3、做好互联网暴露面的测绘与管空4、做好资产安全信息的动态稽核管理 “摸…

代码随想录day39 | 动态规划P2 | ● 62 ● 63

62.不同路径 一个机器人位于一个 m x n 网格的左上角 (起始点在下图中标记为 “Start” )。 机器人每次只能向下或者向右移动一步。机器人试图达到网格的右下角(在下图中标记为 “Finish” )。 问总共有多少条不同的路径&…

el-date-picker禁用指定范围的日期

elementUI中el-date-picker禁用指定日期之前或之后的日期 通过配置picker-options配置指定禁用日期&#xff08;pickerOptions写到data里面&#xff09; <el-date-pickerv-model"date"type"date"size"small"value-format"yyyy-MM-dd&qu…

GmSSL-3.1.1编译

1.源码下载&#xff1a; 下载地址&#xff1a;https://github.com/guanzhi/GmSSL/releases选择对应版本下载。 ​ 2.选择要下载的源码包&#xff1a; ​ 2.编译&#xff1a; 2.1 windows编译&#xff1a;打开vs命令行&#xff0c;选择想要编译的版本&#xff0c;x86或x64…

Mongodb入门--头歌实验MongoDB 复制集 分片

一、MongoDB之副本集配置 1.1MongoDB主从复制 主从复制是MongoDB最早使用的复制方式&#xff0c; 该复制方式易于配置&#xff0c;并且可以支持任意数量的从节点服务器&#xff0c;与使用单节点模式相比有如下优点&#xff1a; 在从服务器上存储数据副本&#xff0c;提高了数…

【python】图像边缘提取效果增强方法-高斯模糊

一、介绍 高斯模糊是一种常用的图像处理技术&#xff0c;用于减少图像中的噪声和细节。它通过对图像中的每个像素点进行加权平均来实现模糊效果。具体而言&#xff0c;高斯模糊使用一个高斯核函数作为权重&#xff0c;对每个像素点周围的邻域进行加权平均。这样可以使得每个像…

在【Cencos7】中安装【Nacos】并适配【PostgreSQL】数据库

在【Cencos7】中安装【Nacos-2.3.0】并适配【PostgreSQL】数据库 安装JDK wget命令下载&#xff1a; wget https://repo.huaweicloud.com/java/jdk/8u151-b12/jdk-8u151-linux-x64.tar.gz解压 tar -xzvf jdk-7u80-linux-x64.tar.gz将解压后的目录移动到/opt下 sudo mv jdk…

二叉树遍历算法和应用

二叉树是指度为 2 的树。它是一种最简单却又最重要的树&#xff0c;在计算机领域中有这广泛的应用。 二叉树的递归定义如下&#xff1a;二叉树是一棵空树&#xff0c;或者一棵由一个根节点和两棵互不相交的分别称为根节点的左子树和右子树所组成的非空树&#xff0c;左子树和右…

【前端】解决前端图表大数据配色难题:利用HSL动态生成颜色方案

解决前端图表大数据配色难题&#xff1a;利用HSL动态生成颜色方案 在数据可视化项目中&#xff0c;尤其是当需要绘制包含大量数据点的图表时&#xff0c;一个常见的挑战是如何为每个数据点分配一个独特而又视觉上容易区分的颜色。使用固定的颜色列表可能在数据点数量超过列表限…

信号完整性之特性阻抗那些事儿

原文来自微信公众号&#xff1a;工程师看海&#xff0c;与我联系&#xff1a;chunhou0820 看海原创视频教程&#xff1a;《运放秘籍》 大家好&#xff0c;我是工程师看海。 我们经常说控制阻抗&#xff0c;这个阻抗是什么意思呢&#xff1f; 信号在传输线中&#xff0c;是一步…

使用Android Studio制作一个蓝牙软件 ---(一)

一、创建项目&#xff08;项目名称---BluetoothActivity&#xff09; 二、创建HomeActivity页面 1.点击一个文件夹 --- 鼠标右击 --- 新建 --- Acyivity --- Empty Views Activity 三、创建styles.xml 点击 values文件夹 --- 鼠标右击 --- 新建 --- Values Resource File sty…

【数据结构】04串

串 1. 定义2. 串的比较3. 串的存储结构4. 具体实现5. 模式匹配5.1 常规思路实现5.2 KMP模式匹配算法5.2.1 next数组计算5.2.1 代码计算next数组5.2.2 KMP算法实现 1. 定义 串(string)是由零个或多个字符组成的有限序列&#xff0c;又叫字符串。 一般记为s a 1 , a 2 , . . . ,…

NGO-VMD+皮尔逊系数+小波阈值降噪+重构

NGO-VMD皮尔逊系数小波阈值降噪重构 NGO-VMD皮尔逊系数小波阈值降噪重构代码获取戳此处代码获取戳此处 以西储大学轴承数据为例&#xff0c;进行VMD&#xff0c;且采用NGO进行K a参数寻优 并对分解分量计算皮尔逊相关系数筛选含噪声分量&#xff0c;对其进行小波软硬阈值降噪&a…

C/C++内存泄漏及检测

“该死系统存在内存泄漏问题”&#xff0c;项目中由于各方面因素&#xff0c;总是有人抱怨存在内存泄漏&#xff0c;系统长时间运行之后&#xff0c;可用内存越来越少&#xff0c;甚至导致了某些服务失败。内存泄漏是最难发现的常见错误之一&#xff0c;因为除非用完内存或调用…

【JAVA基础篇教学】第十篇:Java中Map详解说明

博主打算从0-1讲解下java基础教学&#xff0c;今天教学第十篇&#xff1a;Java中Map详解说明。 在 Java 编程中&#xff0c;Map 接口代表了一种键值对的集合&#xff0c;每个键对应一个值。Map 接口提供了一系列操作方法&#xff0c;可以方便地对键值对进行增删改查等操作。本…

模板方法模式:定义算法骨架的设计策略

在软件开发中&#xff0c;模板方法模式是一种行为型设计模式&#xff0c;它在父类中定义一个操作的算法框架&#xff0c;允许子类在不改变算法结构的情况下重定义算法的某些步骤。这种模式是基于继承的基本原则&#xff0c;通过抽象类达到代码复用的目的。本文将详细介绍模板方…

NASA数据集——亚洲夏季季风化学与气候影响项目超高灵敏度气溶胶光谱(UHSAS)数据

ACCLIP_Aerosol_AircraftInSitu_WB57_Data 简介 ACCLIP_Aerosol_AircraftInSitu_WB57_Data 是亚洲夏季季风化学与气候影响项目&#xff08;ACCLIP&#xff09;期间收集的原地气溶胶数据。本数据集收录了来自下一代激光质谱仪&#xff08;PALMS-NG&#xff09;、单颗粒烟尘光度…