领域应用 | HiTA知识图谱 “药品-适应证”图谱数据发布!

本文转载自公众号:OMAHA联盟。


              

2019年8月,OMAHA对HiTA知识图谱服务平台(kg.omaha.org.cn)进行了更新,同步发布了医学知识图谱表达模型(schema)。2019年9月17日,首次发布了由OMAHA研发的知识图谱数据资源。发布内容主要围绕“药品-适应证”展开包括1.57万实体9.87万关系,其中约0.5万药品实体来源于“OMAHA七巧板医学术语集”相关药品概念,基本涵盖国内临床常用药品。

同时,为了更好地促进计算机对于知识体系的应用,我们以OMAHA七巧板医学术语集为基础,对药品适应证的内容进行了标准化和概念化,助力系统实现语义层面的互操作。

一、“药品-适应证”关系表达模型

基于中国药典、药品说明书和标签管理规规范、药品说明等资料,总结并构建了药品适应证的关系模型,主要包括三类关系:用药目的、适用人群、适应证,具体关系的解释说明见下表。

表1:“药品-适应证”关系表达模型

关系定义值域
用药目的指用药的最终目标,是治疗或缓解症状还是预防相关疾病等。用药目的
适用人群指适宜用于具有一些相同特征的人群。人群
适应证指药物适用于某种疾病、症状、操作等情况。临床所见
操作
事件

完整的OMAHA知识图谱schema详见:

http://kg.omaha.org.cn/portal/index/Schema

以下为“氯达香豆素(药品)”关系的举例:

640?wx_fmt=png

二、构建方式的说明

(一)数据来源

原始数据来源于各地药品医保目录、药品说明书等开放数据,以及中国药典、药理学等高质量医学资源。

(二)构建规则

1.  通过自然语言处理与文本挖掘技术,采用机器与人工相结合的方式进行构建;

2.  为了药品适应证能够更加精确的表达,将用药目的、适用人群、适应证进行成组表示:

(1)其中各关系数量为:x个用药目的(x≥0)、y类适用人群(y≥0)、z个适应证(z≥1);

(2)每个关系组内用药目的、适用人群、适应证最多只会存在一条,且用药目的、适用人群必须与适应证成组存在,不可单独存在;

(3)若相同适应证存在多个用药目的或多个适用人群,则以多条关系成组存在。

(三)数据标准化与概念化

1.  基于“OMAHA七巧板医学术语集”相关内容,已对知识图谱资源中药品进行了语义消歧和归一,并建了相应的映射关系;

2.  所有适应证属性值的相关概念均通过“OMAHA七巧板医学术语集”进行映射,对“适应证”的文本内容进行充分概念化,而非单纯的适应证文本;

3.  最终所有数据都由专业人员进行了审核,确保内容的正确性。

三、属性值的说明

(一)适应证

药品适应证的取值内容已最大化映射至“OMAHA七巧板医学术语集”中的“临床所见”、 “操作”、 “事件”等领域的概念。

其中,对于目前无法映射到“OMAHA七巧板医学术语集”的实体,我们都与“OMAHA七巧板医学术语集”中的相关概念建立层级关系(is-a)或属性关系,尽可能丰富地表达适应证的语义内涵。

(二)用药目的

OMAHA知识图谱的限定词中“用药目的”类的术语,为可枚举的限定词。部分举例如下:

用药目的

“用药目的”属性的属性值为“用药目的”类, “用药目的”类下面划分“治疗用药”、“辅助治疗用药”、“预防用药”、“诊断用药”、“操作用药”,术语解释如下:

1.  治疗用药:是指一切以解除病痛为核心的用药目的,包括一般意义上的治疗、对症治疗和姑息治疗等;

2.  辅助治疗用药:是指药品在治疗行为过程中起辅助作用,包括消毒用药、康复用药、恶性肿瘤辅助用药等;

3.  预防用药:是指药品用于预防某种疾病的发生,如疫苗接种、健康危险因素预防等;

4.  诊断用药:是指药品用于某种疾病的诊断过程当中,包括直接诊断、辅助诊断等;

5.  操作用药:是指药品用于某项临床操作过程中,如手术用药、检查用药、麻醉用药等。

(三)适用人群

OMAHA知识图谱中 “人群”类的术语,部分举例如下:

适用人群

“适用人群”属性的属性值为“人群”类,主要划分标准为年龄、性别和临床特征等。一些特殊的术语解释和概念定义如下:

1.  新生儿:指出生28天以内的人群;

2.  婴儿:指1岁以内的人群;

3.  幼儿:指1岁至3岁之间的人群;

4.  儿童:指14岁以下的人群;

5.  青少年:指14岁至18岁之间的人群;

6.  青年:指14岁至35岁之间的人群;

7.  育龄女性:指15岁至49岁之间的女性人群;

8.  中老年人:指45岁以上人群;

9.  老年人:指60岁以上人群。

四、数据资源下载的说明

HiTA知识图谱服务平台(hita.omaha.org.cn)向机构用户提供dump数据包下载,包含1.57万实体、9.87万关系,其中0.85万实体与OMAHA七巧板医学术语集建立了直接的映射。具体数据表解释说明如下:

OMAHA知识图谱数据文件为TXT格式,包括实体ID、语义标签、属性名称、属性ID、值、值ID、关系组七个字段,其中每条数据即为一条关系。

  • 实体ID:标识本条关系中的主语,并且为所有实体的唯一ID;

  • 语义标签:标识本条关系中实体的语义类型,具体对应OMAHA知识图谱Schema中语义类型的名称;

  • 属性名称与属性ID:标识本条关系中的属性,具体分别对应OMAHA知识图谱Schema中属性关系的名称和ID;

  • 值与值ID:标识本条关系中的属性值。若本条关系中的属性为数据属性时,值为具体的数据内容,值ID为空;若本条关系中的属性为对象属性时,值为空,值ID为所对应的实体ID;

  • 关系组:标识本条关系所在的关系组,是一个非负整数。当group为0时,则代表本条关系与其他关系均不成组,当group不为0时,则表示本条关系与其他相同group的关系成组存在。

*特殊属性解释:

其中OMAHA概念ID(R013)的属性,指该实体所对应的“OMAHA七巧板医学术语集”中的概念ID标识符。本条属性的建立是为了方便机构用户能够更好地将“OMAHA知识图谱”与“OMAHA七巧板医学术语集”结合起来应用。若实体无该属性,则代表该实体暂时无法映射到“OMAHA七巧板医学术语集”。

数据文件示例如下:

640?wx_fmt=png

本次发布数据的完整介绍详见:

http://wiki.omaha.org.cn/pages/viewpage.action?pageId=31424966

640?wx_fmt=png知识图谱资源获取方式:

第一步:登录HiTA服务平台( hita.omaha.org.cn );

640?wx_fmt=png

第二步:进入“知识图谱”—“下载数据资源”板块,点击相应数据包下载即可。

640?wx_fmt=png

五、联系我们

如您在使用资源过程中有任何问题,可随时通过邮箱或者电话的方式联系我们,同时我们也十分希望得到您对于我们提供的知识图谱服务的反馈和建议。

邮箱:hita@omaha.org.cn

电话:0571-88983625(联系知识图谱服务部,工作时间:9:30-17:30)


OpenKG

开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文,进入 OpenKG 博客。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/479568.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

主题模型综述:短文本、细粒度、加入先验知识、作者写作偏好、主题内涵随时间的变迁、融入词嵌入特性、语言模型加持

原文链接:https://www.zhihu.com/question/34801598/answer/765580727 主题模型当然有用咯,谁用谁知道!这次我来展示下它的7个“变种”(短文本、细粒度、加入先验知识、作者写作偏好、主题内涵随时间的变迁、融入词嵌入特性、语言模型加持)&a…

完全解析:使用Faiss进行海量特征的相似度匹配

文 | Gemfield源 | 知乎Faiss为稠密向量提供高效相似度搜索和聚类,支持十亿级别向量的搜索,是目前最为成熟的近似近邻搜索库。本文从最基本的特征比对开始讲解,中间详细讲解Faiss的环境配置以及使用步骤,最后落脚到为什么我们需要…

LeetCode 173. 二叉搜索树迭代器(中序遍历)

文章目录1. 题目信息2. 二叉树中序遍历1. 题目信息 实现一个二叉搜索树迭代器。你将使用二叉搜索树的根节点初始化迭代器。 调用 next() 将返回二叉搜索树中的下一个最小的数。 示例: BSTIterator iterator new BSTIterator(root); iterator.next(); // 返…

论文浅尝 | 面向时序知识图谱推理的循环事件网络

论文笔记整理:谭亦鸣,东南大学博士生,研究方向为知识库问答。来源:arXiv (short version accepted at ICLR 2019Workshop on Representation Learning on Graphs and Manifolds)链接:https://arxiv.org/abs/1904.05530…

Android实现炫酷的星空变幻效果

二话不说,先上效果图: 这个图是什么意思呢,有没有看到一直在变颜色啊,有没有很像星云变幻呢,有没有很炫,快来看看怎么实现的吧! 这是我们要被处理的原图,实现方式就是通过不断的改变…

美团配送数据治理实践

大数据时代的到来,让越来越多的企业看到了数据资产的价值。将数据视为企业的重要资产,已经成为业界的一种共识,企业也在快速探索应用场景和商业模式,并开始建设技术平台。 但这里要特别强调一下,如果在大数据“拼图”中…

这可能是你近 2 年发论文最好机会!

几年前如果熟练使用TensorFlow,同时掌握基本的AI算法就可以很容易找到一份高薪的工作,但现在不一样了,AI岗位的要求越来越高,对知识的深度也提出了更高的要求。如果现在一个面试官让你从零推导SVM的Dual、从零实现CRF、推导LDA、设…

LeetCode 671. 二叉树中第二小的节点

文章目录1. 题目信息2. 解题2.1 递归查找2.2 改循环1. 题目信息 给定一个非空特殊的二叉树,每个节点都是正数,并且每个节点的子节点数量只能为 2 或 0。如果一个节点有两个子节点的话,那么这个节点的值不大于它的子节点的值。 给出这样的一…

论文浅尝 | 多标签分类中的元学习

论文笔记整理:叶群,浙江大学计算机学院,知识图谱、NLP方向。会议:EMNLP 2019链接:https://arxiv.org/abs/1909.04176Abstract这篇论文首次在多标签分类问题中提出了 meta-learning 的方法,学习weight polic…

从源码角度分析Android系统的异常捕获机制是如何运行的

我们在开发的时候经常会遇到各种异常,当程序遇到异常,便会将异常信息抛到LogCat中,那这个过程是怎么实现的呢? 我们以一个例子开始: import android.app.Activity; import android.os.Bundle;public class MainActivit…

法律规则鬼畜图解||全面易懂的旅游投诉赔偿标准

法律规则鬼畜图解||全面易懂的旅游投诉赔偿标准https://zhuanlan.zhihu.com/p/82878902 执笔人:张宗保律师(联系方式:知乎私信)执业地域:深圳市执业方向:民商事诉讼一、赔偿标准的适用前提只有在旅游者和旅…

美团技术十年:让我们感动的那些人那些事

时光荏苒,美团十岁了,美团技术团队也走过了十个春秋。 2010年3月4日美团网上线的时候,整个公司总共十来人,在一套三居室的民房里起步。其中技术团队只有5个人,现在有4位还在美团。 今天,美团是中国市值第三…

LeetCode 113. 路径总和 II(回溯)

文章目录1. 题目信息2. 解题1. 题目信息 给定一个二叉树和一个目标和,找到所有从根节点到叶子节点路径总和等于给定目标和的路径。 说明: 叶子节点是指没有子节点的节点。 示例: 给定如下二叉树,以及目标和 sum 22,5/ \4 8/ / \11 1…

开放开源 | DeepKE:基于深度学习的开源中文关系抽取工具

本文转载自公众号:浙大 KG。作者:余海阳机构:浙江大学代码地址: https://github.com/zjunlp/deepkeOpenKG 发布地址: http://openkg.cn/tool/deepke一、系统简介关系抽取是知识图谱构建的基本子任务之一,它主要面向非结构化的文本…

微前端在美团外卖的实践

背景 微前端是一种利用微件拆分来达到工程拆分治理的方案,可以解决工程膨胀、开发维护困难等问题。随着前端业务场景越来越复杂,微前端这个概念最近被提起得越来越多,业界也有很多团队开始探索实践并在业务中进行了落地。可以看到&#xff0c…

论文浅尝 | Meta Relational Learning: 基于元关系学习的少样本知识图谱推理

本文转载自公众号:浙大KG。 笔记整理:陈名杨,浙江大学在读博士发表会议:EMNLP-2019论文链接:https://arxiv.org/abs/1909.01515开源代码&…

测试集没标签,可以拿来测模型吗?

文:维建编:白鹡鸰背景正常情况下,我们可以用一个带标签的数据集来测试分类器的表现(称之为测试集)。然而,现实中,因为种种因素的制约(标注成本高、标注难度大等 Google:穷…

从0到1 | 手把手教你如何使用哈工大NLP工具——PyLTP!

原文链接:https://flashgene.com/archives/46041.html 本站内容均来自兴趣收集,如不慎侵害的您的相关权益,请留言告知,我们将尽快删除.谢谢. 作者 | 杨秀璋 来源 | CSDN 博客(CSDN id:Eastmount) 【导语】此文是作者基于 Python 构…

美团智能配送系统的运筹优化实战

深入各个产业已经成为互联网目前的主攻方向,线上和线下存在大量复杂的业务约束和多种多样的决策变量,为运筹优化技术提供了用武之地。作为美团智能配送系统最核心的技术之一,运筹优化是如何在美团各种业务场景中进行落地的呢?本文…

Android如何给无法更改继承关系的Activity更换ActionBar(setContentView方法实战)

前言: 通常我们有时候会直接使用ADT工具直接新建一个Activity页,而这个Activity我们又无法更改它的父类,那遇到这种情况该如何处理呢?其实很简单,好,看如何来解决这个问题: 先来看看这个问题出…