开源开放 | OMAHA 联合 OpenKG 发布新冠诊疗图谱数据

本文转载在公众号:OMAHA联盟。


今年新型冠状病毒肺炎爆发期间,大数据、云计算、人工智能等新一代信息技术支撑着我国建立和健全疫情防控机制。知识图谱作为机器认知智能实现的基础之一,是人工智能的重要组成部分,在“抗疫”行动中赋能政府管理、公众健康、交通运输、公共安全等多个领域,为疫情防控助力。

 

目前,虽然我国疫情传播已基本阻断,但境外疫情警报持续拉响,“外防输入,内防反弹”仍是我国防疫策略的重点。国务院联防联控机制科研攻关组专家组组长钟南山院士在9月18日疫情防控策略视频中提到,今年冬天或明年春天疫情应该还会继续存在,同时很可能发生局部地区的爆发。为了助力防控新型冠状病毒肺炎,2020年11月,OMAHA联盟联合OpenKG发布“新型冠状病毒肺炎”诊疗知识图谱,该知识图谱由OMAHA联盟与浙江树人学院树兰国际医学院附属树兰杭州医院、浙江大学传染病诊治国家重点实验室、中国科学院大学宁波华美医院的临床专家协作构建,受国家科技重大专项(2017ZX10204401)和浙江省自然科学基金应急重大项目(编号:LED20H260001)资助。

 

“新型冠状病毒肺炎”诊疗知识图谱采用CC-by SA协议,向行业开放共享。

  • 数据来源

基于国家卫生健康委发布的《新型冠状病毒肺炎诊疗方案(试行第八版)》和《新型冠状病毒肺炎重型、危重型病例诊疗方案(试行第二版)》,构建了“新型冠状病毒肺炎”诊疗知识图谱的Schema,并依照Schema从文献中抽取三元组知识。

图1 “新型冠状病毒肺炎”诊疗知识图谱Schema

  • 构建方法

通过自然语言处理与文本挖掘技术,采用机器与人工相结合的方式进行构建,最终所有数据都由专业人员进行了审核,确保内容的正确性。

  • 数据标准化与概念化

实体通过与“七巧板”医学术语集中的概念进行映射的方式来实现概念化和标准化。

  • 实体数量

“新型冠状病毒肺炎”诊疗知识图谱包含700个实体,实体语义类型的统计见图2。

图2 “新型冠状病毒肺炎”诊疗知识图谱实体语义类型统计

  • 关系数量

“新型冠状病毒肺炎”诊疗知识图谱包含3032条关系,部分关系类型的统计见图3。

图3 “新型冠状病毒肺炎”诊疗知识图谱部分关系类型统计

  • 资源下载

用户可以登录HiTA知识图谱服务平台(hita.omaha.org.cn)下载数据包。下载地址:https://hita.omaha.org.cn/knowledge/kgDownload?num=502

特别鸣谢

汤灵玲(浙江树人学院树兰国际医学院附属树兰杭州医院)

彭   薇(浙江树人学院树兰国际医学院附属树兰杭州医院)

顾钰丹(浙江树人学院树兰国际医学院附属树兰杭州医院)

龚忆雯(浙江大学传染病诊治国家重点实验室)

张佳颖(浙江大学传染病诊治国家重点实验室)

王晶霞(浙江大学传染病诊治国家重点实验室)

金鹏锋(中国科学院大学宁波华美医院)

“汇知”医学知识图谱

“汇知”医学知识图谱是OMAHA联盟发布的医学知识图谱资源的总称,主要切入疾病、手术操作、检验检查、药品的知识,在每个季度第二个月20号定期发布。截止2020年11月,“汇知”已发布“药品适应证”、“临床路径”、“疾病科室”、“心血管专科疾病”、“新型冠状病毒肺炎”领域的知识图谱,共包含8.5万实体、63.0万关系,其中5.4万实体与“七巧板”医学术语集建立了映射,使图谱实体概念化,而非简单的文本堆砌。

联系我们

HiTA服务:hita@omaha.org.cn

数字医学知识中心负责人徐美兰:meilan.xu@omaha.org.cn


OpenKG

开放知识图谱(简称:OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击“阅读原文”,立即下载““新型冠状病毒肺炎”诊疗知识图谱”


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/478632.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LeetCode 498. 对角线遍历

1. 题目 给定一个含有 M x N 个元素的矩阵(M 行,N 列),请以对角线遍历的顺序返回这个矩阵中的所有元素,对角线遍历如下图所示。 输入: [[ 1, 2, 3 ],[ 4, 5, 6 ],[ 7, 8, 9 ] ]输出: [1,2,4,7,5,3,6,8,9]2. 解题 横…

图灵奖得主Jeff Ullman:机器学习不是数据科学的全部!统计学也不是!

文 | Jeff Ullman源 | 智源社区3月31日,2020年图灵奖重磅出炉,颁给了哥伦比亚大学计算机科学名誉教授 Alfred Vaino Aho 和斯坦福大学计算机科学名誉教授 Jeffrey David Ullman。Jeff Ullman 是数据科学领域的巨擘,他的研究兴趣包括数据库理论…

深度学习及AR在移动端打车场景下的应用

本文内容根据作者在美团Hackathon 4.0中自研的项目实践总结而成。作为美团技术团队的传统节目,每年两次的Hackathon已经举办多年,产出很多富于创意的产品和专利,成为工程师文化的重要组成部分。本文就是2017年冬季Hackathon 4.0一个获奖项目的…

开源开放 | 熵简科技 AI Lab 开源金融领域中文预训练语言模型 FinBERT

1 背景及下载地址为了促进自然语言处理技术在金融科技领域的应用和发展,熵简科技 AI Lab 近期开源了基于 BERT 架构的金融领域预训练语言模型 FinBERT 1.0。相对于Google发布的原生中文BERT、哈工大讯飞实验室开源的BERT-wwm 以及 RoBERTa-wwm-ext 等模型&#xff0…

前端如何做极致的首屏渲染速度优化

这里说的极致是技术上可以达到最优的性能。 这里不讨论常见的优化手段,比如:Script标签放到底部、DNS预解析、HTTP2.0、CDN、资源压缩、懒加载等。 这里讨论的是如何使First Contentful Paint的时间降到最低,这个指标决定了白屏的时间有多长…

LeetCode 209. 长度最小的子数组(滑动窗口)

1. 题目 给定一个含有 n 个正整数的数组和一个正整数 s ,找出该数组中满足其和 ≥ s 的长度最小的连续子数组。 如果不存在符合条件的连续子数组,返回 0。 示例: 输入: s 7, nums [2,3,1,2,4,3] 输出: 2 解释: 子数组 [4,3] 是该条件下的长度最小的连…

京东 | NLP人才联合培养计划

01 京东AI项目实战课程安排覆盖了从经典的机器学习、文本处理技术、序列模型、深度学习、预训练模型、知识图谱、图神经网络所有必要的技术。项目一、京东健康智能分诊项目第一周:文本处理与特征工程| Bag of Words模型| 从tf-idf到Word2Vec| SkipGram与CBOW| Hiera…

论文小综 | Pre-training on Graphs

本文转载自公众号:浙大KG。作者:方尹、杨海宏,浙江大学在读博士,主要研究方向为图表示学习。在过去几年中,图表示学习和图神经网络(Graph Neural Network, GNN)已成为分析图结构数据的热门研究领域。图表示学习旨在将具…

初探下一代网络隔离与访问控制

概述 安全域隔离是企业安全里最常见而且最基础的话题之一,目前主要的实现方式是网络隔离(特别重要的也会在物理上实现隔离)。对于很小的公司而言,云上开个VPC就实现了办公网和生产网的基础隔离,但对于有自建的IDC、网络…

LeetCode 189. 旋转数组(环形替换)

1. 题目 给定一个数组,将数组中的元素向右移动 k 个位置,其中 k 是非负数。 示例 1:输入: [1,2,3,4,5,6,7] 和 k 3 输出: [5,6,7,1,2,3,4] 解释: 向右旋转 1 步: [7,1,2,3,4,5,6] 向右旋转 2 步: [6,7,1,2,3,4,5] 向右旋转 3 步: [5,6,7,1,2,3,4]要求…

吴恩达:机器学习应以数据为中心

源 | 新智元今天是吴恩达45岁生日。他是国际最权威的ML学者之一,学生遍布世界各地。在最近的一期线上课程中,吴恩达提出了以模型为中心向以数据为中心的AI。吴恩达发推称,「大家为自己送上最好的礼物就是,观看这个视频观看并提出自…

如何开发小程序开发者工具?

最近集团内部在自研小程序,我负责小程序开发者工具的调试部分。经过一段时间的探索,摸索出不少经过实际检验的可行手段。接下来将会用几篇文章总结一下思路。 文章的内容主要会分为以下几部分: 如何建立逻辑层运行时容器(两种方…

美团点评基于Storm的实时数据处理实践

背景 目前美团点评已累计了丰富的线上交易与用户行为数据,为商家赋能需要我们有更强大的专业化数据加工能力,来帮助商家做出正确的决策从而提高用户体验。目前商家端产品在数据应用上主要基于离线数据加工,数据生产调度以“T1”为主&#xff…

会议交流 | 大规模知识图谱的构建及应用分享

本文转载自公众号:DataFunTalk。论坛出品:张伟 阿里巴巴 资深算法专家分享时间:12月19日,9:00-12:00导读:12月19日,9:00-12:00。在DataFunTalk年终大会上,由阿里巴巴资深…

机器翻译小记

神经网络翻译面临的挑战

赛尔原创 | N-LTP:基于预训练模型的中文自然语言处理平台

论文名称:N-LTP: A Open-source Neural Chinese Language Technology Platform with Pretrained Models论文作者:车万翔,冯云龙,覃立波,刘挺原创作者:冯云龙论文链接:https://arxiv.org/abs/200…

LeetCode 49. 字母异位词分组(哈希)

1. 题目 给定一个字符串数组,将字母异位词组合在一起。字母异位词指字母相同,但排列不同的字符串。 示例:输入: ["eat", "tea", "tan", "ate", "nat", "bat"], 输出: [["ate",…

论文浅尝 - SWJ | 基于知识图谱和注意力图卷积神经网络的可解释零样本学习

论文题目:Explainable Zero-shot Learning via Attentive Graph Convolutional Network and Knowledge Graphs本文作者:耿玉霞,浙江大学在读博士,研究方向为知识图谱、零样本学习、可解释性发表期刊:Semantic Web Jour…

LeetCode 3. 无重复字符的最长子串(滑动窗口+哈希)

1. 题目 给定一个字符串,请你找出其中不含有重复字符的 最长子串 的长度。 示例 1: 输入: "abcabcbb" 输出: 3 解释: 因为无重复字符的最长子串是 "abc",所以其长度为 3。示例 2: 输入: "bbbbb" 输出: 1 解释: 因为无重…