开源开放 | OpenKG发布cnSchema重构版本

cnSchema网站:http://cnschema.openkg.cn/

GitHub地址:https://github.com/cnschema/cnSchema

开放许可协议:CC 0


摘要

cnSchema是由OpenKG管理和维护的面向中文知识图谱的Schema参考标准。结合中文语言特点和中文领域特点需求,cnSchema连接schema.org、WikiData等典型的知识图谱数据标准,为中文领域的知识图谱构建提供一个基础的、共享的、可复用的Schema参考标准。

cnSchema的早期版本由知识图谱资深专家丁力博士牵头设计,并由来自浙江大学、清华大学、东南大学、同济大学、复旦大学、南京大学等多所高校的知识图谱研究者共同参与构建。近期OpenKG组织技术力量对cnSchema进行了重新架构,主要更新内容包括:

1.类层次结构的优化和扩展

2.针对中文领域需求对类及属性进行了扩增和删改

3.新增了支持cnSchema的预训练抽取模型

1. cnSchema重构简介

cnSchema中包含了中文域最常见的概念和属性,围绕人物、机构、地点等最常见的类别定义,cnSchema为每个概念提供了父子概念及可能的属性和关系集合,还为每个属性提供了定义域、值域、子属性、等价关系、逆关系等集合,以帮助形成中文核心概念的简洁稳定的共识,避免重复定义,降低知识图谱构建成本和学习代价,方便大家快速准确复用和拓展中文中的概念。

本次发布的cnSchema V4.0版本对概念和属性进行了全新的翻译拓展,主要包括以下几个方面:

1.Schema.org翻译:根据最新版schema.org(V13),针对schema.org中新增和修改的概念属性进行翻译,并为每个翻译的属性和关系保留schema.org的URI;

2.中文核心概念重构和拓展:顶层概念保留了“动作”、“创作”、“事件”、“服务”、“机构”等10个中文语境下常见的类型,并对较为薄弱的人的概念和属性进行了拓展;

3.中文域特有概念拓增:增加了中文域特有的概念,如“天干地支”、“节气”、“中国传统节日”等。

4.中文域特有属性拓增:增加了中文域特有的属性,如历史人物所具有的“字”、“号”、“朝代”等。

5.支持cnSchema的预训练抽取模型:为便于使用者直接从语料中抽取产生符合cnSchema类型及属性定义的三元组,还发布了支持cnSchema的预训练抽取模型(首批支持20多个类别50多个属性和关系的抽取,后续将持续扩展和更新)。

85489227939ecac9c7f748742a710b31.png下表展示了cnSchemaV4.0的数据及更新概况:

3e59a94a1b5846c5d8ef9deee3607ce1.png

2. 如何使用cnSchema

cnSchema将对外提供基于数据和基于模型的使用方法:

1.下载源数据,进行自主编辑:用户可以在github或cnSchema网站下载最新版的cnSchema数据,包括json/jsonld/xls等格式。cnSchema将发布用于可用于cnSchema编辑的python工具包以及网页版可视化编辑工具,以便用户进行自主编辑和修改。

2.使用基于cnSchema的预训练抽取工具:cnSchema提供了支持cnSchema的预训练抽取工具,该工具可以帮助用户自动构建符合cnSchema定义的知识图谱,目前已支持面向二十多种关系和近五十种概念的三元组抽取。

具体使用方法参考cnschema官方网站:http://cnSchema.openkg.cn

cnSchema会定期更新,欢迎大家试用和提建议。

视频详解:


OpenKG

OpenKG(中文开放知识图谱)旨在推动以中文为核心的知识图谱数据的开放、互联及众包,并促进知识图谱算法、工具及平台的开源开放。

97ffd5d5cd23c1a6b0ac87cdaa6600bb.png

点击阅读原文,进入 OpenKG 网站。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/477614.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Spring Cloud构建微服务架构:分布式服务跟踪(抽样收集)【Dalston版】

通过Trace ID和Span ID已经实现了对分布式系统中的请求跟踪,而这些记录的跟踪信息最终会被分析系统收集起来,并用来实现对分布式系统的监控和分析功能,比如:预警延迟过长的请求链路、查询请求链路的调用明细等。此时,我…

LeetCode 229. 求众数 II(摩尔投票)

1. 题目 给定一个大小为 n 的数组,找出其中所有出现超过 ⌊ n/3 ⌋ 次的元素。 说明: 要求算法的时间复杂度为 O(n),空间复杂度为 O(1)。 示例 1: 输入: [3,2,3] 输出: [3] 示例 2: 输入: [1,1,1,3,3,2,2,2] 输出: [1,2]来源:力扣&#xf…

95后CV工程师晒出工资单:狠补了这个,真香…

许多计算机视觉任务需要对图像进行智能分割,以理解图像中的内容,并使每个部分的分析更加容易。今天的图像分割技术使用计算机视觉深度学习模型来理解图像的每个像素所代表的真实物体,这在十年前是无法想象的。图像分割有助于确定目标之间的关…

论文浅尝 | CAKE:一个用于多视图知识图谱补全的可扩展性常识感知框架

笔记整理:陈子强,天津大学硕士链接:https://aclanthology.org/2022.acl-long.36.pdf动机以往的知识图谱补全仅仅依靠事实级别数据来预测实体之间缺失的关系,这样忽略了有价值的常识性知识。以往的知识图谱嵌入面临无效的负采样和事…

Spring Cloud构建微服务架构:分布式服务跟踪(收集原理)【Dalston版】

在本节内容之前,我们已经对如何引入Sleuth跟踪信息和搭建Zipkin服务端分析跟踪延迟的过程做了详细的介绍,相信大家对于Sleuth和Zipkin已经有了一定的感性认识。接下来,我们介绍一下关于Zipkin收集跟踪信息的过程细节,以帮助我们更…

LeetCode 263. 丑数 264. 丑数 II(DP)

文章目录1. LeetCode 263. 丑数解题2. LeetCode 264. 丑数 IIDP解题1. LeetCode 263. 丑数 编写一个程序判断给定的数是否为丑数。 丑数就是只包含质因数 2, 3, 5 的正整数。 示例 1: 输入: 6 输出: true 解释: 6 2 3示例 2: 输入: 8 输出: true 解释: 8 2 2 2示例 3: …

对比学习效果差?谷歌提出弱语义负样本,有效学习高级特征!

文 | jxyxiangyu编 | 小轶对比学习是 2021 年几大研究热点之一了。如果说预训练模型解决了机器学习对大规模标注数据的需求问题,那么,对比学习可以说是将无监督/自监督学习推广到更一般的应用场景,为苦于标注数据不多的炼丹师们又带来了福音。…

Spring Cloud构建微服务架构:分布式服务跟踪(整合zipkin)【Dalston版】

通过上一篇《分布式服务跟踪(整合logstash)》,我们虽然已经能够利用ELK平台提供的收集、存储、搜索等强大功能,对跟踪信息的管理和使用已经变得非常便利。但是,在ELK平台中的数据分析维度缺少对请求链路中各阶段时间延…

图谱实战 | 阿里新零售多模态知识图谱AliMe MKG的建设与应用

转载公众号 | DataFunSummit分享嘉宾:陈河宏 阿里巴巴 算法工程师编辑整理:李开琦 SHEIN出品平台:DataFunTalk导读:随着知识图谱技术的发展,其在电商、医疗、金融等领域得到了越来越广泛的应用。在过去的几年间&#x…

LeetCode 第 16 场双周赛(402/822,前48.9%)

文章目录1. 比赛结果2. 题目LeetCode 1299. 将每个元素替换为右侧最大元素 easyLeetCode 1300. 转变数组后最接近目标值的数组和 mediumLeetCode 1302. 层数最深叶子节点的和 mediumLeetCode 1301. 最大得分的路径数目 hard1. 比赛结果 做出了2道题,第二道题耽搁时…

CS 期刊哪家强?CCF 发布最新期刊分级目录!

文 | python分级目录中国计算机学会(CCF,就是评ABC类会议的那个机构),在2022年2月19日刚刚发布了《计算领域高质量科技期刊分级目录》。该目录包含T1、T2、T3三类期刊,分别为T1类期刊16本,T2类期刊23本&…

Spring Cloud构建微服务架构:分布式服务跟踪(整合logstash)【Dalston版】

通过之前的入门示例,我们已经为trace-1和trace-2引入了Spring Cloud Sleuth的基础模块spring-cloud-starter-sleuth,实现了为各微服务的日志信息中添加跟踪信息的功能。但是,由于日志文件都离散的存储在各个服务实例的文件系统之上&#xff0…

会议交流 | 第十六届全国知识图谱与语义计算大会(8月24-27日)

点击阅读原文,进入 CCKS2022 官方网站。OpenKGOpenKG(中文开放知识图谱)旨在推动以中文为核心的知识图谱数据的开放、互联及众包,并促进知识图谱算法、工具及平台的开源开放。

1000层的Transformer,诞生了!

卖萌屋今日学术精选大家好,我是卖萌酱。今天下午卖萌屋作者群里一位MILA实验室的大佬在临睡前(蒙特利尔时间凌晨0点半)甩出来一篇论文:大佬表示太困了,肝不动了,于是卖萌酱左手抄起一罐咖啡,右手…

LeetCode 1305. 两棵二叉搜索树中的所有元素(二叉树迭代器)

1. 题目 给你 root1 和 root2 这两棵二叉搜索树。 请你返回一个列表,其中包含 两棵树 中的所有整数并按 升序 排序。. 提示: 每棵树最多有 5000 个节点。 每个节点的值在 [-105, 105] 之间。 2. 二叉树迭代器 按照中序迭代,比较两个迭代…

Spring Cloud构建微服务架构:分布式服务跟踪(跟踪原理)【Dalston版】

通过上一篇《分布式服务跟踪(入门)》的例子,我们已经通过Spring Cloud Sleuth往微服务应用中添加了实现分布式跟踪具备的基本要素。下面通过本文来详细说说实现分布式服务跟踪的一些要点。 分布式系统中的服务跟踪在理论上并不复杂&#xff0…

竞赛报名 | “未来杯”第二届知识图谱锦标赛火热报名中,最高奖金32000元!...

转载公众号 | AI Timer继2021年“未来杯”系列赛事之AI学术联赛暨首届人工智能知识图谱锦标赛成功举办后,中软国际教育科技集团旗下SteerTech科技创新开源生态平台联手AI TIME,再一次迎来人工智能知识图谱应用在众多领域落地的探索旅程。一、组织机构【…

我在鹅厂,拿到满星绩效!

文 | 山竹小鹅背绩效?就算SP以上也背绩效?互联网寒冬?内卷太严重?卷不动?资本家吃相太难看?……听了太多消极言论,有些是陈述事实,也有很多是贩卖焦虑。吐槽能变得更好吗&#xff1f…

2019年学习总结

总结回顾自己学习的过程,看看自己的学习成果,激励自己在2020继续努力。 2019.3 - 2019.9 学习了王争的《数据结构和算法之美》,github 代码地址 统计了 2018.2 至 2019.12 的cpp代码量:41,721‬行 find . -name "*.cpp&qu…

Spring Cloud构建微服务架构:消息驱动的微服务(消费分区)【Dalston版】

通过上一篇《消息驱动的微服务(消费组)》的学习,我们已经能够在多实例环境下,保证同一消息只被一个消费者实例进行接收和处理。但是,对于一些特殊场景,除了要保证单一实例消费之外,还希望那些具…