开源开放|CCKS2021入选开放图谱资源简介

笔记整理 | 王萌(东南大学)、张宁豫(浙江大学)


全国知识图谱与语义计算大会(CCKS)由中国中文信息学会语言与知识计算专委会定期举办的国内知识图谱、语义技术等领域的核心会议。知识图谱以结构化的形式描述真实世界中实体间的复杂关系,是认知智能的底层支撑。依托于行业数据和深度学习技术,知识图谱已被广泛应用于诸多产业核心的场景。众所周知,数据的价值是在经济活动中信息交互所产生的——数据越流通,应用的场景越丰富,其价值会得到不断放大及提升。因此,开放的资源对促进知识图谱和语义计算相关的科学研究及企业应用十分重要。今年,CCKS 2021首次组织了开放资源征集(Resource Track),旨在支持和促进学术界和工业界的数据资源共享。

本次开放资源征集收到来自清华大学、浙江大学、天津大学、西安交通大学、东南大学、苏州大学、南京邮电大学、国防科技大学、北京语言大学等高校和阿里巴巴、深圳宝安机场集团、妙健康等企业的踊跃投稿,每篇论文经过至少3位同行领域专家评议后,最终收录14篇优秀的论文,投稿的论文题目词云如下所示:

本次开放征集的录用论文具有以下三个特色。首先,录用的开放资源涵盖了多个垂直领域,例如,在移动终端领域,南京邮电大学提出了一个大规模移动应用知识图谱MAKG;在教育领域,西安交通大学提出了一个计算机学科的示意图视觉问答数据集CSDQA,国防科技大学提出了面向在线学习场景的数据集MOOPer;在体育领域,苏州大学提出了一个全新的面向体育赛事摘要的数据集SGSum;在医药健康领域,妙健康和阿里巴巴、清华大学提出了一个糖尿病知识图谱数据集DiaKG;在游戏领域,腾讯提出了面向游戏领域本体的数据图TGKG等。其次,录用资源的数据维度和类型丰富,例如,在本体层级,深圳宝安机场集团提出了“基于IATA One Record的航空货运知识本体”;在概念层级,浙江大学构建了一个细粒度中文概念知识图谱OpenConcepts;在不确定性和可信层级,清华大学提出了“面向概率关联式中文可信知识图谱—文脉”;在词汇层级,北京语言大学标注了一个高质量的中文复杂性词汇数据集RCWI;在多模态方面,东南大学提出了一个基于微博、维基、Richpedia构建的多模态实体链接数据集,以及联合之江实验室提出了一个全新的多模态事件抽取数据集MEED;在小样本方面,浙江大学联合多家单位共同提出了零样本学习数据集等。最后,录用的资源还包含了不少开源工具,如天津大学提出了一个基于众包的开源知识图谱构建系统C-CLUE等。

本开放征集的录用的论文列表如下,每篇论文作者都提供了资源下载链接及使用说明,我们将在未来一段时间逐一介绍每一篇工作:

CCKS介绍

全国知识图谱与语义计算大会(CCKS: China Conference on Knowledge Graph and Semantic Computing)由中国中文信息学会语言与知识计算专委会定期举办的全国年度学术会议。CCKS源于国内两个主要的相关会议:中文知识图谱研讨会the Chinese Knowledge Graph Symposium (CKGS)和中国语义互联网与Web科学大会Chinese Semantic Web and Web Science Conference (CSWS)。首届中文知识图谱研讨会于2013年在苏州举行,随后分别在武汉、宜昌成功举办第二次和第三次研讨会。CSWS首次会议于2006年在北京举办,随后的近十年里,逐渐成为国内语义技术领域的主要会议。新的知识图谱与语义计算大会将致力于成为国内知识图谱、语义技术、链接数据等领域的核心会议,并聚集了知识表示、自然语言理解、智能问答、知识抽取、链接数据、图数据库、图挖掘、自动推理等相关技术领域的重要学者和研究人员。

致谢

感谢中国中文信息学会语言与知识计算专业委员会的支持,感谢CCKS2021组委会和各位审稿人的辛勤工作,感谢CCKS Resource Track的各位赐稿者,期待11月线下相聚广州。


 

OpenKG

OpenKG(中文开放知识图谱)旨在推动以中文为核心的知识图谱数据的开放、互联及众包,并促进知识图谱算法、工具及平台的开源开放。

点击阅读原文,进入 OpenKG 网站。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/478185.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

腾讯天衍实验室招聘科研实习生

致力于连接最靠谱的算法岗与最强的求职者招聘贴投放请联系微信xixiaoyao-1腾讯天衍实验室专注于AI算法研究及落地,旨在依托NLP、知识图谱、大数据、医疗影像等技术系统,将算法能力输出到公卫、医保、基层辅助诊断等领域的行业解决方案,以及腾…

LeetCode 475. 供暖器(双指针二分查找)

文章目录1. 题目2. 解题2.1 双指针2. 二分查找1. 题目 冬季已经来临。 你的任务是设计一个有固定加热半径的供暖器向所有房屋供暖。 现在,给出位于一条水平线上的房屋和供暖器的位置,找到可以覆盖所有房屋的最小加热半径。 所以,你的输入将…

ReactiveCocoa核心元素与信号流

ReactiveCocoa(以下简称“RAC”)是一个函数响应式编程框架,它能让我们脱离Cocoa API的束缚,给我们提供另外一套编码的思路与可能性,它能在宏观层面上提升代码易读性与稳定性,让程序员写出富有“诗意”的代码…

【安利向】入坑半年的GPU云平台,三分钟训练起飞!xiu~

大家好,我是Joyce,和小瑶一样,也是搞算法的,不过还在学术界摸鱼,偶尔能抓到一条顶会锦鲤,大多数时候,都是一些小鱼小虾,目前已被boss放养,每周组会都是隐形人...转眼&…

rocketQA学习笔记

端到端问答系统 rocketQA 问答技术发展回顾:

开源开放 | 糖尿病知识图谱DiaKG(CCKS2021)

OpenKG地址:http://openkg.cn/dataset/diakg阿里云天池:https://tianchi.aliyun.com/dataset/dataDetail?dataId88836开放许可协议:CC BY-SA 4.0 (署名相似共享)贡献者:妙健康(常德杰、刘朝振、…

LeetCode 501. 二叉搜索树中的众数(中序遍历)

文章目录1. 题目2. 中序遍历1. 题目 给定一个有相同值的二叉搜索树(BST),找出 BST 中的所有众数(出现频率最高的元素)。 假定 BST 有如下定义: 结点左子树中所含结点的值小于等于当前结点的值 结点右子树…

开源开放 | 移动应用知识图谱MAKG(CCKS2021)

OpenKG地址:http://openkg.cn/dataset/makgGitHub地址:https://github.com/Everglow123/MAKGMAKG网站:http://www.makg.com.cn开放许可协议:CC BY-SA 4.0 (署名相似共享)贡献者:东南大学(周恒、…

恕我直言,你的实验结论可能严重依赖随机数种子!

文 | python编 | 小轶God does not play dice with the universe ......But BERT Does !包括BERT在内的预训练模型已经是现今NLP工作的标配。但你有没有考虑过,这些工作的实验结论可能都是虚假的?在 Bertology 中,大家从 huggingface 上下载 …

Spring MVC注解故障追踪记

Spring MVC是美团点评很多团队使用的Web框架。在基于Spring MVC的项目里,注解的使用几乎遍布在项目中的各个模块,有Java提供的注解,如:Override、Deprecated等;也有Spring提供的注解,如:Control…

LeetCode 951. 翻转等价二叉树(递归)

文章目录1. 题目2. 递归解题1. 题目 我们可以为二叉树 T 定义一个翻转操作,如下所示:选择任意节点,然后交换它的左子树和右子树。 只要经过一定次数的翻转操作后,能使 X 等于 Y,我们就称二叉树 X 翻转等价于二叉树 Y…

开源开放 | 开源大学在线实践数据集及知识图谱MOOPer(CCKS2021)

OpenKG地址:http://openkg.cn/dataset/mooper头歌平台:https://www.educoder.net/ch/rest开放许可协议:CC BY-SA 4.0 (署名相似共享)贡献者:湖南智擎科技有限公司(黄井泉)&#xff0…

python实现文件传输

发送者: send_file.py def send_file(filename: str "mytext.txt", testing: bool False) -> None:import socketport 12312 # Reserve a port for your service.sock socket.socket() # Create a socket objecthost socket.gethostname() # …

不同于NLP,数据驱动、机器学习无法攻克NLU,原因有三

文 | Walid S. Saba源 | 机器之心自然语言理解(NLU)是人工智能的核心课题之一,也被广泛认为是最困难和最具标志性的任务。近年来,机器学习虽然被广泛使用,但是却不能很好的解决自然语言理解问题,其中可能涉…

分布式系统互斥性与幂等性问题的分析与解决

随着互联网信息技术的飞速发展,数据量不断增大,业务逻辑也日趋复杂,对系统的高并发访问、海量数据处理的场景也越来越多。如何用较低成本实现系统的高可用、易伸缩、可扩展等目标就显得越发重要。为了解决这一系列问题,系统架构也…

开源开放 | 多模态实体链接数据集MELBench(CCKS2021)

OpenKG地址:http://openkg.cn/dataset/melbenchGitHub地址:https://github.com/seukgcode/MELBench开放许可协议:CC BY-SA 4.0 (署名相似共享)贡献者:东南大学(汪鹏、周星辰、邓臻凯、李国正、谢…

LeetCode 1219. 黄金矿工(回溯)

文章目录1. 题目2. 回溯DFS解题1. 题目 你要开发一座金矿,地质勘测学家已经探明了这座金矿中的资源分布,并用大小为 m * n 的网格 grid 进行了标注。每个单元格中的整数就表示这一单元格中的黄金数量;如果该单元格是空的,那么就是…

发现一篇专门吐槽 NLP 内卷现状的 ACL 论文 ...

文 | Severus编 | 小轶随着大模型的发展,NLP领域的榜单可说是内卷到了无以复加,现在去浏览各大公开榜单,以至于各个比赛,随处可见BERT、RoBERTa的身影,甚至榜单中见到各大large模型的集成版也并非偶然。在发论文的时候…

大促活动前团购系统流量预算和容量评估

本文整理自美团点评技术沙龙第11期:移动端测试分享。 美团点评技术沙龙由美团点评技术团队主办,每月一期。每期沙龙邀请美团点评及其它互联网公司的技术专家分享来自一线的实践经验,覆盖各主要技术领域。 目前沙龙会分别在北京、上海和厦门等…

论文浅尝 | 融合多层次领域知识的分子图对比学习

笔记整理 | 方尹,浙江大学在读博士,研究方向:图表示学习论文地址:https://arxiv.org/pdf/2106.04509.pdf动机目前基于图的对比学习有以下几个问题:不同领域的图,(比如social network和分子图&am…