聚焦信息抽取前沿难题,CCKS-千言通用信息抽取竞赛报名启动

转载公众号 | 百度NLP


信息抽取旨在将非结构化文本中的信息进行结构化,是自然语言处理的基础技术和重要研究领域,一直受到学术界和工业界广泛关注。传统的信息抽取任务与评测通常针对特定的文本领域和单一的抽取任务,难以评估相关技术与方法在通用场景和任务下的抽取性能。

为此,中国科学院软件研究所、百度公司与千言开源数据集项目(www.luge.ai)联合发起业界首个通用的信息抽取评测——“CCKS-千言通用信息抽取竞赛”。本赛事是千言多形态信息抽取的全新升级,不局限于传统的单任务信息抽取的评测范式,而是将多种不同的信息抽取任务用统一的通用框架进行描述,着重考察相关技术方法面对新的、未知的信息抽取任务与范式时的适应与迁移能力,从而满足当下信息抽取领域快速迭代、快速迁移的实际需求,更贴近实际业务应用。

竞赛于4月11日开启报名,并将在8月25日于2022年全国知识图谱与语义计算大会(CCKS-2022)召开评测研讨会并进行颁奖。百度将为参赛选手提供全面的技术资源、平台支持和丰厚奖池。

报名及竞赛详情链接:

https://aistudio.baidu.com/aistudio/competition/detail/161/0/introduction

任务形式

信息抽取任务旨在根据特定的抽取需求从非结构化文本中自动抽取结构化信息。其中,特定的抽取需求是指抽取任务中的抽取框架,主要由抽取类别(人物名称、企业上市事件)及目标结构(实体、关系、事件等)组成。

本评测的数据及抽取框架主要来自于百度通用信息抽取的应用案例。本次评测构建了多领域多场景下的多种抽取框架,包含医疗、法律、金融等领域和实体抽取、关系抽取、事件抽取等多种抽取任务,以期评测现有技术对通用领域下的信息抽取能力以及对新任务、场景的迁移能力。

任务示例如下:

示例输入1 事件抽取

输入文本(Text):

2月8日上午北京冬奥会自由式滑雪女子大跳台决赛中中国选手谷爱凌以188.25分获得金牌!

抽取需求(Schema):

ef857a8ae5dff03592b16a4d5a84702b.png

事件定义:

参赛选手在体育竞赛中夺得第一名。

<冠军> 于 <夺冠时间> 在 <夺冠赛事>获得冠军。

示例输出1

信息结构(Structure):

ad9c85861aa667876974da26e69a90df.png

示例输入2 对话情感抽取

输入文本(Text):

A: 我昨晚又看了肖申克的救赎,简直百看不厌

B: 是的,它是几代人的经典。

A: 不过,这部剧的主演,我觉得蒂姆罗宾斯的演技不算那么出众。

抽取需求(Schema):

c5e5a3bf6a5e4d89254adcaa8d65a594.png

情感定义:

目标对象: 情感关系的对象

情感表达: 表达正/负向情感的短语或者词

示例输出2

信息结构(Structure):

1d4ee97b3c94432e95de80871d4cb5aa.png

数据描述

最终测试分为已知抽取框架(Seen Schema)和未知抽取框架(Unseen Schema)两部分:

  • Seen Schema:举办方收集了大量开源数据集供参赛者构建模型,该赛道主要评测现有技术基于标记数据构建模型的能力,数据集列表及下载链接请见赛事报名页;

  • Unseen Schema:主要来自百度信息抽取的实际案例,举办方仅提供少量的验证数据,用于参赛者进行抽取需求确认和模型验证,该赛道主要评测现有技术面向新的抽取需求的迁移能力。

赛程安排

1.  报名时间:4月11日—7月25日

2.  验证数据及baseline发布:4月25日

3.  新抽取框架发布:6月20日

4.  测试数据发布:7月25日

5.  测试结果提交截止:7月31日 

6.  评测论文提交:8月12日

7.  CCKS会议(评测报告及颁奖):8月25日—28日

评测奖励

千言-通用信息抽取比赛的最终获奖团队将获得:

  • 丰厚奖金:第一名30000人民币、第二名20000人民币、第三名10000人民币、创新奖5000元(共设立两项)。

  • 荣誉证书:获奖团队将由赛事主办方颁发权威获奖证书。

同时,参赛者也将获得以下福利:

  • 学习交流机会:在赛事群中与参赛者、组织者深入交流;

  • 前沿技术实践:在竞赛平台展开前沿的多任务建模实践;

  • 精美礼品&参赛证明:正式报名参赛并提交最终结果的队伍每位成员将获得千言数据集精美的定制周边一份,并发放参赛证明。

任务交流平台

添加千言助手微信,发送关键词“CCKS”即可加入交流群。

fe309a00c3a1fe1c6a16006d98d0188b.png


OpenKG

OpenKG(中文开放知识图谱)旨在推动以中文为核心的知识图谱数据的开放、互联及众包,并促进知识图谱算法、工具及平台的开源开放。

3516b5131aa10947f47b9df983dc8118.png

点击阅读原文,进入 OpenKG 网站。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/477733.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

我有文章了,但也不想搞学术了

文 | 微调源 | 知乎又到了年底&#xff0c;跟大家简单唠唠2021年的收获&#xff08;和失去&#xff09;。在2020年的总结文章里&#xff08;阿调x2020&#xff1a;爱、学术、钱与系统[1]&#xff09;&#xff0c;我最大的困扰可能是读博一年多却没什么主要成果的痛苦。好消息是…

LeetCode 829. 连续整数求和(数学)

1. 题目 给定一个正整数 N&#xff0c;试求有多少组连续正整数满足所有数字之和为 N? 示例 1: 输入: 5 输出: 2 解释: 5 5 2 3&#xff0c;共有两组连续整数([5],[2,3])求和后为 5。示例 2: 输入: 9 输出: 3 解释: 9 9 4 5 2 3 4示例 3: 输入: 15 输出: 4 解释: 15…

说说我为什么看好Spring Cloud Alibaba

最近对《Spring Cloud Alibaba基础教程》系列的催更比较多&#xff0c;说一下最近的近况&#xff1a;因为打算Spring Boot 2.x一起更新。所以一直在改博客Spring Boot专题页和Git仓库的组织。由于前端技术太过蹩脚&#xff0c;花了不少时间。大家不用担心&#xff0c;这个系列不…

【报名开启】CCKS2022技术评测任务七“化学元素知识图谱构建及应用”

任务描述&#xff1a;随着AI技术的发展和普及&#xff0c;药物研发也逐渐进入到AI时代&#xff0c;擅长处理大数据的AI深度学习技术&#xff0c;就成为近年来大家关注的焦点。化合物的性质预测的主要目的在于及时发现理化性质不达标的化合物&#xff0c;以降低候选化合物进入临…

LeetCode 12/13 罗马数字与整型互转(哈希,贪心)

文章目录1. 罗马数字转整型解题2. 整数转罗马数字解题1. 罗马数字转整型 罗马数字包含以下七种字符: I&#xff0c; V&#xff0c; X&#xff0c; L&#xff0c;C&#xff0c;D 和 M。字符 数值 I 1 V 5 X 10 L 50 …

Facebook 推出多模态通用模型 FLAVA,吊打 CLIP 平均十个点!

文 | 子龙编 | 智商掉了一地厉害了&#xff01;作者将单一模型运用于三个不同领域的不同任务&#xff0c;结构简单且训练直观&#xff0c;还能有着出色的表现。自Transformer横空出世&#xff0c;从NLP到CV&#xff0c;再到今天的多模态&#xff0c;无数基于Transformer的模型被…

Nacos配置中心原理

动态配置管理是 Nacos 的三大功能之一&#xff0c;通过动态配置服务&#xff0c;我们可以在所有环境中以集中和动态的方式管理所有应用程序或服务的配置信息。 动态配置中心可以实现配置更新时无需重新部署应用程序和服务即可使相应的配置信息生效&#xff0c;这极大了增加了系…

论文浅尝 | AI回答小学科学问题达到人类水平(OpenBookQA)

转载公众号 | 南大Websoft AI能否像人类一样学习掌握科学知识&#xff0c;理解运用常识知识&#xff0c;最终像人类一样参加并通过学科考试&#xff1f;近日&#xff0c;南京大学万维网软件研究组&#xff08;Websoft&#xff09;在人工智能评测集OpenBookQA上实现了突破&#…

LeetCode 1003. 检查替换后的词是否有效(栈)

1. 题目 给定有效字符串 “abc”。 对于任何有效的字符串 V&#xff0c;我们可以将 V 分成两个部分 X 和 Y&#xff0c;使得 X Y&#xff08;X 与 Y 连接&#xff09;等于 V。&#xff08;X 或 Y 可以为空。&#xff09;那么&#xff0c;X “abc” Y 也同样是有效的。 例…

论文浅尝 - IJCAI2022 | 基于自适应虚词增强的小样本逆关系分类

论文作者&#xff1a;窦春柳&#xff0c;天津大学&#xff0c;研究方向&#xff1a;知识图谱论文链接&#xff1a;http://arxiv.org/abs/2204.12111代码地址&#xff1a;https://github.com/DOU123321/FAEA-FSRC摘要小样本关系分类&#xff08;Few-shot Relations Classificati…

Spring Cloud Alibaba与Spring Boot、Spring Cloud之间不得不说的版本关系

这篇博文是临时增加出来的内容&#xff0c;主要是由于最近连载《Spring Cloud Alibaba基础教程》系列的时候&#xff0c;碰到读者咨询的大量问题中存在一个比较普遍的问题&#xff1a;版本的选择。其实这类问题&#xff0c;在之前写Spring Cloud基础教程的时候&#xff0c;就已…

这个开源数据集要在全球扩大中文NLP影响力,你也能来做贡献!

源 | 机器之心编辑部千言的升级重点聚焦大模型时代的机遇和挑战。「千言」是由百度联合中国计算机学会、中国中文信息学会共同发起的面向自然语言处理的开源数据集项目&#xff0c;旨在推动中文信息处理技术的进步。近日&#xff0c;在 2021 年 12 月 12 日的 WAVE SUMMIT2021 …

LeetCode 676. 实现一个魔法字典(哈希)

1. 题目 实现一个带有buildDict, 以及 search方法的魔法字典。 对于buildDict方法&#xff0c;你将被给定一串不重复的单词来构建一个字典。 对于search方法&#xff0c;你将被给定一个单词&#xff0c;并且判定能否只将这个单词中一个字母换成另一个字母&#xff0c;使得所…

技术动态 | 北大邹磊:图数据库中的子图匹配算法

转载公众号 | DataFunTalk分享嘉宾&#xff1a;邹磊 北京大学 教授编辑整理&#xff1a;xiaomei出品平台&#xff1a;DataFunTalk导读&#xff1a;本次讲座从图数据库中的核心查询算子——子图匹配入题&#xff0c;介绍了图数据库的基本概念、子图匹配的算法&#xff0c;以及在…

Spring Cloud Alibaba基础教程:Nacos的数据持久化

前情回顾&#xff1a; 《Spring Cloud Alibaba基础教程&#xff1a;使用Nacos实现服务注册与发现》《Spring Cloud Alibaba基础教程&#xff1a;支持的几种服务消费方式》《Spring Cloud Alibaba基础教程&#xff1a;使用Nacos作为配置中心》《Spring Cloud Alibaba基础教程&a…

盘点我跳过的科研天坑,进坑就是半年白干

文 | 白鹡鸰 and 小轶 祝大家新年快乐&#xff01;去年白鹡鸰花了两个月&#xff0c;刷了八千篇Arxiv&#xff0c;结果发现很多论文存在一些比较“基本”的常见问题&#xff1a;研究问题和问题假设存在严重的漏洞&#xff0c;或者缺少充分的相关工作调研&#xff0c;导致所谓的…

LeetCode 553. 最优除法(数学)

1. 题目 给定一组正整数&#xff0c;相邻的整数之间将会进行浮点除法操作。例如&#xff0c; [2,3,4] -> 2 / 3 / 4 。 但是&#xff0c;你可以在任意位置添加任意数目的括号&#xff0c;来改变算数的优先级。你需要找出怎么添加括号&#xff0c;才能得到最大的结果&#…

论文浅尝 - ACL2022 | 子图检索增强的知识图谱问答方法

转载公众号 | 学术头条作者&#xff1a;张静&#xff08;中国人民大学&#xff09;&#xff0c;张晓康&#xff08;中国人民大学&#xff09;&#xff0c;于济凡&#xff08;清华大学&#xff09;&#xff0c;唐建&#xff08;魁北克人工智能研究所&#xff09;&#xff0c;唐杰…

Spring Cloud Alibaba基础教程:Nacos配置的多文件加载与共享配置

前情回顾&#xff1a; 《Spring Cloud Alibaba基础教程&#xff1a;使用Nacos实现服务注册与发现》《Spring Cloud Alibaba基础教程&#xff1a;支持的几种服务消费方式》《Spring Cloud Alibaba基础教程&#xff1a;使用Nacos作为配置中心》《Spring Cloud Alibaba基础教程&a…

2202年了,“小样本”还值得卷吗?

文 | Severus从一个应用实验引发的思考。大家好&#xff0c;我是Severus&#xff0c;一个在某厂做中文自然语言理解的老程序员。这个主题&#xff0c;源自于我之前在公司内做的一次技术分享。承接上一篇文章&#xff08;格局打开&#xff0c;带你解锁 prompt 的花式用法&#x…