【报名开启】CCKS 2022教科书示意图问答任务

赛题背景

示意图是一种高度抽象的知识表达载体,常由矩形、圆形等几何形状和箭头、折线等逻辑符号组成,广泛被应用于教科书、百科、知识博客等教育场景。在上述场景中,学习者常通过视觉问答的形式来判断对知识点的掌握情况,即:给定学习者一张示意图,根据视觉信息来回答与该知识点相关的自然语言问题,我们将其定义为教科书示意图问答任务,任务样例如图1所示(实际评测中会提供标注信息)。该任务可能涉及视觉对象的检测与对齐、知识术语的理解以及知识表示的动态变化等复杂推理过程,良好的完成该任务是未来跨媒体智能、智慧教育等应用的重要基础,也有助于提升计算机对人类认知行为和学习习惯的理解。

65bf9d35b3c3fcb48201973a95a76978.png

图1 教科书示意图问答样例

该任务主要有两个挑战:一是示意图资源稀缺,标注代价高昂,具有天然的小样本场景,在不具备大型语料库的场景下完成该任务是一个难题;二是示意图表达抽象、特征稀疏,简单的几何形状蕴含有丰富、专业的语义信息,如何较好地提取并理解其视觉特征是一个难题。本次测评任务的示意图来源于计算机科学领域,希望选手能针对上述两个难点,深入理解示意图中的关键信息,构建模型实现准确的示意图问答表现。

比赛任务

比赛要求选手根据提供的训练集示意图及问答数据训练算法模型并对验证集中的示意图对应问题答案进行预测。比赛使用的问答数据来自计算机科学领域示意图问答数据集,采用正确率(Accuracy)评测模型性能。

组织机构

陕西省天地网技术重点实验室:实验室成立于2004年10月,依托计算机、自动化、机械电子等学科,重点开展面向天地网基础理论、关键技术及其应用系统的研究,包括远程教育、舆情分析、可信软件、自然语言处理、医疗与生物医学大数据等方向的研究。

联想(北京)有限公司是联想集团全资子公司,作为全球领先的智能设备及企业IT解决方案提供商以及国家高新技术企业,拥有授权专利 12883 项,其中国内发明专利7462项,国际专利1771项;拥有智慧教育解决产品市场占有率70%等优势。

比赛数据

Ø 数据来源:

本次测评任务的示意图问答数据来自Computer Science Diagrams (CSDia) ,是一个包含有丰富标注信息的计算机科学领域数据集。CSDQA是计算机科学领域的第一个示意图问答数据集,共包含1,294张示意图和超过3,400个问答对。其中,所有的示意图均来自于教育场景中的真实数据,包含两本英文教科书,五本中文教科书,若干博客和知识百科等来源,并经过自动化收集、领域专家选取与标注,可保证数据的准确性和多样性。问答数据集中的问题,包含判断题和四选一问题,数量比例大致为1:1;所有问题依据难度还可划分为简答(一步推理)问题和复杂(两步推理)问题,数量比例大致为4:1。

Ø 标注内容:

数据集中,每个问题对应一张示意图,为了便于选手处理数据,我们将问题及标注信息统一整理为Q.json文件,文件中问题格式样例如下:

1

|---question: How many contents are in the array?

|---type: MC

|---difficulty: easy

|---diagram_path: ./data/CSDia_train_val_test/train/D\10.png

|---cords:

||---0

|    |---211

|    |---233

|    |---108

|    |---44

|---answer

||---d: 13

||---c: 10

||---b: 5

||---a: 9

|---correct_answer: a

|---split: train

其中,‘question’为问题文本;‘type’为问题类型,包含TF(判断题)和MC(四选一问题);‘difficulty’为问题难度,包含简单和复杂;‘diagram_path’为该问题对应的示意图相对路径;‘cords’中包含有若干对象的标注框坐标;‘answer’为该问题的候选答案;‘correct_answer’为该问题的正确答案,需要注意,仅在训练集中包含问题的正确答案标注;‘split’为该问题所属的划分集合。

Ø 训练集&验证集:

在训练数据发布阶段,我们会发布约2000条标注好的数据作为训练集。同时发布约600条不含标注答案的问题作为验证集,选手可以将自己生成的验证集答案提交,比赛系统会对答案进行评测,给出得分并进行排行。

在测试数据发布阶段,我们会发布验证集的标注结果(包括答案),同时发布约600条左右不含标注结果的问题,作为测试。选手将自己生成的测试集答案提交,比赛系统会对答案进行评测,给出得分并进行排行。

评测方法

提交文件:

本次比赛需要选手提交一个csv格式的文件,包括两列(‘id’和‘label ’),其中id列必须和测试集相吻合,顺序不限;label列为A到D的大写字母之一。

答案文件格式:

id,label

0,A

1,B

2,C

3,D

....

评价指标:

本任务的评价指标使用正确率(Accuracy),最终排名以其值为基准。假设数据数量为n, 预测正确的数量为c,,相关计算公式如下: 

单位是%, 所以满分得分为100。

提交方式:

本次任务将采取刷榜的方式,分为两个阶段进行:

第一阶段:验证集发布后,参赛队伍提交对验证集(validation dataset)的预测文件后由系统自动评测打分。

第二阶段:测试集发布后,参赛队伍提交对测试集(test dataset)的预测文件后由系统自动评测打分。

获奖验证:

• 复赛结束后,比赛组织者将邀请所有在复赛阶段排名前列的选手提交完整的模型代码,代码中必须包含requirements.txt文件,注明所需要的Python依赖包,以及Python的版本。

• 同时需要包含一个readme.md文件,提供运行代码所需的命令和参数。比赛组委会会在独立环境里安装并验证所提交的代码进行审核。

以上文件需在任务提交截止日期前发送至邮箱wang97@stu.xjtu.edu.cn。邮件的标题为:“CCKS-DQA-参赛队名称”,例如“CCKS-DQA-张三队”。

代码及其文档需打包成一个文件(tar,zip,gzip,rar等均可),用code.xxx命名,要求提交所有的程序代码及相关的配置说明,程序应当可以运行且所得结果与提交结果相符。如果方法使用了额外资源,要求说明并提供资源文件或地址。

* 关于使用比赛规程的最终解释权归属大赛组委会。

奖励

总奖金1.5万元

一等奖(1名):5000

二等奖(2名):2500

三等奖(2名):1000

创新技术奖(1名):3000

时间安排

l 评测任务发布:4月11日

l 报名截止时间:7月25日(23:59 UTC

l 初赛截止时间:7月25日(23:59 UTC

初赛(验证集预测)提交与组队报名截止。

l 复赛截止时间:7月31日(23:59 UTC

测试集阶段,所有参赛团队都可以下载测试集,并提交测试集的预测结果。测试集上的结果将决定本次比赛的排名。

报名地址

CCKS评测任务简介:http://sigkg.cn/ccks2022/?page_id=22

报名入口:https://www.biendata.xyz/competition/ccks2022dqa

点击阅读原文,进入报名页面

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/477705.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

以4%参数量比肩GPT-3!Deepmind 发布检索型 LM,或将成为 LM 发展新趋势!?

文 | ZenMoore编 | 小轶GPT3 一声枪响,给 NLP 带来了大模型风潮。这么长时间过来,无论是中文还是英文,模型越做越大。当然,这确实是符合逻辑的,因为如果以人脑为向导的话,那么多神经元,不得不需…

Spring Cloud Alibaba基础教程:使用Nacos作为配置中心

通过本教程的前两篇: 《Spring Cloud Alibaba基础教程:使用Nacos实现服务注册与发现》《Spring Cloud Alibaba基础教程:支持的几种服务消费方式(RestTemplate、WebClient、Feign)》 我们已经学会了,如何利…

LeetCode 1020. 飞地的数量(图的BFS/DFS)

文章目录1. 题目2. 解题2.1 BFS2.2 DFS1. 题目 给出一个二维数组 A,每个单元格为 0(代表海)或 1(代表陆地)。 移动是指在陆地上从一个地方走到另一个地方(朝四个方向之一)或离开网格的边界。 …

论文浅尝 | ISEEQ: 利用动态元信息检索和知识图谱的资讯搜索式问题生成器

笔记整理:侯哲衡,东南大学硕士,研究方向为知识图谱问答、自然语言生成。动机对话资讯搜索是在智能问答中一个新兴研究领域。对话资讯搜索旨在根据通过用户查询自动询问资讯搜索式问题(information-seeking questions,I…

浅谈点击信号对搜索的影响

文 | bytecoder源 | 知乎背景过去一周,我们探讨了搜索系统最核心的指标以及如何通过实验的方式来判断策略的好坏。但是影响一个实验的好坏除去策略本身的影响之外,还会受到一些反直觉的因素的影响;之前在做搜索,尤其是搜索系统成熟…

Spring Cloud Alibaba基础教程:支持的几种服务消费方式(RestTemplate、WebClient、Feign)

通过《Spring Cloud Alibaba基础教程:使用Nacos实现服务注册与发现》一文的学习,我们已经学会如何使用Nacos来实现服务的注册与发现,同时也介绍如何通过LoadBalancerClient接口来获取某个服务的具体实例,并根据实例信息来发起服务…

CCKS 2022 | 如何通过“说一句话”精准获取数据?恒生发布金融NL2SQL评测任务

某投资者登录券商理财APP,想要查找最近两年上市的公司,并按照最新的市值进行排序。然而他很难直接找到结果,需要经过层层筛选才能大致找到相关结果。有没有更简便的方式来查找数据?如果说一句话或者打一小段文字后,就能…

AI从业几年还不具备提出新模型的技术能力?看这个就够了!

AI是一门入门简单,但想深入却很难的学科,这也是为什么AI高端人才一直非常紧缺的重要原因。在AI领域技术领域,我们可以说机器学习功底决定了一个人的上限也不为过。为什么?机器学习就像物理学中的数学,如果你对数学没有…

Spring Cloud Alibaba基础教程:Nacos 生产级版本 0.8.0

昨晚Nacos社区发布了第一个生产级版本:0.8.0。由于该版本除了Bug修复之外,还提供了几个生产管理非常重要的特性,所以觉得还是有必要写一篇讲讲这次升级,在后续的文章中也都将以0.8.0版本为基础。 升级的理由 如Nacos官方的发布文…

LeetCode 1016. 子串能表示从 1 到 N 数字的二进制串(bitset)

1. 题目 给定一个二进制字符串 S(一个仅由若干 ‘0’ 和 ‘1’ 构成的字符串)和一个正整数 N,如果对于从 1 到 N 的每个整数 X,其二进制表示都是 S 的子串,就返回 true,否则返回 false。 示例 1&#xff…

论文浅尝 | KM-BART:用于视觉常识生成的知识增强多模态BART

笔记整理:陈子强,天津大学硕士动机视觉语言模型早期集中在纯理解任务(例如,VQA视觉问答),尽管在理解任务上取得了先进的性能,却很少关注多模态生成任务。当前的预训练任务例如,掩码语…

AllenAI | 用GPT-3帮助增建数据,NLI任务直接提升十个点!?

文 | iven编 | 小轶用机器构建数据集,这件事可能比机器学习诞生的还要早,很多人做过很多工作。怎样让机器参与进来?前人的工作可以分成两类思路:一类是以远程监督为代表,让机器来标注,主要目的在于得到更多…

论文浅尝 | CLIP-Event: 用事件结构连接文本和图像

笔记整理:康婧淇,东南大学硕士,研究方向为多模态事件抽取、自然语言处理。动机视觉语言预训练模型通过理解图像和文本之间的排列组合,在支持多媒体应用方面取得了巨大成功。虽然现有的视觉语言预训练模型主要侧重于理解图像中的物…

LeetCode 402. 移掉K位数字(贪心,单调栈)

1. 题目 给定一个以字符串表示的非负整数 num,移除这个数中的 k 位数字,使得剩下的数字最小。 注意: num 的长度小于 10002 且 ≥ k。 num 不会包含任何前导零。 示例 1 : 输入: num "1432219", k 3 输出: "1219" 解释: 移除掉…

Spring Cloud Alibaba基础教程:使用Nacos实现服务注册与发现

自Spring Cloud Alibaba发布第一个Release以来,就备受国内开发者的高度关注。虽然Spring Cloud Alibaba还没能纳入Spring Cloud的主版本管理中,但是凭借阿里中间件团队的背景,还是得到不少团队的支持;同时,由于Spring …

忙累了躺平,躺醒后该干点啥

文 | 一只菜鸡前几天刷到 微调 的一些碎碎念,觉得自己的2021年还是有蛮多收获的,于是在各位卖萌屋小伙伴的鼓励下,就有了本文。收获很多,我从中挑选出来自我感觉对读者来说比较有用的三点。1. 放低期待,学会适当躺平我…

论文浅尝 | P-Adapters: 从具有不同提示的语言模型中鲁棒地提取事实信息

笔记整理:田玺,浙江大学硕士研究生。研究方向:知识图谱、自然语言处理论文地址:https://openreview.net/forum?idDhzIU48OcZh,录用于ICLR2022摘要之前的工作发现,从大型语言模型(LLMs&#xff…

LeetCode 470. 用 Rand7() 实现 Rand10()(随机概率)

1. 题目 已有方法 rand7 可生成 1 到 7 范围内的均匀随机整数,试写一个方法 rand10 生成 1 到 10 范围内的均匀随机整数。 不要使用系统的 Math.random() 方法。 示例 1: 输入: 1 输出: [7]示例 2: 输入: 2 输出: [8,4]示例 3: 输入: 3 输出: [8,1,10]提示: rand…

Spring Cloud Stream同一通道根据消息内容分发不同的消费逻辑

应用场景 有的时候,我们对于同一通道中的消息处理,会通过判断头信息或者消息内容来做一些差异化处理,比如:可能在消息头信息中带入消息版本号,然后通过if判断来执行不同的处理逻辑,其代码结构可能是这样的…

图谱实战 | 再谈图谱表示:图网络表示GE与知识图谱表示KGE的原理对比与实操效果分析...

转载公众号 | 老刘说NLP知识图谱嵌入是一个经典话题,在之前的文章《知识表示技术:图谱表示VS图网络表示及基于距离函数的表示学习总结》中,围绕知识图谱嵌入学习这一主题,对比了知识图谱嵌入与图网络嵌入的异同。而在实际工作中&a…