来源: AINLPer公众号(每日干货分享!!)
编辑: ShuYini
校稿: ShuYini
时间: 2024-3-10
该数据集是由斯坦福大学研究人员提出的,用于评估NLP模型在常识自然语言推理(NLI)任务上的性能,旨在促进NLP领域在常识理解和推理方面的发展,特别是在开发能够模拟人类常识推理的AI系统方面。该数据集包含了约10万个问答对,这些问题虽然对人类来说非常简单,但对现有的NLP模型来说却极具挑战性。
HellaSwag支持的任务包括句子完成和文本生成,要求模型能够基于上下文生成合理的续写。数据集的结构详细记录了活动标签、上下文、候选续写以及多个可能的结尾,还包括源ID、数据集分割和标签等信息。数据集遵循MIT许可证,允许研究者自由使用。
相关数据集与论文获取,GZ: AINLPer公众号 回复:** HS数据集**