kaggle新赛:写作质量预测大赛【数据挖掘】

赛题名称:Linking Writing Processes to Writing Quality

赛题链接:https://www.kaggle.com/competitions/linking-writing-processes-to-writing-quality

赛题背景

写作过程中存在复杂的行为动作和认知活动,不同作者可能采用不同的计划修订技术、展示不同的停顿模式或在全过程中策略性地分配时间,这些都可能影响写作质量。过去的研究探索了与停顿、添加删除和修订等行为相关的多种过程特征,但是使用的数据集较小,且只研究了少数特征。

本次竞赛使用键盘日志的数据过程特征来预测总体写作质量,可能识别学习者写作行为与表现之间的关系。鉴于当前写作评估工具主要关注最终产出,这可能帮助学习者关注文本产出过程,增强写作的自主性、元认知意识和自我调节。

赛题任务

本次竞赛的目标是预测写作整体质量。写作方式是否会影响作文结果?参赛者将在一个大规模键盘日志数据集上训练模型,该数据集捕获了书写过程特征。

参赛者的工作将帮助探索学习者的书写行为与书写表现之间的关系,这可能为书写指导、自动书写评估技术和智能辅导系统的发展提供有价值的见解。

评价指标

我们使用均方根误差来评分提交项,定义为:

其中是预测值,是n个实例中每个实例i的原始值。

提交文件

对测试集中的每个id,你必须预测对应的score(参见数据页面的描述)。文件应包含一个表头,格式如下:

id,score
0000aaaa,1.0
2222bbbb,2.0
4444cccc,3.0
...

数据描述

竞赛数据集包含了大约5000份用户输入日志,如键盘和鼠标点击,这些都是在作文过程中捕获的。每篇作文的评分在0到6的范围内。参赛者的目标是根据用户输入日志来预测一篇作文的评分。

文件和字段信息:

  • train_logs.csv - 用于训练的数据输入日志。
    • id - 文章的唯一ID

    • event_id - 事件的索引,按时间顺序排列

    • down_time - 键盘/鼠标按下的时间,毫秒

    • up_time - 键盘/鼠标释放的时间,毫秒

    • action_time - 事件持续时间(down_time和up_time之差)

  • activity - 事件所属的活动类别
    • Nonproduction - 事件不会改变文本

    • Input - 事件向文档添加文本

    • Remove/Cut - 事件从文档中删除文本

    • Paste - 事件通过粘贴输入改变文本

    • Replace - 事件用另一个字符串替换一段文本

  • Move From [x1, y1] To [x2, y2] - 事件将文本从字符索引x1,y1移动到新的位置x2,y2

  • down_event - 键盘/鼠标按下时的事件名称

  • up_event - 键盘/鼠标释放时的事件名称

  • text_change - 事件导致的文本更改(如果有)

  • cursor_position - 事件后文本光标的字符索引

  • word_count - 事件后文档的词数

注意测试集中可能存在训练集中没有出现过的事件。

  • test_logs.csv - 用于测试的数据输入日志。

  • train_scores.csv
    • id - 文章的唯一ID

    • score - 文章的分数(满分6分,预测目标)

  • sample_submission.csv - 正确格式的提交文件示例。

时间安排

  • 2023 年 10 月 2 日 - 开始日期

  • 2024 年 1 月 2 日 - 报名截止日期

  • 2024 年 1 月 2 日 - 合并截止日期

  • 2024 年 1 月 9 日 - 提交截止日期

赛题奖金

排行榜

  • 第一名 - 12,000美元

  • 第二名 - 8,000美元

  • 第三名 - 5,000美元

效率奖

  • 第一名 - 15,000美元

  • 第二名 - 10,000美元

  • 第三名 - 5,000美元

关注下方【学姐带你玩AI】🚀🚀🚀

回复“比赛”获取190+场比赛top方案(kaggle、天池、ccf...)

码字不易,欢迎大家点赞评论收藏!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/104949.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Google zxing 生成带logo的二维码图片

环境准备 开发环境 JDK 1.8SpringBoot2.2.1Maven 3.2 开发工具 IntelliJ IDEAsmartGitNavicat15 添加maven配置 <dependency><groupId>com.google.zxing</groupId><artifactId>core</artifactId><version>3.4.0</version> </…

thinkphp6 入门(8)-- Session

开启Session Session功能默认是没有开启的&#xff08;API应用通常不需要使用Session&#xff09; think\middleware\SessionInit// 添加引用 use think\facade\Session; 赋值 Session::set(name, thinkphp);取值 // 如果值不存在&#xff0c;返回null Session::get(name)…

简单配置linux防火墙

selinux: 建议新手暂时关掉 vi /etc/sysconfig/selinux 修改SELINUXdisabledtcp_wrappers:可以实现对某些服务开放关闭&#xff0c;允许禁止。 在/etc/hosts.allow中配置允许登录的计算机&#xff0c;例如&#xff1a; sshd: 192.168.49.1 #允许该ip通过sshd访问在/etc/hosts…

pytorch 对图片进行归一化处理

如题&#xff0c;神经网络通常使用浮点数张量作为输入&#xff0c;我们要做的第一件事情就是将图片转化为浮点数&#xff0c;并且做归一化操作。 import torch import imageio import osdata_dirF:\\work\\deep_learning\\pytorch\\dlwpt-code-master\\data\\p1ch4\\image-cat…

机器学习-有监督学习-神经网络

目录 线性模型分类与回归感知机模型激活函数维度诅咒过拟合和欠拟合正则数据增强数值稳定性神经网络大家族CNNRNNGNN&#xff08;图神经网络&#xff09;GAN 线性模型 向量版本 y ⟨ w , x ⟩ b y \langle w, x \rangle b y⟨w,x⟩b 分类与回归 懂得两者区别激活函数&a…

『heqingchun-ubuntu系统下安装cuda与cudnn』

ubuntu系统下安装cuda与cudnn 一、安装依赖 1.更新 sudo apt updatesudo apt upgrade -y2.基础工具 sudo apt install -y build-essential python二、安装CUDA 1.文件下载 网址 https://developer.nvidia.com/cuda-toolkit-archive依次点击 (1)“CUDA Toolkit 11.6.2”…

Service Weaver:以单体形式编码,以微服务形式部署

分布式应用的主流架构模式演化为微服务架构已经有些年头了。微服务、DevOps、持续交付和容器技术(k8s)是构成最初云原生概念[1]的核心要素。它们相生相拌&#xff0c;共同演进&#xff0c;并推动了云计算全面进入云原生时代。 云原生应用普遍采用微服务架构&#xff0c;遗留的单…

C# Onnx Yolov8 Detect 涉黄检测

效果 项目 检测类别 代码 using Microsoft.ML.OnnxRuntime; using Microsoft.ML.OnnxRuntime.Tensors; using OpenCvSharp; using System; using System.Collections.Generic; using System.ComponentModel; using System.Data; using System.Drawing; using System.Linq; usi…

【Linux】从零开始学习Linux基本指令(一)

&#x1f6a9;纸上得来终觉浅&#xff0c; 绝知此事要躬行。 &#x1f31f;主页&#xff1a;June-Frost &#x1f680;专栏&#xff1a;Linux入门 &#x1f525;该文章主要了解Linux操作系统下的基本指令。 目录&#xff1a; ⌛️指令的理解⏳目录和文件的理解⏳一些常见指令✉…

“小程序:改变电商行业的新趋势“

目录 引言1. 小程序的简介1.1 什么是小程序&#xff1f;1.2 小程序的优势 2. 小程序之电商演示1.注册微信小程序2.安装开发工具3.创建项目 3. 小程序之入门案例总结 引言 随着移动互联网的迅猛发展&#xff0c;小程序作为一种全新的应用形态&#xff0c;正在逐渐改变着传统电商…

鲲山科技:引入和鲸 ModelWhale,实现量化策略的高效迭代

量化投资是数据科学在金融行业的应用。 2023 年&#xff0c;量化行业的超额收益开始收敛&#xff0c;量化私募如何形成自身核心竞争力&#xff1f; 和鲸拜访客户鲲山科技&#xff08;深圳&#xff09;&#xff0c;揭示其“弯道超车”的独家秘诀。 群体作战 年初至今&#xff…

使用Selenium的WebDriver进行长截图

from selenium import webdriver from PIL import Image from io import BytesIO # 创建浏览器驱动 driver webdriver.Chrome()# 打开网页 driver.get("https://www.douban.com/") # 替换为您要截图的网页URL def get_long_shot(driver,table_element):# 获取页面的…

【软考-中级】系统集成项目管理工程师-配置管理历年案例

持续更新。。。。。。。。。。。。。。。 目录 2023 上 试题三(20分) 2023 上 试题三(20分) 某公司有自己的质量管理体系&#xff0c;其中配置管理程序已运行多年&#xff0c;由项目经理牵头组建变更控制委员会(CCB)&#xff0c;在创建配置管理环境后&#xff0c;并经过变更申请…

golang中的RSA算法,加密解密,签名校验,导出公钥密钥,导入公钥密钥

RSA算法广泛应用与数据加密&#xff08;比如 SSL 传输层加密&#xff09;&#xff0c;数字签名&#xff08;比如支付宝的支付签名&#xff09;。 1、加密解密 // encrypts the given message with RSA-OAEP func f1() {// random 用来生成随机的素数rsaPriviteKey, err : rsa…

计算机视觉实战--直方图均衡化和自适应直方图均衡化

计算机视觉 文章目录 计算机视觉前言一、直方图均衡化1.得到灰度图2. 直方图统计3. 绘制直方图4. 直方图均衡化 二、自适应直方图均衡化1.自适应直方图均衡化&#xff08;AHE&#xff09;2.限制对比度自适应直方图均衡化&#xff08;CRHE&#xff09;3.读取图片4.自适应直方图均…

NewStarCTF 2023 公开赛道 WEEK2|Crypto

目录 T1.滴啤 T2.不止一个pi T3.halfcandecode T4.Rotate Xor T5.broadcast T6.partial decrypt T1.滴啤 下载题目附件&#xff0c;我们获得到以下代码。 from Crypto.Util.number import * import gmpy2 from flag import flag def gen_prime(number):p getPrime(numb…

openGauss指定schema下全部表结构备份与恢复

本次测试针对openGauss版本为2.0.5 gs_dump指定schema下全部表结构信息备份 gs_dump database_name -U username -p port -F c -s -n schema_name -f schema.sqldatabase_name&#xff1a;数据库名&#xff0c;要备份的数据库名称 username&#xff1a;用户名&#xff0c;数据…

跨行或跨列布局

关键点 1、float 实现 2、flex 实现 3、grid 实现效果预览: html: <div class="container"><h2>float 实现</h2>

10.12按键中断

设置按键中断&#xff0c;按键1按下&#xff0c;LED亮&#xff0c;再按一次&#xff0c;灭 按键2按下&#xff0c;蜂鸣器响。再按一次&#xff0c;不响 按键3按下&#xff0c;风扇转&#xff0c;再按一次&#xff0c;风扇停 keyit.h: #ifndef __KEYIT_H__ #define __KEYIT_…

对计算思维的培养

斯坦福大学在 “ 下个十年计算机课程开设情况方案中提出了新的 核心课程体系&#xff0c;包括计算机数学基础、计算机科学中的概率论、数据 结构和算法的理论核心课程&#xff0c;以及包括抽象思维和编程方法、计算机 系统与组成、计算机系统和网络原理在内的系统核心课程。…