美赛优秀论文阅读--2023C题

文章目录

  • 1.题目说明
  • 2.我对于这个题目信息的理解
  • 3.优秀论文学习
    • 3.1摘要
    • 3.2相关的算法模型
  • 4.总结

1.题目说明

今天阅读的这个文章来自于这个2023年的这个美赛的这个C题的论文;

我们的这个题目可以到网上去找,这个还是比较容易找到的,大致就是进行这个相关的预测吧

image-20241118184212119

我们的这个数据文件里面的这个内容就是我们的这个不同的模式下面的这个

image-20241118184317608

2.我对于这个题目信息的理解

首先就是下面的这个图片:我们的这个过程就展示了这个游戏的玩法,例如这个第一行里面的这个表示的就是这两个字母在我们的这个正确单词里面是存在的,这个位置不对;

接下来我们对于这个位置进行调整,这个位置是对的的时候这个字母快就会显示成为这个绿色的;

image-20241118185602484

其次就是下面的这个数据图:表示的就是这个数据结果在网上是存在多少份的,这个现实的案例就是42237份,但是这个困难模式的就是3685份;

下面的这个比率我没看的很明白,我觉得可能就是一次通关,2次通关的这个人数的比率,以及这个始终没通关的这个人数的百分比吧;

image-20241118185804619

下面的这个就是我们的这个题目的要求了:

1)开发模型对于这个现象结果进行解释,并使用我们的这个魔性对于这个具体的某一天里面的这个数据进行预测;

2)就是开发模型对于未来日期里面的这个数据报告,就是对于未来某一天的用户多少次猜出来这个单词的比例的数据报告结果进行预测;

3)然后就是根据这个难度进行划分,使用我们的这个模型对于这个分类的准确性进行判断;

image-20241118190046727

3.优秀论文学习

说实话,这个论文写的我自己没看的很懂:

3.1摘要

在数字时代,语言往往通过缩写、表情符号和语音消息传达。然而,《纽约时报》提供的Wordle游戏提供了一个回归语言基础的机会。因此,我们对Wordle的结果进行了数据分析。

首先,我们建立了一个GRU预测模型,以预测2023年3月1日报告结果的数量。该模型使用了有效的门控循环单元(GRU)算法。因此,训练集对测试集的预测相对误差率是2.1569%,相对RESE为6.4957%,表明模型预测具有较高的准确性。2023年3月1日报告结果数量的预测区间为20367 ± 2.01569%。

其次,我们对单词属性和分数进行了数据分析,分数定义为得分百分比。然后,我们定义了单词的四个属性词频、字母频率总和、字母重复模式(2/3或无),以及主要词性

对于前两个属性,我们进行了与变量“得分”的回归分析。fword与得分之间的皮尔逊相关系数为-0.3165,fletter与得分之间的相关系数为-0.4005。rep和pos可以用于对单词进行分类。箱线图结果显示,rep的中位数差异为0.13004,而pos仅为0.05973。因此,我们认为fword、fletter和rep可以影响得分百分比,而pos则不能。

第三,我们开发了GSRF预测模型,以预测2023年3月1日EERIE的1到X的得分百分比。网格搜索随机森林(GSRF)算法是通过使用最佳超参数组合改进的随机森林算法。我们选择了fword、fletter和rep作为模型的输入参数。模型的训练结果显示MSE为20.70641,MAE为3.24388,表明模型具有良好的预测性能。(表10)EERIE的预测结果为(1,7,23,30,23,13,3)。此外,我们通过分别向fword和fletter添加高斯噪声进行了敏感性分析,结果显示模型的敏感性较低,因此非常稳定。

第四,使用==K-Means++==进行了难度率分类模型。我们首先定义了每个单词的难度日期δ。EERIE的预测分布难度率为0.35916。然后,我们使用K-Means++分析每个单词的δ,并获得了五个难度级别(表11)。EERIE被归类为第三级。最后,我们将模型的分类与部分采样单词的手动难度评分进行了比较,匹配率为93.33%,确认了模型的准确性。

最后,我们探索了另外两个数据特征。之后,我们根据稳定的模型为《纽约时报》的填字游戏编辑撰写了一封信。

关键词:GRU;回归分析;箱线图分析;GSRF;K-Means++

3.2相关的算法模型

下面的这个论文内容里面的这个GRU我是没有听说过的,但是这个时间序列分析我略有了解,可能是一个著名的算法,可以了解一下,学学;

GRU(门控递归单元)是一种递归神经网络(RNN),通常用于时间序列分析
用于时间序列分析。它具有与 LSTM(长短期记忆)架构类似的特性,但计算速度通常更快。
GRU 架构背后的主要思想是有两个门:复位门和更新门、
这两个门控制网络中的信息流。重置门决定应遗忘多少之前的隐藏状态,而更新门则决定应向当前隐藏状态添加多少新输入。

下面的这个就是实现的这个方法使用的就是pytorch总金额个模型,划分这个测试集合训练集合,这个是常规操作,这个大致可以看懂;

在Python丰富库的支持下,我们选择使用PyTorch提供的GRU模型。PyTorch是一个基于Python的机器学习库,其独特之处在于动态计算图,这与静态计算图不同。动态计算图可以在运行时进行修改,这意味着模型可以根据我们的需求进行调整。这对于处理可变长度的序列数据非常有用,并且非常适合预测我们需要的报告结果数量。在PyTorch中,我们可以利用torch.nn.GRU类轻松构建和训练GRU模型,并使用该模型进行预测。我们使用了从2022年1月7日到2022年12月31日的每日“报告结果数量”时间序列数据的80%作为训练集,剩余的20%作为测试集用于我们的GRU模型。测试集上的预测结果可视化如图4所示。

下面的这个就是进行这个误差的分析,使用的是这个均方根误差,之前在这个机器学习里面略有了解,但是这个公式没讲过,这个对于图像的说明,也可以学习一下;

image-20241118195816947

下面的这个聚类的方法的这个具体的描述,这个和之前学习的这个二维空间里面划分的那个机器学习的思想是很像的;

K-Means聚类算法是一种常用的无监督机器学习算法,用于将数据划分成若干类别。它预先指定初始的聚类数量和初始聚类中心,并根据样本之间的距离大小将样本集划分为不同的聚类。使用欧氏距离作为数据对象之间相似性的度量,相似性与数据对象之间的距离成反比。相似性越大,距离越小。根据数据对象与聚类中心之间的相似性,不断更新聚类中心的位置,并持续减少聚类的平方误差和(SSE)。当SSE不再变化或目标函数收敛时,聚类结束并获得最终结果。

下面的这个就是进行的灵敏度的分析,分别对于这几个属性进行分析:最后就是一些这个参考文献和这个相关的这个模型的优缺点了;

image-20241118200625258

4.总结

我的这个第一次阅读这个英文的优秀论文,主要是为了这个亚太进行准备,确实这个英文的这个论文的阅读是有难度的,而且这个文章里面使用的这个相关的这个模型和算法,对我我目前的这个水平而言,还是遥不可及的,可能是这个论文选择的时候选的太高了,但是对于这个一些问题,常用的这个方法,可能也会为我的这个接下来的这个备战指明这个学习的方向吧;

例如这个聚类里面的这个kmeans我了解过,但是这个++不了解,可能就是一个改进的版本呢,还有这个灵敏度分析,以及这个模型的评价之类的都是我们的数学建模的传统思路,万变不离其宗;

例如这个聚类里面的这个kmeans我了解过,但是这个++不了解,可能就是一个改进的版本呢,还有这个灵敏度分析,以及这个模型的评价之类的都是我们的数学建模的传统思路,万变不离其宗;

路漫漫其修远兮,数学建模之路,任重而道远,通过这次的学习,可能会知道一些这个相关的论文写作格式之类的,但是这个论文目前对于我而言,跨度太大,后面可能会选择合适的论文进行深入学习,比赛的时候进行模仿;

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/886565.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

无人机飞手入门指南

无人机飞手入门指南旨在为初学者提供一份全面的学习路径和实践建议,帮助新手快速掌握无人机飞行技能并了解相关法规知识。以下是一份详细的入门指南: 一、了解无人机基础知识 1. 无人机构造:了解无人机的组成部分,如机身、螺旋桨…

【JavaEE初阶 — 多线程】定时器的应用及模拟实现

目录 1. 标准库中的定时器 1.1 Timer 的定义 1.2 Timer 的原理 1.3 Timer 的使用 1.4 Timer 的弊端 1.5 ScheduledExecutorService 2. 模拟实现定时器 2.1 实现定时器的步骤 2.1.1 定义类描述任务 定义类描述任务 第一种定义方法 …

AIGC----生成对抗网络(GAN)如何推动AIGC的发展

AIGC: 生成对抗网络(GAN)如何推动AIGC的发展 前言 随着人工智能领域的迅猛发展,AI生成内容(AIGC,AI Generated Content)正成为创意产业和技术领域的重要组成部分。在AIGC的核心技术中,生成对抗网络(GAN&am…

基于css的Grid布局和vue实现点击左移右移轮播过渡动画效果

直接上代码&#xff0c;以下代码基于vue2,需要Vue3或者react可以使用国内直连GPT/Claude来帮你转换下 代码如下&#xff1a; // ScrollCardsGrid.vue <template><div class"scroll-cards-container"><!-- 左箭头 --><div v-show"showLef…

Springboot如何打包部署服务器

文章目的&#xff1a;java项目打包成jar包或war包&#xff0c; 放在服务器上去运行 一、编写打包配置 1. pom.xml 在项目中的pom.xml文件里面修改<build>...</build>的代码 >> 简单打包成Jar形式&#xff0c;参考示例&#xff1a; <build><fina…

RabbitMQ-死信队列(golang)

1、概念 死信&#xff08;Dead Letter&#xff09;&#xff0c;字面上可以理解为未被消费者成功消费的信息&#xff0c;正常来说&#xff0c;生产者将消息放入到队列中&#xff0c;消费者从队列获取消息&#xff0c;并进行处理&#xff0c;但是由于某种原因&#xff0c;队列中的…

ALSA - (高级Linux声音架构)是什么?

ALSA是Linux声音系统的核心组件&#xff0c;让用户可以精细控制声音硬件和声音进出。它通过抽象层屏蔽了硬件复杂性&#xff0c;使开发者能够专注于功能实现。这篇文章将逐步解析ALSA的基础知识&#xff0c;包括其运作原理、应用场景&#xff0c;以及如何完成一个基本配置和使用…

Ceph层次架构分析

Ceph的层次结构可以从逻辑上自下向上分为以下几个层次&#xff1a; 一、基础存储系统RADOS层 功能&#xff1a;RADOS&#xff08;Reliable Autonomic Distributed Object Store&#xff09;是Ceph的底层存储系统&#xff0c;提供了分布式存储的核心功能。它是一个完整的对象存…

在连锁零售行业中远程控制软件的应用

在连锁零售行业&#xff0c;远程控制软件正逐渐成为提高效率和降低成本的重要工具。作为零售经理&#xff0c;您可能已经注意到这种技术带来的变化。试想一下&#xff0c;无论您身在何处&#xff0c;都可以实时监控商店的运营情况&#xff0c;甚至在远离的地方解决顾客的问题。…

JS学习日记(jQuery库)

前言 今天先更新jQuery库的介绍&#xff0c;它是一个用来帮助快速开发的工具 介绍 jQuery是一个快速&#xff0c;小型且功能丰富的JavaScript库&#xff0c;jQuery设计宗旨是“write less&#xff0c;do more”&#xff0c;即倡导写更少的代码&#xff0c;做更多的事&#xf…

支持用户注册和登录、发布动态、点赞、评论、私信等功能的社交媒体平台创建!!!

需要整体源代码的可以在我的代码仓下载https://gitcode.com/speaking_me/social-media-platformTest.git 社交媒体平台 描述&#xff1a;社交媒体平台需要支持用户注册、发布动态、点赞、评论、私信等功能。 技术栈&#xff1a; 前端&#xff1a;React, Angular, Vue.js后端…

数字IC后端实现之Innovus specifyCellEdgeSpacing和ICC2 set_placement_spacing_rule的应用

昨天帮助社区IC训练营学员远程协助解决一个Calibre DRC案例。通过这个DRC Violation向大家分享下Innovus和ICC2中如何批量约束cell的spacing rule。 数字IC后端手把手实战教程 | Innovus verify_drc VIA1 DRC Violation解析及脚本自动化修复方案 下图所示为T12nm A55项目的Ca…

【时间之外】IT人求职和创业应知【37】-AIGC私有化

目录 新闻一&#xff1a;2024智媒体50人成都会议暨每经20周年财经媒体峰会召开 新闻二&#xff1a;全球机器学习技术大会在北京召开 新闻三&#xff1a;区块链技术在金融领域的应用取得新突破 不知不觉的坚持了1个月&#xff0c;按照心理学概念&#xff0c;还要坚持2个月&am…

基于单片机智能温室大棚监测系统

本设计以单片机为核心的智能温室大棚监测系统&#xff0c;用于监测大棚内的温湿度、土壤湿度、CO2浓度和光照强度。该系统以STM32F103C8T6芯片为核心控制单元&#xff0c;涵盖电源、按键、NB-IoT模块、显示屏模块、空气温湿度检测、土壤湿度检测、二氧化碳检测和光敏电阻等模块…

JavaScript逆向爬虫教程-------基础篇之常用的编码与加密介绍(python和js实现)

目录 一、编码与加密原理 1.1 ASCII 编码1.2 详解 Base64 1.2.1 Base64 的编码过程和计算方法1.2.2 基于编码的反爬虫设计1.2.3 Python自带base64模块实现base64编码解码类封装 1.3 MD5消息摘要算法 1.3.1 MD5 介绍1.3.2 Python实现md5以及其他常用消息摘要算法封装 1.4 对称加…

RHCSA学习超详细知识点2命令篇

输入命令行的语法 终端中执行命令需要遵照一定的语法&#xff0c;输入命令的格式如下&#xff1a; 命令 参数命令 -选项 参数 输入命令时可以包含多个选项&#xff0c;假如一个命令有-a,-b,-c,-d四个选项&#xff0c;可以写作 命令 -a -b -c -d 参数 这里的多个选项可以“提…

Java结合ElasticSearch根据查询关键字,高亮显示全文数据。

由于es高亮显示机制的问题。当全文内容过多&#xff0c;且搜索中标又少时&#xff0c;就会出现高亮结果无法覆盖全文。因此需要根据需求手动替换。 1.根据es的ik分词器获取搜索词的分词结果。 es部分&#xff1a; //中文分词解析 post /_analyze {"analyzer":"…

5. langgraph中的react agent使用 (从零构建一个react agent)

1. 定义 Agent 状态 首先&#xff0c;我们需要定义 Agent 的状态&#xff0c;这包括 Agent 所持有的消息。 from typing import (Annotated,Sequence,TypedDict, ) from langchain_core.messages import BaseMessage from langgraph.graph.message import add_messagesclass …

STL序列式容器之list

相较于vector的连续性空间&#xff0c;list相对比较复杂&#xff1b;list内部使用了双向环形链表的方式对数据进行存储&#xff1b;list在增加元素时&#xff0c;采用了精准的方式分配一片空间对数据及附加指针等信息进行存储&#xff1b; list节点定义如下 template<clas…

Science Robotics 封面论文:视触觉传感器的手内操作

现在&#xff0c;随便丢给机械手一个陌生物体&#xff0c;它都可以像人类一样轻松拿捏了。除了苹果&#xff0c;罐头、乐高积木、大象玩偶、骰子&#xff0c;都不在话下&#xff1a; 这就是来自Meta FAIR团队最新的NeuralFeels技术&#xff0c;通过融合触觉和视觉&#xff0c;机…