2024美国大学生数学建模C题网球运动中的势头详解思路+具体代码

2024美国大学生数学建模C题网球运动中的势头详解思路+具体代码

在这里插入图片描述

E题数据已更新,做E题的小伙伴推荐看看博主的E题解析文章。那么废话不多说我们继续来做C题。

赛题分析

我们先阅题:

在2023年温布尔登男单决赛中,20岁的西班牙新星卡洛斯·阿尔卡拉兹击败了36岁的 诺瓦克·德约科维奇。这是德约科维奇自2013年以来在温布尔登的首次失利,也终结 了这位历史上最伟大的大满贯选手之一的辉煌战绩。

这场比赛本身就是一场非凡的战斗。[1]德约科维奇似乎注定要轻松获胜,因为他以6比1 控制了第一局(7局中赢了6局)。然而,第二盘比赛气氛紧张,最终阿尔卡雷斯在抢七局 中以7 - 6获胜。第三局与第一局相反,阿尔卡拉斯以6 - 1轻松获胜。这位年轻的西班 牙人在第四盘开始时似乎完全控制了比赛,但不知怎么的,比赛再次改变了方向,德约 科维奇完全控制了比赛,以6比3赢得了比赛。第五盘也是最后一盘,德约科维奇从第四 盘开始保持优势,但再次改变方向,阿尔卡拉兹获得控制并以6比4获胜。本次比赛的数 据在提供的数据集中,“match_id”为“2023-wimbledon1701”。你可以用“set_no” 列= 1看到德约科维奇在第一盘领先时的所有得分。令人难以置信的挥杆,有时是在许多 分甚至是比赛中,发生在似乎有优势的球员身上,通常被归因于“势头”。

读到这里感觉这个题有点意思,比较抽象。这美赛难道是想让我们建模找出势头?说实话这玩意多半是和时间序列预测有关,而且这东西预测出来有点虚无缥缈,也就是言之有理即可,重要的是有过程的数据分析,题目不会算很难,给了很多答主自由选择模型的空间。我们继续往下读题:

字典上对动量的一个定义是“通过运动或一系列事件获得的强度或力”。[2]在体育运 动中,一个团队或球员在比赛中可能会感到他们有动力,或“力量/力量”,但很难衡 量这种现象。此外,我们也不清楚比赛中的各种事件是如何创造或改变动量的。 2023年温布尔登男单前两轮之后的每一分数据。你可以选择包含额外的玩家信息或其他 数据,但你必须完整地记录这些来源。使用这些数据:

(1).开发一个模型,在游戏流程捕捉势头,并将其应用于一场或多场比赛。你的模型应该识别出哪名球员在比赛的特定时间表现更好,以及他们的表现有多好。 提供基于您的模型的可视化来描述匹配流。注:在网球比赛中,发球的选手赢得得 分/比赛的可能性要大得多。您可能希望以某种方式将此因素纳入您的模型中。

(2).一位网球教练怀疑“势头”在比赛中是否起作用。相反,他假设一个玩家在游戏中 的波动和成功的运行是随机的。使用你的模型/指标来评估这种说法。

(3).教练们很想知道,是否有一些指标可以帮助确定比赛流程何时会从有利于一名球员转变为有利于另一名球员。

  • 使用至少一场比赛提供的数据,开发一个预测比赛中这些摆动的模型。哪些因素看起来最相关(如果有)?
  • 考虑到过去比赛中动量波动的差异,你如何建议一个球员在新的比赛中面对不同的球员?

(4).在一个或多个其他比赛中测试你开发的模型。你对比赛结果的预测有多准确?如果模 型有时表现不佳,您能否确定可能需要包括在未来模型中的任何因素?您的模型对 其他比赛(如女子比赛)、锦标赛、球场表面和其他运动(如乒乓球)的通用性如何?

(5).提交一份不超过25页的调查报告,并包括一到两页的备忘录,总结你的结果,并就“ 势头”的作用向教练提出建议,以及如何让球员准备好应对影响网球比赛过程的事件。

题一、抓捕势头模型

不看数据集不知道,一看数据集单场比赛居然可以有这么多特征,那么该题的最大问题就是如何用好这些数据集了。首先我们要明白一点,就是这些数据是建立在时间之上的,也就是时序数据。时序数据不能用传统的数据分析方法,而是要尽可能将时间视为一个特征链去分析,也就是视为一个x轴,在时间轴上去衡量计算各个维度的特征关联。模型应该能够在比赛的任何给定时间点评估哪位选手表现更好,以及他们的表现优势有多大。此外,模型应该考虑到发球方赢得得分/局的概率通常更高这一因素。

单次比赛数据包含了详细的比赛信息,包括比赛ID、选手姓名、比赛经过的时间、盘数、局数、分数等多达46个字段。这些数据提供了每一分的详细记录,包括选手的得分情况、发球速度、发球方向、球的落点深度、选手跑动距离、连续击球数(rally count)等。

数据处理和分析

首先,需要整理和分析提供的数据。这可能包括每个得分的详细信息,比如哪位选手得分、得分是如何获得的(例如,发球得分、主动得分或对手失误)以及得分时的比赛状态(例如,比分、局数、盘数)。

附加数据:可能还需要考虑选手的一些基本信息,如世界排名、赛前状态、历史对决记录等,这些都可能影响比赛动力的评估。

我们需要详细分析每个得分事件,并根据比赛情况(如谁赢得了分数)来更新得分,所以进行积分规则编程尤为重要。

建模思路

  1. 解析规则:根据提供的计分规则,我们需要一个函数来解释每个得分事件,并更新每位选手的得分。
  2. 计算得分:我们将使用比赛的得分事件来模拟每个游戏内的得分变化。每位选手的得分将根据比赛规则更新。
  3. 确定动力:我们可以通过考虑比赛中的关键事件(如破发点、保发、发球优势)来确定每位选手的动力。动力可以用得分差异来表示,也可以通过其他衡量方式来衡量,比如连续得分或突然得分变化。
  4. 可视化:使用得分差异和比赛关键时刻,我们可以创建一个时间序列图来显示比赛动力的变化。

规则题目已经给出:

在这里插入图片描述

那么我们开始进行仿真模拟单场发球规则,而且这么多维度的数据,必须要进行降维或者是优化得分更新逻辑,或者将数据分批处理,在更新得分之前先预处理数据以减少需要处理的数据量。

由于网球比赛的计分规则相对复杂,我们需要确保模型能够处理以下情况:

  • 普通得分,从0(Love)开始,到15、30、40,然后赢得游戏。
  • 当双方得分都达到40(Deuce)时,需要赢得连续两分才能赢得游戏。
  • 盘的胜利需要赢得至少6个游戏,并且至少领先对手2个游戏。如果双方都赢得6个游戏,那么进行决胜局。
  • 比赛的胜利需要赢得3个盘。

在网球得分系统中,当比分到达40-40(Deuce)时,需要连续赢得两分才能赢得该游戏。此外,在6-6平局时,通常会进行决胜局(Tie-break),其计分规则与普通游戏不同。在决胜局中,首先赢得7分(必须领先2分)的选手将赢得该盘。如果是比赛的最后一盘(通常是第五盘),则可能需要10分来赢得胜利。所以我们还需要加入Deuce规则:

考虑以上40-40(Deuce)的情况:

Rowcolumn(s)Value(s)Description
Row 8p1_score, p2_score40, 40The score is 40 – 40 meaning each player has won 3 previous points (this is also called “deuce”)
point_victor1Alcaraz wins point 7 (in row 8)
Row 9p1_score, p2_scoreAD,40Since Alcaraz won the previous point (point 7) the score on point 8 is now “AD” for Alcaraz and “40” for Jarry meaning Alcaraz has won one more point and could win the game on the next point.
point_victor2Jarry (player 2) wins point 8 (in row 9).
Row 10p1_score, p2_score40, 40The score returns to 40 – 40 (“deuce”) meaning each player has won the same number of previous points although now it is 4 points each.
point_victor1Alcaraz wins point 9 (in row 10).
Row 11p1_score, p2_scoreAD,40Alcaraz again has the advantage having won point 9
point_victor1Alcaraz wins point 10 (in row 11) which means he has won the game (has score 2 more points now).
Row 12game_no2This is now the first point of game 2.
p1_games1Alcaraz won game 1.
# 定义更新得分的函数,考虑到deuce和advantage的情况
def update_match_scores(df):p1_points, p2_points = 0, 0  # Points in a gamep1_games, p2_games = 0, 0  # Games in a setp1_sets, p2_sets = 0, 0  # Sets in the matchfor index, row in df.iterrows():if row['point_victor'] == 1:p1_points += 1else:p2_points += 1if p1_points >= 4 and p1_points - p2_points >= 2:p1_games += 1p1_points, p2_points = 0, 0  # Reset pointselif p2_points >= 4 and p2_points - p1_points >= 2:p2_games += 1p1_points, p2_points = 0, 0  # Reset pointsif p1_games >= 6 and p1_games - p2_games >= 2:p1_sets += 1p1_games, p2_games = 0, 0  # Reset gameselif p2_games >= 6 and p2_games - p1_games >= 2:p2_sets += 1p1_games, p2_games = 0, 0  # Reset gamesdf.loc[index, 'p1_points'] = p1_pointsdf.loc[index, 'p2_points'] = p2_pointsdf.loc[index, 'p1_games'] = p1_gamesdf.loc[index, 'p2_games'] = p2_gamesdf.loc[index, 'p1_sets'] = p1_setsdf.loc[index, 'p2_sets'] = p2_setsreturn df

在这里插入图片描述

这样一来我们就先完成了捕捉赛点发生时的比赛流程模拟,现在捕捉势头也就是预测峰值走向,其实就是梯度的概念,下一步我们开始进行时序预测模型的建模处理:

在这里插入图片描述

这样一来我们就先完成了捕捉赛点发生时的比赛流程模拟,现在捕捉势头也就是预测峰值走向,其实就是梯度的概念,下一步我们开始进行时序预测模型的建模处理。

对时序预测算法不是很有把握的推荐去看看博主之前写的专栏,很有帮助。先记录到这里后面整理一下,期待大家的关注和支持!就是我一直以来写作的动力!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/663373.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

数据结构—动态查找

动态查找介绍 1. 动态查找的引入:当查找表以线性表的形式组织时,若对查找表进行插入、删除或排序操作,就必须移动大量的记录,当记录数很多时,这种移动的代价很大。 2. 动态查找表的设计思想:表结构本身是…

【论文速览_01】Awesome Few Shot Segmentation论文

Awesome Few Shot Segmentation Awesome Few Shot Segmentation论文CVPR 2023Hierarchical Dense Correlation Distillation for Few-Shot Segmentation文章内容 MIANet: Aggregating Unbiased Instance and General Information for Few-Shot Semantic Segmentation文章内容 I…

探讨深浅拷贝在js加密中的运用

深浅拷贝是JavaScript中常用的概念,用于复制对象或数组。它们在处理数据时有不同的用途,适用于不同的场景。在本文中,我们将详细介绍深浅拷贝的概念,提供案例代码,并探讨它们在JavaScript中的应用场景,以及…

MySQL原理(一)架构组成之逻辑模块(1)组成

总的来说,MySQL可以看成是二层架构,第一层我们通常叫做SQL Layer,在MySQL数据库系统处理底层数据之前的所有工作都是在这一层完成的,包括权限判断,sql解析,执行计划优化,query cache的处理等等&…

中二少年工具箱(PC端)简介

同学们可以私信我加入学习群! 正文开始 简介一、功能模块1.node版本管理工具 总结 简介 中二少年开发的中二少年工具箱,相信博主,功能不孬。 辅助自己开发工作,帮助新人快速入门,提供交互式文档辅助学习……如果还不…

拓展欧几里得法求逆元

板子: x即为最终答案,x可能为负数,加模数即可 乘法逆元 - OI Wiki (oi-wiki.org) void exgcd(int a, int b, int& x, int& y) {if (b 0) {x 1, y 0;return;}exgcd(b, a % b, y, x);y - a / b * x; } 使用: exgcd(a, n 1, x,…

空间计算时代加速到来,需要的不只是苹果

近年来,科技行业一直在期待“寒武纪”时刻。伴随技术革命的深入推进,所有厂商都预感新的时代即将到来,并期待自己成为那个引爆点,轻轻一触,推开一扇新的未来之门。 今年开年,苹果就为科技圈锚定了一个可能…

Hutool导入导出用法

整理了下Hutool导入导出的简单使用。 导入maven或jar包&#xff08;注意这里导入的poi只是为了优化样式&#xff09; <!-- https://mvnrepository.com/artifact/cn.hutool/hutool-all --> <dependency><groupId>cn.hutool</groupId><artifactId&g…

2024技术发展洞察与趋势学习总结

2023技术发展洞察 2024技术发展趋势

《Lua程序设计》-- 学习10

环境&#xff08;Environment&#xff09; 具有动态名称的全局变量 全局变量的声明 由于Lua语言将全局变量存放在一个普通的表中&#xff0c;所以可以通过元表来发现访问不存在全局变量的情况。 正如前面所提到的&#xff0c;我们不允许值为nil的全局变量&#xff0c;因为值为…

【Java程序设计】【C00196】基于(JavaWeb+SSM)的旅游管理系统(论文+PPT)

基于&#xff08;JavaWebSSM&#xff09;的旅游管理系统&#xff08;论文PPT&#xff09; 项目简介项目获取开发环境项目技术运行截图 项目简介 这是一个基于ssm的旅游平台 本系统分为前台、管理员2个功能模块。 前台&#xff1a;当游客打开系统的网址后&#xff0c;首先看到的…

C# 引用同一个dll不同版本的程序集

因为项目需要所以必须在项目中引用不同版本的同一程序集 我要引用的文件是newtonsoft.json.dll 两个版本为12.0.0.0 和4.0.0.0 1.如果已经先引入了newtonsoft.json 12.0.0.0版本的程序集&#xff0c;如果直接引入另一个版本的程序集的话会提示不成功&#xff0c;所以先将另一个…

分布式ID介绍实现方案总结

分布式 ID 介绍 什么是 ID&#xff1f; 日常开发中&#xff0c;我们需要对系统中的各种数据使用 ID 唯一表示&#xff0c;比如用户 ID 对应且仅对应一个人&#xff0c;商品 ID 对应且仅对应一件商品&#xff0c;订单 ID 对应且仅对应一个订单。 我们现实生活中也有各种 ID&…

BetrFS: A Compleat File System for Commodity SSDs——论文阅读

EuroSys 2022 Paper 分布式元数据论文汇总 问题 在不同的工作负载下&#xff0c;没有单一的Linux文件系统在普通SSD上始终表现良好。我们将一个完备的文件系统定义为在各种微基准测试和应用程序中&#xff0c;没有一个工作负载的性能低于最佳文件系统性能的30%&#xff0c;并…

EasyX图形库学习(一)

目录 一、easyX图形库基本介绍 1、easyX的原理 2、easyX的安装 3、easyX的颜色&#xff08;RGB颜色模型&#xff09; 颜色模型相关函数: 4、easyX的坐标 二、相关函数介绍: 绘图设备相关函数&#xff1a; 图形颜色及样式设置相关函数: 图形绘制相关函数: 文字输出相关…

Linux多线程服务端编程:使用muduo C++网络库 学习笔记 第十一章 反思C++面向对象与虚函数(下)

11.7.2 值语义与生命期 值语义的一个巨大好处是生命期管理很简单&#xff0c;就跟int一样——你不需要操心int的生命期。值语义的对象要么是stack object&#xff0c;要么直接作为其他object的成员&#xff0c;因此我们不用担心它的生命期&#xff08;一个函数使用自己stack上…

分享个前端工具-取色调色工具

这里虽然贴了两个&#xff0c;但推荐 Pipette. PipetteWin22.10.22.zip: https://download.csdn.net/download/rainyspring4540/88799632 图标&#xff1a; 界面&#xff1a; ColorPix https://download.csdn.net/download/rainyspring4540/88799642 图标&#xff1a; 界面…

Google Play上架:因行为透明度被拒审或下架的政策自查(基于区块链的内容)

近期很多朋友的项目出现因行为透明度问题被谷歌拒审或者已经上架的包被下架甚至封号,今天解释一下为什么会被封号下架,根据是什么? 目录 政策发布时间与截止时间政策内容政策背景政策解析和问题讲解政策发布时间与截止时间 基于区块链的内容相关政策,于2023-07-12 公布,…

看完这篇文章,你一定能看懂Datasheet!

大家好&#xff0c;我是砖一。 针对以上学妹的疑问&#xff0c;我有几点建议&#xff0c;大家可以听一下~ 一&#xff0c;怎么样查找Datasheet&#xff08;数据手册&#xff09; 大多数人下意识就点开浏览器&#xff0c;把型号往里面一输&#xff0c;不建议这样。 对于刚入行…

Fluent的小bug处理:后处理截面显示存在漏洞

最近发现的Fluent的bug&#xff0c;关于后处理截面显示不完整的问题。 1 现象 在使用六面体核心类型单元&#xff08;包括四面体-六面体核心和多面体-六面体核心&#xff09;进行网格划分的时候&#xff0c;可能会在截面上不能完整捕捉单元形状及其分布状态&#xff0c;导致做…