2024年第三届钉钉杯大学生大数据挑战赛初赛赛题浅析

一图流

题目

涉及模型

所需背景知识

综合难度

题量

题目复杂度

初赛A:烟草营销案例数据分析

ARIMA, SARIMA, Prophet, 线性回归, LSTM, 随机森林, XGBoost

时间序列分析, 机器学习, 数据预处理, 统计学

中等

3个主要问题

涉及时间序列预测和集成学习模型

初赛B:医疗门诊患者及用药数据案例分析

RNN, LSTM, 线性回归, SVM, 集成学习(如Stacking, Blending)

时间序列分析, 机器学习, 数据预处理, 医疗数据分析

中等偏上

3个主要问题

涉及时间序列预测和集成学习模型, 医疗数据复杂性较高

AB题综合难度不大,难度可以视作0.4个国赛,题量可以看作0.35个国赛题量。适合于国赛前队伍练手,队伍内磨合。竞赛获奖率50%,八月底出成绩,参赛人数3000队左右。

A:烟草营销案例数据分析

1. 问题背景

烟草是我国重要的国家税收和财政收入来源。国家对烟草实行专卖制度,对烟草及其制品的生产和流通进行严格管理。数据来自某地区近些年多种品牌的烟草销售情况,已做脱敏和数据变换处理。

2. 解决问题

预测分析

1. 销量预测:

   - 使用历史销售数据构建两个不同类型的时间序列预测模型,分别对A1、A2品牌的未来销量进行预测。

   - 模型选择可以包括ARIMA模型、SARIMA模型、Prophet模型等。

2. 销售金额预测:

   - 使用历史销售数据构建两个不同类型的时间序列预测模型,分别对A3、A4品牌的销售金额进行预测。

   - 模型选择可以包括线性回归模型、LSTM神经网络模型等。

3. 集成学习:

   - 在上述分别对销量及销售金额预测模型的基础上,构建集成学习模型,实现对A5品牌的销量和销售金额的联合预测。

   - 可以考虑集成不同的预测模型,如随机森林、XGBoost等,以提高预测精度。

数据处理与模型选择

- 数据预处理:处理缺失值、异常值,进行数据归一化。

- 特征选择:选择影响销量和销售金额的重要特征,进行特征工程。

- 模型评估:使用准确率(Accuracy)、F1-score、AUC面积等指标评估模型性能。

B:医疗门诊患者及用药数据案例分析

1. 问题背景

智慧医疗的出现解决了传统医疗管理系统的不完善等问题。数据来自某医院近些年门诊医疗数据,已做脱敏和数据变换处理。

2. 解决问题

预测分析

1. 康复医学科一病房门诊收入预测:

   - 以日期、患者人数、药品总收入、当日病房收入为基础输入数据,构建两个不同类型的时间序列预测模型,分别预测门诊收入数据。

   - 模型选择可以包括RNN、LSTM等神经网络模型。

2. 康复医学科二病房门诊收入预测:

   - 以相同的输入数据,构建两个不同类型的时间序列预测模型,分别预测门诊收入数据。

   - 模型选择可以包括线性回归、支持向量机(SVM)等。

3. 集成学习:

   - 结合上述两个模型,构建集成学习模型,针对康复医学科三病房,预测门诊收入数据。

   - 可以考虑使用集成学习方法,如Stacking、Blending等,以提高预测准确性。

数据处理与模型选择

- 数据预处理:处理缺失值、异常值,进行数据归一化。

- 特征选择:选择影响门诊收入的重要特征,进行特征工程。

- 模型评估:使用准确率(Accuracy)、F1-score、AUC面积等指标评估模型性能。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/50920.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Redis 哨兵搭建

Redis哨兵(sentinel)搭建 7.2.5 文章目录 一、单节点哨兵1. 环境介绍2. 环境前准备工作3. 安装 Redis 7.2.54. redis 配置修改并且启动4.1 修改配置文件4.2 编写启动脚本 5. 开启主从5.1 开启5.2 主库实例查看主从信息 6. 创建sentinel的配置文件并启动6.1 创建配置文件6.2 启…

Qt-线程-创建线程的三种方法

文章目录 1: 派生于QThread2: 派生与QRunable3: moveToThread 1: 派生于QThread 派生于Qthread 是创建的Qt创建线程的方法 ,重写虚函数void QThread::run(),在run写具体的内容,外部通过start调用,即可执行线程体run() 注意 :派生…

算法-插入排序

插入排序步骤 前面文章分享了两种排序算法:冒泡排序和选择排序。虽然它们的效率都是O(N2),但其实选择排序比冒泡排序快一倍。现在来学第三种排序算法——插入排序。你会发现,顾及最坏情况以外的场景将是多么有用。 插入排序包括以下步骤。 …

2024固定资产管理软件排名 6款好用的企业资产管理软件

固定资产管理是企业财务管理的重要组成部分,选择一款好用的固定资产管理软件可以显著提升资产跟踪和维护的效率。本文将介绍几款功能强大且易于操作的固定资产管理软件,帮助企业优化资产管理流程,确保资产数据的准确性和实时性,从…

软件测试:Postman 工具的使用。开发及测试均需要掌握的测试工具

工具介绍 各个模块功能的介绍如下: 1、New:在这里创建新的请求、集合或环境;还可以创建更高级的文档、Mock Server 和 Monitor以及API。 2、Import:这用于导入集合或环境。有一些选项,例如从文件,文件夹导…

SpringBoot3:轻松使用Jasypt实现配置文件信息加密

文章目录 前言一、概述1.1 Jasypt库简介1.2 Jasypt库的主要特点 二、开发环境三、Jasypt集成到SpringBoot33.1 引入依赖3.2 配置Jasypt3.3 加密配置文件信息3.3.1 方案一(不推荐)a.编写测试类生成加密后的配置文件信息b.运行c.修改原本的配置文件信息 3.…

探索 GPT-4o mini:成本效益与创新的双重驱动

💝💝💝欢迎来到我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。 推荐:kwan 的首页,持续学…

MySQL中的MVCC实现原理与处理流程

1. 什么是MVCC? MVCC,全称Multi-Version Concurrency Control,即多版本并发控制。它是一种并发控制方法,广泛用于数据库管理系统中,以实现对数据库的并发访问。在编程语言中,它实现事务内存。MVCC在MySQL InnoDB中的实现主要是为了提高数据库的并发性能,用更好的方式处…

如何解决 uni-app 项目中 “文件查找失败:‘crypto-js‘“ 的问题

在开发使用 uni-app 框架的项目时,遇到依赖问题是常见的。本文将介绍如何解决编译过程中出现的 “文件查找失败:‘crypto-js’” 错误,并说明这种错误为什么会发生以及如何避免。 问题背景 在对 uni-app 项目进行编译时,我们可能…

【优秀python web系统毕设】基于python的全国招聘数据分析可视化系统,包括随机森林算法

1.1 研究背景 自1997年互联网开始在国内的招聘行业发展至今已有二十几年的历史,互联网招聘进入了蓬勃发展的“黄金时代”。根据智研咨询发布的《2023年中国互联网招聘行业发展现状》报告显示,截至2023年5月,中国互联网招聘平台中&#xff0c…

2-46 基于matlab的声音信号的短时能量、短时过零率、端点检测

基于matlab的声音信号的短时能量、短时过零率、端点检测。通过计算计算短时能量、调整能量门限,然后开始端点检测。输出可视化结果。程序已调通,可直接运行。 2-46 短时能量 短时过零率 端点检测 - 小红书 (xiaohongshu.com)

C++初阶学习第四弹——类与对象(中)

目录 一. 类的默认成员函数 二.六种默认成员函数 1、构造函数 1.1 构造函数的作用 1.2 特性 1.3 默认构造函数 2、析构函数 2.1 析构函数的作用 2.2 析构函数的用法 3、拷贝构造函数 3.1 拷贝构造函数的作用 3.2 特征 3.3 默认拷贝构造函数 三.总结 类与对象&…

Stable Diffusion WebUI本地环境搭建

一、项目代码下载 git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui 二、环境配置 conda create --n stafu python3.10.6 实际上跟自己创建的环境没有关系,项目启动会自动复制这个环境,之后项目根据这个基础环境构建 也可以在自己…

在一个事物方法中开启新事物,完成对数据库的修改

在Java中,使用Transactional注解来管理事务非常常见。但是,在一个已经标记为Transactional的方法内部调用另一个也标记了Transactional的方法时,如果不正确处理,可能会导致一些意料之外的行为。这是因为默认情况下,Spr…

【VUE】封装一个追随鼠标的漂浮组件框架

红色箭头代表鼠标位置&#xff0c;蓝色区域跟随鼠标出现&#xff0c;鼠标进行其他操作的时候&#xff0c;蓝色区域隐藏。 vue全码 <template><divmousemove"updatePosition"mouseleave"hideDiv"class"container":style"{ positi…

《Milvus Cloud向量数据库指南》——BGE-M3:多功能、多语言、多粒度的文本表示学习模型

引言 在自然语言处理(NLP)领域,随着大数据时代的到来,对文本信息的精准处理与高效检索成为了研究热点。BERT(Bidirectional Encoder Representations from Transformers)作为近年来NLP领域的里程碑式模型,以其强大的上下文理解能力在多项任务中取得了显著成效。然而,面…

《C语言实现各种排序算法》

文章目录 一、排序1、排序的各种方式分类 二、插入排序1、直接插入排序2、希尔排序3、希尔排序时间复杂度分析 三、选择排序1、直接选择排序2、堆排序 四、交换排序1、冒泡排序2、快速排序 一、排序 在生活中各种场景中都会有排序的身影存在&#xff0c;在网购时会有价格排序&a…

Apache Nifi挂接MQTT与Kafka实践

目录 1. 说明&#xff1a; 2. 方案设计&#xff1a; 2.1 资源配置&#xff1a; 2.2 交互Topics: 3. 实现步骤 3.1 Nifi 桌面 3.2 MqttToKafka 3.2.1 配置 3.2.2 测试 3.2.3 结果 3.3 KafkaToMqtt 3.3.1 配置 3.3.1 测试 3.3.1 结果 ​编辑 4. 总结&#xff…

Mysql的RedoLog、BingLog、UndoLog

UndoLog undo log 是一种用于撤销回退的日志。在事务没提交之前&#xff0c;MySQL 会先记录更新前的数据到 undo log 日志文件里面&#xff0c;当事务回滚时&#xff0c;可以利用 undo log 来进行回滚。 每当 InnoDB 引擎对一条记录进行操作&#xff08;修改、删除、新增&#…

vue3 命令运行窗口暴露网络地址,以及修改端口号

一般情况下这里的地址是隐藏的 这里加上 --host 可以暴露网络地址&#xff0c;再加上--port --8080 就可以将端口号修改为8080&#xff08;修改后边的数字就可以修改为你想要的端口号&#xff09;