第100+2步 ChatGPT文献复现:ARIMAX预测肺结核 vol. 2

基于WIN10的64位系统演示

一、写在前面

各位大佬,不知大家是否把结果一复现出来了呢?

我们继续往下看,首先复习一下:

《PLoS One》杂志的2023年一篇题目为《A comparative study of three models to analyze the impact of air pollutants on the number of pulmonary tuberculosis cases in Urumqi, Xinjiang》文章的公开数据做案例。

这文章做的是用:空气污染物对新疆乌鲁木齐肺结核病例数影响的比较研究。

在结果一中,我们把时间序列进行了分解,使其变成了时间序列的总体趋势、季节性和随机成分,最主要的就是总体趋势季节性成分咯。看过我之前的ARIMA系列的大佬应该记得,这两个性质关系到ARIMA模型的选择和调参。

二、学习和复现:结果二ARIMA模型的调参和诊断

咱们一段一段来:

1第一段:

下面是原文:

上翻译:

如图2所示,乌鲁木齐的PTB病例系列显然是非平稳的。经过一阶差分后,得到了ACF图和PACF图(见图3)。ACF图显示,滞后2个顺序后,ACF值落入双标准偏差区间。总之,一阶差分后的PTB病例系列具有短期相关性,并且通过ADF测试证明是平稳的(ADF = -9.14,P < 0.05)。

然后再一句一句来:

①“如图2所示,乌鲁木齐的PTB病例系列显然是非平稳的。之前说过,总体趋势上升或者下降,那就是数据不平稳。特别是做这个时间序列拆分,看的更加明显。

②“经过一阶差分后,得到了ACF图和PACF图(见图3)。:这里就是雷打不动的ACF和PACF图,由于数据不平稳,所以无脑做一次一般的一阶拆分。看这个图的模样,应该是用Eview做的(具体教程传送门),我们这里就用SPSS平替呗(具体教程传送门)

参数设置如下:

SPSS出的图是ACF和PACF是分开的,而原文中用Eview做的是合并的:

③“ACF图显示,滞后2个顺序后,ACF值落入双标准偏差区间。总之,一阶差分后的PTB病例系列具有短期相关性,”这个应该好理解,实际上吧,这个图对于调参,作用不是太大,但是得有。

④“并且通过ADF测试证明是平稳的(ADF = -9.14,P < 0.05)。”:平行性检验对于ARIMA很重要,因此,ADF检验也是必做的。要命的是,SPSS做不了,Eviews可以,所以文章这个结果全部在Eviews做了(教程传送门)

这里补上Eviews做的ACF和PACF图:

做ADF检验结果:

不同软件版本算出的值有点差异属于正常,不要纠结。

(2)第二段:

再看原文:

上翻译:

通过对肺结核病例数量的数据特征和稳定化过程的初步分析,确定了ARIMA(p, 1, q)(P, 0, Q)12模型。接下来,为了在更大范围内选择最优模型,进行了自相关函数(ACF)和偏自相关函数(PACF)的分析,结果显示p、q、Q=0、1或2,P=0或1(见图3),因此总共有3×3×3×2=54种不同的选择。对54个模型的系数进行了T检验,对残差进行了Box检验。最终,10个模型通过了测试,它们的拟合优度评估结果根据AIC、BIC和MAPE标准在表2中给出。

解读:

通过对肺结核病例数量的数据特征和稳定化过程的初步分析,确定了ARIMA(p, 1, q)(P, 0, Q)12模型。:做了一次一般拆分,d=1。但是吧,可以看到明显的季节趋势,其实D也可以直接等于1。其实也没问题,因为d=1的时候,数据已经平稳,如果在做D=1的季节性拆分,会损失数据。

接下来,为了在更大范围内选择最优模型,进行了自相关函数(ACF)和偏自相关函数(PACF)的分析,结果显示p、q、Q=0、1或2,P=0或1(见图3),因此总共有3×3×3×2=54种不同的选择。:说实话,我也看不懂为何这么取值,我的经验就是无脑去0、1、2、3。来咨询一下GPT:

大家参考一下吧,能自圆其说就行,反正我做就是无脑尝试0、1、2甚至是3。

③“对54个模型的系数进行了T检验,对残差进行了Box检验。最终,10个模型通过了测试,它们的拟合优度评估结果根据AIC、BIC和MAPE标准在表2中给出。”:这个没啥好说的了,劳动密集型,一个一个去建模尝试:要求参数都要通过统计学检验,然后比较AIC和BIC值,挑出2个数值最小的,就是最优模型。具体可以看我之前的教程。

(3)第三段:

原文:

简单翻译一下:

根据最小信息标准,ARIMA(1,1,2)×(0,0,1)12是10个候选模型中具有最小贝叶斯信息准则(BIC=643.75)和最小平均绝对百分比误差(MAPE=15.98%)的最佳模型(见表2)。ARIMA(1,1,2)×(0,0,1)12模型的参数估计结果和白噪声检验结果分别在表3和表4中展示,所有的P值在统计上都是显著的(P<0.05)

解读:

选出最优模型,把它的参数检验结果,白噪声检验结果列出来,又多了几个看起来高大上的结果。

三、个人感悟

也没啥好说的,因为ARIMA建模的步骤很标准化了。至于参数取值范围的问题,不同研究都会不同的,能够自圆其说即可,不必太纠结,毕竟最后都需要做模型假设检验和选择。此外,在强调一遍,不同软件或者统一软件不同版本号,算出来的模型参数和结果会有差异。因此,文章中要写清楚软件及其版本号。

四、数据

链接:https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0277314

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/752500.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Java进阶-主流框架总结与详解

一、Java框架概述 Java开发领域涵盖了众多框架&#xff0c;这些框架提供了丰富的功能和工具&#xff0c;帮助开发人员更高效地构建应用程序。其中&#xff0c;Spring框架是最为广泛应用的之一&#xff0c;它提供了全方位的解决方案&#xff0c;包括依赖注入、面向切面编程等&a…

HCIP —— 交换 (VLAN)

VLAN --- 虚拟局域网 在 HCIA 中 &#xff0c;已经学过交换机的一些基础配置&#xff0c;下面进行回顾一些简单的内容。 1.创建VLAN VLAN ID --- 区别和标识不同的VLAN 使用范围&#xff1a;0-4095 &#xff0c; 由12位二进制构成。 0 和 4095 作为 保留的VLAN。 …

【R语言基础操作】

&#x1f349;CSDN小墨&晓末:https://blog.csdn.net/jd1813346972 个人介绍: 研一&#xff5c;统计学&#xff5c;干货分享          擅长Python、Matlab、R等主流编程软件          累计十余项国家级比赛奖项&#xff0c;参与研究经费10w、40w级横向 文…

simulink汽车动力特性模型

1、内容简介 略 76-可以交流、咨询、答疑 simulink汽车动力特性模型 节气门、Gasoline Engine、离合器、作动器 2、内容说明 略 齿轮半径1 0.06; 齿轮半径2 0.072; 有效齿轮半径 2/3*(radius2^3 - radius1^3)/(radius2^2 - radius1^2); 输入传动比 2.1; 输出传动比 1…

洛谷——查单词+简单题+火车线路 +无聊的数列+最大数——线段树

一、 线段树 P2412 查单词 - 洛谷 | 计算机科学教育新生态 (luogu.com.cn)https://www.luogu.com.cn/problem/P2412 解析&#xff1a; 板子题&#xff0c;区间搜索&#xff0c;不需要区间修改 #include <bits/stdc.h> using namespace std; #define endl \n #define i…

【PHP + 代码审计】函数详解2.0

&#x1f36c; 博主介绍&#x1f468;‍&#x1f393; 博主介绍&#xff1a;大家好&#xff0c;我是 hacker-routing &#xff0c;很高兴认识大家~ ✨主攻领域&#xff1a;【渗透领域】【应急响应】 【Java、PHP】 【VulnHub靶场复现】【面试分析】 &#x1f389;点赞➕评论➕收…

python内置函数 D

python内置函数 D Python 解释器内置了很多函数和类型&#xff0c;任何时候都能使用。 D 名称描述delattr删除对象的属性。dict创建字典对象。dir列出对象的属性。divmod同时执行除法运算和取模运算&#xff0c;返回一个包含商和余数的元组。 delattr(object, name) delat…

HTML5实现一笔画游戏

HTML5实现一笔画游戏 一笔画问题 一笔画是图论科普中一个著名的问题&#xff0c;它起源于柯尼斯堡七桥问题科普。当时的东普鲁士哥尼斯堡城中有一条河&#xff0c;在这条河上有七座桥&#xff1a; 蓝色的代表河&#xff0c;这条河将城市分开成为四个区域&#xff0c;而七个橙…

深度学习 精选笔记(13.2)深度卷积神经网络-AlexNet模型

学习参考&#xff1a; 动手学深度学习2.0Deep-Learning-with-TensorFlow-bookpytorchlightning ①如有冒犯、请联系侵删。 ②已写完的笔记文章会不定时一直修订修改(删、改、增)&#xff0c;以达到集多方教程的精华于一文的目的。 ③非常推荐上面&#xff08;学习参考&#x…

深入浅出Hive性能优化策略

我们将从基础的HiveQL优化讲起&#xff0c;涵盖数据存储格式选择、数据模型设计、查询执行计划优化等多个方面。会的直接滑到最后看代码和语法。 目录 引言 Hive架构概览 示例1&#xff1a;创建表并加载数据 示例2&#xff1a;优化查询 Hive查询优化 1. 选择适当的文件格…

unity学习(61)——hierarchy和scene的全新认识+模型+皮肤+动画controller

刚刚开始&#xff0c;但又结束的感觉&#xff1f; 1.对hierarchy和scene中的内容有了全新的认识 一定要清楚自己写过几个scene&#xff1b;每个scene之间如何跳转&#xff1b;build setting是add当前的scene。 2.此时的相机需要与模型同级&#xff0c;不能在把模型放在相机下…

odoo中传递上下文

在Odoo中&#xff0c;上下文&#xff08;context&#xff09;是一个非常重要的概念&#xff0c;它允许开发人员在不同的动作、视图或模型间传递信息。上下文通常用于传递特定的标志或变量&#xff0c;这些变量可以影响方法的行为或视图的展示方式。 向表单和动作传递参数 1. …

vue的一些个人理解

个人的一些理解吧 可能不是很全面有的地方可能也不准确 MVVM 的理解 MVVM 是 Model-View-ViewModel 的缩写。MVVM 是一种设计思想。 Model 层代表数据模型&#xff0c;也可以在 Model 中定义数据修改和操作的业务逻辑; View 代表 UI 组件&#xff0c;它负责将数据模型转化成 U…

STM32的USART能否支持9位数据格式话题

1、问题描述 STM32L051 这款单片机。平常的 USART 串口传输是 8 位数据&#xff0c;但是他的项目需要用串口传输 9 位数据。当设置为 8 位数据时&#xff0c;串口响应中断正常。但是&#xff0c;当设置为 9 位数据时&#xff0c;串口就不产生中断了。USART2 的 ISR 寄存器 RXN…

ssh命令——安全远程连接Linux服务器

ssh命令是Secure Shell的简写&#xff0c;其功能是安全地远程连接服务器&#xff0c;ssh是OpenSSH套件中的客户端连接工具&#xff0c;通过SSH加密协议进行远程主机访问&#xff0c;并对远程服务器进行管理。 ssh命令的基本语法格式如下&#xff1a; ssh [选项] 主机名或IP地…

STM32G4高精度定时器的同步功能

1、引言 STM32G474 所含的高精度定时器(HRTIMER)其实包含了多个定时器&#xff0c;多个定时器之间可以单独工作&#xff0c;也可以进行同步&#xff0c;且高精度定时器还能与片上的其他定时器以及其他芯片进行同步&#xff0c;本文将对高精度定时器的同步功能进行介绍。 2、定…

linux安装wxWidgets

概要 在Linux系统中安装erlang时&#xff0c;需要提前安装wxWidgets&#xff01; 官方地址: https://docs.wxwidgets.org gitCode地址&#xff1a;https://gitcode.com/wxWidgets/wxWidgets 下载 下载地址&#xff1a; wget https://github.com/wxWidgets/wxWidgets/releas…

I2S 协议简介

I2S(Inter-IC Sound)是飞利浦公司提出的一种用于数字音频设备之间进行音频数据传输的总线。和 I2C、SPI 这些常见的通信协议一样&#xff0c;I2S 总线用于主控制器和音频 CODEC 芯片之间传输音频数据。 I2S 接口需要 3 根信号线(如果需要实现收和发&#xff0c;那么就要 4 根信…

【Text-to-CAD】基于生成式AI的CAD文件生成工具

Text-to-CAD作为一种机械设计工具,通过简单的文本提示实现CAD文件的智能生成。其开源接口、机器学习支持和Fine Tuning选项为用户提供了高度可定制化的体验。未来的Fine Tuning功能和可能的商业合作有望进一步拓展其在机械设计领域的影响力。 产品概述: 名称: Text-to-CAD类…

Django项目创建和settings设置

2021版本的pycharm有bug,需要将settings.py中 把BASE_DIR后面的/换成, url:统一资源定位符 互联网上每个文件都有一个唯一的url,它包含的信息指出文件的位置以及浏览器应该怎么处理它 语法: protocol://hostname[:port]/path[?query][#fragment] protocol:协议 hostname:主…