第100+2步 ChatGPT文献复现:ARIMAX预测肺结核 vol. 2

基于WIN10的64位系统演示

一、写在前面

各位大佬,不知大家是否把结果一复现出来了呢?

我们继续往下看,首先复习一下:

《PLoS One》杂志的2023年一篇题目为《A comparative study of three models to analyze the impact of air pollutants on the number of pulmonary tuberculosis cases in Urumqi, Xinjiang》文章的公开数据做案例。

这文章做的是用:空气污染物对新疆乌鲁木齐肺结核病例数影响的比较研究。

在结果一中,我们把时间序列进行了分解,使其变成了时间序列的总体趋势、季节性和随机成分,最主要的就是总体趋势季节性成分咯。看过我之前的ARIMA系列的大佬应该记得,这两个性质关系到ARIMA模型的选择和调参。

二、学习和复现:结果二ARIMA模型的调参和诊断

咱们一段一段来:

1第一段:

下面是原文:

上翻译:

如图2所示,乌鲁木齐的PTB病例系列显然是非平稳的。经过一阶差分后,得到了ACF图和PACF图(见图3)。ACF图显示,滞后2个顺序后,ACF值落入双标准偏差区间。总之,一阶差分后的PTB病例系列具有短期相关性,并且通过ADF测试证明是平稳的(ADF = -9.14,P < 0.05)。

然后再一句一句来:

①“如图2所示,乌鲁木齐的PTB病例系列显然是非平稳的。之前说过,总体趋势上升或者下降,那就是数据不平稳。特别是做这个时间序列拆分,看的更加明显。

②“经过一阶差分后,得到了ACF图和PACF图(见图3)。:这里就是雷打不动的ACF和PACF图,由于数据不平稳,所以无脑做一次一般的一阶拆分。看这个图的模样,应该是用Eview做的(具体教程传送门),我们这里就用SPSS平替呗(具体教程传送门)

参数设置如下:

SPSS出的图是ACF和PACF是分开的,而原文中用Eview做的是合并的:

③“ACF图显示,滞后2个顺序后,ACF值落入双标准偏差区间。总之,一阶差分后的PTB病例系列具有短期相关性,”这个应该好理解,实际上吧,这个图对于调参,作用不是太大,但是得有。

④“并且通过ADF测试证明是平稳的(ADF = -9.14,P < 0.05)。”:平行性检验对于ARIMA很重要,因此,ADF检验也是必做的。要命的是,SPSS做不了,Eviews可以,所以文章这个结果全部在Eviews做了(教程传送门)

这里补上Eviews做的ACF和PACF图:

做ADF检验结果:

不同软件版本算出的值有点差异属于正常,不要纠结。

(2)第二段:

再看原文:

上翻译:

通过对肺结核病例数量的数据特征和稳定化过程的初步分析,确定了ARIMA(p, 1, q)(P, 0, Q)12模型。接下来,为了在更大范围内选择最优模型,进行了自相关函数(ACF)和偏自相关函数(PACF)的分析,结果显示p、q、Q=0、1或2,P=0或1(见图3),因此总共有3×3×3×2=54种不同的选择。对54个模型的系数进行了T检验,对残差进行了Box检验。最终,10个模型通过了测试,它们的拟合优度评估结果根据AIC、BIC和MAPE标准在表2中给出。

解读:

通过对肺结核病例数量的数据特征和稳定化过程的初步分析,确定了ARIMA(p, 1, q)(P, 0, Q)12模型。:做了一次一般拆分,d=1。但是吧,可以看到明显的季节趋势,其实D也可以直接等于1。其实也没问题,因为d=1的时候,数据已经平稳,如果在做D=1的季节性拆分,会损失数据。

接下来,为了在更大范围内选择最优模型,进行了自相关函数(ACF)和偏自相关函数(PACF)的分析,结果显示p、q、Q=0、1或2,P=0或1(见图3),因此总共有3×3×3×2=54种不同的选择。:说实话,我也看不懂为何这么取值,我的经验就是无脑去0、1、2、3。来咨询一下GPT:

大家参考一下吧,能自圆其说就行,反正我做就是无脑尝试0、1、2甚至是3。

③“对54个模型的系数进行了T检验,对残差进行了Box检验。最终,10个模型通过了测试,它们的拟合优度评估结果根据AIC、BIC和MAPE标准在表2中给出。”:这个没啥好说的了,劳动密集型,一个一个去建模尝试:要求参数都要通过统计学检验,然后比较AIC和BIC值,挑出2个数值最小的,就是最优模型。具体可以看我之前的教程。

(3)第三段:

原文:

简单翻译一下:

根据最小信息标准,ARIMA(1,1,2)×(0,0,1)12是10个候选模型中具有最小贝叶斯信息准则(BIC=643.75)和最小平均绝对百分比误差(MAPE=15.98%)的最佳模型(见表2)。ARIMA(1,1,2)×(0,0,1)12模型的参数估计结果和白噪声检验结果分别在表3和表4中展示,所有的P值在统计上都是显著的(P<0.05)

解读:

选出最优模型,把它的参数检验结果,白噪声检验结果列出来,又多了几个看起来高大上的结果。

三、个人感悟

也没啥好说的,因为ARIMA建模的步骤很标准化了。至于参数取值范围的问题,不同研究都会不同的,能够自圆其说即可,不必太纠结,毕竟最后都需要做模型假设检验和选择。此外,在强调一遍,不同软件或者统一软件不同版本号,算出来的模型参数和结果会有差异。因此,文章中要写清楚软件及其版本号。

四、数据

链接:https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0277314

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/752500.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

HCIP —— 交换 (VLAN)

VLAN --- 虚拟局域网 在 HCIA 中 &#xff0c;已经学过交换机的一些基础配置&#xff0c;下面进行回顾一些简单的内容。 1.创建VLAN VLAN ID --- 区别和标识不同的VLAN 使用范围&#xff1a;0-4095 &#xff0c; 由12位二进制构成。 0 和 4095 作为 保留的VLAN。 …

simulink汽车动力特性模型

1、内容简介 略 76-可以交流、咨询、答疑 simulink汽车动力特性模型 节气门、Gasoline Engine、离合器、作动器 2、内容说明 略 齿轮半径1 0.06; 齿轮半径2 0.072; 有效齿轮半径 2/3*(radius2^3 - radius1^3)/(radius2^2 - radius1^2); 输入传动比 2.1; 输出传动比 1…

洛谷——查单词+简单题+火车线路 +无聊的数列+最大数——线段树

一、 线段树 P2412 查单词 - 洛谷 | 计算机科学教育新生态 (luogu.com.cn)https://www.luogu.com.cn/problem/P2412 解析&#xff1a; 板子题&#xff0c;区间搜索&#xff0c;不需要区间修改 #include <bits/stdc.h> using namespace std; #define endl \n #define i…

【PHP + 代码审计】函数详解2.0

&#x1f36c; 博主介绍&#x1f468;‍&#x1f393; 博主介绍&#xff1a;大家好&#xff0c;我是 hacker-routing &#xff0c;很高兴认识大家~ ✨主攻领域&#xff1a;【渗透领域】【应急响应】 【Java、PHP】 【VulnHub靶场复现】【面试分析】 &#x1f389;点赞➕评论➕收…

HTML5实现一笔画游戏

HTML5实现一笔画游戏 一笔画问题 一笔画是图论科普中一个著名的问题&#xff0c;它起源于柯尼斯堡七桥问题科普。当时的东普鲁士哥尼斯堡城中有一条河&#xff0c;在这条河上有七座桥&#xff1a; 蓝色的代表河&#xff0c;这条河将城市分开成为四个区域&#xff0c;而七个橙…

深度学习 精选笔记(13.2)深度卷积神经网络-AlexNet模型

学习参考&#xff1a; 动手学深度学习2.0Deep-Learning-with-TensorFlow-bookpytorchlightning ①如有冒犯、请联系侵删。 ②已写完的笔记文章会不定时一直修订修改(删、改、增)&#xff0c;以达到集多方教程的精华于一文的目的。 ③非常推荐上面&#xff08;学习参考&#x…

深入浅出Hive性能优化策略

我们将从基础的HiveQL优化讲起&#xff0c;涵盖数据存储格式选择、数据模型设计、查询执行计划优化等多个方面。会的直接滑到最后看代码和语法。 目录 引言 Hive架构概览 示例1&#xff1a;创建表并加载数据 示例2&#xff1a;优化查询 Hive查询优化 1. 选择适当的文件格…

unity学习(61)——hierarchy和scene的全新认识+模型+皮肤+动画controller

刚刚开始&#xff0c;但又结束的感觉&#xff1f; 1.对hierarchy和scene中的内容有了全新的认识 一定要清楚自己写过几个scene&#xff1b;每个scene之间如何跳转&#xff1b;build setting是add当前的scene。 2.此时的相机需要与模型同级&#xff0c;不能在把模型放在相机下…

STM32的USART能否支持9位数据格式话题

1、问题描述 STM32L051 这款单片机。平常的 USART 串口传输是 8 位数据&#xff0c;但是他的项目需要用串口传输 9 位数据。当设置为 8 位数据时&#xff0c;串口响应中断正常。但是&#xff0c;当设置为 9 位数据时&#xff0c;串口就不产生中断了。USART2 的 ISR 寄存器 RXN…

STM32G4高精度定时器的同步功能

1、引言 STM32G474 所含的高精度定时器(HRTIMER)其实包含了多个定时器&#xff0c;多个定时器之间可以单独工作&#xff0c;也可以进行同步&#xff0c;且高精度定时器还能与片上的其他定时器以及其他芯片进行同步&#xff0c;本文将对高精度定时器的同步功能进行介绍。 2、定…

I2S 协议简介

I2S(Inter-IC Sound)是飞利浦公司提出的一种用于数字音频设备之间进行音频数据传输的总线。和 I2C、SPI 这些常见的通信协议一样&#xff0c;I2S 总线用于主控制器和音频 CODEC 芯片之间传输音频数据。 I2S 接口需要 3 根信号线(如果需要实现收和发&#xff0c;那么就要 4 根信…

Django项目创建和settings设置

2021版本的pycharm有bug,需要将settings.py中 把BASE_DIR后面的/换成, url:统一资源定位符 互联网上每个文件都有一个唯一的url,它包含的信息指出文件的位置以及浏览器应该怎么处理它 语法: protocol://hostname[:port]/path[?query][#fragment] protocol:协议 hostname:主…

适用于系统版本:CentOS 6/7/8的基线安全检测脚本

#!/bin/bash #适用于系统版本&#xff1a;CentOS 6/7/8 echo "----------------检测是否符合密码复杂度要求----------------" #把minlen&#xff08;密码最小长度&#xff09;设置为8-32位&#xff0c;把minclass&#xff08;至少包含小写字母、大写字母、数字、特殊…

51单片机—DS18B20温度传感器

目录 一.元件介绍及原理 二&#xff0c;应用&#xff1a;DS18B20读取温度 一.元件介绍及原理 1.元件 2.内部介绍 本次元件使用的是单总线 以下为单总线的介绍 时序结构 操作流程 本次需要使用的是SKIP ROM 跳过&#xff0c; CONVERT T温度变化&#xff0c;READ SCRATCHPAD…

AI美图设计室试用,可以生成PPT,以及模特试衣

文章目录 美图设计室试用 美图设计室试用 美图设计室是美图秀秀的公司推出的AI图像处理工具&#xff0c;其功能涵盖图片编辑、抠图、海报设计、文生图等常用的AI功能。尽管很多功能需要开通会员使用&#xff0c;但一些免费功能的表现也还不错&#xff0c;值得一用。 美图设计…

Spring Boot(六十九):利用Alibaba Druid对数据库密码进行加密

1 Alibaba Druid简介 之前介绍过Alibaba Druid的,章节如下,这里就不介绍了: Spring Boot(六十六):集成Alibaba Druid 连接池 这章使用Alibaba Druid进行数据库密码加密,在上面的代码上进行修改,这章只介绍密码加密的步骤。 目前越来越严的安全等级要求,我们在做产品…

JS原型和原型链的理解

原型链图&#xff0c;图中Parent是构造函数&#xff0c;p1是通过Parent实例化出来的一个对象 前置知识 js中对象和函数的关系&#xff0c;函数其实是对象的一种 函数、构造函数的区别&#xff0c;任何函数都可以作为构造函数&#xff0c;但是并不能将任意函数叫做构造函数&…

python之前端css样式(一)

css ID选择器 #c1{color:red;#边框为红色border:1px solid red; } <div id"c2">中国移动</div> 类选择器 .xx{color:blue; } <div class"xx">中国联通</div> 标签选择器 li{color: pink; } <ul><li>北京</li…

CSS动画属性(一)加两实例

keyframes 定义 使用可以创建动画&#xff08;逐步改变从一个CSS样式设定到另一个。)可以设置多次变化发生时使用%/关键字from和to 0&#xff05;是开头动画&#xff0c;100&#xff05;是当动画完成。 为了获得最佳的浏览器支持&#xff0c;始终定义为0&#xff05;和100&…

数据分析 | NumPy

NumPy&#xff0c;全称是 Numerical Python&#xff0c;它是目前 Python 数值计算中最重要的基础模块。NumPy 是针对多维数组的一个科学计算模块&#xff0c;这个模块封装了很多数组类型的常用操作。 使用numpy来创建数组 import numpy as npdata np.array([1, 2, 3]) print…