文章目录
- 一、时间序列综述
- 二、时间序列数据以及基本概念
- 三、时间序列分解
- 四、指数平滑模型
- 五、一元时间序列分析的模型
- 六、AR(p)模型
- 七、MA(q)模型
- 八、ARMA(p, q)模型
- 九、模型选择:AIC 和 BIC 准则(选小准则)
- 十、检验模型是否识别完全
- 十一、ARIMA(p, d, q)模型
- 十二、SARIMA模型
- 十三、时间序列建模思路
一、时间序列综述
时间序列是指某种现象的指标按照时间顺序排列而成的数值序列。
本文主要介绍时间序列分析中常用的三种模型:季节分解、指数平滑方法以及 ARIMA 模型。
二、时间序列数据以及基本概念
- 时间序列的数据
时间序列的数据类型主要是对同一对象在不同时间连续观察所得到的数据。例如:某个地方 24 小时内每隔一个小时的温度数据;二胎政策以来每年的人口数量…… - 时间序列的基本概念
时间序列主要有两个组成要素构成:- 时间要素
年、季度、月份、周…… - 数值要素
时间要素对应的数值数据……
- 时间要素
- 时间序列根据时间和数值性质的不同,可以分为时期时间序列和时点时间序列。
- 时期时间序列
顾名思义,时期时间序列的数据要素反应的就是在一定时期内的发展水平……(例如:上文所提到的温度数据就是在每隔一小时后的时间点上测得的数据) - 时点时间序列
同样,时点时间序列的数据要素反应的就是在一定时点上的瞬间水平……(例如:上文所提到的人口数据就是由一年这一时期中人口变化二测得的数据)
- 时期时间序列
三、时间序列分解
时间序列的数值变化规律一般有以下四种:长期变动趋势、季节变动规律、周期变动规律、不规则变动。一个时间序列往往是以上四类变化形式的叠加。
数值变化规律 | 字母表示 | 意义 |
---|---|---|
长期趋势 | T | 统计指标在相当长的一段时间内,收到长期趋势影响因素的影响,表现出的持续上升或者持续下降的趋势 |
季节趋势 | S | 由于季节的转变使得指标数值发生周期性变动(其周期一般以月、季、周为单位,不能以年为单位) |
循环变动 | C | 循环变动的周期往往是若干年,其在曲线图上表现为波浪式的周期变动 |
不规则变动 | I | 由某些随机因素导致的数值变化,并且这些因素的作用不可预知且没有规律性 |
这四种变动与指标数值的关系可能是叠加关系,也可能是乘积关系。
-
叠加模型和成绩模型
- 如果四种变动之间是相互独立的关系,那么可以使用叠加模型:Y=T+S+C+IY = T + S + C + IY=T+S+C+I
- 如果四种变动之间存在相互影响关系,那么可以使用乘积模型:Y=T×S×C×IY = T \times S \times C \times IY=T×S×C×I
注意:
(1)使用时间序列分解的前提是具有年内的周期性(不包括以年份为周期的数据)
(2)在具体的时间序列图中,如果随着时间的推移,序列的季节波动越来越大,此时应该采用乘积模型;反之,如果时间序列图的波动保持恒定,则应该采用叠加模型
-
下面来看一个例子
进行时间序列分解的步骤主要有以下几步:
处理缺失值 ⇒\Rightarrow⇒ 定义时间变量 ⇒\Rightarrow⇒ 做出时序图选择模型 ⇒\Rightarrow⇒ 进行时间序列分解在这个例子中,我们可以做出的时序图如下:
可以看出,第二季度的销量明显高于其他季度,因此数据表现出很强的季节性。同时,销量数据的季节波动变化不大,因此可以使用加法分解模型。在 SPSS 中对数据进行季节性分解可得到结果为:
从表格中可知:第一二季度的季节因子为正,第三四季度的季节因子为负,说明第一二季度的平均销量要高于第三四季度。并且第二季度的平均销量要高于全年平均水平 20.930 件;第四季度的平均销量要低于全年平均水平 19.727 件。有意思的是:采用加法模型时,季节因子的和为 0 ;而采用乘法模型时,季节因子的乘积为 1 ,同时,乘法模型的季节因子表示是全年平均销量的倍数。
四、指数平滑模型
-
简单(Simple)模型
名称 使用条件 与之类似的ARIMA模型 简单指数平滑法 不含趋势和季节成分 ARIMA(0, 1, 1) 令 xtx_txt 为 ttt 时刻的观测数据,StS_tSt 为第 ttt 期的平滑值,且令 St=x^t+1S_t = \hat{x}_{t + 1}St=x^t+1,即第 t+1t + 1t+1 期的预测值,且满足:x^t+1=αxt+(1−α)xt^\hat{x}_{t + 1} = \alpha x_t + (1 - \alpha)\hat{x_t}x^t+1=αxt+(1−α)xt^,因此可以证明:x^t+1=αxt+α(1−α)xt−1+α(1−α)2xt−2+⋯+α(1−α)t−1x1+(1−α)tl0\hat{x}_{t + 1} = \alpha x_t + \alpha(1 - \alpha)x_{t - 1} + \alpha(1 - \alpha)^2x_{t - 2} + \cdots + \alpha(1 - \alpha)^{t - 1}x_1 + (1 - \alpha)^tl_0x^t+1=αxt+α(1−α)xt−1+α(1−α)2xt−2+⋯+α(1−α)t−1x1+(1−α)tl0,其中 l0=x^1l_0 = \hat{x}_1l0=x^1 视为初始值,α\alphaα 为平滑系数 (0≤α≤1)(0 \leq \alpha \leq 1)(0≤α≤1)。
还可以看出,越接近当期的数据,其权重越大,意味着影响也越大;反之,早期数据对当期影响也就越小。
平滑指数 α\alphaα 一般是需要我们自己决定的。但是,SPSS 的专家建模器如果采用简单模型帮助我们建模会自动给出 α\alphaα 的值。
简单(Simple)模型只能往后预测一期数据,原因是公式 x^t+1=αxt+(1−α)xt^\hat{x}_{t + 1} = \alpha x_t + (1 - \alpha)\hat{x_t}x^t+1=αxt+(1−α)xt^ 中使用了本期的准确数据 xtx_txt ,后面的数据只是预测出来的,而不是准确的。
-
线性趋势模型(lineartrendlinear\ \ trendlinear trend)
名称 使用条件 与之类似的 ARIMA 模型 特线性趋势模型 线性趋势、不含季节成分 ARIMA(0, 2, 2) 该方法包含一个预测方程和两个平滑方程:{lt=αxt+(1−α)(lt−1+bt−1)(水平平滑方程)bt=β(lt−lt−1)+(1−β)bt−1(趋势平滑方程)x^t+h=lt+hbt,h=1,2,⋯(预测方程)\left\{ \begin{aligned} &l_t = \alpha x_t + (1 - \alpha)(l_{t - 1} + b_{t - 1}) \text{(水平平滑方程)} \\ &b_t = \beta(l_t - l_{t - 1}) + (1 - \beta)b_{t - 1} \text{(趋势平滑方程)} \\ &\hat{x}_{t + h} = l_t + hb_t, h = 1, 2, \cdots \text{(预测方程)} \end{aligned} \right.⎩⎪⎨⎪⎧lt=αxt+(1−α)(lt−1+bt−1)(水平平滑方程)bt=β(lt−lt−1)+(1−β)bt−1(趋势平滑方程)x^t+h=lt+hbt,h=1,2,⋯(预测方程)
ttt:当前期
hhh:预测超前期数,也称之为预测补偿
xtx_txt:第 ttt 期的实际观测值
ltl_tlt:时刻 ttt 的预估水平
btb_tbt:时刻 ttt 的预测趋势
α\alphaα:水平的平滑参数
β\betaβ:趋势的平滑参数 -
阻尼趋势模型(DampedtrendDamped\ \ trendDamped trend)
称 使用条件 与之类似的 ARIMA 模型 尼趋势模型 线性趋势逐渐减弱且不含季节成分 ARIMA(1, 1, 2) {lt=αxt+(1−α)(lt−1+ϕbt−1)(水平平滑方程)bt=β(lt−lt−1)+(1−β)ϕbt−1(趋势平滑方程)x^t+h=lt+(ϕ+ϕ2+⋯+ϕh)bt(预测方程)\left\{ \begin{aligned} &l_t = \alpha x_t + (1 - \alpha)(l_{t - 1} + \phi b_{t - 1}) \text{(水平平滑方程)} \\ &b_t = \beta(l_t - l_{t - 1}) + (1 - \beta)\phi b_{t - 1} \text{(趋势平滑方程)} \\ &\hat{x}_{t + h} = l_t + (\phi + \phi^2 + \cdots + \phi^h)b_t \text{(预测方程)} \end{aligned} \right.⎩⎪⎨⎪⎧lt=αxt+(1−α)(lt−1+ϕbt−1)(水平平滑方程)bt=β(lt−lt−1)+(1−β)ϕbt−1(趋势平滑方程)x^t+h=lt+(ϕ+ϕ2+⋯+ϕh)bt(预测方程) α\alphaα:水平的平滑参数
β\betaβ:趋势的平滑参数
ϕ\phiϕ:阻尼参数(0<ϕ≤10 < \phi \leq 10<ϕ≤1)
如果 ϕ=1\phi = 1ϕ=1,则阻尼趋势模型就是霍特线性趋势模型。 -
简单季节性
简单季节性 使用条件 与之类似的 ARIMA 模型 单季节性 含有稳定的季节成分、不含趋势 SARIMA(0, 1, 1) × (0, 1, 1)s_ss {lt=α(xt−st−m)+(1−α)lt−1(水平平滑方程)st=γ(xt−lt−1)+(1−γ)st−m(季节平滑方程)x^t+h=lt+st+h−m(k+1),k=[h−1m](预测方程)\left\{ \begin{aligned} &l_t = \alpha(x_t - s_{t - m}) + (1 - \alpha)l_{t - 1} \text{(水平平滑方程)} \\ &s_t = \gamma(x_t - l_{t - 1}) + (1 - \gamma)s_{t - m} \text{(季节平滑方程)} \\ &\hat{x}_{t + h} = l_t + s_{t + h - m(k + 1)}, k = [\frac{h - 1}{m}] \text{(预测方程)} \end{aligned} \right.⎩⎪⎪⎪⎨⎪⎪⎪⎧lt=α(xt−st−m)+(1−α)lt−1(水平平滑方程)st=γ(xt−lt−1)+(1−γ)st−m(季节平滑方程)x^t+h=lt+st+h−m(k+1),k=[mh−1](预测方程) mmm:周期长度(月度数据取12,季度数据取4)
α\alphaα:水平的平滑参数
γ\gammaγ:季节的平滑参数
hhh:预测超前期数
x^t+h\hat{x}_{t + h}x^t+h:第 hhh 期的预测值 -
温特加法模型(Winter′sadditiveWinter's\ \ additiveWinter′s additive)
称 使用条件 与之类似的 ARIMA 模型 特加法模型 含有线性趋势和稳定的季节成分 SARIMA(0, 1, 0) × (0, 1, 1)s_ss {lt=α(xt−st−m)+(1−α)(lt−1+bt−1)(水平平滑方程)bt=β(lt−lt−1)+(1−β)bt−1st=γ(xt−lt−1−bt−1)+(1−γ)st−m(季节平滑方程)x^t+h=lt+hbt+st+h−m(k+1),k=[h−1m](预测方程)\left\{ \begin{aligned} &l_t = \alpha(x_t - s_{t - m}) + (1 - \alpha)(l_{t - 1} + b_{t - 1}) \text{(水平平滑方程)} \\ &b_t = \beta(l_t - l_{t - 1}) + (1 - \beta)b_{t - 1} \\ &s_t = \gamma(x_t - l_{t - 1} - b_{t - 1}) + (1 - \gamma)s_{t - m} \text{(季节平滑方程)} \\ &\hat{x}_{t + h} = l_t + hb_t + s_{t + h - m(k + 1)}, k = [\frac{h - 1}{m}] \text{(预测方程)} \end{aligned} \right.⎩⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎧lt=α(xt−st−m)+(1−α)(lt−1+bt−1)(水平平滑方程)bt=β(lt−lt−1)+(1−β)bt−1st=γ(xt−lt−1−bt−1)+(1−γ)st−m(季节平滑方程)x^t+h=lt+hbt+st+h−m(k+1),k=[mh−1](预测方程) mmm:周期长度(月度数据取12,季度数据取4)
α\alphaα:水平的平滑参数
β\betaβ:趋势的平滑参数
γ\gammaγ:季节的平滑参数
x^t+h\hat{x}_{t + h}x^t+h:第 hhh 期的预测值 -
温特乘法模型(Winter′smultiplicativeWinter's\ \ multiplicativeWinter′s multiplicative)
称 使用条件 与之类似的 ARIMA 模型 特乘法模型 含有线性趋势和不稳定的集结成分 不存在 {lt=αxtst−m+(1−α)(lt−1+bt1)(水平平滑方程)bt=β(lt−lt−1)+(1−β)bt−1(趋势平滑方程)st=γxtlt−1+bt+1+(1−γ)st−m(季节平滑方程)x^t+h=(lt+hbt)st+h−m(k+1),k=[h−1m](预测方程)\left\{ \begin{aligned} &l_t = \alpha \frac{x_t}{s_{t - m}} + (1 - \alpha)(l_{t - 1} + b{t_1}) \text{(水平平滑方程)} \\ &b_t = \beta(l_t - l_{t - 1}) + (1 - \beta)b_{t - 1} \text{(趋势平滑方程)} \\ &s_t = \gamma \frac{x_t}{l_{t - 1} + b_{t + 1}} + (1 - \gamma)s_{t - m} \text{(季节平滑方程)} \\ &\hat{x}_{t + h} = (l_t + hb_t)s_{t + h - m(k + 1)}, k = [\frac{h - 1}{m}] \text{(预测方程)} \end{aligned} \right.⎩⎪⎪⎪⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎪⎪⎪⎧lt=αst−mxt+(1−α)(lt−1+bt1)(水平平滑方程)bt=β(lt−lt−1)+(1−β)bt−1(趋势平滑方程)st=γlt−1+bt+1xt+(1−γ)st−m(季节平滑方程)x^t+h=(lt+hbt)st+h−m(k+1),k=[mh−1](预测方程) mmm:周期长度(月度数据取12,季度数据取4)
α\alphaα:水平的平滑参数
β\betaβ:趋势的平滑参数
γ\gammaγ:季节的平滑参数
x^t+h\hat{x}_{t + h}x^t+h:第 hhh 期的预测值
五、一元时间序列分析的模型
-
平稳时间序列(stationaryseriesstationary\ \ seriesstationary series)
若时间序列 {xt}\{x_t\}{xt} 满足下列三个条件:
(1)E(xt)=E(xt−s)=uE(x_t) = E(x_{t - s}) = uE(xt)=E(xt−s)=u(均值为固定常数)
(2)Var(xt)=Var(xt−s)=σ2Var(x_t) = Var(x_{t - s}) = \sigma^2Var(xt)=Var(xt−s)=σ2(方差存在且为常数)
(3)Cov(xt,xt−s)=γsCov(x_t, x_{t-s}) = \gamma_sCov(xt,xt−s)=γs(协方差只和间隔 sss 有关,与 ttt 无关)
则称 {xt}\{x_t\}{xt} 为协方差平稳,又称为弱平稳。如果对于任意的 t1,t2,⋯,tkt_1, t_2, \cdots, t_kt1,t2,⋯,tk 和 hhh,多维随机变量 (xt1,xt2,⋯,xtk)(x_{t_1}, x_{t_2}, \cdots, x_{t_k})(xt1,xt2,⋯,xtk) 和 (xt1+h,xt2+h,⋯,xtk+h)(x_{t_1 + h}, x_{t_2 + h}, \cdots, x_{t_k} + h)(xt1+h,xt2+h,⋯,xtk+h) 的联合分布相同,则称 {xt}\{x_t\}{xt} 为严格平稳。
注:严格平稳的要求太高,因此一般所说的平稳都是弱平稳。
-
白噪声序列
若时间序列 {xt}\{x_t\}{xt} 满足下列三个条件:
(1)E(xt)=E(xt−s)=0E(x_t) = E(x_{t - s}) = 0E(xt)=E(xt−s)=0(均值为固定常数)
(2)Var(xt)=Var(xt−s)=σ2Var(x_t) = Var(x_{t - s}) = \sigma^2Var(xt)=Var(xt−s)=σ2(方差存在且为常数)
(3)Cov(xt,xt−s)=0(s≠0)Cov(x_t, x_{t-s}) = 0(s \neq 0)Cov(xt,xt−s)=0(s=0)(协方差只和间隔 sss 有关,与 ttt 无关)
则称 {xt}\{x_t\}{xt} 为白噪声序列。显然,白噪声序列是平稳时间序列的一个特例。 -
差分方程
将凑个时间序列变量表示为该变量的滞后项、时间和其他变量的函数,这样一个函数方程称为差分方程。例如:
yt=α0+α1yt−1+α2yt−2+⋯+αpyt−p+εty_t = \alpha_0 + \alpha_1y_{t - 1} + \alpha_2y_{t - 2} + \cdots + \alpha_py_{t - p} + \varepsilon_tyt=α0+α1yt−1+α2yt−2+⋯+αpyt−p+εt(ε\varepsilonε为白噪声序列)- 差分方程的齐次部分
只包含该变量自身和它的滞后项的式子。
例如:yt=α0+∑i=1pαiyt−i+εt+∑i=1qβεt−iy_t = \alpha_0 + \sum_{i = 1}^{p}\alpha_iy_{t - i} + \varepsilon_t + \sum_{i = 1}^{q}\beta \varepsilon_{t - i}yt=α0+i=1∑pαiyt−i+εt+i=1∑qβεt−i 齐次部分为:yt=∑i=1pαyt−iy_t = \sum_{i = 1}^{p}\alpha y_{t - i}yt=i=1∑pαyt−i - 差分方程的特征方程
齐次部分可以被转换为特征方程:令 yt=xty_t = x^tyt=xt 带入齐次方程花间即可。例如:齐次部分:yt=∑i=1pαyt−iy_t = \sum_{i = 1}^{p}\alpha y_{t - i}yt=i=1∑pαyt−i 那么特征方程为:xp=α1xp−1+α2+⋯+αpx^p = \alpha_1x^{p - 1} + \alpha_2 + \cdots + \alpha_pxp=α1xp−1+α2+⋯+αp 特征方程是一个 ppp 阶多项式,对应可以求出 ppp 个解。
- 差分方程的齐次部分
-
滞后算子
用符号 LLL 表示滞后算子:Liyt=yt−iL^iy_t = y_{t - i}Liyt=yt−i,且由如下的性质:
(1)LC=CLC = CLC=C(CCC 为常数)
(2)(Li+Lj)yt=yt−i+yt−j(L^i + L^j)y_t = y_{t - i} + y_{t - j}(Li+Lj)yt=yt−i+yt−j
(3)LiLjyt=yt−i−jL^iL^jy_t = y_{t - i - j}LiLjyt=yt−i−j
例如:yi=α0+∑i=1pαiyt−i+εt+∑i=1qβiεt−iy_i = \alpha_0 + \sum_{i = 1}^{p}\alpha_iy_{t - i} + \varepsilon_t + \sum_{i = 1}^{q}\beta_i\varepsilon_{t - i}yi=α0+i=1∑pαiyt−i+εt+i=1∑qβiεt−i 可以表示为:yt=α0+∑i=1pαiLiyt+εt+∑i=1qβiLiεty_t = \alpha_0 + \sum_{i = 1}^{p}\alpha_iL^iy_t + \varepsilon_t + \sum_{i = 1}^{q}\beta_iL^i\varepsilon_tyt=α0+i=1∑pαiLiyt+εt+i=1∑qβiLiεt
六、AR(p)模型
ppp 阶的自回归模型(AR§模型):
yt=α0+α1yt−1+α2yt−2+⋯+αpyt−p+εty_t = \alpha_0 + \alpha_1y_{t - 1} + \alpha_2y_{t - 2} + \cdots + \alpha_py_{t - p} + \varepsilon_tyt=α0+α1yt−1+α2yt−2+⋯+αpyt−p+εtε\varepsilonε 是方差为 σ2\sigma^2σ2 的白噪声序列
(自回归:将自己的 1 至 ppp 阶滞后项视为自变量来进行回归)
-
注意
讨论的AR§模型一定是平稳的时间序列模型,原数据不平稳的话也要先转换为平稳的数据才能进行建模。 -
AR§模型平稳的条件
将 AR§ 模型的齐次部分转换为特征方程:xp=α1xp−1+α2xp−2+⋯+αpx^p = \alpha_1x_{p - 1} + \alpha_2x_{p - 2} + \cdots + \alpha_pxp=α1xp−1+α2xp−2+⋯+αp 特征方程是一个 ppp 阶多项式,因此可以求出 ppp 个解(可能有实根,也可能有虚根)那么模型的平稳可以这样确定:
(1)如果这 ppp 个解的模长均小于1,则 {yt}\{y_t\}{yt} 平稳,即 AR§ 模型平稳;
(2)如果这 ppp 个解中有 kkk 个解的模场等于1,则 {yt}\{y_t\}{yt} 为 kkk 阶单位根过程(kkk 阶单位根过程可以经过 kkk 阶差分变为平稳的时间序列)
(3)如果这 ppp 个根至少有一个的模长大于1,则 {yt}\{y_t\}{yt} 称为爆炸过程。 -
下面来看一个例子
AR(3) 模型:yt=0.1+0.2yt−1+0.3yt−2+0.5yt−3+εty_t = 0.1 + 0.2y_{t - 1} + 0.3y_{t - 2} + 0.5y_{t - 3} + \varepsilon_tyt=0.1+0.2yt−1+0.3yt−2+0.5yt−3+εt 齐次部分的特征方程为:x3=0.2x2+0.3x+0.5x^3 = 0.2x^2 + 0.3x + 0.5x3=0.2x2+0.3x+0.5 解得:x1=−4−34i10,x2=−4+34i10,x3=1x_1 = \frac{-4 - \sqrt{34}i}{10}, x_2 = \frac{-4 + \sqrt{34}i}{10}, x_3 = 1x1=10−4−34i,x2=10−4+34i,x3=1
求模长:∣x1∣=∣x2∣=16100+34100=0.7071<1|x_1| = |x_2| = \sqrt{\frac{16}{100} + \frac{34}{100}} = 0.7071 < 1∣x1∣=∣x2∣=10016+10034=0.7071<1所以 yty_tyt 为一阶单位根过程
此时可以进行一阶差分变形:yt−yt−1=0.1−0.8(yt−1−yt−2)−0.5(yt−2−yt−3)+εty_t - y_{t - 1} = 0.1 - 0.8(y_{t - 1} - y_{t - 2}) - 0.5(y_{t - 2} - y_{t - 3}) + \varepsilon_tyt−yt−1=0.1−0.8(yt−1−yt−2)−0.5(yt−2−yt−3)+εt ⇒Δyt=0.1−0.8Δyt−1−0.5Δyt−2+εt\Rightarrow \Delta y_t = 0.1 - 0.8\Delta y_{t - 1} - 0.5 \Delta y_{t - 2} + \varepsilon_t⇒Δyt=0.1−0.8Δyt−1−0.5Δyt−2+εt(转换成了一个 AR(2) 过程)
此时齐次方程对应的特征方程:x2=−0.8x−0.5x^2 = -0.8x - 0.5x2=−0.8x−0.5 解得 x1=−4−34i10,x2=−4+34i10x_1 = \frac{-4 - \sqrt{34}i}{10}, x_2 = \frac{-4 + \sqrt{34}i}{10}x1=10−4−34i,x2=10−4+34i对于 AR(p) 模型而言:yt=α0+α1yt−1+α2yt−2+⋯+αpyt−p+εty_t = \alpha_0 + \alpha_1y_{t - 1} + \alpha_2y_{t - 2} + \cdots + \alpha_py_{t - p} + \varepsilon_tyt=α0+α1yt−1+α2yt−2+⋯+αpyt−p+εt (1){yt}\{y_t\}{yt} 为单位根的充要条件:α1+α2+⋯+αp=1\alpha_1 + \alpha_2 + \cdots + \alpha_p = 1α1+α2+⋯+αp=1 (2){yt}\{y_t\}{yt} 平稳的充分条件:∣α1∣+∣α2∣+⋯+∣αp∣<1|\alpha_1| + |\alpha_2| + \cdots + |\alpha_p| < 1∣α1∣+∣α2∣+⋯+∣αp∣<1 (3){yt}\{y_t\}{yt} 平稳的必要条件:α1+α2+⋯+αp<1\alpha_1 + \alpha_2 + \cdots + \alpha_p < 1α1+α2+⋯+αp<1
七、MA(q)模型
qqq 阶移动平均模型(MA(q)模型):yt=εt+β1εt−1+β2εt−2+⋯+βqεt−qy_t = \varepsilon_t + \beta_1\varepsilon_{t - 1} + \beta_2\varepsilon_{t - 2} + \cdots + \beta_q\varepsilon_{t - q}yt=εt+β1εt−1+β2εt−2+⋯+βqεt−q
-
MA模型和AR模型之间的关系
MA(1) 模型:yt=εt−β1εt−1y_t = \varepsilon_t - \beta_1\varepsilon_{t - 1}yt=εt−β1εt−1 将上面的式子使用滞后算子的写法为:yt=(1−β1L)εt⇒11−β1Lyt=εty_t = (1 - \beta_1L)\varepsilon_t \Rightarrow \frac{1}{1 - \beta_1L}y_t = \varepsilon_tyt=(1−β1L)εt⇒1−β1L1yt=εt又因为 (1−β1L)(1+β1L+β12L2+⋯)=(1−β1L+β12L2+⋯)−(β1L+β12L2+⋯)=1(1 - \beta_1L)(1 + \beta_1L + \beta_1^2L^2 + \cdots) = (1 - \beta_1L + \beta_1^2L^2 + \cdots) - (\beta_1L + \beta_1^2L^2 + \cdots) = 1(1−β1L)(1+β1L+β12L2+⋯)=(1−β1L+β12L2+⋯)−(β1L+β12L2+⋯)=1所以 11−β1L=1+β1L+β12L2+⋯(条件:∣β1∣<1)\frac{1}{1 - \beta_1L} = 1 + \beta_1L + \beta_1^2L^2 + \cdots(\text{条件:}|\beta_1| < 1)1−β1L1=1+β1L+β12L2+⋯(条件:∣β1∣<1)则 11−β1Lyt=εt⇒(1+β1L+β12L2+⋯)yt=εt\frac{1}{1 - \beta_1L}y_t = \varepsilon_t \Rightarrow (1 + \beta_1L + \beta_1^2L^2 + \cdots)y_t = \varepsilon_t1−β1L1yt=εt⇒(1+β1L+β12L2+⋯)yt=εt
所以 yt+β1yt−1+β12yt−2+⋯=εt⇒yt=εt−β1yt−1−β12yt−2+⋯y_t + \beta_1y_{t - 1} + \beta_1^2y_{t - 2} + \cdots = \varepsilon_t \Rightarrow y_t = \varepsilon_t - \beta_1y_{t - 1} - \beta_1^2y_{t - 2} + \cdotsyt+β1yt−1+β12yt−2+⋯=εt⇒yt=εt−β1yt−1−β12yt−2+⋯
从上面的例子可以知道,可以将 1 阶移动平均模型转换为无穷阶的自回归模型。之所以需要 MA(q) 模型,是因为在模型分析中我们需要参数尽可能地少,因此需要 MA(q) 模型来帮助我们简化。
-
MA(q) 模型的平稳性
只要 qqq 是常数,那么 MA(q) 模型一定是平稳的。
八、ARMA(p, q)模型
自回归移动平均模型就是设法将自回归过程 AR 和移动平均过程 MA 结合起来,共同模拟由时间序列的随机过程。
- ARMA(p, q) 模型 yt=α0+∑i=1pαiyt−i+εt+∑i=1qβiεt−iy_t = \alpha_0 + \sum_{i = 1}^{p}\alpha_iy_{t - i} + \varepsilon_t + \sum_{i = 1}^{q}\beta_i\varepsilon_{t - i}yt=α0+i=1∑pαiyt−i+εt+i=1∑qβiεt−i
- ARMA(p, q) 模型的平稳性
由上述讨论可以知道,对于 MA(q) 模型而言,只要 qqq 大于0,那么 MA(q) 模型平稳。因此,ARMA(p, q) 模型的平稳性只与 AR§ 部分有关。 - 如何确定 p, q 的值
简单的确定 p, q 的值,我们可以作出自相关系数(ACF)和偏自相关系数(PACF)图来确定。
例如:模型 ACF PACF AR(p) 逐渐衰减,即拖尾 p 阶后截尾 MA(q) q 阶后截尾 逐渐衰减,即拖尾 ARMA(p, q) 逐渐衰减,即拖尾 逐渐衰减,即拖尾
由图一可得,序列 x 的自相关系数在第 1, 2 阶显著异于 0 ,超过 2 阶后均和 0 没有显著的差异;而其偏自相关系数在第 1, 2, 7, 9, 16 阶显著异于0,且表现出拖尾现象。因此可以得出序列 x 可以由 MA(2) 生成。
九、模型选择:AIC 和 BIC 准则(选小准则)
-
赤池信息准则:AIC=2(模型中参数的个数)−2ln(模型的极大似然函数值)AIC = 2(\text{模型中参数的个数}) - 2\ln (\text{模型的极大似然函数值})AIC=2(模型中参数的个数)−2ln(模型的极大似然函数值)
-
贝叶斯信息准则:BIC=ln(T)(模型中参数的个数)−2ln模型的极大似然函数值BIC = \ln(T)(\text{模型中参数的个数}) - 2\ln \text{模型的极大似然函数值}BIC=ln(T)(模型中参数的个数)−2ln模型的极大似然函数值
AIC 和 BIC 是喧嚣原则,我们要选择使得 AIC 或者 BIC 最小的模型。(由于 BIC 对于模型复杂程度的惩罚系数更大,因此通常根据 BIC 来确定模型)
十、检验模型是否识别完全
估计了时间序列模型后,我们需要对残差进行白噪声检验,如果残差是白噪声,则说明模型能够完全识别时间序列数据的规律。
H0=ρ1=ρ2=⋯=ρs=0,H1:ρi(i=1,2,⋯,s)中至少有一个不为0H_0 = \rho_1 = \rho_2 = \cdots = \rho_s = 0, H_1: \rho_i(i = 1, 2, \cdots, s)中至少有一个不为 0H0=ρ1=ρ2=⋯=ρs=0,H1:ρi(i=1,2,⋯,s)中至少有一个不为0 在 H0H_0H0 成立的条件下,统计量 Q=T(T+2)∑i=1srk2T−kχs−n2Q = T(T + 2)\sum_{i = 1}^{s}\frac{r_k^2}{T - k}~\chi_{s - n}^2Q=T(T+2)∑i=1sT−krk2 χs−n2
软件可以计算出 ppp 值,ppp 值小于 0.05 则可以拒绝原假设,此时模型没有识别完全,需要进行修正。
(1)TTT 表示样本个数
(2)nnn 表示模型中的位置参数
(3)sss 根据样本量的大小一般可以取 8,16,24 等(SPSS取18)
十一、ARIMA(p, d, q)模型
对于可能是 ddd 阶单位根过程的时间序列,我们需要先对数据进行差分处理,将其转换为平稳的时间序列后再进行建模。
- ARIMA(p, d, q) 模型 yt′=α0+∑i=1pαiyt−i′+εt+∑i=1qβiεt−iy_t' = \alpha_0 + \sum_{i = 1}^{p}\alpha_iy_{t - i}' + \varepsilon_t + \sum_{i = 1}^{q}\beta_i\varepsilon_{t - i}yt′=α0+i=1∑pαiyt−i′+εt+i=1∑qβiεt−i 且 yt′=Δdyt=(1−L)dyty_t' = \Delta^dy_t = (1 - L)^dy_tyt′=Δdyt=(1−L)dyt
所以:(1−∑i=1pαiLi)(1−L)dyt=α0+(1+∑i=1qβiLi)εt(1 - \sum_{i = 1}^{p}\alpha_iL^i)(1 - L)^dy_t = \alpha_0 + (1 + \sum_{i = 1}^{q}\beta_iL^i)\varepsilon_t(1−i=1∑pαiLi)(1−L)dyt=α0+(1+i=1∑qβiLi)εt
十二、SARIMA模型
季节性 ARIMA 模型是通过在 ARIMA 模型中包含额外的季节性项而生成的,其形式为:SARIMA(p,d,q)×(P,D,Q)mSARIMA(p, d, q)\times(P, D, Q)_mSARIMA(p,d,q)×(P,D,Q)m(m 表示周期数)(1−∑i=1pϕiLi)(1−∑i=1PΦiLmi)(1−L)d(1−Lm)Dyt=α0+(1+∑i=1qθiLi)(1+∑i=1QΘiLmi)εt(1 - \sum_{i = 1}^{p}\phi_iL^i)(1 - \sum_{i = 1}^{P}\Phi_iL^{mi})(1 - L)^d(1 - L^m)^Dy_t = \alpha_0 + (1 + \sum_{i = 1}^{q}\theta_iL^i)(1 + \sum_{i = 1}^{Q}\Theta_iL^{mi})\varepsilon_t(1−i=1∑pϕiLi)(1−i=1∑PΦiLmi)(1−L)d(1−Lm)Dyt=α0+(1+i=1∑qθiLi)(1+i=1∑QΘiLmi)εt
十三、时间序列建模思路
- 处理缺失值,生成时间变量和时间序列图
- 数据是否为季度数据或者月份数据(至少两个完整的周期),判断是否存在季节性波动
- 根据时间序列判断数据是否为平稳序列
- 使用 SPSS 进行建模
- 如果结果是ARIMA(p, 0, q)模型,可以结合 ACF 和 PACF 进行分析;如果结果是ARIMA(p, 1, q)模型,可以先进行 1 阶差分后使用 ACF 和 PACF进行分析;如果结果与季节性相关,可以考虑时间序列分析。
注意:预测需要结合背景,不要硬套模型哦~~~
如果有什么错误,还请斧正hhh