时间序列*稳性检测
在上一篇文章中我们介绍了时间序列及一些时间序列预测模型。我们可以看到在进行预测时有一些模型表现较好,而另一些模型的预测结果却不尽人意。这是因为不同的时间序列模型对原始数据的要求是不同的,例如之前提到的ARIMA模型,要求时间序列数据*稳,否则得出的预测结果就会相差较大。本篇文章我们介绍时间序列的*稳性、随机性检验及相关时间序列数据处理方法。
时间序列的*稳性、随机性检验
在拿到时间序列数据后,首先要对数据的随机性和*稳性进行检测, 这两个检测是时间序列预测的重要部分,根据不同检测结果需要采取不同的分析方法。
为什么时间序列要求*稳性呢?*稳性就是要求由样本拟合出的曲线在未来一段时间内仍然能够以现有的形态和趋势发展下去,这样预测结果才会有意义。
- 对于*稳声序列, 它的均值和方差是常数, 现已有一套非常成熟的*稳序列的建模方法。 通常是建立一个线性模型来拟合该序列的发展,借此提取该序列的有用信息。
- 对于非*稳序列, 由于它的均值和方差不稳定, 处理方法一般是将其转变为*稳序列,这样就可以应用有关*稳时间序列的分析方法, 如建立 ARIMA模型来进行相应的研究,或者分解趋势与季节性等并根据情况应用指数*滑模型等。
- 对于纯随机序列, 又称为白噪声序列, 序列的各项之间没有任何相关关系, 序列在进行完全无序的随机波动, 可以终止对该序列的分析。 白噪声序列是没有信息可提取的*稳序列。
在讲解*稳性和随机性的定义之前,我们先介绍一下时间序列中常用的几个特征统计量。
时间序列的特征统计量
对于一个时间序列任意时刻的序列值$\left\{ X _ { t } , t \in T \right\}$,任意时刻的序列值$X_t$都是一个随机变量,记其分布函数为$F_t(x)$,则其特征统计量均值、方差、自协方差函数、自相关系数的定义分别如下:
- 均值: 表示时间序列在各个时刻取值的*均值,其定义如下:
- 方差: 表示时间序列在各个时刻围绕其均值波动的*均程度,其定义如下:
- 自协方差 : 表示时间序列任意两个时刻直接的相关性,任取$t,s\in T$,则其定义如下:
-
自相关系数: 同自协方差函数,其定义如下:
*稳时间序列的定义与检验
*稳时间序列的定义
*稳时间序列按照限定条件的严格程度可以分为以下两种类型:
严*稳时间序列: 指时间序列的所有统计性质不会随着时间的推移而发生变化,即其联合概率分布在任何时间间隔都是相同的。设$\{X_t\}$为一时间序列,对任意的正整数m,任取$t_1,t_2,...,t_m\in T$,对任意整数$\tau$,有:
则称时间序列$\{X_t\}$为严*稳时间序列。
宽*稳时间序列: 宽*稳时间序列则认为只要时间序列的低阶距(二阶)*稳,则该时间序列*似*稳。如果时间序列$\{X_t\}$满足以下三个条件:
在现实生活中,时间序列是很难满足严*稳时间序列的要求的,因此,一般所讲的*稳时间序列在默认情况下都是指宽*稳时间序列。根据宽*稳时间序列的条件,我们可以容易得到宽*稳时间序列所具有的性质:
- 均值为常数,即:任取$t\in T$,有$EX_t = \mu$,其中$\mu$为常数。
- 方差也为常数,即:$D X _ { t } = \gamma ( t , t ) = \gamma ( 0 ) , \quad \forall t \in T$
- 自协方差函数和自相关系数只依赖于时间的*移长度,而与时间的起点无关。即:$\gamma(t , s ) = \gamma(k , k + s - t ), \quad \forall t , s , k \in T$,因此可以记$\gamma(k)$为时间序列$\{X_t\}$的延迟k自协方差函数。