Goodな生活

経済学修士→環境コンサル→データサイエンス

【統計検定準1級】時系列解析(1) 定常性とホワイトノイズ

時系列データとは

時系列データ(time-series data)とは、時間の経過とともに観測されたデータ。毎月の消費部下指数や毎日の気温なども時系列データの1種。時系列データには年、月など一定間隔で観測されるものもあれば、株式の日中取引など不規則な間隔で観測されるものもある。ここでは一定の間隔で観測されるデータを扱う。

時系列データの基本統計量

平均・分散

時系列分析においてもクロスセクションデータを扱う場合と同様に基本統計量を用いてデータの要約を行う。期間t=1,2,\cdots,Tの期間で観測される時系列データをy_1,y_2,\cdots,y_Tとする。平均と分散は、


\begin{eqnarray}
E[y_t] = μ_t, V[y_t] = σ^{2}_{t} \tag{1} 
\end{eqnarray}

自己共分散

同一変数の異なる時点y_t,y_{t-h}の共分散を自己共分散(autocovariance)と呼ぶ。h次(h時点離れた)の自己共分散はγ(h)と表される。


\begin{eqnarray}
Cov[y_{t},y_{t-h}] &=&  E[(y_{t} - E[y_t])(y_{t-h}-E[y_{t-h}])] \\ 
&=& γ_{t,h} \tag{2} 
\end{eqnarray}

同一変数の相関係数を自己相関係数(autocorelation coefficient)または自己相関と呼ぶ。h次の自己相関係数は、


\begin{eqnarray}
ρ(y_{t},y_{t-h}) &=& \frac{Cov[y_{t},y_{t-h}] }{\sqrt{V[y_t]V[y_{t-h}] }} \\
                       &=& \frac{γ_{t,h}}{\sqrt{γ_{t,0}γ_{t,h}}} \\
                       &=& ρ_{t,h} \tag{3}
\end{eqnarray}

自己相関係数は相関係数の1種であるため-1から1の間の値をとる。自己相関係数をグラフに描いたものがコレログラムである。

定常性

弱定常過程の定義

時系列データの平均と分散が有限であり、平均と自己共分散(自己相関係数も)が観測時点tに依存しない条件を満たす場合、その系列は弱定常過程(weak stationary process)と呼ばれる。弱定常過程の定義は、


\begin{eqnarray}
E[y_{t}] &=& μ < \infty \tag{4} \\ \\     
Cov[y_{t},y_{t-h}]  &=&  E[(y_{t} - μ)(y_{t-h}-μ)] \\ 
&=& γ_{|h|} \tag{5} 
\end{eqnarray}

(5)は観測時点tに依存せず、tとの時間差(ラグ)hのみに依存する。(5)のhに絶対値が付いているのは、tに対してh期前に観測されたものとh期後に観測されたものとの共分散は等しいため。弱定常過程の条件は、自己相関係数を用いて、


\begin{eqnarray}
E[y_{t}] &=& μ < \infty \tag{6} \\ \\     
ρ[y_{t},y_{t-h}]  &=&  ρ_{|h|}  \tag{7} 
\end{eqnarray}

強定常過程との違い

弱定常過程はデータ間の関係が観測時点tに依存せず、時間差(ラグ)hのみに依存する過程であるのに対し、強定常過程はy_t,y_{t-h_1},\cdots,y_{t-h_n}のすべての変数の同時分布が観測時点tに依存せず、tとの時間差(ラグ)hのみに依存することを必要とする。平均と分散が有限な強定常過程は弱定常過程となるが、逆は成立しない。

ホワイトノイズ

iid系列

最も基本的な強定常過程がiid(independently and identically distributed)系列であり、各時点のデータが互いに独立かつ同一の分布に従う系列を意味する。独立性や同一分布性の仮定を緩め、時系列モデルの誤差項ε_tとして扱いやすくした系列がホワイトノイズである。ホワイトノイズの定義は、


\begin{eqnarray}
E[ε_{t}] &=& 0 \tag{8} \\   
γ_k &=& E[ε_t,ε_{t-k}] =
\left\{\begin{array}{l}
σ^2, &k=0& \\
0, &k≠0&
\end{array}
\right. \tag{9} 
\end{eqnarray}

ホワイトノイズは平均と分散どちらも0で有限であり、共分散σ^2も一定であるため弱定常過程である。独立性と同一分布性について、iidとホワイトノイズの違いを下表にまとめる。

独立性
同一分布性 定常性
iid
あり
あり 強定常
ホワイトノイズ
なし
(無相関であればよい)
なし 弱定常