時系列データとは
時系列データ(time-series data)とは、時間の経過とともに観測されたデータ。毎月の消費部下指数や毎日の気温なども時系列データの1種。時系列データには年、月など一定間隔で観測されるものもあれば、株式の日中取引など不規則な間隔で観測されるものもある。ここでは一定の間隔で観測されるデータを扱う。
時系列データの基本統計量
平均・分散
時系列分析においてもクロスセクションデータを扱う場合と同様に基本統計量を用いてデータの要約を行う。期間の期間で観測される時系列データをとする。平均と分散は、
自己共分散
同一変数の異なる時点の共分散を自己共分散(autocovariance)と呼ぶ。次(時点離れた)の自己共分散はと表される。
同一変数の相関係数を自己相関係数(autocorelation coefficient)または自己相関と呼ぶ。の自己相関係数は、
自己相関係数は相関係数の1種であるため-1から1の間の値をとる。自己相関係数をグラフに描いたものがコレログラムである。
定常性
弱定常過程の定義
時系列データの平均と分散が有限であり、平均と自己共分散(自己相関係数も)が観測時点に依存しない条件を満たす場合、その系列は弱定常過程(weak stationary process)と呼ばれる。弱定常過程の定義は、
(5)は観測時点に依存せず、との時間差(ラグ)のみに依存する。(5)のに絶対値が付いているのは、に対して期前に観測されたものと期後に観測されたものとの共分散は等しいため。弱定常過程の条件は、自己相関係数を用いて、
強定常過程との違い
弱定常過程はデータ間の関係が観測時点に依存せず、時間差(ラグ)のみに依存する過程であるのに対し、強定常過程はのすべての変数の同時分布が観測時点に依存せず、との時間差(ラグ)のみに依存することを必要とする。平均と分散が有限な強定常過程は弱定常過程となるが、逆は成立しない。
ホワイトノイズ
iid系列
最も基本的な強定常過程がiid(independently and identically distributed)系列であり、各時点のデータが互いに独立かつ同一の分布に従う系列を意味する。独立性や同一分布性の仮定を緩め、時系列モデルの誤差項として扱いやすくした系列がホワイトノイズである。ホワイトノイズの定義は、
ホワイトノイズは平均と分散どちらも0で有限であり、共分散も一定であるため弱定常過程である。独立性と同一分布性について、iidとホワイトノイズの違いを下表にまとめる。
独立性 |
同一分布性 | 定常性 | |
---|---|---|---|
iid | あり |
あり | 強定常 |
ホワイトノイズ | なし(無相関であればよい) |
なし | 弱定常 |