『統計学入門』第13章の学習メモ。ガウス・マルコフの定理について。
定義
最小二乗推定量(least squares estimator)は、線形不偏推定量のうち、最小の分散をもつ。
この推定量を最良線形不偏推定量(BLUE; best linear unbiased estimator)と呼ぶ。
線形推定量とは
回帰モデル(1)を仮定する。誤差項は系列無相関であり、平均0、分散の正規分布に従う。
、は(1)の最小二乗推定量である。
、を(2)の形で表せるとき、これらを線形推定量と呼ぶ。線形推定量は確率変数の線形結合で表せる推定量である。
はで表すことができる。
同様に、も線形不偏推定量となることが分かる。
分散が最小になることの証明
の分散が最小になることを証明する。
まず、 を(1)の回帰モデルの任意の線形不偏推定量とする。
は不偏推定量であるため、その期待値がと一致する。
(6)が成立するためには、
であることが必要である。
同じくも線形不偏推定量であるため、
であることが必要である。ここで(5),(7)より、
となる。
次にの分散を表す。
任意の線形不偏推定量の分散の下限値がの分散であること、つまりの分散が最小となることが示された。
途中の式変形では(7),(9)を用いた。
補足:分散を小さくする条件
、の分散はそれぞれ以下の通りである。
、の分散を小さくするためには、確率変数 は以下の性質を満たせばよい。
- の標準偏差が小さいだけではなく、が小さい。
- のばらつきが大きい。
- 標本の大きさ(サンプルサイズ)が大きい。