はじめに
この記事では中心極限定理(central limit theorem ; CLT)を扱います。仮説検定はもちろん統計的推論(statistical inference)の大前提となる重要な定理です。内容の一部を東京大学出版の『統計学入門』の第8章を参考にしています。CLTにも研究者によるバリエーションや付随する条件など色々ありますが、細かい事項には踏み込みません。
定義の確認と大数の法則との違い
まずはCLTの定義を確認しましょう。
(1)の左辺はある確率の収束先を示しています。ある確率とは、確率変数の和を標準化した値がある範囲を取る確率です。右辺は標準正規分布の密度関数です。CLTを機械的に説明すると、サンプルサイズが十分に大きいとき、確率変数の和を標準化した確率変数は標準正規分布に従うこと、です。ことを示しています。サンプルサイズは、母集団からの1回の標本抽出で得られるデータの数です。標準正規分布は、平均、分散
に従う確率変数の分布です。
前回の記事の大数の弱法則は、標本平均が母集団の平均に収束することを示しました。一方、CLTは、確率分布の和の形が正規分布の形に収束することを示すものです。どちらも確率変数の収束に関する性質であり、前者は確率収束(convergence in probability)、後者は分布収束(convergence in distribution)*1と呼ばれます。大数の法則に比べ、CLTは正規分布の形を取りながら母集団の平均に収束する、より厳密な収束の条件を確率変数に課すものです。
証明
まず確率変数を標準化した変数
を考えます。
はそれぞれが独立に同一の分布に従うと仮定します。
ここではに対し
、
です。
(2)のうち1つののモーメント母関数(moment generating function)*2を
とします。ここで
とすると*3、
のモーメント母関数は、
の積となります。
(3)より、標準化された確率変数は、標準正規分布に分布収束します。(3)の途中式ではテイラー展開と、以下の指数関数の性質を用います。
興味深いのは、確率変数の従う分布について何の仮定も置かれていない点です。つまりどんな分布に従う確率変数であっても、たくさん観察して標準化してプロットすれば、正規分布(に近しい分布)を描けます。回帰分析の標準的仮定*4の1つに、『誤差項が正規分布に従う』というものがあります。これをサポートするのがCLTです。
イメージで理解する
CLTをイメージを使って理解します。確率 、サンプルサイズ(試行回数)
の二項分布に従う確率変数を仮定します。確率変数の平均は
、分散は
です。標準化した確率変数のヒストグラムに、平均
、分散
の標準正規分布の密度関数を重ねて表示します。CLTが成立するならば、サンプルサイズが大きくなるにつれて、確率変数のヒストグラムは標準正規分布に近い形になると予想されます。以下、サンプルサイズを
とした場合の図を示します。
疑問点
理解が及んでいない点は「CLTの証明に確率変数の標準化が必要条件なのかどうか」です。標準化の理由が、モーメント母関数を導出する上での数学的な操作のしやすさ、だけならば、確率変数の和の形のままでも正規分布のモーメント母関数に収束するはずです。別の証明の形があるのかどうか、気になっているところです。