分散分析とは
分散分析は実験計画法の1つであり、実験で得られたデータより、処置(因子や水準)が結果に与える効果の検定を行うもの。基本的な考え方は平均値の差の検定と同じ。平均値の差の検定では、2群(処置あり、なし)のデータの平均値が等しいという帰無仮説についてt検定を行うが、分散分析では、因子や水準ごとのデータのばらつき(分散)を使いF検定を行う。帰無仮説や検定方法については後述する。
一元配置分散分析
一つの因子について複数の水準下での実験データを比較する分析を一元配置と呼ぶ。ここではある大きな農園におけるコーヒーの収穫量を最大化する問題を考える。コーヒー豆の品種Aを因子、3段階の水準(標高1000m、標高1200m、標高1500m)を設定する。
下表は、それぞれの標高で4回ずつ収穫を行った際に得られた収穫量データである。
構造式(モデル)
標高の水準を、収穫の回数を(回目)とすると、コーヒーの収穫量はとなる。標高の水準によっての平均値に違いがあるかどうかを検定したいので、まずの標高ごとの平均をとする。一元配置モデルは
表1では標高が3水準なので、収穫回数がどの標高においても4回なので、実験データ数はとなる。
標高(水準)ごとの平均の平均を(一般平均)とする。
標高の違いが収穫量に与える効果を、つまりと一般平均との差とすると*1、(1)は
と表される。(3)のモデルを推定し、1つでもとなるが得られれば標高によっての平均は異なることが示される。同様に、のデータ全体の平均をとし、標高ごとの平均は以下のように表すことができる。
とおくと、は次のように推定される。
帰無仮説
帰無仮説は「標高によってコーヒー豆の収穫量の平均値に差がない」ことなので、(1)において
もしくは(3)において
が成立するかどうかを調べればよい。
(8)を調べるには、パラメータについて
が成立するかどうか、推定値を用いて表すと、
標高の水準の平均値と全体の平均値の差の平方和がゼロであるかどうかを調べればよい。
検定統計量の算出
この検定を行うために、平方和の分解を考える。データ全体の偏差平方和をTSSとし、その内訳としてBSS(群間変動)、WSS(郡内変動)を定義する。ここでの変動は偏差平方和と同義。
帰無仮説のが0から離れるにつれてBSS(群間変動)の値は大きくなるため、検定にBSS(群間変動)を利用することができる。次のような検定統計量を用いる。
(12)は群間変動と郡内変動の平均平方*2の比であり、不偏分散の比と同様にF分布を用いて検定することができる。
帰無仮説のもとで
の値がを超えるとき(十分に値が大きいとき)は帰無仮説は棄却される。これらの値を一覧表にまとめたものが分散分析表である。
平方和 | 自由度 | 平均平方 | F統計量 | |
---|---|---|---|---|
水準(標高) | ||||
誤差 | - | |||
合計 | - | - |
長々と書いてしまったが、一元配置分散分析は、BSS(群間変動)とWSS(郡内変動)の比を求め、BSS(群間変動)が十分に大きければ水準を変えたことによる効果がある、と結論づける。構造式の誤差項が正規分布に従うと想定しており、正規分布に従う確率変数の二乗であるBSSとWSSはカイ二乗分布に従う。したがってBSSとWSSの比はF分布に従う。
水準ごとの平均値の点推定
分散分析表を用いて、(6)に書いたように、標高ごとの平均の近似値を推定することが可能である。点推定値は、
となり、の95%信頼区間は、群内変動(誤差)の平均平方(分散)、自由度の分布表を用いて、以下に表す。
(補足)TSS = BSS + WSSの証明
表1では簡単のために、各標高での収穫回数を同一()としたが、必ずしも同一である必要はない。標高によって収穫回数*3が異なる場合にも(例えば表2では)同様の検定を行うことができる。
二元配置分散分析
次に、品種と標高の2つの因子の組み合わせによる二元配置の実験を行う。1つの因子(A因子)はコーヒーの品種(アラビカ種かティピカ種)、もう1つの因子(B因子)は標高(1,000m、1,200m、1,500m)。先ほどと同じ農園で、標高の異なる3つの場所に、2種類の品種を栽培する。表3は標高3パターンと2品種の計6パターンの環境下において、それぞれ3回にわたってコーヒー豆を収穫した結果である。
構造式(モデル)
コーヒーの品種を、標高を、収穫の回数を(回目)とすると、コーヒーの収穫量の二元配置モデルは
はA因子の主効果、はB因子の主効果といい、をA因子とB因子の交互作用効果と呼ぶ。
表3ではであり、
全体のデータ数はとなる。
は
を満たすパラメータである。検定にあたっては「要因A(品種)に影響力があるならにゼロではないものがある」と考え、
同様に、「要因B(標高)に影響力があるならにゼロではないものがある」と考えると、
「要因A(品種)、B(標高)に相乗効果(もしくは相殺効果)があるならにゼロではないものがある」と考えると
ここでを以下のように定義すると、の推定値を表すことができる*4。
したがって。
したがって。
したがって。
したがって。
分散分析表
次に分散分析表を作成し、F検定のための検定統計量を算出する。
A因子の偏差平方和は
B因子の偏差平方和は
交互作用の偏差平方和は
残差の偏差平方和*5は
全ての偏差平方和(総変動)*6は
したがって分散分析表は以下のようになる。
平方和 | 自由度 | 平均平方 | F統計量 | ||
---|---|---|---|---|---|
A因子 | |||||
B因子 | |||||
交互作用 | |||||
残差 | - | ||||
合計 | - | - | - |
帰無仮説と検定統計量
帰無仮説はA因子(品種)については「品種の違いによって収穫量の平均値に差がない」、B因子(標高)については「標高の違いによって収穫量の平均値に差がない」、交互作用については「品種と標高における相互作用(相殺作用)による収穫量への影響はない」となる。
帰無仮説のもとで
F検定統計量は
検定から分かることは、帰無仮説を棄却できるかどうか、すなわち品種や標高によって収穫量に差があるのかどうかだけである。ここではどの品種や標高の組み合わせによって差が生じるのかまでは分からない。帰無仮説が棄却されたときに、もう少し細かい枠組みでの検定を設定し、その組み合わせによって差が生じるのかを調べることもできる。こうした検定を多重比較検定と呼ぶ。
参考文献
*1:この式は個のパラメータを個のパラメータで表現いるため一意ではない。したがってが推定できない。推定する(識別可能とする)ためにまたはと制約をおく。前者の制約下ではは個のの平均、後者の制約下ではの加重平均として推定される。
*2:平均平方は偏差平方和を自由度で割った値であるため標本分散と同義。
*3:コーヒーの収穫回数を繰り返し数と呼ぶ。二元配置分析において繰り返しがないとき、つまりのときには交互作用の影響は検定できない。となり、つまりF統計量を作成できない。
*4:F検定の結果、交互作用が認められない場合、A因子とB因子それぞれの収穫量の平均値の高い同士を最適な水準として選択する。この場合の点推定値は
*5:実際の計算ではA因子、B因子、交互作用、総変動を計算した後、総変動から残差以外の平方和の差分を求めることで導出できる
*6: としても計算できる。これは分散を求めるときに頻繁に使うテクニック。