Goodな生活

経済学修士→環境コンサル→データサイエンス

実験計画法(3)乱塊法

乱塊法の構造式(モデル)

乱塊法では実験条件が同一であるブロック因子を、実験結果に影響を与える1つの因子だと考える。分散分析の構造式にブロック因子rを足せばよい。

一元配置分散分析の構造式は、
 {
\begin{align}
y_{ij} &= μ + α_i + ε_{ij} , \quad ε_{ij} \sim \mathcal{N}(0,σ^2) \tag{1} 
\end{align}
}

ブロック因子を加え、

 {
\begin{align}
y_{ij} &= μ + α_i + r_j + ε_{ij}, \quad ε_{ij} \sim \mathcal{N}(0,σ^2) \tag{2} 
\end{align}
}

因子Aとブロックrとの交互作用は考えない。

同様に二元配置分散分析の構造式は、

 {
\begin{align}
y_{ijk} = μ + α_i + β_j + (αβ)_{ij}  + ε_{ijk}, \quad ε_{ijk} \sim \mathcal{N}(0,σ^2) \tag{3}
\end{align}
}

ブロック因子を加え、

 {
\begin{align}
y_{ijk} = μ + α_i + β_j + (αβ)_{ij} + r_k + ε_{ijk}, \quad ε_{ijk} \sim \mathcal{N}(0,σ^2) \tag{4}
\end{align}
}

因子A、因子Bとブロックrとの交互作用は考えない。交互作用が存在する場合は偶然誤差としてε_{ijk}に含まれる。

乱塊法の検定精度

分散分析(完全無作為法)では、ブロック因子による変動は誤差分散に含まれ、乱塊法ではブロック因子の変動を切り出すため、誤差分散が小さくなる。ブロック因子による変動が大きい場合、誤差分散が小さくなり、A因子、B因子の効果が検出しやすくなる(F値が大きくなる)。一方、ブロック因子による変動が小さい場合は、誤差の自由度が小さくなり、A因子、B因子の効果が検出しにくくなる(F値が小さくなる)。

数式で表すと、二元配置分散分析におけるA因子のF値の

 {
\begin{align}
F_α = \frac{ \frac{S_α}{(I-1)}  }{  \frac{S_{ε}}{(n-1)IJ} } \tag{5}
\end{align}
}

分母のS_{ε}が誤差分散、同じく分母の(n-1)IJが誤差の自由度である。

分散分析(完全無作為法)と比較すると、誤差分散が小さくなる点では検定精度が高く、誤差の自由度が小さくなる点では検定精度が低い*1。一般的に、誤差の自由度を10以上確保できるならば乱塊法が有利だと考える。

*1:変動と同じく、因子の平方和の自由度と誤差の自由度の総和がデータ全体の自由度N-1と一致する。乱塊法を用いるとブロック因子の数-1個の自由度が新たに登場するため誤差の自由度は小さくなる。自由度は誤差分散を推定するときの分母であるため、これが小さくなると誤差分散の推定値が大きくなる。