主成分分析と因子分析の違い
主成分分析と同様、因子分析も多次元のデータを要約するため新しい座標軸を設定する。主成分分析では偏差の平方和が最大になるような座標軸を求め、これを繰り返し第1主成分、第2主成分と順に求め、累積寄与率が十分になった時点でデータを要約する。要約とは、元データと主成分の相関を解釈し、座標軸(主成分)に名前を付けて解釈する(例えば元データが算数、国語、理科、社会の4科目の成績である場合、第1主成分は理数系能力、第2主成分は文系能力等)。主成分とは、観察されたデータの合成変数つまり線形結合を意味する。一方、因子分析では分析者があらかじめ因子を設定し、因子によって観察されたデータを説明する。つまり観察されたデータを因子の合成変数(線形結合)で表す。因子に解釈を与え、名前を付ける点は主成分分析と同じ。
主成分分析では、観察データの情報の損失が最小になるように主成分に要約する。因子分析では、分析者が設定した共通因子によって観察データを説明する*1。共通因子によって説明されなかった部分は独自因子によって説明されるため情報の損失は起こらない。
主成分分析はデータの要約という記述統計としての性格が強い一方、因子分析はあらかじめ想定した仮説やストーリーを裏付けていく演繹的な手法。同じ観察データを使っても落とし込みたいストーリーによって結果が変わる恣意的な面がある。1因子モデル
3変量を1つの因子で分析する。 3変量のデータ、共通因子は各個体によって値の異なる観測可能なデータ。因子分析では、共通因子の影響の大きさ(因子負荷量)はどのような値で、共通因子は3つの変数をどのくらい説明できるかを把握する。また共通因子で説明できなかった要因(独自因子)の影響の大きさはどのくらいかを把握する。前者を共通性、後者を独自性と呼ぶ。1因子モデルの図示
図2において黒字は観察データ、赤字のベクトルは因子分析によって求める値。因子についての仮定条件
分析にあたって以下の3つの仮定を置く。- 共通因子は標準化されている
- 独自因子の平均はゼロ
- すべての因子は独立であり共分散はゼロ
連立方程式を解く
変数の分散は、 同様に、 共分散は 同様に したがってデータから共分散の推定値であるが求まれば、因子負荷量、独自因子の分散は、次の連立方程式を解くことで計算できる。(5)(6)(7)より、 (8)(9)(10)より2因子モデル
3変量を2つの因子で分析する方法。2因子モデルの図示
図2の1因子モデルと同様に、黒字は観察データ、赤字のベクトルは因子分析によって求める値を表す。注意が必要なのは、赤字のベクトルとはどちらも大きさが1でもなければ、直交してもいない。分散共分散行列(もしくは相関行列)の固有ベクトルを求め、第主成分が第主成分に対して直交するような座標軸を設定する主成分分析と異なる点。因子についての仮定条件
- 共通因子は標準化されている
- 独自因子の平均はゼロ
- すべての因子は独立であり共分散はゼロ
共通性
共通因子が各変数をどの程度説明しているかを表す。各変数の因子負荷量の二乗和を計算する。1因子モデルの場合、- (の共通性)=
- (の共通性)=
- (の共通性)=
- (の共通性)=
- (の共通性)=
- (の共通性)=
独自性
各変数の因子では説明できなかったものの大きさ(独自因子の影響力)を表す。独自因子の分散。(独自性)=-(共通性)と計算する。 1因子モデルの場合、- (の独自性)
- (の独自性)
- (の独自性)
- (の独自性)
- (の独自性)
- (の独自性)
因子の回転
因子負荷量を平面上にプロットしたとき、さしたる傾向が導けない場合には因子を回転してもよい。1因子モデル(1)をベクトルと行列を使って表し、の左から回転行列を、の右側から回転行列を掛ける。 モデルは変わらず、因子負荷量は不変。バリマックス回転(直交回転)、プロマックス回転(斜交回転)等が代表的な回転。*1:ただし共通因子も観察可能なデータではある。