Goodな生活

INTP型コンサルタントが好奇心の受け皿を探す

【Mostly Harmless Ch.3.4.2】COP効果

はじめに

この記事では、平均処置効果の構成要素の一つであるCOP効果(Conditional on Positive Effects)を扱います。内容はJoshua D. Angrist & Jorn-steffen Pischke (2008)『Mostly Harmless Econometrics』Ch.3.4.2"Limited Dependent Variables and Marginal Effects"を参考にしています。

良いCOP、悪いCOP

前回の記事では、平均処置効果(Average Treatment Effect;ATE)を参加効果(Participation effect)とCOP(Condition on Positive)効果とに分解しました。



\begin{eqnarray}
E[Y_i|D_i = 1]- E[Y_i|D_i = 0] &=& E[Y_i|Y_i > 0, D_i=1]P[Y_i > 0|D_i=1]-E[Y_i|Y_i >0, D_i=0]P[Y_i >0 |D_i =0] \\ \\
                                       &=&  \underbrace{\left\{ P[Y_i > 0|D_i =1] - P[Y_i >0|D_i=0]  \right\}}_{Participation \, effect} E[Y_i|Y_i >0 ,D_i=1] \\ \\ 
                                       &+& \underbrace{E[Y_i|Y_i > 0,D_i =1] - E[Y_i|Y_i >0,D_i=0]}_{COP \, effect}P[Y_i >0 ,D_i=0]  \tag{1}
\end{eqnarray}

支出のような非負の確率変数に与える効果の推定には、この分解が必要(つまり別々に観察すべき)だと主張する研究者もいます。実際に多くの研究者が「2部構成のモデル」を使用しており、参加効果とCOP効果を評価しています*1。「2部構成のモデル」の問題点は、例えRCTが行われた場合であっても、COP効果は因果関係を意味しないことです。これはCh.3.2.3で提起された、セレクションバイアスに対処するための良くないコントロール変数の議論と同様です。COP効果を次のように2つに分解します。



\begin{eqnarray}

E[Y_i|Y_i > 0,D_i = 1]- E[Y_i|Y_i >0,D_i = 0] &=& E[Y_{1i}|Y_{1i} > 0 ]-E[Y_{0i}|Y_{0i} >0] \\ \\
                                       &=&  \underbrace{\left\{ E[Y_{1i}-Y_{0i} |Y_{1i} > 0 ]  \right\}}_{Causal \, effect} +  \underbrace{\left\{E[Y_{0i}|Y_{1i} > 0] - E[Y_{0i}|Y_{0i} >0]\right\}}_{Selection \, bias}  \tag{2}
\end{eqnarray}


1つ目は、保険が無料の場合に医療サービスを利用するグループにおいて、自己負担が支出に与える対する因果効果、2つ目は、保険が無料の場合に医療サービスを利用するグループと有料の場合(自己負担の発生する場合)に医療サービスを利用するグループ間の Y_{0i} の差です。第2項はセレクションバイアスの一種ですが、Ch.2のセレクションバイアスと比べるとやや曖昧なものです。

RAND医療保険実験の場合、実験そのものが医療費支出が正のグループの構成を変化させるため、セレクションバイアスが発生します。Y_{0i} > 0のグループには、仮にディダクティブルグループになり控除額を支払わなければならなくなった場合に医療サービスを受けることを止めてしまう人が含まれています。言い換えれば、このグループはY_{1i} > 0 のグループよりも規模が大きく、Y_{1i} > 0のグループと比べた平均的な医療費支出も小さいです。したがって、セレクションバイアスの項は正であり、その結果、COP効果は負の因果効果E[Y_{1i} - Y_{0i} |Y_{1i} > 0]よりもゼロに近くなります。これはCh.3.2.3の良くないコントロール変数の一種です。因果推論の文脈においては、Y_i > 0 はアウトカム変数であり、したがって処置が Y_iが正である可能性に影響を及ぼさない限りは、条件付けを行うことは正当化されます。

打ち切り回帰モデル

COP効果の非因果性に対する一つの解決策は、Tobitモデルのような打ち切り回帰モデル(censored regression model)を用いることです。支出をアウトカムとして扱う伝統的なTobitモデルは、観察された従属変数Y_i



\begin{eqnarray}
Y_i = 1[Y_i^* > 0]Y_i^* \tag{3}
\end{eqnarray}


(3)を満たすよう作られています。Y_i^*は負の値をとり、正規分布に従う潜在支出変数(latent expenditure variable)です。Y_i^*は制限従属変数(LDV)ではないため、Tobit支持者は、これを伝統的な線形モデル、例えばD_iの関数として表すことを好みます*2



\begin{eqnarray}
Y_i^* =  β_0^* + β_1^* D_i - v_i \tag{4}
\end{eqnarray}



この場合、β_1^*は潜在支出Y_iに対するD_iの因果効果です。(3)はY_iが正であろうとなかろうと、すべての観察データに対して定義されます。Y_i^*に対する効果を把握しさえすればよいのであれば、COPのセレクションバイアスは生じません。

しかし、今回はY_i^*に対する効果を把握するの問題があります。まず第1に、「潜在的な医療費」が不可解な変数であるということです。一部の人にとっては、医療費は本当にゼロです。これはある種の匿名化等の統計処理の結果ではありません。このように、潜在的に負のY_i^*という概念は理解しがたいものです。Y_i^*に関するデータは今後とも存在しないものです。第2に、潜在モデルのパラメータβ_1^*と、観察されたアウトカムY_iとの因果関係が、潜在変数に関する分布の仮定に依存していることです。この関係を確立するため、Y_iD_iによる条件付き期待値を求めます。




\begin{eqnarray}
E[Y_i|D_i] = Φ\left[ \frac{β_0^*+β_1^* D_i}{σ} \right] [β_0^*+β_1^* D_i] + σ φ\left[ \frac{β_0^*+β_1^* D_i}{σ}\right] \tag{5}
\end{eqnarray}


σv_iの標準偏差です。(5)はv_iの正規性と均一分散性、そしてY_i1[Y^*_i>0]Y^*_iで表されるという仮定に基づいています。

TobitモデルのCEFは、観察された支出に対する医療保険の効果(処置効果)の影響を表します。具体的には、




\begin{eqnarray}

E[Y_i|D_i=1]-E[Y_i|D_i=0] &=& \left\{ Φ\left[\frac{β_0^*+β_1^*}{σ_v}\right] [β_0^* + β_1^*] + σφ\left[ \frac{β_0^* + β_1^*}{σ_v}\right] \right\} \\ \\
 &-&  \left\{Φ\left[\frac{β_0}{σ_v}\right][β_0^*] + σ_vφ\left[\frac{β_0^*}{σ_v}\right] \right\} \tag{6}

\end{eqnarray}


というかなり厄介な式です。しかし、唯一の説明変数はダミー変数D_iなので、E[Y_i|D_i = 1] - E[Y_i |D_i = 0]の推定には他の変数は必要ありません。Y_iD_iに回帰した線形回帰の回帰係数は、Tobitモデルを採用しようとしまいと(6)の左辺のCEFを表します。

COP効果は、アウトカムの分布に質量点がある場合、つまりゼロのような特定の値が積み重なっている場合、あるいは分布に大きく偏りがある場合、あるいはその両方がある場合、平均値に対する効果の分析は何かを見逃しているという研究者の感覚によって動機付けられることがあります。平均値の効果の分析では、実際に、特定の値の確率の変化や、中央値から離れた分数点の推移などを見逃すことがあります。しかし、それではなぜアウトカムの分布の効果を直接観察しないのでしょうか?

アウトカムの分布は、年間医療費がゼロ以上、100ドル以上、200ドル以上等の可能性などを含みます。言い換えれば、推定したい回帰の左辺は、様々な値のcの下での1[Y_i > c]を想定することとなります。計量経済学的には、これらの結果はすべて(7)の範疇にあります。Angrist (2001)*3では、出産行動が労働時間に与える影響を題材に、線形確率モデル(Linear Probability Model)を用いて分布効果を直接見るという考え方が示されています。別の方法として、分位点が焦点となる場合は、分位点回帰(quantile regression)を使ってモデル化することもできます。



\begin{eqnarray}
E[Y_{1i}-Y_{0i}] &=& E[Y_{1i}]-E[Y_{0i}] \\ \\
       &=& P[Y_{1i}=1] -P[Y_{0i}=1] \tag{7}
\end{eqnarray}


Tobitの潜在変数モデルは、扱う観察データがトップコーディング(top cording)*4等による打ち切り(censored)がされている場合、有意義なモデルになります。本当の打ち切りは、潜在変数が、関心のあるアウトカムである実際のデータと対応していることを意味します。例えば米国の労働賃金を分析する統計として有名なCPS(The Current Population Survey)が挙げられます。CPSは電話調査により集計された統計であり、回答データを匿名化するためにトップコーディングが行われています。一般的に、私たちが関心を持っているのは、CPSでトップコーディングされた賃金ではなく、回答者の納税申告書に記載されている所得に対する学校教育の因果関係です。Chamberlain (1994)*5は、ある年度において、CPSのトップコーディングによって、学校教育へのリターンの測定値が大幅に減少することを示し、Tobitモデルに基づいた打ち切りによる推定量の調整を提案しています。

*1:Naihua Duan, Willard G. Manning, Carl N. Morris & Joseph P. Newhouse (1983) A Comparison of Alternative Models for the Demand for Medical Care, Journal of Business & Economic Statistics, 1:2, 115-126, DOI: 10.1080/07350015.1983.10509330

*2:v_iは平均0、分散σ^2の正規分布に従う

*3:Joshua D Angrist (2001) Estimation of Limited Dependent Variable Models With Dummy Endogenous Regressors, Journal of Business & Economic Statistics, 19:1, 2-28, DOI: 10.1198/07350010152472571

*4:秘匿性の観点から、ある閾値以上の値は具体的な値を公表しない等、特定化を防ぐ操作。

*5:Chamberlain, G. (1994). Quantile regression, censoring, and the structure of wages. In C. Sims (Ed.), Advances in Econometrics: Sixth World Congress (Econometric Society Monographs, pp. 171-210). Cambridge: Cambridge University Press. doi:10.1017/CCOL0521444594.005