【Mostly Harmless Ch.3.4.2】制限従属変数

はじめに

この記事では制限従属変数（Limited Dependent Variable；LDV）を扱います。内容はJoshua D. Angrist & Jorn-steffen Pischke (2008)『Mostly Harmless Econometrics』Ch.3.4.2"Limited Dependent Variables and Marginal Effects"を参考にしています。

はじめに
制限従属変数とは
LDVsの例～RAND医療保険実験
Probitモデルを用いた推定
平均処置効果の分解
参考文献

制限従属変数とは

従属変数（被説明変数）がある限られた範囲の値しか取らない場合、これを制限従属変数（Limited Dependent Variable；LDV）と呼びます。

Angrist and Evans(1998)*1は、出生率が女性の労働参加に与える影響を分析しました。「女性は子供をたくさん持つと外で働かなくなるのか」という仮説の検証です。しかし、出生率と女性の労働参加は同時決定的*2であり、就労機会に恵まれない女性が多くの子供をもつ、というセレクションバイアスが生じる可能性があります。Angrist and Evans(1998)は、二人以上子供をもつ夫婦もしくは母親を対象にし、二つの操作変数を用いました。一つは、第一子と第二子の性別が異なるか否かを示すダミー変数（sibling sex composition）です。二つ目は、双子の出産有無を示すダミー変数（multiple birth）です。いずれも労働参加（被説明変数）とは独立し、出生率（説明変数）とは相関のあると考えられる変数です。この研究で用いられた識別のうち大半は、従属変数が二値（失業状態の有無）または非負（労働時間、賃金）でした。多くの計量経済学の教科書では、従属変数が制限従属変数の場合には、線形回帰は不適合であり、ProbitモデルやTobit モデルを用いるべきだと説明されています。一方で、線形回帰こそが条件付き期待値関数（Conditional Expectation Function； CEF）の真っ当な近似だと考えると、必ずしも制限従属変数モデルを中心に識別を考える必要はありません。

LDVsの例～RAND医療保険実験

この識別の問題を検討するベンチマークとして、RCTの有名な事例であるRAND医療保険実験（RAND Health Insurance Experiment；HIE）を取り上げます。この野心的な実験では、実験のために民間医療保険会社が設立され、無作為に選ばれた参加者は医療保険に加入することができました。医療保険の特徴は、自己負担割合によって様々なプランが用意されたことです。自己負担がまったくゼロ、他には共同支払いやディダクティブル*3など、ポケットマネーを支出するものが用意されました。実験の目的は、自己負担割合の大小が、受診行動や健康状態に与える影響を明らかにすることです。HIEの結果、自己負担割合が低い参加者ほど受診行動が増加する一方、健康状態には影響を与えないことが明らかになりました。この実験結果は保険プランの設計等に示唆を与えるものとなりました。

RAND医療保険実験の従属変数のほとんどは制限従属変数（LDV）です。これらは医療費の発生有無、入院有無、または外来診療の回数や年間の総医療費支出などです。下表は、HIEの処置群（HIE treatment group）のうち、自己負担が無料のグループ（Free）と、支払いが必要なディダクィテブルのグループ（Individual Deductible;ID）の2つの群の結果です。ディダクテブルのグループは、外来診療のために一人当たり年間150ドル、または家族当たり年間450ドルの前払いが必要でした（入院費は含まず）。

	Face to Face Visits	Outpatient Expense($)	Admissions(%)	Prob. Any medical(%)	Prob. Any Inpatient(%)	Total Expense(%)
Free	4.55	340	12.8	86.8	10.3	749
ID	3.02	235	11.5	72.3	9.6	608

表は、Manning et al.(1987) *4に基づき、2つのグループの平均アウトカム（average outcome）を示しています。

LDVの議論を簡単にするため、無料のグループとディダクテブルのグループがランダムに割り当てられたとします。 $D_i = 1$ がディダクテブルグループへの割当を表します。 $D_i=1$ と $D_i=0$ の平均値の差は、割り当ての因果効果（the unconditional average treatment effect）を表します。なぜならRCTの節の議論と同様に、割り当て $D_i$ は潜在結果とは独立だからです。

$\begin{eqnarray} E[Y_i|D_i=1] - E[Y_i|D_i=0] &=& E[Y_{1i}|D_i=1] - E[Y_{0i}|D_i=0] \\ \\ &=& E[Y_{1i}-Y_{0i}] \tag{1} \end{eqnarray}$

(1)は、実験における因果効果の推定は、 $Y_i$ が二値であろうと、非負であろうと、連続的に分布していようと、特別な課題はないことを表します。右辺の解釈は従属変数の種類によって変わりますが、平均処置効果（Average Treatment Effect；ATE）を得るために特別なことをする必要はありません。例えば、HIEのアウトカムの1つには、医療費の支出有無を表すダミーがあり、これは二項確率変数（ベルヌーイ試行）なので、以下のようにATEを表すことができます。

$\begin{eqnarray} E[Y_{1i}-Y_{0i}] &=& E[Y_{1i}]-E[Y_{0i}] \\ \\ 　　　　　　　&=& P[Y_{1i}=1] -P[Y_{0i}=1] \tag{2} \end{eqnarray}$

(1)の左辺のグループ間の比較を観察するため、表内のProb Any Medical[%]（いずれかの外来診察確率）に注目します。無料のグループの87％が何らかの医療サービスを利用したのに対し、ディダクティブルグループでは72％しか医療サービスを利用していません。したがって、ディダクティブルグループは150ドルの前払いを行っていましたが、これは医療サービスの利用率に顕著な影響を与えていました。2つのグループの確率の差0.15（標準偏差 = 0.017）は、 $Y_i$ を医療費支出の有無を示すダミー変数とした場合の $E[Y_{1i}-Y_{0i}]$ の推定値です。ここでのアウトカム変数はダミー変数なので、平均処置関係はまた医療サービスの利用率に対する因果関係でもあります。

Probitモデルを用いた推定

Probitモデルを用いたCEFの推定を考えます。ここでは従属変数は0か1をとる二項変数、つまりLDVの性質を満たします。従属変数 $Y_i$ に対して、潜在変数（latent variable） $Y_i^*$ を考えます。潜在変数とは、 $Y_i$ の取る値は分析者には観測できない潜在変数 $Y^*_i$ によって決定されるという考え方です。潜在変数は、グループへの割り当てダミー $D_i$ と誤差項 $v_i$ の1次関数で表されるとします。

$\begin{eqnarray} Y_i^* = β_0^* + β_1^* D_i - v_i \tag{3} \end{eqnarray}$

$v_i$ は平均0,分散 $σ^2$ の正規分布に従います。観察される従属変数 $Y_i$ は潜在変数 $Y_i^*$ を使って表します。潜在変数が正の値をとったときには1、負の値となったときにはゼロとして観測されます。

$\begin{eqnarray} Y_i = \left\{ \begin{array}{l} 1 & if & Y_i^* > 0\\ 0 & if & Y_i^* <0 \end{array} \right. \tag{4} \end{eqnarray}$

潜在変数はインデックス関数を使って以下のようにも表すことができます。

$\begin{eqnarray} Y_i = 1[Y_i* > 0] \tag{5} \end{eqnarray}$

CEFは標準正規分布の累積分布関数 $Φ(\cdot)$ を使って、CEFは以下のように表されます。

$\begin{eqnarray} E[Y_i|D_i] &=& Φ\left[\frac{β_0^* + β_1^* D_i}{σ} \right] 　\\ &=& Φ\left[\frac{β_0^* }{σ} \right] + \left\{ Φ \left[\frac{β_0^*+β_1^*}{σ} \right] - Φ \left[\frac{β_0^*}{σ} \right] \right\} D_i \tag{6} \end{eqnarray}$

これは説明変数 $D_i$ の線形関数であり、 $Y_i$ を $D_i$ に回帰した係数は、Probitモデルの予測値（Probit fitted value）の差分 $Φ \left[\frac{β_0^*+β_1^*}{σ} \right] - Φ \left[\frac{β_0^*}{σ} \right]$ です。しかしながら、Probitモデルの係数 $\frac{β_0^*}{σ},\frac{β_1^*}{σ}$ は、標準正規分布の累積分布関数にそれらを代入しない限りは、 $D_i$ が $Y_i$ に与える影響の大きさについて何ら解釈をすることはできません。

平均処置効果の分解

RAND医療保険実験で得られた最も重要な結果の一つは、自己負担の割合によって医療支出が変わる、というものです。ディダクテブルグループは医療サービスの利用に加えて医療費支出も少なかったのでしょうか。RAND医療保険実験の結果からは、無料のグループとディダクテブルグループの医療費支出の平均値の差は141ドル（標準偏差=6.0）だと分かります。この結果からは、（推定値は正確でないにしろ）自己負担割合を高めることで総医療費を削減できる、という示唆が得られます。

自己負担が無料のグループと、自己負担が発生するディダクティブルグループへの割り当てが $D_i$ によって決まるとし、医療費支出 $Y_i$ の条件付き期待値を求めると、

$\begin{eqnarray} E[Y_i|D_i] &=& E[Y_i|Y_i > 0, D_i]P[Y_i > 0|D_i] \tag{7} \end{eqnarray}$

グループ間の医療費支出の差は、以下のように2つの部分に分割することができます。

$\begin{eqnarray} E[Y_i|D_i = 1]- E[Y_i|D_i = 0] &=& E[Y_i|Y_i > 0, D_i=1]P[Y_i > 0|D_i=1]-E[Y_i|Y_i >0, D_i=0]P[Y_i >0 |D_i =0] \\ \\ &=& \underbrace{\left\{ P[Y_i > 0|D_i =1] - P[Y_i >0|D_i=0] \right\}}_{Participation \, effect} E[Y_i|Y_i >0 ,D_i=1] \\ \\ &+& \underbrace{E[Y_i|Y_i > 0,D_i =1] - E[Y_i|Y_i >0,D_i=0]}_{COP \, effect}P[Y_i >0 ,D_i=0] \tag{8} \end{eqnarray}$

一つは、自己負担があるグループとないグループ間での医療費支出が正となる確率の差＝参加効果（Participation effect）。もう一つは、自己負担の有無という条件下での医療費支出の期待値の差＝COP効果（conditional on positive）です。しかしこれは因果効果の推定において特別な意味を持つ訳ではなく、(1)を推定することは依然として必要であり、 $Y_i$ の $D_i$ への回帰により母集団平均処置効果を得ることができます。次回はこのCOP効果について更に詳しく見ていきます。

参考文献

Mostly Harmless Econometrics: An Empiricist's Companion

作者:Angrist, Joahua D.,Pischke, Jorn-steffen
Princeton University Press

Amazon

*1:Angrist, Joshua D & Evans, William N, 1998. "Children and Their Parents' Labor Supply: Evidence from Exogenous Variation in Family Size," American Economic Review, American Economic Association, vol. 88(3), pages 450-477, June.

*2:同時方程式体系、ともいいます。

*3:米国の保険の一種であり、被保険者が一定金額（免責金額）を支払った後に初めて保険会社がサービスを開始する仕組み

*4:Manning, Willard G, et al, (1987), Health Insurance and the Demand for Medical Care: Evidence from a Randomized Experiment, American Economic Review, 77, (3), 251-77

Goodな生活

INTP型コンサルタントが好奇心の受け皿を探す