计量经济学中的工具变量法(IV)详解
计量经济学中的工具变量法(IV)详解
工具变量法(Instrumental Variables Method,简称IV法)是计量经济学中处理内生性问题的重要方法。本文将从内生性的定义和来源出发,详细介绍工具变量法的原理、估计过程、两阶段最小二乘法(2SLS)、内生性检验、弱工具变量问题以及过度识别检验等内容。
1. 内生性(Endogeneity)
定义:指一个模型中的变量不是随机分配的,受到模型中其他变量的影响。
解释变量与误差项相关:
$$Cov(X_r, u) \neq 0$$
其中,$X_r$为内生自变量。
来源:
- 模型误设
- 测量误差
- 联立性/双向因果
- 样本选择性
后果:OLS估计不一致
来源
- 模型误设
- 函数形式错误(是否存在非线性的函数形式)
- 是否包含无关变量
- 是否遗漏变量
- 测量误差
- X、Y的值未被真实记录,如家庭收入
- 联立性/双向因果
- 联立性:两个变量之间的因果关系不是单方向的,它们之间相互影响
- 在单方程模型中,如果至少一个解释变量同时由被解释变量y部分决定,模型就出现了联立性问题。此时,$E(u|x) \neq 0$。
- 样本选择性
- 样本选择性指的是我们所观察的被解释变量Y的结果,部分地受到行为主体是否参与某项活动选择的影响,从而导致我们所得到的样本成为非随机的样本。
内生性产生的原因和后果,主要是违背了$E(u|x) \neq 0$。
参考伍德里奇的计量经济学导论
MLR.1 线性于参数
MLR.2 随机抽样
MLR.3 不存在完全共线性
MLR.4 零条件均值 $E(u|x) = 0$
MLR.5 同方差性 $Var(u|X) = \sigma^2$
MLR.6 正态性 $\mu \sim Normal(0, \sigma^2)$
在MLR.1-5,估计量为最优线性无偏估计量(BLUEs)的
在MLR.1-6,为经典线性模型(CLM)(classical linear model)
2. 工具变量法
定义
若$X_k$为内生的解释变量,可分解为两个部分,与误差项u相关,与误差项u无关。若能找到一个或多个变量Z,与$X_k$相关,但与u无关,就可通过Z将$X_k$中与u无关的部分分离出来,从而识别出$X_k$中对y的边际影响,且这个结果具有一致性。这种方法称为工具变量法(Instrumental Variables Method,简称IV法)。
工具变量的2个条件
(1)工具外生性:z与u不相关,即$Cov(z,u) = 0$
(2)工具相关性:z与x相关,即$Cov(z,x) \neq 0$
所以:
$\beta_1$的工具变量(IV)估计量:
$$\widehat{\beta_{1}} = \frac{\sum_{i=1}^{n}(z_{i}-\bar{z})(y_{i}-\bar{y})}{\sum_{i=1}^{n}(z_{i}-\bar{z})(x_{i}-\bar{x})}$$
$\beta_0$的工具变量(IV)估计量:
$$\widehat{\beta_{0}} = \bar{y} - \widehat{\beta_{1}}·\bar{x}$$
3. IV估计
结构方程(structural equation)
考虑两个解释变量条件下的标准线性模型
$$y_1 = \beta_0 + \beta_1 × y_2 + \beta_2 × z_1 + u_1$$
$z_1$是外生的,与$u_1$不相关。
$y_2$,表示该变量被怀疑与$u_1$相关。
考虑多个解释变量条件下的标准线性模型
$$y_1 = \beta_0 + \beta_1 × y_2 + \beta_2 × z_1 + ··· + \beta_k × z_{k-1} + u_1$$
工具变量$z_k$需要满足的条件:
- 在结构方程中不出现;
- 与error term不相关;
- 与内生解释变量部分相关(如果完全相关,那就是自己了)
估计过程
对于,$y_1 = \beta_0 + \beta_1 × y_2 + \beta_2 × z_1 + u_1$,OLS估计量是有偏且不一致的。因此,需要采用寻找$y_2$的工具变量的策略。考虑一个方程中未出现的外生变量$z_2$,关键假定是:
$$E(u_1) = 0$$
$$Cov(z_1, u_1) = 0$$
$$Cov(z_2, u_1) = 0$$
给定零条件均值假定,后面两个等同于$E(z_1u_1) = E(z_2u_1) = 0$
即
$$\sum_{i=1}^{n}(y_{i1}-\hat{\beta}{0}-\hat{\beta}{1}y_{i2}-\hat{\beta}{2}z{i1}) = 0$$
$$\sum_{i=1}^{n}z_{i1}(y_{i1}-\hat{\beta}{0}-\hat{\beta}{1}y_{i2}-\hat{\beta}{2}z{i1}) = 0$$
$$\sum_{i=1}^{n}z_{i2}(y_{i1}-\hat{\beta}{0}-\hat{\beta}{1}y_{i2}-\hat{\beta}{2}z{i1}) = 0$$
根据数据,求解上述三个方程对应的样本来得到$\hat{\beta}{0}$、$\hat{\beta}{1}$、$\hat{\beta}_{2}$,这些估计量叫做工具变量估计量。
关键识别条件
约简型方程(reduced form equation)把内生解释变量写出关于外生变量和误差项的方程
对于,$y_1 = \beta_0 + \beta_1 × y_2 + \beta_2 × z_1 + u_1$
如果我们认为$y_2$是外生的,并选择$z_2 = y_2$,则上述三个方程恰好是OLS的一阶条件,但我们需要$y_2$和$z_2$相关。从偏相关的角度来表述这一假定,将把内生解释变量写出关于外生变量和误差项的一个线性函数:
$$y_2 = \pi_0 + \pi_1·z_1 +\pi_2 ·z_2 + v_2$$
其中,$E(v_2) = 0,Cov(z_1, v_1) = 0,Cov(z_2, v_1) = 0$
关键识别条件是$\pi_2$不等于0,即排除了$z_1$的影响后,$z_2$和$y_2$仍相关。
4. 两阶段最小二乘法
工作原理:2SLS首先构造出与内生解释变量$x_k$相关度最强的工具变量的线性组合$\widehat{x}$,然后再用y对$\widehat{x}$做回归,从而得到一致性的估计。$\widehat{x}$被认为是内生解释变量被外生化的部分。
第一阶段,用OLS法进行X关于工具变量Z的回归,并记录X的拟合值;
第二阶段,以得到的X的拟合值代替X作为解释变量,进行OLS回归。
5. 内生性检验
内生性检验,也即是否需要使用工具变量?
当解释变量外生时,2SLS不如OLS有效,因此需要检验一个解释变量是否真的存在内生性。
方法:
豪斯曼检验
豪斯曼检验则用来检验是否有内生性问题
$H_0$:所有解释变量均为外生变量
注:豪斯曼原假设假设同方差情况,修正为“杜宾-吴-豪斯曼检验”(Durbin-Wu-Hausman Test,DWH),可以考虑异方差情况下的内生性。
6. 弱工具问题(weak instruments)
如果工具变量与内生变量的相关性很弱,$cov(z,x) \approx 0$,会导致估计量$\widehat{\beta_{iv}}$的方差变得很大,称为“弱工具变量问题”
会导致如下后果:
方差:IV估计值的标准误可能很大
期望:即使z与u只是适度相关,IV估计量的渐近偏误也可能很大,可能会导致有偏的估计。
$R^2$: $R^2 = 1 - \frac{SSR}{SST}$, SSR是IV残差平方和,实际上可能会大于SST,所以IV的$R^2$可能为负。
为检验是否存在弱工具变量,可在第一阶段回归中,检验所有方程外的工具变量的系数是否联合为零。
也即检验$H_0: \alpha_1 = \alpha_2 = ··· =\alpha_k = 0$,详见第一张图中的辅助回归方程。
若检验的F统计量大于10 则拒绝“存在弱工具变量”的原假设。
7. 过度识别检验
- 不可识别(unidentified):工具变量个数小于内生解释变量个数;
- 恰好识别(just or exactly identified):工具变量个数等于内生解释变量个数;
- 过度识别(overidentified):工具变量个数大于内生解释变量个数
过度识别检验:检验在过度识别情况下,工具变量的外生性。
过度识别检验的基本思想是:在一个过度识别的模型中,如果所有的工具变量都是有效的(满足外生性条件),那么不同工具变量对参数的估计结果应该是一致的。如果工具变量与误差项相关(工具变量无效),则会导致估计的不一致,从而可以通过检验来发现问题。
注:在恰好识别的情况下,只有唯一的工具变量估计量,无法进行比较,故过度识别检验失效。
假设检验:
原假设($H_0$):所有工具变量是外生的(即工具变量与误差项无相关性)。
备择假设($H_1$):至少有一个工具变量是内生的(即工具变量与误差项相关)。
过度识别约束检验:
- 用2SLS法估计结构方程,获得2SLS残差$\hat{u_1}$;
- 将$\hat{u_1}$对所有外生变量回归,获得$R^2$,即$R^2_1$;
- 在所有IV都与$u_1$不相关的原假设下,$nR^2_1 \sim \chi^2_q$,其中q是模型之外的工具变量数目减去内生解释变量的总数目。如果$nR^2$超过了临界值,拒绝$H_0$,并推断出至少部分IV不是外生的。