计量经济学中的工具变量法(IV)详解
计量经济学中的工具变量法(IV)详解
工具变量法(Instrumental Variables Method,简称IV法)是计量经济学中处理内生性问题的重要方法。本文将从内生性的定义和来源出发,详细介绍工具变量法的基本原理、IV估计、两阶段最小二乘法(2SLS),以及如何检验内生性、弱工具变量问题和过度识别问题。
1. 内生性 Endogeneity
定义:指一个模型中的变量不是随机分配的,受到模型中其他变量的影响。
解释变量与误差项相关
[Cov(X_r, u) \neq 0]
其中,(X_r)为内生自变量。
来源:
- 模型误设:函数形式错误、无关变量的包含或遗漏变量。
- 测量误差:变量值未被真实记录,如家庭收入。
- 联立性/双向因果:两个变量之间存在相互影响的关系。
- 样本选择性:样本选择过程受到被解释变量的影响,导致样本非随机。
后果:OLS估计不一致。
参考伍德里奇的计量经济学导论,OLS估计需要满足以下基本假定:
- MLR.1 线性于参数
- MLR.2 随机抽样
- MLR.3 不存在完全共线性
- MLR.4 零条件均值 (E(u|x) = 0)
- MLR.5 同方差性 (Var(u|X) = \sigma^2)
- MLR.6 正态性 (\mu \sim Normal(0, \sigma^2))
在MLR.1-5条件下,估计量为最优线性无偏估计量(BLUEs);在MLR.1-6条件下,为经典线性模型(CLM)。
2. 工具变量法
定义
若 (X_k) 为内生的解释变量,可将其分解为与误差项 (u) 相关和不相关的两部分。若能找到一个或多个变量 (Z),满足以下条件:
- 工具外生性:(Z) 与 (u) 不相关,即 (Cov(z, u) = 0)
- 工具相关性:(Z) 与 (X_k) 相关,即 (Cov(z, x) \neq 0)
则可通过 (Z) 将 (X_k) 中与 (u) 无关的部分分离出来,从而识别出 (X_k) 对 (y) 的边际影响。这种方法称为工具变量法(Instrumental Variables Method,简称IV法)。
工具变量的估计量:
(\beta_1) 的工具变量(IV)估计量:
[
\widehat{\beta_{1}} = \frac{\sum_{i=1}^{n}(z_{i} - \bar{z})(y_{i} - \bar{y})}{\sum_{i=1}^{n}(z_{i} - \bar{z})(x_{i} - \bar{x})}
](\beta_0) 的工具变量(IV)估计量:
[
\widehat{\beta_{0}} = \bar{y} - \widehat{\beta_{1}} \cdot \bar{x}
]
3. IV估计
结构方程
考虑两个解释变量条件下的标准线性模型:
[
y_1 = \beta_0 + \beta_1 \times y_2 + \beta_2 \times z_1 + u_1
]
其中,(z_1) 是外生的,与 (u_1) 不相关;(y_2) 被怀疑与 (u_1) 相关。
考虑多个解释变量条件下的标准线性模型:
[
y_1 = \beta_0 + \beta_1 \times y_2 + \beta_2 \times z_1 + \cdot \cdot \cdot + \beta_k \times z_{k-1} + u_1
]
工具变量 (z_k) 需要满足的条件:
- 在结构方程中不出现;
- 与 error term 不相关;
- 与内生解释变量部分相关(如果完全相关,那就是自己了)。
估计过程
对于 (y_1 = \beta_0 + \beta_1 \times y_2 + \beta_2 \times z_1 + u_1),OLS 估计量是有偏且不一致的。因此,需要采用寻找 (y_2) 的工具变量的策略。考虑一个方程中未出现的外生变量 (z_2),关键假定是:
- (E(u_1) = 0)
- (Cov(z_1, u_1) = 0)
- (Cov(z_2, u_1) = 0)
给定零条件均值假定,后面两个等同于 (E(z_1u_1) = E(z_2u_1) = 0)。
根据数据,求解上述三个方程对应的样本来得到 (\hat{\beta}_0)、(\hat{\beta}_1)、(\hat{\beta}_2),这些估计量叫做工具变量估计量。
关键识别条件
约简型方程(reduced form equation):把内生解释变量写出关于外生变量和误差项的方程。
对于 (y_1 = \beta_0 + \beta_1 \times y_2 + \beta_2 \times z_1 + u_1),如果我们认为 (y_2) 是外生的,并选择 (z_2 = y_2),则上述三个方程恰好是 OLS 的一阶条件,但我们需要 (y_2) 和 (z_2) 相关。
从偏相关的角度来表述这一假定,将把内生解释变量写出关于外生变量和误差项的一个线性函数:
[
y_2 = \pi_0 + \pi_1 \cdot z_1 + \pi_2 \cdot z_2 + v_2
]
其中,(E(v_2) = 0),(Cov(z_1, v_1) = 0),(Cov(z_2, v_1) = 0)。
关键识别条件是 (\pi_2) 不等于 0,即排除了 (z_1) 的影响后,(z_2) 和 (y_2) 仍相关。
4. 两阶段最小二乘法
工作原理:2SLS 首先构造出与内生解释变量 (x_k) 相关度最强的工具变量的线性组合 (\widehat{x}),然后再用 (y) 对 (\widehat{x}) 做回归,从而得到一致性的估计。其中,(\widehat{x}) 被认为是内生解释变量被外生化的部分。
第一阶段:用 OLS 法进行 (X) 关于工具变量 (Z) 的回归,并记录 (X) 的拟合值。
第二阶段:以得到的 (X) 的拟合值代替 (X) 作为解释变量,进行 OLS 回归。
5. 内生性检验
内生性检验,也即是否需要使用工具变量?
当解释变量外生时,2SLS 不如 OLS 有效,因此需要检验一个解释变量是否真的存在内生性。
方法:豪斯曼检验
豪斯曼检验用来检验是否有内生性问题
- (H_0):所有解释变量均为外生变量
注:豪斯曼原假设假设同方差情况,修正为“杜宾-吴-豪斯曼检验”(Durbin-Wu-Hausman Test,DWH),可以考虑异方差情况下的内生性。
6. 弱工具问题(weak instruments)
如果工具变量与内生变量的相关性很弱,(cov(z, x) \approx 0),会导致估计量 (\widehat{\beta_{iv}}) 的方差变得很大,称为“弱工具变量问题”。
会导致如下后果:
- 方差:IV 估计值的标准误可能很大
- 期望:即使 (z) 与 (u) 只是适度相关,IV 估计量的渐近偏误也可能很大,可能会导致有偏的估计。
- (R^2):(R^2 = 1 - \frac{SSR}{SST}),SSR 是 IV 残差平方和,实际上可能会大于 SST,所以 IV 的 (R^2) 可能为负。
为检验是否存在弱工具变量,可在第一阶段回归中,检验所有方程外的工具变量的系数是否联合为零。也即检验 (H_0: \alpha_1 = \alpha_2 = \cdot \cdot \cdot = \alpha_k = 0),详见第一张图中的辅助回归方程。
若检验的 F 统计量大于 10,则拒绝“存在弱工具变量”的原假设。
7. 过度识别检验
- 不可识别(unidentified):工具变量个数小于内生解释变量个数;
- 恰好识别(just or exactly identified):工具变量个数等于内生解释变量个数;
- 过度识别(overidentified):工具变量个数大于内生解释变量个数
过度识别检验:检验在过度识别情况下,工具变量的外生性。
过度识别检验的基本思想是:在一个过度识别的模型中,如果所有的工具变量都是有效的(满足外生性条件),那么不同工具变量对参数的估计结果应该是一致的。如果工具变量与误差项相关(工具变量无效),则会导致估计的不一致,从而可以通过检验来发现问题。
注:在恰好识别的情况下,只有唯一的工具变量估计量,无法进行比较,故过度识别检验失效。
假设检验:
- 原假设((H_0)):所有工具变量是外生的(即工具变量与误差项无相关性)。
- 备择假设((H_1)):至少有一个工具变量是内生的(即工具变量与误差项相关)。
过度识别约束检验:
- 用 2SLS 法估计结构方程,获得 2SLS 残差 (\hat{u_1});
- 将 (\hat{u_1}) 对所有外生变量回归,获得 (R^2),即 (R_1^2);
- 在所有 IV 都与 (u_1) 不相关的原假设下,(nR_1^2 \sim \chi_q^2),其中 (q) 是模型之外的工具变量数目减去内生解释变量的总数目。如果 (nR^2) 超过临界值,拒绝 (H_0),并推断出至少部分 IV 不是外生的。