Stata:固定效应的颗粒度选择:实践与陷阱
Stata:固定效应的颗粒度选择:实践与陷阱
在实证研究中,固定效应模型是处理个体异质性的重要工具。然而,在选择固定效应的颗粒度时,研究者常常面临一个难题:究竟是选择更细的公司固定效应还是更粗的行业固定效应?本文通过具体案例分析,探讨了固定效应颗粒度选择对回归结果的影响,并提供了实用的建议。
1. 引言
在实证研究中,时间和个体双重固定效应模型随处可见。但在对个体固定效应选择时,究竟是选择更细的公司固定效应还是更粗的行业固定效应?为什么有时两种控制方法会使结果产生显著性变化,甚至符号变化?本文进一步总结了实践中固定效应模型的使用,并结合具体问题探讨了“个体”固定效应选择层级的问题。
2. 固定效应模型理解
2.1 最小二乘虚拟变量估计法
固定效应可以在一定程度上解决遗漏变量带来的估计偏差。在实践中,我们通常生成一系列的虚拟变量来建立一个大型变量矩阵进行回归。对于个体,虚拟变量定义为,如果是其他个体,则。包含虚拟变量的固定效应模型如下:
该方法的基本Stata命令为:
reg Y X Z i.id
2.2 个体内差分估计法
固定效应回归命令通常使用一种数学技巧产生与原模型相同的系数,但计算更容易。具体地,将个体不可观测且不随时间变化的变量表示为,个体可观测不随时间变化的变量表示为,可以通过组内离差变换消除和:
其中,,,为个体内差值,即去除个体均值后的值。通过个体变换,不仅去除了不可观测的固定效应,同时去除了可观测的不随时间变化的变量。该方法的Stata命令包含三种等价的基本代码:
xtreg Y X, fe
areg Y X, absorb(id)
reghdfe Y X, absorb(id)
接下来,我们以Kleiber和Zeileis (2008)的Grunfeld.dta数据集为例,对两种回归结果进行比较分析。其中,被解释变量是invest,解释变量是mvalue和kstock,个体变量是company,时间变量是year。
webuse 'grunfeld', clear
xtset company year
* LSDV
qui: reg invest mvalue kstock i.company
est store m1
* 个体固定效应模型
qui: xtreg invest mvalue kstock, fe
est store m2
qui: areg invest mvalue kstock, absorb(company)
est store m3
qui: reghdfe invest mvalue kstock, absorb(company)
est store m4
local mlist_1 'm1 m2 m3 m4 '
esttab `mlist_1' , scalars(N r2) noconstant replace ///
> mtitles('reg' 'xtreg' 'areg' 'reghdfe')
回归结果如下:
--------------------------------------------------------------
(1) (2) (3) (4)
reg xtreg areg reghdfe
--------------------------------------------------------------
mvalue 0.110*** 0.110*** 0.110*** 0.110***
(9.29) (9.29) (9.29) (9.29)
kstock 0.310*** 0.310*** 0.310*** 0.310***
(17.87) (17.87) (17.87) (17.87)
--------------------------------------------------------------
N 200 200 200 200
r2 0.944 0.767 0.944 0.944
--------------------------------------------------------------
t statistics in parentheses
* p<0.05, ** p<0.01, *** p<0.001
3. 固定效应模型颗粒度选择
在固定效应模型选择,特别是对于个体固定效应的选择时,我们需要着重考虑数据的组间、组内变异情况和回归的经济含义。以Zhou (2001)的文章内容为例:
在探究公司绩效与管理层持股之间的关系时,实证研究出现了不一致的结果。这被解释为内部所有权的复杂作用:一方面管理层持股的增加协调了管理者和股东的利益,从而提高了绩效;另一方面也促进了管理防御,并对绩效产生负面影响。在实证过程中,控制与不控制公司的固定效应对结果产生了不同的影响。
管理层所有权虽然在不同公司之间有很大的不同,但在一个公司内部,管理层所有权通常每年变化缓慢。由于理性的管理者将预期的长期利益最大化,因此尚不清楚的是,一年内所有权的微小变化是否预示着管理激励机制的显著变化。即使随着时间的推移,管理层所有权增加会提高公司绩效,这种影响预计会在横截面数据中显示出来。
一个例子有助于说明这一点,比较两个CEO:
- CEO A平均持有公司10%的股票;
- CEO B平均持有公司0.1%的股票。
假设CEO的持股比例每年的变化很小,比如小于10%,而且在一个变化缓慢且受控制的世界中基本上是随机的。然后,观察到的所有权分配为:
- CEO A在9%-11%之间;
- CEO B在0.09%-0.11%之间。
如果管理层持股提供了重要的激励因素,可以预计两位CEO的业绩会有显著差异。但对于两家公司来说,每家公司的业绩并不会因管理层持股在一年内的微小变化而发生明显变化。当加入公司固定效应时,我们探究的是每家公司内部管理层持股变化对该公司绩效的影响,因此可能不会得到管理层持股增加能够有效提高公司业绩的结论。
如果施加公司固定效应能够解决因未观察到的企业异质性而产生的内生性问题,那么使用工具变量对OLS回归结果的改善将和固定效应模型的结果类似,但研究中发现所有权-绩效之间的关系在固定效应回归中消失,但在工具变量回归中变得更强。
Zhou (2001)使用来自标准普尔1993-1997年ExecuComp数据集对CEO持股占比数据进行了分析。
Table 1显示了CEO所有权的内部变化和横截面变化之间的显著差异。表格中显示的持股数据是CEO所持有的公司总股份的百分比。可以看出管理层所有权的变化通常会随着时间的推移而缓慢变化,但不同公司之间差异巨大。这些数字表明,所有权的微小内部变化似乎不太可能意味着激励机制的实质性变化,并在年内对业绩产生可察觉的影响。
Table 2显示了CEO持股比例逐年变化的分布情况。这些变化的计算方法是用年末-年初所有权的差额除以前一年的所有权。对于全部样本,近一半的绝对变化小于10%。表中还报告了平均持股比例分别超过1%和10%的CEO分布情况。如第三和第四列所示,对于持有较高股权的首席执行官来说,CEO持股变化明显更小。在持有公司10%以上股份的CEO中,约有四分之三变动幅度小于10%。
CEO所有权如此微小的变化,并不支持管理层股权激励每年都有显著变化的观点。在长期的雇佣关系中,经理的行为不太可能因为股权的微小且可能是暂时的变化而改变。例如,人们不会期望一个经理在一年内因为工作努力而增加了5%的持股,然后在第二年卖出5%的股份后放松。样本中的大多数公司似乎都有一个CEO所有权的目标水平,该目标水平不随时间变化或变化缓慢。这是有道理的,因为所有权可用于激励管理层稳定努力工作,以使公司的长期价值最大化。
与小的内部变异形成鲜明对比的是,公司间的CEO持股权变化非常大。Table 3比较了CEO的平均所有权。根据每个CEO在样本期内的平均持股情况,整个样本被分成十分位数。表格显示了十分位数之间的巨大差异。最高的十分位数的股票持有量大约是最低的十分位数的1000倍。
因此在实践过程中,我们需要对数据的横截面变异和组内变异情况进行有效汇报,并根据经济含义来选择到底应该采用颗粒度更细的固定效应(公司、个体固定效应)还是颗粒度更粗的固定效应(行业、城市固定效应)。
4. 总结
本文总结了固定效应的两种估计方式,并着重解释了为什么研究人员经常将固定效应描述为“对X的组内变异分析”。进一步基于Zhou (2001)的“所有权-绩效”研究,分析了固定效应颗粒度结果选择对回归结果的可能影响。在未来研究中,建议汇报数据的横截面、组内变异情况,并针对具体研究问题考虑固定效应选择的合理性。
参考文献
- Zhou X. Understanding the determinants of managerial ownership and the link between ownership and performance: comment[J]. Journal of financial economics, 2001, 62(3): 559-571.
- deHaan E. Using and interpreting fixed effects models[J]. Available at SSRN 3699777, 2021.
- 知乎推文:固定效应回归的两种实现方法