|
原始信息:
A,Roth J. 2023。“更多……” ,90(5):2555-2591。
上写:在实证研究“可信度革命”的背景下,双重差分是目前最常用的因果识别方法,而平行趋势假设是双重差分估计中的重要假设。由于平行趋势假设本身无法检验,目前大多数事前平行趋势检验方法也存在一定的问题。本文提出了在放宽平行趋势假设条件下更加可信的鲁棒推理和敏感性分析方法,为平行趋势检验的可信度提供了更有效的证据。
01
研究背景
平行趋势假说指出,在没有干预的情况下,治疗组和对照组的平均结果随着时间的推移将具有相同的趋势。由于我们只能观察治疗组受到电击后的情况,因此对照组为研究提供了反事实,这意味着未经治疗的对照组在观察期间的“变化”可以近似于本来会发生的情况如果治疗组没有受到影响。受到冲击时发生变化(Huang Wei et al., 2022)。
当不满足平行趋势假设时,以往的处理方法主要有两种:一是将治疗组与对照组重新匹配;二是将治疗组与对照组重新匹配。另一种是通过重新加权来合成双差。本文作者和Roth(2023)提出了第三种方法:当存在不同程度违反平行趋势假设时,预处理趋势可以提供违反平行趋势的相关信息,并对平行趋势进行敏感性分析相关估算结果。这种方法称为DID。
近年来,许多学者指出,预处理趋势检验对于DID估计的有效性来说既不充分也没有必要。如果治疗前平行趋势检验的可靠性不高,可能会导致对治疗后治疗效果的估计出现偏差。如果您不确定平行趋势假设的有效性该怎么办?本文提出了在可能违反平行趋势假设的情况下对双重差异和事件研究进行稳健推断的方法。即不需要平行趋势假设完全成立,但处理后与处理前违反平行趋势的程度差异有限。在这些限制下,构建不依赖于平行趋势的治疗效果估计器可以部分识别感兴趣的因果参数,同时使用平行趋势的敏感性检验得出结论。
什么是DID
02
由于通过事前平行趋势检验并不意味着平行趋势假设一定成立,因此预处理趋势检验不能作为满足平行趋势假设的经验证据。现有的平行趋势检验方法也存在一些问题。因此,有学者陆续提出引入非平行的治疗前趋势来检验治疗效果估计器对于治疗前趋势不满足平行趋势假设的敏感性。和(2018)、(2018)和Roth(2023)提出了替代平行趋势测试方法。
等人(2018)指出,首先获得具有复杂趋势的DID估计量。如果认为存在平行趋势,则估计两个具有不同斜率的线性趋势模型并与更简化的模型进行比较,然后测试这两个模型。治疗效果是否有差异(或在一定范围内)。
等(2018)认为,在识别治疗效果时,可以将不变性假设弱化为有界变异假设,可以采用直观灵活的方法来提高实证研究的可信度,并可以评估推断不同识别限制的敏感性。
基于and (2018),Roth (2023)提出了一种新方法。如果不满足平行趋势假设,则对治疗效果点估计量的置信区间进行敏感性分析。在一定的相对偏差程度下,如果置信区间没有超过临界值,则说明平行趋势假设相对稳健。该方法是检验违反平行趋势假设对点估计量和置信区间的影响,主要利用相对偏差极限和平滑极限,利用平行趋势敏感性检验为处理效果的可信度提供更多的经验证据。
核心思想是对处理后的点估计器的置信区间进行稳健的推理和敏感性分析。主要包括两部分:一是构造平行趋势的最大偏离度(Mbar);另一种是构造与偏差程度对应的后处理点估计器的置信区间。如果在最大偏差程度时,处理后点估计量的置信区间不包含0值,则表明处理效果对于偏离平行趋势的程度相对稳健(徐文利和孙磊, 2023)。
具体来说,首先假设待估计的DID参数β一致,对β进行分解:
其中 τ 是感兴趣的因果参数,在处理之前假设为 0。 δ是趋势差异引起的偏差。与标准 DID 模型一样,β 是因果估计系数,τ 表示平均治疗效果 (ATT) 向量,δ 是治疗组和对照组之间未经治疗的潜在结果趋势差异。
识别 τpost 中的平行趋势的假设是 δpost = 0,但通常测试原假设 δpre = 0(“预测趋势”检验)以评估该假设的合理性。此时,不需要完全建立平行趋势假设,但在给定的处理前趋势δpre下,处理后δpost可能存在的差异是有限的。这种形式的限制的基础是预处理趋势提供了有关后处理趋势的反事实差异的信息。本文假设δ∈Δ,Δ是一个指定集合,因果参数τpost在此限制下被部分识别。这种形式的限制适用于可能违反平行趋势假设的情况。
例如,and(2018)指出,研究人员可能愿意假设治疗后导致违反平行趋势的混杂因素的程度与治疗前的混杂因素的程度相似。事实上,通过指定一个Δ,以参数Mbar为边界,将处理后平行趋势的最大违反量乘以处理前平行趋势的最大违反量。平行趋势随时间平滑变化,并且可以通过限制违反平行趋势的斜率随时间变化的程度来表示。
03
如何使用DID
(一)两种形式的限制
在DID估计中,主要涉及两种测试方法:一是相对偏差极限;二是相对偏差极限。另一个是平滑极限。其中,相对偏差限制的核心思想是处理后平行趋势的违反程度不得超过处理前平行趋势的违反程度。平滑极限的核心思想是,后处理违反平行趋势的程度不会偏离前处理线性外推趋势太多。在具体的检验过程中,主要包括两部分:一是根据相关研究背景,选择可能偏离平行趋势假设的程度Δ;二是根据相关研究背景,选取可能偏离平行趋势假设的程度Δ;其次,构造与偏差程度相对应的置信区间。通过在违反平行趋势假设时构建稳健的置信区间,并测试不同违反水平下治疗效果的敏感性。
① 相对偏差度限制。假设处理后引起非平行趋势的混杂因素与处理前差异较小,则该限制可表示为 δεΔRM(Mbar),Mbar ≥ 0。
ΔRM(Mbar) 是将治疗后连续时段的平行趋势最大违反程度限制为 Mbar 乘以治疗前平行趋势最大违反程度的边界。 RM代表“相对程度”。如果平行趋势的违反可能是由与前一时期的混杂经济冲击规模相似的冲击驱动的,则可以选择ΔRM(Mbar)。
②平滑极限。当长期趋势随时间平滑变化时,需要控制线性特定时间趋势。然而,并不完全满足线性规格。通过限制其线性斜率在连续周期内可能变化的程度,其微分趋势可以随时间平滑变化。该限制表示为 δεΔSD(M), M ≥ 0。
参数M≥0决定了连续周期之间δ的斜率变化有多大,限制了二阶导数的离散模拟。 SD 代表“二阶导数”。在M = 0的情况下,SD(0)要求趋势的差异完全是线性的。
(2) Δ的选取
需要根据经济知识选择适当的Δ,以考虑可能产生非平行趋势的混杂因素。在本文的主要案例中,ΔRM(Mbar) 和 ΔSD(M) 是主要选择。
在某些实证情况下,人们可能会关注治疗组和对照组受到的不同经济冲击,这些冲击会导致违反平行趋势。如果认为治疗后期这些差异影响的大小与治疗前相差不大,则可以合理地假设δεΔRM(Mbar),并根据早期观察到的违规情况治疗后,明确定义了治疗后违反平行趋势的相对程度。
在其他情况下,如果由于平滑变化的长期趋势的差异对治疗组和对照组有不同的影响而违反了平行趋势,则可以假设δεΔSD(M)。对于趋势差异的斜率在连续时期内可以变化的程度有明确的限制。
(3) 推理程序的选择
基于相关理论分析和蒙特卡罗模拟,建议构建一般形式和多维形式的 Δ 的 ARP 混合置信区间。对于ΔSD(M)或其他类型Δ的特殊情况,建议使用FLCI(以保证FLCI的一致性和有限样本中的接近最优)。相关推理程序可以在论文附录中的R和Stata包中实现。
(4)敏感性分析
如果选择了可能违反平行趋势的极限类别(如相对偏差极限ΔRM(Mbar)或平滑极限ΔSD(M)),则需要进一步对相关参数进行敏感性分析(对应Mbar≥ 0或M≥0)。这些参数确定治疗后平行趋势的违反程度与治疗前的不同程度。因果结论的敏感性主要取决于该参数的选择和“分解”参数值。
DID应用示例
04
为了更好地理解和应用DID,作者选取了两个例子,将DID抽象的理论思想具体化。
(1) 预估增值税减税幅度
和(2019)研究了法国餐厅增值税(VAT)削减的发生率。 2009年7月,法国将堂食餐厅的税率从19.6%降至5.5%。本文采用动态DID设计来分析增值税变化的影响,将餐馆与其他不受增值税变化影响的市场服务公司作为对照组进行比较,并估计一个OLS回归模型:
其中,Y为i公司t年利润(税前)的对数,D表示i是否为餐厅。主要发现是增值税削减可以显着增加餐馆利润。图 4 显示了事件研究方法的估计系数变化。 2006 年和 2007 年的趋势似乎不同,因此拒绝了平行趋势的假设(βpre = 0,p
可见,即使增值税没有变化,也可能会出现未观察到的行业或宏观经济冲击,这对餐馆和其他市场服务企业产生不同的影响。治理后对餐饮业的影响不会比治理前更大。太多了。然而,始终假设特定行业的冲击遵循平稳趋势似乎不合理,有必要分析相对偏差极限ΔRM(Mbar)。
图5左图显示了2009年不同Mbar值下ΔRM(Mbar)治疗效果的稳健置信区间。若Mbar=1,则表示处理后平行趋势的违反程度被限制为不超过处理前平行趋势的最大违反程度,2009年餐厅利润效应的稳健置信区间为得到[0.07,0.31],大于原始OLS估计的置信区间。宽,当平行趋势假设完全成立时有效,但仍拒绝零效应假设。可以看出,零值效应的“分解值”大约为Mbar=2。因此,增值税变化显着影响餐厅利润,而这个结论取决于你是否愿意在之后限制平行趋势的违规程度。治疗量不超过治疗前最大值的2倍。考虑到法国在治疗后的第一年(2009年)就面临经济大衰退,2009年影响餐馆利润变化的因素可能比治疗前更大。
右图估计了四个治疗后时期对餐厅利润的平均因果影响,显示了类似的结果。当 Mbar = 1 时,稳健置信区间包含零,效果大约是第一个周期的两倍。可以看出,τbar的置信区间比τ2009的要大,因为ΔRM(Mbar)将连续时段内平行趋势的违反程度限制为Mbar乘以处理前一时段的最大值。因为治疗组和对照组之间有更多的时间间隔(例如,第二时段的识别间隔是第一时段的两倍)。如果愿意在治疗的早期阶段限制最大经济冲击的幅度,则后期阶段的估计参数通常会获得更宽的置信区间。
(二)谈判义务法对学生学业成绩的长期影响
和 Willén(2019)研究了州级讨价还价义务(DTB)法律的影响,该法律要求学区与教师工会进行谈判。本文探讨了该法律制度在法律通过前后对学生成人劳动力市场结果的影响。利用美国社区调查 (ACS) 数据,构建了 OLS 模型来分别估计其对男性和女性的影响。
其中 Ysct 指 t 年出生于 s 州的学生队列 c 中的平均成绩。 Dscr 指的是,在 c 群体年满 18 岁之前的 r 年内,s 州是否通过了 DTB 法律。
图6是事件研究法中βr的估计系数。在男性样本中,治疗前的系数相对接近于零,而治疗后的系数长期为负。相比之下,女性样本显示出向下倾斜的预处理趋势。
该论文的识别策略侧重于与治疗效果不同的长期趋势,例如劳动力供给或教育程度的混杂变化。考虑到长期趋势可能会随着时间的推移平滑变化,此时选择ΔSD形式的平滑极限是合适的。事实上,在稳健性检验中,估计模型具有大致对应于ΔSD(0)的特定组线性趋势。因此,考虑 ΔSD(M) 形式的约束,它允许连续周期内的非线性偏差不超过 M。
图 7 通过 15 年后的就业待遇效应报告了 DTB 方法的结果,构建了关于趋势差异非线性变化的稳健置信区间。蓝线代表 β15 的原始 OLS 估计置信区间。红线表示不同M值下Δ=ΔSD(M)对应的推理程序FLCI。 M = 0对应于仅允许平行趋势的线性违规,较大的M值允许较大的线性偏差。
在左侧的男性样本中,当允许平行趋势的近似线性 (M≈0) 违反时,FLCI 与 OLS 类似。随着非线性变化的增加,FLCI 变得更宽,在 M≈0.01 时效果显着。对于右侧的女性样本,原始 OLS 估计值为负,置信区间不包含值 0。当考虑平行趋势的线性违规 (M = 0) 时,原始预处理下降趋势发生大幅变化。当 M < 0.01 时,稳健置信区间仅包含正值。因此,如果对男性和女性施加相同的平滑限制,则要么会针对性别调整相反符号的显着效应(如果 M < 0.01),要么不会排除两性的零效应(如果 M ≥ 0.01) )。
05
总结
当不满足平行趋势假设时,本文提出了一种新方法,仍然可以提供稳健的推理和敏感性分析。首先,定量限制处理后平行趋势违反程度,限制为处理前平行趋势违反程度的M倍。通过敏感性分析得到平均治疗效果的置信区间,评价不同M值范围内治疗效果的稳健性。当允许治疗后违反平行趋势的程度是治疗前的M倍时,DID估计的治疗效果是否仍然显着。该方法的实用性在于,即使可能不满足平行趋势假设,仍然可以对DID治疗效果做出合理的估计和推断。
其次,它限制了正式测试方法的选择。如果认为治疗后混杂因素对治疗组和对照组的影响与治疗前的影响差异较小,则选择相对偏差限度来构建稳健的置信区间。如果认为违反平行趋势的原因主要来自于治疗组和对照组的长期变化趋势的差异,则选择平滑极限来构建稳健的置信区间。事实上,具体分析时,可能违反平行趋势假设的原因需要放在相关经济社会制度的背景下讨论。
事实上,仅仅预先通过平行趋势测试是不够的,因为平行趋势本身是不可测试的。那么,如果平行趋势假设不成立或者放宽平行趋势假设,此时仍然可以获得显着的处理效果,结论也会更加可信。这就是本文放宽平行趋势假设敏感性检验的思路。无论采用何种检验方法,基于研究背景的经济知识都应该为可能违反平行趋势的讨论和分析提供更多信息,从而得出更可信的结论。
该方法的过程可以在R(命令:)和Stata(命令:)软件中应用。 R语言参考链接:。
对于Roth(2023)的平行趋势假说的敏感性检验,徐文利和孙雷(2023)的附录提供了相关的DO程序,参考如下。
**附录图1政策实施年份平行趋势敏感度测试图**
//处理当前周期的系数
列表 e(b)
, 前(1/9) 后(10/16) mvec(0(0.002)0.02) alpha(0.1)
local(平行趋势失效的相对程度Mbar)(90%稳健置信区间)标题(相对偏差极限)((白)(白)(白)(白))()
, ``
局部(平行趋势失效的相对程度Mbar)(90%稳健置信区间)标题(平滑极限)((白色)(白色)(白色)(白色))()
, 前(1/9) 后(10/16) mvec(0(0.002)0.02) delta(sd) alpha(0.1) `'
**附录图 2-4 和 Roth (2023) 平行趋势假设的敏感性检验**
//处理后的第4期d4
l_vec=0\0\0\0\1\0\0
,l_vec(l_vec) 前(1/9) 后(10/16) mvec(0(0.002)0.02) alpha(0.1)
local(平行趋势失效的相对程度Mbar)(90%稳健置信区间)标题(相对偏差极限)((白)(白)(白)(白))()
, ``
局部(平行趋势失效的相对程度Mbar)(90%稳健置信区间)标题(平滑极限)((白色)(白色)(白色)(白色))()
l_vec=0\0\0\0\1\0\0
,l_vec(l_vec) 前(1/9) 后(10/16) mvec(0(0.002)0.02) delta(sd) `'
相关文献:
Y、D.谁受益于减税?远离大额增值税[J]. : , 2019, 11(1): 38-63.
A,L A.看这里吗?非对等模型[J]. arXiv arXiv:1805.03273,2018。
D,Mühlrad H.法律与妇女[J]。 , 2021, 76: .
MF,Willén A. 的长期[J]。 : , 2019, 11(3): 292-324.
CF、J V。携带权法如何降低犯罪率?与使用-[J]. , 2018, 100(2): 232-244.
Roth J、Sant'Anna PHC、A 等人。里面有什么?一之[J]. , 2023, 235(2): 2218-2244。
黄伟、章子尧、刘安然。从双重差分法到事件研究法[J].工业经济评论,2022(2):17-36。
徐文丽、孙磊.基于市场激励的环境规制与能源消费结构转型——来自中国碳排放权交易试点的经验证据[J].数量经济学与技术经济研究,2023(7):133-155。
本文为可能的情况下的内部和事件研究提供了工具。就这一点而言,我们研究后-of如何从前-in(“前-”)中衍生出来。 of 就在这些下面。我们两个认为有效,而我们小说认为他们在我们的权力下。
我们怎样才能一分为二。我们还如何我们可以用什么可以画下就可以了。 |
|