3种DID命令操作手册(附Stata17官方新命令)

来源:互联网 时间:2025-11-07 22:20:31 浏览量:1

1 、简介

现代计量经济学和统计学的发展为我们的研究提供了可行的工具。倍差法来源于计量经济学的综列数据模型,是政策分析和工程评估中广为使用的一种计量经济方法。主要是应用于在混合截面数据集中,评价某一事件或政策的影响程度。该方法的基本思路是将调查样本分为两组,一组是政策或工程作用对象即“作用组”,一组是非政策或工程作用对象即“对照组”。根据作用组和对照组在政策或工程实施前后的相关信息,可以计算作用组在政策或工程实施前后某个指标(如收入)的变化量(收入增长量),同时计算对照组在政策或工程实施前后同一指标的变化量。然后计算上述两个变化量的差值(即所谓的“倍差值”)。这就是所谓的双重差分估计量(Difference in Differences,简记DD或DID),因为它是处理组差分与控制组差分之差。该法最早由Ashenfelter(1978)引入经济学,而国内最早的应用或为周黎安、陈烨(2005)。

常用的倍差法主要包括双重倍差法和三重倍差法。双重差分法(Difference-in-difference,DID)有几种其他的称谓:倍差法、差分再差分等。该方法的原理非常简单,它要求数据期至少有两期,所有的样本被分为两类:实验组和控制组,其中实验组在第一期是没有受到政策影响,此后政策开始实施,第二期就是政策实施后的结果,控制组由于一直没有受政策干预,因此其第一期和第二期都是没有政策干预的结果。双重差分方法的测算也非常简单,两次差分的效应就是政策效应。

双重差分法的假定,为了使用OLS一致地估计方程,需要作以下两个假定。

假定1:此模型设定正确。特别地,无论处理组还是控制组,其时间趋势项都是。此假定即“平行趋势假定”(parallel trend assumption)。DID最为重要和关键的前提条件:共同趋势(Common Trends)

双重差分法并不要求实验组和控制组是完全一致的,两组之间可以存在一定的差异,但是双重差分方法要求这种差异不随着时间产生变化,也就是说,处理组和对照组在政策实施之前必须具有相同的发展趋势。

假定2:暂时性冲击与政策虚拟变量不相关。这是保证双向固定效应为一致估计量(consist estimator)的重要条件。在此,可以允许个体固定效应与政策虚拟变量相关(可通过双重差分或组内变换消去,或通过LSDV法控制)。

DID允许根据个体特征进行选择,只要此特征不随时间而变;这是DID的最大优点,即可以部分地缓解因 “选择偏差”(selection bias)而导致的内生性(endogeneity)。

2、DID命令reg与diff

首先diff命令为外部命令,需要下载和安装

下载安装命令方法为:

ssc install diff, replace 下载安装方法(外部命令)

语法格式为:

diff outcome_var [ if] [ in] [weight] ,[ options]

模型必选项介绍:

其中

  • “outcome_var”表示结果变量

  • “treat(varname) ”为必选项,用来指定处理变量

  • “period(varame)”用来指定实验期虚拟变量(1=实验期,0=非实验期)

可选项介绍:

  • cov(varlist),协变量,加上kernel可以估计倾向得分

  • kernel, 执行双重差分倾向得分匹配

  • id(varname),kernel选项要求使用

  • bw(#) ,核函数的带宽,默认是0.06

  • ktype(kernel),核函数的类型

  • qdid(quantile),执行分位数双重差分

  • pscore(varname) 提供倾向得分

  • logit,进行倾向得分计算,默认probit回归

  • ddd(varname),三重差分

  • SE/Robust

  • cluster(varname) 计算聚类标准误。

  • robust 稳健标准误

3、案例应用

案例数据介绍:cardkrueger1994

背景介绍:在这种情况下,作者研究提高最低工资的影响在新泽西州——治疗组在快餐行业的就业水平。他们将接受治疗的这一组餐厅员工数量的变化与相邻州宾夕法尼亚州(对照组)的员工数量的变化进行了比较。他们在1992年2月收集了基线,并在11月收集了后续数据。

1992年4月,新泽西州通过最低工资法案,将最低工资从4.25美元提高到5.05美元,而相邻的宾夕法尼亚州的最低工资却保持不变。因此,Card and Kruger考虑了一个自然实验,即将新泽西州作为实验组,而宾州作为控制组,收集了两州不同快餐店在实施新法前后前后雇佣人数的数据,并采用双重差分法进行估计。

该数据集共包含522家快餐,并涉及两个时期(1992年2月和1992年11月,以t表示,分别赋值为0和1)。treated用以区分实验组和控制组,其中1表示新泽西,0表示宾州。因变量为fte(full time employment),用以刻画快餐店的雇佣人数。数据集还包括其余4个控制变量,均为快餐店的品牌,包括bk(Burger King),kfc(Kentuky Fried Chiken ),roys(Roy Rogers),wendys(Wendy's)。

3.1 DID命令之reg

  • 首先我们先定义t和treated的交互项,并用进行双重差分估计:

use "http://fmwww.bc.edu/repec/bocode/c/CardKrueger1994.dta"
  • 生成实验组和法案实施时期的交互项

gen gd=t*treated // (定义交叉项gd)
  • 手工进行DID估计,并使用稳健标准误

reg fte gd treated t, r

结果为:

gen gd=t*treated

. reg fte gd treated t, r

Linear regression Number of obs = 801

F(3, 797) = 1.43

Prob > F = 0.2330

R-squared = 0.0080

Root MSE = 9.003

------------------------------------------------------------------------------

| Robust

fte | Coefficient std. err. t P>|t| [95% conf. interval]

-------------+----------------------------------------------------------------

gd | 2.913982 1.736818 1.68 0.094 -.4952963 6.323261

treated | -2.883534 1.403338 -2.05 0.040 -5.638209 -.1288592

t | -2.40651 1.594091 -1.51 0.132 -5.535623 .7226031

_cons | 19.94872 1.317281 15.14 0.000 17.36297 22.53447

------------------------------------------------------------------------------

.

上述结果显示,政策效应(did)在10%的显著性水平上显著,且系数为正(2.914),表明最低工资法案政策实施后,快餐店的雇佣人数不会减少,反而会在一定程度上增多。不过,这个结论未考虑其他控制变量的影响。

  • 接着我们引入快餐品牌的虚拟变量作为控制变量,再次回归

reg fte gd treated t bk kfc roys,r

Linear regression Number of obs = 801

F(6, 794) = 57.30

Prob > F = 0.0000

R-squared = 0.1878

Root MSE = 8.1617

------------------------------------------------------------------------------

| Robust

fte | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+----------------------------------------------------------------

gd | 2.93502 1.543422 1.90 0.058 -.0946504 5.96469

treated | -2.323906 1.253701 -1.85 0.064 -4.784867 .1370549

t | -2.402678 1.410265 -1.70 0.089 -5.170966 .3656108

bk | .9168795 .9382545 0.98 0.329 -.9248729 2.758632

kfc | -9.204856 .8991089 -10.24 0.000 -10.96977 -7.439945

roys | -.8970458 1.041071 -0.86 0.389 -2.940623 1.146532

_cons | 21.16069 1.307146 16.19 0.000 18.59482 23.72656

------------------------------------------------------------------------------

3.2 DID命令之diff 3.2.1 使用diff命令进行操作,结果为: *-2、双重差分

diff fte, t(treated) p(t) robust

****结果为:

*-----------------------------------result.begin--------------------------------

diff fte, t(treated) p(t) robust

DIFFERENCE-IN-DIFFERENCES ESTIMATION RESULTS

Number of observations inthe DIFF-IN-DIFF: 801

Before After

Control: 78 77 155

Treated: 326 320 646

404 397

--------------------------------------------------------

Outcome var. | fte | S. Err. | |t| | P>|t|

----------------+---------+---------+---------+---------

Before | | | |

Control | 19.949 | | |

Treated | 17.065 | | |

Diff (T-C) | -2.884 | 1.403 | -2.05 | 0.040**

After | | | |

Control | 17.542 | | |

Treated | 17.573 | | |

Diff (T-C) | 0.030 | 1.023 | 0.03 | 0.976

| | | |

Diff-in-Diff | 2.914 | 1.737 | 1.68 | 0.094*

--------------------------------------------------------

R-square: 0.01

* Means and Standard Errors are estimated by linear regression

**Robust Std. Errors

**Inference: *** p<0.01; ** p<0.05; * p<0.1

*-----------------------------------result.over--------------------------------

3.2.2、DID with covariates带协变量的估计 diff fte, t(treated) p(t) cov(bk kfc roys)

diff fte, t(treated) p(t) cov(bk kfc roys) report

diff fte, t(treated) p(t) cov(bk kfc roys) report bs

结果为:

. diff fte, t(treated) p(t) cov(bk kfc roys)

DIFFERENCE-IN-DIFFERENCES WITH COVARIATES

DIFFERENCE-IN-DIFFERENCES ESTIMATION RESULTS

Number of observations inthe DIFF-IN-DIFF: 801

Before After

Control: 78 77 155

Treated: 326 320 646

404 397

--------------------------------------------------------

Outcome var. | fte | S. Err. | |t| | P>|t|

----------------+---------+---------+---------+---------

Before | | | |

Control | 21.161 | | |

Treated | 18.837 | | |

Diff (T-C) | -2.324 | 1.031 | -2.25 | 0.024**

After | | | |

Control | 18.758 | | |

Treated | 19.369 | | |

Diff (T-C) | 0.611 | 1.037 | 0.59 | 0.556

| | | |

Diff-in-Diff | 2.935 | 1.460 | 2.01 | 0.045**

--------------------------------------------------------

R-square: 0.19

* Means and Standard Errors are estimated by linear regression

**Inference: *** p<0.01; ** p<0.05; * p<0.1

.

3.2.3、Kernel Propensity Score Diff-in-Diff diff fte, t(treated) p(t) cov(bk kfc roys) kernel rcs

diff fte, t(treated) p(t) cov(bk kfc roys) kernel rcs support

diff fte, t(treated) p(t) cov(bk kfc roys) kernel rcs support addcov(wendys)

diff fte, t(treated) p(t) kernel rcs ktype(gaussian) pscore(_ps)

diff fte, t(treated) p(t) cov(bk kfc roys) kernel rcs support addcov(wendys) bs reps(50)

结果为:

. diff fte, t(treated) p(t) cov(bk kfc roys) kernel rcs

KERNEL PROPENSITY SCORE MATCHING DIFFERENCE-IN-DIFFERENCES

Repeated Cross Section - rcs option

Matching iterations: control group at base line...

..............................................................................................

> ............................................................................................

> ............................................................................................

> ................................................

Matching iterations: control group at follow up...

..............................................................................................

> ............................................................................................

> ............................................................................................

> ..........................................

Matching iterations: treated group at baseline...

..............................................................................................

> ............................................................................................

> ............................................................................................

> ................................................

DIFFERENCE-IN-DIFFERENCES ESTIMATION RESULTS

Number of observations inthe DIFF-IN-DIFF: 801

Before After

Control: 78 77 155

Treated: 326 320 646

404 397

--------------------------------------------------------

Outcome var. | fte | S. Err. | |t| | P>|t|

----------------+---------+---------+---------+---------

Before | | | |

Control | 20.040 | | |

Treated | 17.405 | | |

Diff (T-C) | -2.636 | 0.939 | -2.81 | 0.005***

After | | | |

Control | 17.341 | | |

Treated | 17.573 | | |

Diff (T-C) | 0.232 | 0.948 | 0.24 | 0.807

| | | |

Diff-in-Diff | 2.867 | 1.334 | 2.15 | 0.032**

--------------------------------------------------------

R-square: 0.01

* Means and Standard Errors are estimated by linear regression

**Inference: *** p<0.01; ** p<0.05; * p<0.1

3.2.4、 Quantile Diff-in-Diff 分位数双重差分法 diff fte, t(treated) p(t) qdid(0.25)

diff fte, t(treated) p(t) qdid(0.50)

diff fte, t(treated) p(t) qdid(0.75)

diff fte, t(treated) p(t) qdid(0.50) cov(bk kfc roys)

diff fte, t(treated) p(t) qdid(0.50) cov(bk kfc roys) kernel id(id) diff fte, t(treated) p(t) qdid(0.50) cov(bk kfc roys) kernel rcs

结果为

diff fte, t(treated) p(t) qdid(0.25)

DIFFERENCE-IN-DIFFERENCES ESTIMATION RESULTS

Number of observations inthe DIFF-IN-DIFF: 801

Before After

Control: 78 77 155

Treated: 326 320 646

404 397

--------------------------------------------------------

Outcome var. | fte | S. Err. | |t| | P>|t|

----------------+---------+---------+---------+---------

Before | | | |

Control | 12.500 | | |

Treated | 11.000 | | |

Diff (T-C) | -1.500 | 1.584 | -0.95 | 0.344

After | | | |

Control | 11.500 | | |

Treated | 11.500 | | |

Diff (T-C) | -0.000 | 1.658 | 0.00 | 1.000

| | | |

Diff-in-Diff | 1.500 | 2.293 | 0.65 | 0.513

--------------------------------------------------------

R-square: 0.00

* Values are estimated at the .25 quantile

**Inference: *** p<0.01; ** p<0.05; * p<0.1

.

3.2.5、Balancing test of covariates.包含协变量的控制组与实验组之间差异检验 diff fte, t(treated) p(t) cov(bk kfc roys wendys) test

diff fte, t(treated) p(t) cov(bk kfc roys wendys) testid(id) kernel

diff fte, t(treated) p(t) cov(bk kfc roys wendys) testkernel rcs

diff fte, t(treated) p(t) cov(bk kfc roys wendys) test

TWO-SAMPLE T TEST

Number of observations (baseline): 404

Before After

Control: 78 - 78

Treated: 326 - 326

404 -

t-test at period = 0:

----------------------------------------------------------------------------------------------

Variable(s) | Mean Control | Mean Treated | Diff. | |t| | Pr(|T|>|t|)

---------------------+------------------+--------------+------------+---------+---------------

fte | 19.949 | 17.065 | -2.884 | 2.44 | 0.0150**

bk | 0.443 | 0.411 | -0.032 | 0.52 | 0.6035

kfc | 0.152 | 0.205 | 0.054 | 1.08 | 0.2818

roys | 0.215 | 0.248 | 0.033 | 0.61 | 0.5448

wendys | 0.190 | 0.136 | -0.054 | 1.22 | 0.2241

----------------------------------------------------------------------------------------------

*** p<0.01; ** p<0.05; * p<0.1

.

3.2.6. Triple differences (consider bk is a second treatment category). 三重差分法

diff fte, t(treated) p(t) ddd(bk)

diff fte, t(treated) p(t) ddd(bk)

TRIPLE DIFFERENCE (DDD) ESTIMATION RESULTS

Notation of DDD:

Control (A) treated = 0 and bk = 1

Control (B) treated = 0 and bk = 0

Treated (A) treated = 1 and bk = 1

Treated (B) treated = 1 and bk = 0

Number of observations inthe DDD: 801

Before After

Control (A):34 35 69

Control (B):44 42 86

Treated (A):133 132 265

Treated (B):193 188 381

404 397

--------------------------------------------------------

Outcome var. | fte | S. Err. | |t| | P>|t|

----------------+---------+---------+---------+---------

Before | | | |

Control (A) | 25.654 | | |

Control (B) | 15.540 | | |

Treated (A) | 18.547 | | |

Treated (B) | 16.044 | | |

Diff (T-C) | -7.612 | 2.206 | 3.45 | 0.001***

After | | | |

Control (A) | 22.193 | | |

Control (B) | 13.667 | | |

Treated (A) | 19.913 | | |

Treated (B) | 15.930 | | |

Diff (T-C) | -4.543 | 2.214 | 2.05 | 0.040**

| | | |

DDD | 3.069 | 3.125 | 0.98 | 0.326

--------------------------------------------------------

R-square: 0.09

* Means and Standard Errors are estimated by linear regression

**Inference: *** p<0.01; ** p<0.05; * p<0.1

.

4、DID命令之Stata17新命令:DID和DDD模型(附截面DID+面板DID+DDD+平行趋势检验等)

Stata新的didregress和xtdidregress命令符合控制未观察组和时间效应的DID和DDD模型。

didreress可以与重复的横断面数据一起使用,其中我们在不同的时间点对不同的观测单位进行抽样。

xtdidreress用于面板(纵向)数据。这些命令提供了一个统一的框架来获得适用于各种研究设计的推理。

差异中的差异(DID)提供了一种非实验研究方法,通过比较对照组和治疗组中不同结果的差异在时间上的差异,来估计平均治疗对治疗的效果(ATET)。因此,称为DID。这项技术控制了未观察到的时间和组别特征,这些特征混淆了治疗对结果的影响。

差异中的差异(DDD)向DID框架添加了一个控制组,以解释DID可能无法捕捉到的不可观察的组特征和时间特征交互。在新的对照组中,它增加了DID。因此,称为DDD(Difference-in-differences-in-differences,简记DDD)。

下面我们介绍一下Stata官方DID命令didregress和xtdidregress。

4.1、 截面DID

DID with repeated cross-sectional data

4.1.1 语法格式

图片

图片 4.1.2 didregress案例操作

医疗服务提供者想要研究一种新的住院程序对病人满意度的影响,使用在他们的一些医院实施新程序之前和之后的病人月度数据。

卫生服务提供者将使用DID回归分析新入院程序对参与该计划的医院的影响。

结果变量是病人的满意度,变量名称为 (satis),治疗的变量是程序(procedure),我们可以用didregress拟合这个模型。

第一个表格给出了关于对照组和治疗组以及治疗时间的信息。

第一部分告诉我们,28家医院继续使用旧的程序,18家医院改用新程序。

第二部分告诉我们,所有实施新程序的医院都在第4th时间段内这么做了。如果一些医院后来采取了这一政策,第一次治疗的最短时间和最长时间将有所不同。

第二个表给出了估计的 ATET, 0.85 (95% CI [0.78,0.91])。与没有实施新程序的医院相比,接受治疗的医院的患者满意度提高了0.85个百分点。

该模型的假设之一是,在实施新程序之前,控制组和治疗组的满意度轨迹是平行的。可以通过绘制两组随时间变化的结果或通过可视化线性趋势模型的结果来直观地检查这些轨迹。我们可以使用统计趋势图执行这两种诊断检查。

. estat trendplots

结果为

在政策实施之前,控制医院和治疗医院是平行的。我们可以使用带有统计趋势的平行趋势检验来进一步评估这个假设。

. estat ptrends

结果为

我们没有足够的证据来拒绝平行趋势的零假设。这个检验和图形分析支持平行趋势假设。

我们可能想要进行的另一项检验是,看看在预期治疗中,控制组或治疗组是否会改变他们的行为。这是用格兰杰因果检验来评估的。

. estat granger

结果为

我们没有足够的证据来拒绝治疗前没有行为改变的零假设。连同我们之前的诊断,这些结果表明我们应该相信我们的ATET估计的有效性。

在这个例子中,我们有足够数量的医院(46家)来对我们的治疗效果做出可靠的推断。然而,如果我们只有15家医院的数据,我们可能会考虑其他方法。

为了使用Bell and McCaffrey(2002)自由度调整的偏差校正标准误差,我们可以添加vce(hc2)选项。

. didregress (satis) (procedure), group(hospital) time(month) vce(hc2)

结果为

要使用Donald和Lang(2007)提出的聚合方法,我们可以添加aggregate(dlang) 选项。

结果为

如果我们想允许一些系数在不同的组之间变化,我们可以添加vary的选项。

结果为

我们还可以使用野蛮自举抽样法来获得p值和置信区间。与所有自举抽样的方法一样,我们需要设置种子数字以使结果可复制。

结果为

4.2、DDD model

关于DDD model的案例背景与前面系列基础知识请往下阅读或者阅读昨日推文 重磅!Stata 17的新模块(一):DID官方命令 didregress与xtdidregress

医疗服务提供者想要研究一种新的住院程序对病人满意度的影响,使用在他们的一些医院实施新程序之前和之后的病人月度数据。

卫生服务提供者将使用DID回归分析新入院程序对参与该计划的医院的影响。

结果变量是病人的满意度,变量名称为 (satis),治疗的变量是程序(procedure),我们可以用didregress拟合这个模型。

使用didregress估计双重差分的操作请阅读 重磅!Stata 17的新模块(一):DID官方命令 didregress与xtdidregress

下面我们接着介绍。

如果 重磅!Stata 17的新模块(一):DID官方命令 didregress与xtdidregress 中介绍的操作结果是其他未观察到的变量的结果,而不是新的住院程序的结果,那么它们可能会受到质疑。卫生服务提供者管理者认为,对调查的答复与个人到医院就诊的频率有关。患者可能有未观察到的特征,这影响了他们访问医院的频率和他们对入院程序的感觉。换句话说,可能有一些未观察到的特征混淆了新的住院程序的影响。管理员决定 使用DDD模型获取ATET。他们想要估计以高频率或非常高频率就诊的患者的平均治疗效果。

为此,我们将首先创建一个新变量hightrt作为新的处理变量。如果一个人去医院就诊的频率很高或非常高(frequency = 3 or 4,即频率为3或4),或者如果医院在4月份实施了新的入院程序,观察结果将被标记为接受处理(hightrt = 1)。

生成命令为:

图片

DDD模型将纳入医院和使用频率效应,以及它们与时间效应的相互作用。为了拟合该模型,我们加入了一个新的组变量,频率(frequency:):

操作结果为:

上面的第一个表有关于第二组变量,频率的信息,其中低和中频率是控制,高和非常高的频率是处理。

第二个表显示,ATET现在变小了,但策略仍然提高了满意度。

下面我们来学习面板DID

4.3、面板DID

面板DID

DID for panel-data model

案例1

Moser和Voena(2012)研究了强制许可对国内发明的影响。

强制许可允许发展中国家的公司在没有外国专利所有者同意的情况下生产外国发明。获得外国技术可能会阻碍国内发明,但它也可以提高本地生产。

Moser and Voena考虑了发生在第一次世界大战期间的叫做对敌贸易法(TWEA)的立法。到1919年,德国拥有的专利系统地授权给了美国公司。

在Moser和Voena(2012)中,根据美国专利和商标局(USPTO)的报告,所处理的观察结果与1918年后被授予至少一项TWEA专利的化学工业亚类相对应。根据USPTO的定义,一个子类是行业中使用类似技术的一组公司。

利益的结果是授予美国发明家的专利数量在这个子类,uspatents。这是衡量国内创新的标准。Moser和Voena还包括来自外国发明者的非twa专利的数量。fpatents衡量的是非美国发明家的创新。从1875年到1939年,我们在每个时间点观察到相同的子类。因此,我们有一个面板数据集。

首先导入生成数据

为了估计这个模型,我们首先xtset我们的数据,命令为

图片

下面,我们对一个子类中授予美国发明人的专利数量采用DID模型,并控制授予外国发明人的非twea专利数量。如果子类在1918年后获得了TWEA专利,则获得专利的处理指标为1,否则为0。该模型包括年份固定效应和子类固定效应。

图片

结果为:

图片

图片

ATET为0.15,这意味着在获得一项或多项专利的子类别中,与未授予这些子类别专利的情况相比,在TWEA之后,国内发明者平均产生了0.15个额外的专利。

案例2

关于DDD model的案例背景与前面系列基础知识请往下阅读或者阅读昨日推文 重磅!Stata 17的新模块(一):DID官方命令 didregress与xtdidregress

医疗服务提供者想要研究一种新的住院程序对病人满意度的影响,使用在他们的一些医院实施新程序之前和之后的病人月度数据。

卫生服务提供者将使用DID回归分析新入院程序对参与该计划的医院的影响。

结果变量是病人的满意度,变量名称为 (satis),治疗的变量是程序(procedure),我们可以用didregress拟合这个模型。

使用didregress估计双重差分的操作请阅读 重磅!Stata 17的新模块(一):DID官方命令 didregress与xtdidregress

关于DDD模型请阅读 重磅!Stata 17的新模块(二):DDD操作分析

接下来我们进行面板DID操作分析。

cdC:\Users\admin\Desktopuse 计量经济学服务中心hospdid.dta,clear

然后进行面板设定

*面板数据设定xtset hospital

面板DID操作

结果为:

4.4、Stata17:截面DID+面板DID平行趋势检验汇总

如截面DID平行趋势检验所示,在进行DID研究时,通常使用图形诊断和检验来补充回归分析,以提供证据,说明估计效果是否可以给出因果解释。正如在DID介绍中所讨论的,我们希望观察到治疗组和对照组在治疗前的平均结果彼此相似。这通常被称为平行趋势或共同趋势假设。

我们还想确定,无论是对照组还是治疗组,都没有因预期治疗而改变他们的行为。这是通过格兰杰检验来评估的。

下面,我们使用模拟数据来说明didregress和didregress后可用的诊断和测试。模拟数据帮助我们确切地知道我们应该期望什么以及如何解释它。

假设我们有一个有10个时间点的面板数据集,用t1表示,其中治疗发生在t1 = 5和t1 = 6之间。我们有一组协变量,x1 x2,和一个结果y1。结果可以是病人满意度,如例子1,或者美国发明家申请的专利数量,如例子3。

导入数据

进行DID分析

这个结果有效吗?我们首先可以绘图来探讨平行趋势的假设,比较对照组和治疗组在治疗日期前的结果变量的轨迹。我们可以通过绘制两组结果随时间变化的平均值,或者通过可视化线性趋势模型的结果来验证这个假设。我们可以使用统计趋势图来执行这两种诊断检查。

观察图表(图2左侧),对照组和治疗组在治疗前的结果轨迹略有不同。虽然我们可以观察到两组的下降趋势,但看起来对照组的下降速度更快,

尤其是在三点到五点之间。通过查看图2右侧的线性趋势模型的结果,我们可以更清楚地了解这一点。组水平的轨迹显示了一个共同的参考点,t1 = 1,这使得很容易辨别他们是否平行。在这种情况下,我们可以看到它们不是。治疗组和对照组之间的差异随着时间的推移越来越大,直到t1 = 5(在评估平行趋势假设时,治疗后的时间周期并不相关)。仅从图2判断,我们应该关注平行趋势假设是否适用于我们的效果估计。

评估预处理轨迹是否平行的一种更正式的方法是对线性趋势模型系数进行测试,以捕获处理后和对照组之间趋势的差异。如果预处理趋势在两组中实际上都是线性的,那么这个系数将为0,因为两组之间的斜率没有差异。因此,通过对0检验这个系数,我们可以检验前处理阶段轨迹是平行的零假设。我们可以使用estat ptrends来执行这个测试:

我们拒绝线性趋势平行的零假设。

我们也可以把不平行看作是预期治疗效果的指示。我们看到这些趋势在治疗开始前并不平行,这甚至可以在治疗实施前就表明治疗效果。

因此,另一种陈述我们平行趋势假设的方法是,在预期的治疗中不应该有治疗效果。为了验证这一假设,我们可以拟合格兰杰型因果模型,在该模型中,我们使用虚拟变量来表明治疗前每一段时间的未来治疗状态。这些虚拟变量的系数对0的联合检验可以用来检验没有发生预期效果的零假设。我们可以使用estat granger执行这个测试:

注意,平行趋势F检验只消耗1个分子自由度,而格兰杰因果关系F检验消耗4个分子自由度。这是因为我们有5个预处理时间段,因此有4个系数需要测试。在本例中,两种测试都是合适的,但是并行趋势测试具有更高的统计能力。然而,正如我们将在下文中看到的那样,格兰杰检验更为灵活,可用于预处理期间治疗组和对照组之间的差异是非线性的情况。

Copyright © 转乾企业管理-加盟网 版权所有 | 黔ICP备2023009682号-14

免责声明:本站内容仅用于学习参考,信息和图片素材来源于互联网,如内容侵权与违规,请联系我们进行删除,我们将在三个工作日内处理。联系邮箱:303555158#QQ.COM (把#换成@)