论文部分内容阅读
本文的主要研究内容是政策评估、处理效应和半参数模型。本文共分五章。第一章简要介绍了我们的工作。在第二章,我们对Hsiao etal.(2012)提出的方法进行了修改,然后比较了它与合成控制法、机器学习法(LASSO和elastic net)在预测上的表现。在第三章中,我们证明了城市更名对经济的影响是微不足道的。因此,决策者无法通过城市更名来赢得“晋升锦标赛”。在金融研究中,人们经常对估计特定的金融或经济事件对受影响公司的价值的影响感兴趣。在小样本下,传统市场模型的检验统计量不再有效。在第4章中,我们提出了新的推断方法,该方法不依赖于样本容量的大小或其他的参数约束。另外,在最后一章我们提供了一个新的方法来识别和估计带有随机系数虚拟内生回归元的异方差删失模型,并给出了它的一个应用。在评价一项政策时,社会科学家或者经济学家面临的最大挑战就是对缺少政策介入时的反事实进行估计。当只有一个个体受到政策的影响时,我们通常可以用介入时间序列分析、合成控制法、面板数据法和机器学习法来估计反事实。由于3.2节中所提到的介入时间序列分析方法的缺陷,在第二章中我们主要比较了其它三种方法。Hsiao et al.(2012)提出的模型选择策略有两个缺陷。第一,控制单位的数量必须小于政策介入前的时期维度(N<T0);第二,控制单位的数量不能太大,否则此策略在计算上是不可行的。为了解决第一个缺点,Gardeazabal and Vega-Bayo(2016)建议修改此方法(在这里称之为V-AICC方法)使得Hsiao et al.(2012)提出的控制组选择步骤中的第一步进行到M(T0-g)为止,即使得从N-1个控制单位中最多只选出T0-g个个体。但是Gardeazabal and Vega-Bayo(2016)提出的修改只适用于小的N和T0。例如,当N=71和T0=25时,如果我们允许至少10个自由度(即g=10),GV-AICC方法需要使用AICC标准大约9.75 × 1014次来选择控制单位,这在计算上是不可行的。此外,为了克服第一个缺点,Li and Bell(2017)提出把所有的控制单位分割成m组,使得(m-1)T0≤N<mT0,然后再使用AICC标准在每个组中再选择最优的控制单位。由于同样的原因,Li and Bell(2017)所提出的修改也只适用于小的T0。在第二章,我们提出的修改的方法把N-1个控制单位分成n组,每组包含k个控制单位(在这里称为k-AICC方法),k是一个小于T0-1的恰当选择的正整数。这个修改不仅使得面板数据方法适用于各种情形而不必考虑控制单位的个数或者政策介入前的时期维度,而且使得我们可以从一系列结果中选出一个最好的结果。因为 Gardeazabal and Vega-Bayo(2016)中修改的表现比较差,所以 Gardeazabal and Vega-Bayo(2016)中面板数据法和合成控制法的比较是不能令人信服的。使用我们的修改,在这里重新比较了合成控制法、面板数据法和机器学习法的表现。在因子模型下,我们发现合成控制法和面板数据法的表现相当。因此在实证研究中,我们应该根据实际情形在合成控制法和面板数据法中选择合适的方法,而机器学习法则通常用来检验实证结果的稳健性。在中国,很多城市想通过更名来促进经济发展。为了探索城市更名对经济增长的影响,我们使用襄樊更名为襄阳这个案例比较了合成控制法、面板数据法和机器学习法在实证上的表现。基于模型的预测精确性和可解释性这两个标准,对GDP增长率数据来说,面板数据法是一个更好的选择。面板数据法证明了襄阳的GDP增长率在更名后平均每年提高了1.43%。基于Li and Bell(2017)推导的渐近分布,此结果在1%的显著性水平上显著。然而,进一步的讨论表明第三产业的增长率每年下降了 1.59%,这和更名的品牌效应机制相矛盾。如果多个政策同时发生,前面提到的方法都不能识别不同政策的不同效应。在这里我们想知道城市更名的效应是否的确显著,但是传统的大样本推断技术不再有效。根据Abadie et al.(2010)中的安慰剂研究方法,我们构建了平均处理效应的一个分布来决定城市更名效应是否显著。第3章实施的统计推断表明即使一个城市没有实施更名,获得和襄阳一样大的效应的概率是25.9%。因此,城市更名的效应是不显著的,是其它的政策而不是城市更名促进了襄阳的经济发展。换句话说,政策制定者不能通过给城市更名来赢得“晋升竞标赛”。在过去,市场模型是用来测量经济事件影响的标准方法。然而,那些把机器学习思想运用到面板数据环境的方法(例如合成控制法和面板数据法)和机器学习方法(LASSO和elastic net)都可以用来评价公司政策变化的金融影响。这些方法对小样本情形尤其适用。因为受影响的公司通常基于一定的标准被分类,所以小样本情形在金融学和会计学文献中经常出现。使用小样本,传统的市场模型所使用的检验统计量不再有效。在第4章,通过研究中国A股市场上的股票更名效应,我们比较了市场模型、合成控制法、面板数据法和机器学习法的预测精度。另外在这一章我们还提出了一个不依赖于样本容量和参数假设的新的统计推断方法。我们使用股票更名作为例子解释了这个新统计推断方法在事件研究上的应用。因为政策介入(例如工会,教育,培训,法律等等)的处理效应对不同的个体来说是不同的,所以随机系数模型在政策评价中通常被使用。此外,删失也经常在经济学应用中出现。例如,很多观测到的经济变量(比如说工作时间、支出和家庭总资产等)由于归并处理或者非负约束从而是删失的。删失和不同的个体受到的政策影响不同是应用微观计量经济学中通常出现的现象。我们可以用带有随机系数虚拟变量的删失回归模型来处理这类问题。在参数分布假设下,带有随机系数虚拟变量的删失回归模型可以转化为带有内生变量的删失模型。Blundell and Powell(2007)和 Chernozhukov et al.(2014)使用控制函数方法来处理同时出现的删失和内生性。然而,他们的方法都需要假设内生变量是连续分布的。虽然Hong and Tamer(2003)和Khan and Tamer(2009)提出的方法都能够处理带有虚拟内生变量的删失模型,但是除了实践中计算麻烦之外,当虚拟内生变量有随机系数的时候,他们的识别假设不再有效。Abrevaya et al.(2010)提出的框架适用于任何带有内生回归元的非线性模型,但是这个框架只能够估计处理效应的方向而不能估计处理效应的大小。在最后一章,我们新提出了一个结构模型方法来处理带有随机系数虚拟内生变量的删失回归模型。在一般的识别条件下,我们提出的多步估计量一致地估计了模型中的参数,并且证明了估计量是渐进正态的。蒙特卡洛模拟表明在各种删失水平下这个估计量都具有良好的有限样本性质。因为我们提出的估计量有一个闭形式的表达,所以不管样本容量多大,它都很容易计算。这一章提出的方法能够很容易推广到带有多个随机系数虚拟内生回归元的异方差删失回归模型。最后我们使用这个模型估计了生育对母亲劳动供给的影响。