论文部分内容阅读
众所周知,收支数据在反映居民生活方面发挥着重要作用。政府以及学者通过对居民的收支数据进行分析得出相应的结论,来为国家相关政策的制定提供科学依据。想要得到准确的分析结果,就需要完整准确的居民收支数据做支撑。在获取居民收支数据时,往往会出现无回答的情况,使得数据不完整,影响进一步的分析。当数据缺失情况出现时,经常采取的方法就是删掉缺失部分的数据,仅对完整的数据进行分析,通过这样的方式,虽然可以继续进行下一步的分析,但是删掉有缺失的数据,仅仅对有完整观测的数据进行分析,这样用来分析的数据对总体的代表性变差,相应的分析结果也会不可靠。因此,有必要对有缺失的数据进行一定的调整,在一定程度上减小由于无回答造成的偏差,加权调整法就是处理缺失数据的一类方法。对缺失数据进行调整的众多方法中,加权调整法主要是解决单位无回答的一类方法。目前传统的加权调整方法有Politz-Simmons调整法、加权组调整法、事后分层调整法以及再抽样加权调整法等。本文在传统的加权调整方法基础上,对双稳健逆概率加权法的理论以及在居民收支数据中的应用进行了讨论。在对相关的文献资料进行梳理总结的基础上,首先对数据缺失机制进行了假定,并且说明了权数的概念;其次,对双稳健逆概率加权法的基本理论进行了阐述,并且介绍了传统的四种加权调整方法:Politz-Simmons调整法、加权组调整法、事后分层调整法以及再抽样加权调整法;再次,对双稳健逆概率加权法与传统的加权组调整法、事后分层调整法和再抽样调整法四种方法的理论进行了比较,并且从方法的假设条件、利用信息情况、适用场合、误差减小情况以及优点这五个方面进行比较,在对这四种加权调整方法深入分析的基础上,还通过模拟运算的方式对四种方法的调整效果进行了分析总结,分析得出,在缺失率逐渐升高的情况下,相比于其他方法,双稳健逆概率加权法有更好的调整效果;最后,结合居民收支数据(数据来自中国收入分配研究院2013年的CHIP数据库),对双稳健逆概率加权法进行了应用,并且对调整效果进行了分析总结。分析得出,由于居民的收入和支出变量本身具有良好的相关性,并且存在显著的回归模型,正好符合双稳健逆概率加权法的应用前提,因此,对居民收支数据应用双稳健逆概率加权法进行调整,能够很好的降低由于数据缺失而造成的估计偏差,使得分析结果更加可靠。