Benford法则在我国微观调查数据质量评估中的应用研究——以CHARLS微观数据库为例

来源 :安徽财经大学 | 被引量 : 0次 | 上传用户:harric1234
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
众所周知,高质量的统计数据是应用经济学研究的至关重要的基础,如果基础数据的质量得不到保证,那么相应的研究成果就可能是不正确的。特别近几年来,统计数据的质量好坏一直是政府部门和企业都十分关注的问题。随着我国经济实力的不断增长,国际经济环境的日趋多样化,政府和企业迫切需要更加准确的统计数据来制定相关的政策和管理办法。很多学者都开始投入大量精力开始对数据质量检测这块进行研究,于是不同的评估方法和研究策略被研究出来运用到数据质量检测实践中去。然而,由于大部分统计数据检验方法专业性太强且结果却差强人意,本着找出大众性的检测方法的目的,本文尝试运用一个比较新的方法Benford法则来研究统计数据质量问题,期望达到比较好的效果。  本文的主要方法就是Benford第一数字定律,通过介绍Benford法则的相关文献、Benford法则内涵和意义以及Benford从产生到发展至今的相关理论,从国外到国内两个层面分析了学者们对Benford法则的运用,学习的同时提出Benford法则的运用应该可以用在微观调查数据的数据检测的可能性并加以实施,通过理论和实证研究,证明了如何在微观调查数据运用Benford法则来进行统计数据检测。运用Benford法则,同时选取微观数据库中的11年全国基线调查数据以及之后的12年两省追踪调查数据的部分指标,通过对不同数据类型的分组进行了可靠性分析,得出结论所选指标中的调查数据里的数据质量确实存在问题,尤其是数字5作为首位数的出现频率异常突出,然而考虑到微观数据的获得过程,调查数据存在误差在所难免;之后通过数据检测得出的结果分析描述,再进行对比得出结论,两省追踪数据因数据调查时比较深入而比全国基线调查数据更加准确点,质量更好。最后在完成Benford法则对微观调查数据的检验之后,给微观数据库调查者提供了比较中肯的建议。
其他文献
为了解遵义烟区土壤pH的空间分布及演变特征,2016—2017年在遵义11个植烟县区采集4816个土壤样本进行pH测定,并与第二次土壤普查数据及2000—2005年调研取样数据进行对比分析。结果表明:(1)2016—2017年遵义全市烟区土壤pH变幅为4.4~8.8,平均值为6.6,变异系数为14.72%,适宜植烟pH的土壤样本占比62.5%,偏碱范围的土壤样本占比20.5%,偏酸范围的占比17.