不同缺失值填充方法在全国血吸虫病监测资料中的比较研究

来源 :中国卫生统计 | 被引量 : 0次 | 上传用户:j_program
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的以全国血吸虫病疫情监测资料为数据来源,比较不同缺失值处理方法对模拟缺失值的处理结果 ,为确定适用于处理该资料缺失值的方法提供依据。方法从资料中分别随机抽取10%、20%、30%、40%、50%的观测值作为假设缺失值,采用均值填充法、热平台填充法和多重填充法对模拟缺失值进行填充,分别从分布特征、准确度和精确度三个方面评价缺失值的填充效果。结果不同假设缺失比例下,三种填充方法填充后的结果与原始值相比差异均无统计学意义。多重填充方法填充后结果精确度较好且分布特征与原始值符合度最好。结论多重填充技术较为适合处
其他文献