论文部分内容阅读
目的以全国血吸虫病疫情监测资料为数据来源,比较不同缺失值处理方法对模拟缺失值的处理结果 ,为确定适用于处理该资料缺失值的方法提供依据。方法从资料中分别随机抽取10%、20%、30%、40%、50%的观测值作为假设缺失值,采用均值填充法、热平台填充法和多重填充法对模拟缺失值进行填充,分别从分布特征、准确度和精确度三个方面评价缺失值的填充效果。结果不同假设缺失比例下,三种填充方法填充后的结果与原始值相比差异均无统计学意义。多重填充方法填充后结果精确度较好且分布特征与原始值符合度最好。结论多重填充技术较为适合处