论文部分内容阅读
对缺失数据的处理一直以来都是一个非常重要的研究领域,随着越来越多的分析方法、数据结构的出现,对于数据质量也就有了更高的要求。纵向数据中的混合效应模型是一种被逐步广泛应用的模型,由于其在分析数据时,不仅仅是基于对数据的整体进行了考量,更对数据中的组内关系给予了更多的关注,因此其得出的结果也就更加符合客观事实。本文将针对于混合效应模型中的缺失数据的处理问题进行讨论,这里使用缺失数据处理方法是四种比较常用的插补方法:均值插补法、最后观测值替代法、回归(比率)插补法、随机插补法。文章中通过多次数据模拟,对这四种方法在该模型中可能存在的两种缺失机制的处理效率进行比较,并进行了一定的解释。 本文的基本框架如下: 导论介绍了本文的选题原因、意义,并且对本文的特点进行了阐述。 第一章阐述了纵向数据中混合效应模型的一些基本概念。 第二章阐述了缺失数据处理研究领域中的主要缺失机制以及本文中要用到的一些插补方法。 第三章利用R软件对数据的生成、缺失、插补分别进行多次模拟,并对模拟的结果进行描述、讨论。 结语对文章进行总结,提出了不足之处,同时也对今后的研究方向进行了一定的说明。