论文部分内容阅读
在众多的统计理论和实际应用研究中,人们通常假设回归模型中的解释变量和响应变量都是可以直接观测的,但在实际问题中由于数据收集者本身的能力和水平的参差致使所收集得到的数据往往存在着测量误差。当测量误差较大时,如果在数据分析时忽略这些测量误差的影响,很容易使分析推断结果产生较大的偏差。EV模型则是用来解决这一问题的一个很重要的回归模型,它采用特定的方法来削弱测量误差所带来的偏差,因此,近年来备受统计理论研究者和实际应用者的青睐。同时,在实际应用中,缺失数据也是普遍存在的,为了减少因数据缺失给统计分析所带来的影响,在数据分析中需对缺失数据进行特别处理,从而发展了相应的分析方法。一些研究者在可忽略缺失数据机制下研究了非线性EV模型的参数估计及其渐近性质,但在一些实际问题中数据缺失是由其变量本身的特性(如:个人隐私、药品的副作用等)所导致的,因此,研究带有不可忽略缺失数据的非线性EV模型是非常有意义的。然而,由于带有不可忽略缺失数据的非线性EV模型涉及到缺失数据机制模型致使其研究的难度增大,所以,该问题的研究至今都没有得到很好的发展。 本文在EV模型和缺失数据理论的基础上,同时考虑了解释变量带有测量误差和响应变量带有不可忽略缺失的非线性EV模型的参数推断问题,其主要创新之处包括: 1.根据数据缺失的特点,建立了不可忽略缺失数据机制模型。本文通过引入示性函数,对不可忽略缺失数据在假设数据的选择概率仅依赖于响应变量的情况下,建立了Logistic回归模型,并对选择概率发展了其估计理论。由于所提出的选择概率估计方法具有稳健性,因此,本文提出的Logistic回归模型假设对选择概率估计结果的影响不大。 2.利用逆概率加权原理对估计方程进行插补,并用核实数据建立了条件期望估计。在缺失数据理论中,一般的插补方法是对缺失数据的插补,而本文使用的是对估计方程进行插补以达到消除缺失数据所带来的偏差的目的,所得的参数估计具有相合性和渐近正态性。 3.根据本文建立的理论结果,进行了大量的模拟研究和实例分析,其模拟结果和实例分析验证了本文所提出的估计方法的有效性和稳健性。