纵向和分类数据分析中秩回归模型的参数估计

来源 :东北师范大学 | 被引量 : 0次 | 上传用户:vince_yang_666666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
纵向数据(分类数据)是指随着时间的演变而追踪测得的数据,或者是对具有某种共性(例如相似基因或者生存环境)的个体测量所得到的数据。这种数据在生物、医药、心理、社会经济等领域广泛存在。纵向数据不仅能更好地反映每个个体随时间变化的趋势,还可以深刻地体现不同个体之间的差异。不同个体间的测量值通常假设是独立的,但是来自同一个个体的数据间可能存在着某种潜在相关性。这种潜在的相关性通常情况下是未知的,而且很难建模。如果忽略了纵向数据的相关性,在统计推断中可能导致错误的置信区间和较小的p-值。考虑到纵向数据的相关性,Liang&Zeger(1986,Biometrika)提出了著名的广义估计方程(GEE)方法。这种方法提高了参数估计的效,且不受协方差矩阵误识别的影响,但它对异常值比较敏感。   最近几年越来越多的研究者开始考虑用基于秩的方法来研究纵向数据。一般来说,基于秩的方法是比较稳健的,也是比较高效的。但是在纵向数据研究中,只有少数研究者考虑了数据的相关性,且所建议的方法依赖于协变量的设计。本文主要考虑纵向数据分析中秩回归模型的参数估计问题。为了得到更有效的推断,我们需要考虑纵向数据的相关性和不同被试测量次数变化(或者类的大小的变化)所提供的信息。基于这个目的,我们假设误差分布是等相关的,用导出的协方差矩阵作为工作的协方差矩阵。它解释了数据的相关性和不同被试测量次数变化的影响。我们通过模拟研究考察了所建议的方法在不同的协方差结构和相关系数的情况下的表现,并且通过与其它已有方法的比较分析了其优劣性。模拟结果表明:无论是在协方差矩阵是正确识别还是误识别的情况下,我们的方法都是稳健的、高效的。   因为基于秩的参数估计函数是参数的阶梯函数,所以计算速度可能比较慢而且方程的解也可能不唯一。同时基于秩的方法得到的参数估计的渐近协方差依赖于误差的密度函数,而误差的密度函数通常情况下是未知的且很难计算。我们把Induced smoothing(Brown&Wang,2005,Biometrika)方法应用到纵向数据秩回归模型的参数估计中,把不光滑的秩估计函数变成光滑的估计函数。这种方法不需要估计误差的密度函数,只需几步迭代就可以得到参数估计及其协方差矩阵估计。我们证明了导出的光滑估计函数与其原估计函数是渐近等价的,也证明了其参数估计的相合性和渐近正态性。我们做了大量的模拟研究以评估由不同估计方程导出的参数估计的表现。与已有方法相比,Induced smoothing方法计算比较快,且数值较为稳健。
其他文献
本文研究了几类广义压缩映像在度量空间、锥度量空间、半序锥度量空间中不动点的存在性定理.利用几种不同的迭代方法对非伸展映像、非伸展算子半群、强制非扩张映像和非扩张
通常,我们将多处理器系统看作网络,其中多处理器系统的处理器对应网络的顶点,处理器之间的连线对应网络的边.大规模多处理器系统在运行过程中,处理器或连线出现故障无法避免,这就
自上世纪七十年代以来,随着山路引理,喷泉定理等临界点定理的发明,近代微分法(又称大范围变分法)得到了重大的进展。应用临界点理论研究非线性方程解的存在性及多重性受到了人们
Pardoux-Peng(1990)首次考虑了如下形式的倒向随机微分方程(BSDE):并给出了解的存在唯一性.在对BSDE的性质深入研究的基础上,Peng(1997)基于BSDE的解提出了g-期望和条件g-期
学位
设rk(n)表示一个自然数n表示成k个整数的平方的个数,文献[7]考虑了有关整点在圆锥体(公式略)上的分布,得到了如下渐近公式(此处公式省略),其中c=c(k)>0是一个确定的常数。  设f
随着科学技术和现代数学基础理论的不断发展,出现的各种各样的非线性问题也日益引起人们的广泛重视,非线性泛函分析已成为现代数学的重要研究方向之一.非线性泛函分析又是非线