论文部分内容阅读
生存时间常表现为起始事件和终止事件之间的持续时间。由于任何研究都不能无休止地进行到所有个体的终止事件发生,并且在追踪观测过程中还会有其他不可控的因素影响终止事件的发生,因此,生存数据通常都存在右删失。当起始事件的发生时间存在区间删失,终止事件的发生时间存在左截断右删失时,此类数据被称为左截断双删失数据。生存分析中,感兴趣的问题是可能的相关风险因素对生存时间的影响,既包括影响的形式,也包括影响的程度。以危险率函数为建模对象的可加可乘危险率模型同时包含了协变量对危险率的乘性和加性影响。其优点是可以同时估计不同影响形式的协变量的影响程度,难点是估计过程比单一的乘性模型或加性模型都更为复杂。根据模型中协变量的参数是否依赖于时间变化,可加可乘模型有几种不同的形式变换。Lin-Ying可加可乘模型中,协变量的参数均恒定不变;Cox-Aalen可加可乘危险率模型中,乘性影响的参数为常数,加性影响的参数为关于时间的函数;变系数可加可乘危险率模型中,乘性和加性影响的参数均为关于时间的函数。本文主要研究了左截断双删失和随机右删失数据下,可加可乘危险率模型的估计问题及其实证分析。第一,研究了左截断双删失数据下,Lin-Ying可加可乘危险率模型的估计问题。首先,运用两阶段法估计了模型的参数,估计结果包括忽略区间删失数据的初始估计和包含区间删失数据的修正估计;其次,通过模拟研究验证了所提方法在有限样本下估计结果的无偏性,结果显示修正的估计结果较初始估计结果更为有效;最后,运用该方法研究了恶性黑色素瘤切除手术的数据。模拟研究和实例研究都印证了包含区间删失信息的两阶段估计比直接将区间删失个体剔除的初始估计更有效。第二,研究了左截断双删失数据下,Cox-Aalen可加可乘危险率模型的估计问题。运用两阶段法估计模型参数的过程与Lin-Ying可加可乘危险率模型类似,不同之处在于Lin-Ying模型的初始估计使用了估计方程方法,Cox-Aalen模型使用了从极大似然函数导出的得分方程进行估计。通过模拟研究验证了有限样本下估计结果的无偏性,以及修正的估计结果比初始估计结果更为有效。通过实例研究再次说明两阶段估计更为可靠有效。第三,研究了随机右删失数据下,变系数可加可乘危险率模型的估计问题。首先,基于局部常系数展开式,构建了局部似然函数来估计模型的变系数;其次,证明了局部似然估计结果的大样本性质(包括相合性和渐近正态性);最后,通过有限样本的模拟研究说明了估计结果的有效性和稳定性。