论文部分内容阅读
复发事件数据和生存数据是纵向研究中十分常见的两种复杂数据,比如:病人癌细胞复发、车保索赔和产品质量检测等。分析这些复杂数据,需要根据数据的背景及数据类型,建立合理的统计模型用以参数估计或统计推断,进而达到解释和预测的目的,帮助研究者从数据中挖掘更多的有用信息。因此,研究这些复杂数据不仅具有重要的理论意义,也具有广泛的应用前景。 在复发事件数据分析方面,本文对带相依终止事件的复发事件数据提出了一种联合建模分析方法。在第二章和第三章中,对复发事件的条件比率分别考虑了带乘积效应脆弱变量的可加模型和Cox-Aalen模型。而对终止事件的风险率都考虑了可加模型。通过引入共享脆弱变量刻画终止事件和复发事件的相依性。建立了一组广义估计方程估计模型参数和非参数基准函数,证明了估计的渐近性质。 在生存数据分析方面,本文主要研究了变系数生存模型的变量选择,局部稀疏诊断和变量筛选问题。在第四章,提出了一个惩罚估计函数的方法,同时进行变量选择、局部稀疏诊断和回归系数估计。在一些正则条件下证明了估计的oracle性质。另外,在第五章,提出了一个变系数生存模型的变量筛选过程:KS-SIS,用以分析超高维生存数据。在一定程度上,此方法并不依赖于模型假定。在正则条件下证明了此变量筛选过程的SIS性质。也给出了它的两个推广版本用以改善有限样本下的表现。 最后都通过数值模拟评估了文中所提估计的有限样本性质,并将所提方法应用于实际数据进行了实证研究。