论文部分内容阅读
多元分析方法是医学研究中常用的统计方法。经典多元分析模型及其建模方法的优良性质是以典型数据为基础的。研究中获得的数据关于某种假定模型的典型性是未知的,常常是非典型的。非典型数据将干扰经典多元统计分析模型的建模过程,所建模型稳健性差。本文提出了一类多元分析模型的建模方法,这类方法受数据的非典型性影响较小,具有较好的稳健性,经典多元分析建模方法是这类方法的特例。本研究作了下面几个方面工作: 1.提出了回归系数的稳健有偏估计。回归系数的稳健估计和有偏估计是两种根据非典型数据建立线性回归模型的方法。稳健估计抗异常点的干扰,有偏估计能克服自变元多元共线的影响。通过模拟试验,发现稳健估计受多元共线影响,有偏估计受异常点影响。当非典型数据中异常点和多元共线关系同时存在时,用稳健估计和有偏估计都难于获得正确的线性回归模型,在回顾文献和模拟试验的基础上定义了三种稳健有偏估计方法,他们是稳健M-估计和有偏估计的有机结合,具有抗异常值和多元共线的特性。三种方法分别是稳健主成分估计、稳健岭估计和稳健根方估计。针对7种数据类型,模拟试验结果表明三种方法估计结果一致优于LS估计、M-估计、主成分估计、岭估计和根方估计。稳健主成分估计实用上较为方便,但稳健岭估计、稳健根方估计实用上尚有困难,关键是最优k值确定的问题尚未解决,有待进一步深入研究。其理论上的优越性为今后研究提供了依据。 2.完善和丰富了广义根方估计的理论,并用模拟试验考证了广义根方估计的特性。 3.提出了logistic回归系数的有偏估计方法。logistic回归模型的目的是描述因变元与自变元之间的关系,回归系数有明确的实际