广义线性模型的稳健估计及其医学应用

来源 :山西医科大学 | 被引量 : 10次 | 上传用户:sea23266
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
广义线性模型(generalized linear model,GLM)是一类应用范围较广的模型,它可以满足应变量为连续和离散数据的建模,特别是后者,如属性数据,计数数据。这在应用上,尤其是生物、医学、经济和社会数据的统计分析上,有着重要意义。但是其经典模型拟合方法最大似然估计(MLE)容易受离群点的影响,甚至得出错误结论。因此,研究能有效对抗离群点的稳健估计方法将具有重要意义。本文回顾和比较了四种适用于广义线性模型的稳健估计方法:Mallows拟似然估计、条件无偏影响约束估计(CUBIF)、Mallows降权杠杆点估计和一致性错分模型估计。首先在稳健回归估计基本理论的基础上对这四种估计方法的基本思想和稳健性质进行了详细的阐述。其中后两种方法只能适用于Logistic回归模型。在模拟分析中,对Mallows拟似然估计考虑了帽矩阵、MVE和MCD三种针对x方向降权的尺度,对Mallows降权杠杆点估计考虑Carroll和Huber两种降权函数。模拟分析基于两种常见的广义线性模型即Logistic回归和Poisson回归进行了设计,然后对每种模型建立的模拟样本中分别构建y方向、x和y方向两种不同类型和不同比例的离群点情况,探讨了适用于各自模型的各种估计方法对抗不同类型和比例离群点的能力。通过模拟研究我们得到以下结论:1.相比较于经典的MLE,这一类稳健估计方法在一定程度上可以更好的对抗离群值产生的影响,描述最佳拟合大部分数据的结构;可以更清楚地识别离群值、模型中的强影响点与模型偏离的结构;当数据中没有影响点时,其估计与经典MLE估计一样好,但是当MLE条件不满足时,稳健估计结果要远远优于MLE。2.在Logistic回归模型和Poisson回归模型情况下,Mallows拟似然估计基于MVE和MCD的降权方法都表现了较其他估计方法更强的对抗离群点的能力。而基于帽矩阵的降权方法则由于帽矩阵本身的不稳健性导致了其较低的失效点。3.Mallows降权杠杆点估计方法由于其权函数是基于x方向离群点,所以在单纯的1%的y方向的离群点时即失去效用,但是在x和y方向同时异常时有很好的对抗性离群点的能力,不过由于其权函数对x方向离群点观测赋权重为0达到规避离群观测的特性,在离群点比例增大时,极容易导致logistic回归模型完美分割导致估计无解情况的发生,而且其降权过程会损失样本的大量信息。4.一致性错分模型估计表现要差于前两种方法,但相对MLE来说具有较好的稳健性,不过其缺点在于可能造成正常观测点的强制降权作用。5.CUBIF本身思想为影响约束估计,可以同时考虑x和y方向的异常情况,不过其表现要劣于其他稳健估计方法。最后本文通过两个实例,探讨了这些方法的实际应用。
其他文献
教师引导学生诵读国学经典作品不仅能够拓宽学生的学习知识面,同时还能在一定程度上提升学生的文学素养。将语文课堂实际教学与国学经典互相融合渗透,能够提升个人的语文综合能力和素养。  一、生字练习中的国学  汉字可以说是华夏文明的最重要标志之一。汉字又被称为方块字,是几千年来汉字书写规范的传统结论。体会中华汉字之美和内涵,是领略和传承国学经典文化的基础。在对学生进行日常文字教学(识字、写字等)的同时引导
期刊
在小学生的作文中,最常见的问题是“千篇一律”,同一个题目写出来的文章大同小异,这反映出学生在写作构思中习惯遵循传统思维。古人云:“文贵出新,文贵创新。”教师在指导写作的过程中,要启发学生“见人所未见,發人所未发”,追求立意和构思的新颖性和独创性。引导学生打破常规思维,变换思考的角度,获得独到的见解,于平淡中见奇,写出“新”作文。  一、逆向求异,立意新颖  文好题一半。一个富有新意的标题往往能在第
期刊
1真菌毒素(Mycotoxin)是真菌产生的次级代谢产物,通常存在于霉变的谷物中,一旦通过食物链进入人体后,将可能造成致畸、致突变和致癌等严重危害,因此在全球食品安全问题中备受关