论文部分内容阅读
广义线性模型(GLMs),可用于对多种类型的数据进行建模,是应用非常广泛的模型,线性回归模型、方差分析模型、用于列联表分析的对数线性模型和逻辑斯谛模型等都是广义线性模型的特例,变量选择是处理高维统计模型的基本方法,但是传统的子集变量选择方法在维数较大时难以计算出结果,并且子集选择方法是离散的非连续过程,估计不够稳定.文献中已经研究了多种变量选择的方法。
本论文研究稀疏高维背景下的广义线性模型的SCAD惩罚最小二乘估计的渐近性质。SCAD惩罚最小二乘估计在可计算性和稳定性方面都有很好的效果。在一定条件下,当协变量的个数随着样本量的增加而趋于无穷时,证明了该估计具有相合性和渐近正态性,尤其研究了该估计在同时进行变脸选择和估计时的效果,在一定的条件下,证明了SCAD惩罚最小二乘估计的变量选择具有相合性,并且得到非零系数的估计与零系数已知情况下的估计具有相同的渐近分布,最后用几个数值模拟说明该估计在变量选择和估计方面具有良好的效果。