经验似然纵向数据和似然Dantzig Selector方法

来源 :山东大学 | 被引量 : 4次 | 上传用户:xxx12
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文主要对如何充分利用纵向数据的组内相关性来提高对纵向数据半参模型的估计精度以及高维数据的变量选择问题进行研究。纵向数据是对多个观测主体的响应变量和相应的多个协变量进行重复观测形成的数据。对每个主体的观测数据称为一组数据。纵向数据最主要的特征是组内数据相关而组间数据独立。对纵向数据进行分析的难点就是如何充分利用组内数据的相关性来提高统计推断的精度。在第二章,我们将利用经验似然方法对纵向数据的半参模型的回归参数构造置信域。众所周知,与基于渐近正态的方法或基于Bootstrap的方法相比较,经验似然方法在构造置信域时有很大的优越性。本章的主要贡献是充分利用了纵向数据的组内相关性来提高估计精度。我们的方法是:首先,我们为每个主体的观测数据的误差假设一个半参的协方差结构。然后,我们同时利用观测数据的一阶矩和二阶矩条件来构造估计方程。其中的讨厌参数被profile掉了。由于在估计方程中插入了未知分量的非参估计,我们采用了under-smoothing技术来保证所得到的对数经验似然比统计量渐近收敛于标准卡方分布。我们还做了大量的统计模拟来验证我们提出的方法的优越性。受很多实际应用的激励,近年来人们对高维数据的研究有了很大的进展。一些为传统的低维数据设计的统计方法已经无法适应现代统计学的要求。进行高维数据分析的重点是如何利用数据结构的特征进行降维。如果在高维数据中,有很多的预测变量是冗余的,也就是说这些变量根本不含有响应变量的信息,那么,有效地分辨出哪些预测变量是重要的,哪些是冗余的,可以帮助我们建立一个解释性更强、更有用的模型。在第三章,我们将考虑似然情况下的变量选择问题。Dantzig方法自提出就受到了广泛的关注。Dantzig方法主要适应于参数是高维且稀疏情形的线性模型:Y=Xβ+ε,其中Y是n×1响应变量,X是n×p预测变量的矩阵,β是p维且稀疏的参数向量,ε是n×1的零均值、独立同分布的误差项。Dantzig的原理是:假设ε是正态分布,在将得分函数的取值控制在一定的范围内的同时,找寻那个使参数β的l1,范数达到最小的参数值,此向量即为我们的解。在第三章,我们将Dantzig方法的思想推广到了一般的似然情况。我们的方法是:首先得到未知参数的极大似然估计βmle然后,将得分函数在βmle点Taylor展开,得到得分函数的一个线性近似,然后我们就可以利用Dantzig已有的分析方法讨论它的统计性质了。我们的方法在参数维数随样本容量一起趋于无穷时也表现良好。我们研究了解的存在唯一性,并且得到了解的相合和渐近正态性。为了确保模型选择的相合性,我们提出了基于似然的Adaptive Dantzig方法并得到其Oracle性质。最后,我们做了大量的统计模拟来验证我们所提出的方法的优良特性。在实际应用中,高维问题的参数经常具有某种分组结构,即,每组参数同时为零或同时非零。通常的例子就是多元的ANOVA问题以及非参成分的可加模型。在以上的情况中,进行变量选择等同于对一组变量进行选择而非选择单个的变量。在这类变量选择问题中如何充分利用这种结构是我们要加以考虑的重要问题。在第四章中,考虑到每组中元素的个数可能不同,我们提出了新的Group Dantzig Selector方法。我们得到了估计的非渐近的l2范数的上界。我们还做了大量模拟来研究我们的方法在实际中的表现。
其他文献
第一部分小鼠cTnIR193H突变致限制性心肌病的早期心肌线粒体损害目的:心肌线粒体损害是导致各种心血管疾病的重要原因,特别是肥厚性心肌病和扩张性心肌病。但心肌线粒体损害是否在限制性心肌病(RCM)中也伴有重要角色,目前还不清楚。然而近年来有研究报道,RCM的发生与ATP产生和线粒体代谢密切相关,提示心肌能量代谢异常可能是RCM心肌重塑的重要病理过程。因此本部分研究旨在确定小鼠心肌肌钙蛋白I(cT
随着互联网技术的不断发展,“互联网+护理服务”作为护理行业内解决护理资源紧缺问题的新兴服务模式,其作用日趋显著。在规范我国“互联网+护理服务”发展的相关研究中,对于风险源头及传播过程的研究仍然存在一定的欠缺。文章共六部分,第一部分结合研究背景、意义、国内外研究现状、研究方法、思路等对“互联网+护理服务”的风险研究做了概述。第二部分从“互联网+护理服务”和风险的社会放大框架的基本概述、主要内容等方面
教案是对外汉语领域中不可或缺的组成部分,是教师个人在进行教学前编制的教学具体方案,是把握课堂进度、确保教学目标完成的重要依据。一份优秀的教案可以减轻新手教师在课堂上的盲目性和不确定性,通过对新手教师教案案例的分析可以对真实教学过程或教学实践进行描述、分析,从中发现问题、获得启发,而综合课又是对外汉语课程中的核心课程,每一课生词、语言点、课文等都服务于综合课,综合课的教学效果不仅设计自身的教学任务能
目的:比较慢性冠脉综合征患者夜间和早晨不同时间顿服阿托伐他汀或瑞舒伐他汀的降脂疗效差异。方法:45例既往夜间稳定服用长效他汀类药物的慢性冠脉综合征患者,其中23例既往夜间稳定服用阿托伐他汀的患者和22例夜间稳定服用瑞舒伐他汀的患者,将前述患者的他汀类药物等品种等剂量的改为早上(6:00 am-8:00 am)服用2月后,再将患者他汀类药物改回夜间(7:00 pm-9:00 pm)服用2月。患者分别
为了促进并加快光学系统向小体积、大容量、低成本、多功能和高运行效率的方向发展,人们提出了“集成光学”的概念。集成光学主要研究光学系统的微型化,即通过在单个光学芯片基底上制备和集成若干个微纳光子学器件实现对光信号的处理与传输,从而形成微纳光学系统--集成光路。构成集成光路的光子学器件包括无源光子学器件和有源光子学器件,无源光子学器件是指器件工作时不需要外加能源驱动,如分束器、耦合器、滤波器、衰减器、
我们首先从倒向随机微分方程理论说起(backward stochastic differential equations简记作BSDEs).众所周知,Bismut在处理一个最优随机控制问题时第一次提出线性形式的BSDEs [4],然后Pardoux-Peng在著名的[92]中的工作揭开了一般形式的BSDEs研究的序幕,Pardoux-Peng在标准的Lipschitz条件下证明了此类方程解的存在唯
本文主要对两种经典哈密顿系统的周期解的线性稳定性进行研究,一个是N-体问题中椭圆共形解的稳定性,另一个是紧凸超曲面上闭特征的稳定性。N-体问题来自于天体运动的研究,而人们对天体运动的探索早在古希腊时代就开始了,直到牛顿时代由于微积分的引入,才使得天体运动的研究有了突破性的进展。在理论上我们把N个天体看做N个质点,研究它们只在万有引力作用下所做的运动以及它们的稳定性,最为典型的例子是太阳-地球-月球
蛋白质在生物体内占有特殊的地位,是生物体形态结构和生命活动所依赖的物质基础。氨基酸、酰胺作为重要的生物活性物质,是组成蛋白质的基本结构单位,被认为是研究中重要的生物模型化合物。糖类和醇类化合物能够稳定球形蛋白质的天然构象,而有机溶剂对蛋白质的溶解性、变性行为、折叠和解折叠及酶的活性等都有很大影响。通过研究水溶液中蛋白质模型分子与糖类及醇类化合物的热力学性质,既可以获得水溶液中溶剂化的溶质分子间的相
目的:通过CiteSpace软件对近十年国内四君子汤应用研究的相关文献进行可视化分析,探讨四君子汤应用情况。方法:检索国家知识基础设施数据库(CNKI)2011年1月1日至2020年12月31日发表的四君子汤应用研究的期刊文献,运用CiteSpace软件绘制该领域的知识图谱,并对文献的关键词进行共现分析、聚类分析、时间线分析及突现分析。结果:初步检索获得1 378篇四君子汤应用研究相关文献,进一步
L-函数在中心点s=1/2处如何取值在很多研究方向中都是很深刻的研究课题,有重要的应用,譬如实的Dirichlet特征产生的Dirichlet L-函数在s=1/2是正的,这一事实可以推出虚二次域的类数的非常好的下界.从Hecke L-函数在中心点有好的正的下界就能证明Landau-Siegel零点不存在.除此之外,一些特定的Rankin-Selberg L-函数的非零结果对研究广义Ramanuj