【摘 要】
:
本文提出向前可加回归方法(Forward Additive Regression)来解决超高维非参数可加模型的变量选择问题,超高维问题下的维数pn=O(exp(nα)在超高维数据中,自变量的个数远大于样
论文部分内容阅读
本文提出向前可加回归方法(Forward Additive Regression)来解决超高维非参数可加模型的变量选择问题,超高维问题下的维数pn=O(exp(nα)在超高维数据中,自变量的个数远大于样本量,这种“大p小n”的特性给传统的多元统计方法带来了新的挑战。当变量个数p远大于样本数n时,传统的变量选择方法不再适用。为解决p>>n下的变量选择问题,统计学者们提出了独立扫描方法(Independence screening)。独立扫描方法运用单个变量与因变量Y之间的边际得分来衡量变量的重要性,得到边际得分后通过人为给定的阈值将边际得分低于阈值的变量剔除。但独立扫描方法存在以下两个问题:1、当某个重要变量与因变量边际独立时,独立扫描方法倾向于忽略该重要变量。2、当不重要变量与强信号重要变量高度相关时,独立扫描方法很可能忽略弱信号的重要变量。Wang(2009)针对独立扫描方法所具有的缺点提出了向前回归方法,该方法能够有效解决超高维线性模型下的变量选择问题。向前回归方法在进行变量选择时会利用已入选变量的信息,这降低了重要变量因为信号较弱而无法被选出的概率。在解决实际问题当中我们无法掌握足够的信息来确定模型的结构,Stone(1985)提出的可加模型是一种适用范围广、弹性大的模型,为此我们将可加模型作为本文的研究对象。向前可加回归方法是向前回归方法的拓展,该方法同样能够克服独立扫描方法所具有的两个缺点。从相关的数值模拟中可以看出,向前可加回归方法在解决不同情形下的变量选择问题都能保持稳定的选择效果。
其他文献
随着社会医疗水平和生活水平的提升,我国人口老龄化现状已不容忽视。老年人和下肢运动疾病患者的运动功能衰退不但会影响其生活质量并且还会增加社会负担。近年来,下肢外骨骼
家政服务业蓬勃发展,家政服务机构及其从业人员的信用状况极其重要,大数据信息信息共享应用,造就了数字经济和互联网经济的发展,通过大数据分析市场需求和自身产能,开展营销活动,就显得尤为重要。通过回顾国内外家政O2O企业开展营销和服务的情况,以PEST环境分析和行业分析,对比竞争对手的营销模式开展研究。结合市场营销组合理论,深入分析斑马电商云营销活动对市场需求的反映度不够高,平台产品体系较多,与消费者互
平板显示器、太阳能电池、发光二极管、气体传感器、节能玻璃等光电器件的广泛应用进一步扩大了透明导电薄膜的市场需求。目前应用最多的是ITO薄膜,但是ITO薄膜主要成分In是
缺失数据作为复杂数据的一种,在生物医学、教育学和经济学等研究领域中普遍存在,目前国内外大部分对于数据缺失问题的研究都是基于数据缺失机制为可忽略的情况下。但一些实际
谐波是电力系统中的有害物,是电力系统中的一种能量污染。谐波不仅造成电网污染,影响线路的稳定,而且会对电子设备产生一定的污染,导致电子设备不能正常运行。而且,谐波对人
作为传统计算模型的电子计算机,计算速度逐渐地接近瓶颈。为解决计算的瓶颈问题,科学家们对计算模型进行了大量的研究,其研究的领域中最具代表性的就是自然计算。作为自然计
路灯是为道路提供照明功能的灯具,它可改善交通条件,减轻驾驶员疲劳,有利于提高道路通行能力和保证交通安全,还可美化市容,在城镇道路以及高速公路上得到广泛使用。随着使用年限的增加,工业尾气、自然污染物会附着在路灯表面,造成路灯的透光性降低,影响交通安全。由于路灯悬空高度高,人工清洗方式费时费力、且存在人员安全问题。因此,迫切需要开发机械化的路灯清洗装置,同时对路灯进行识别和定位,获取路灯的位置信息,进
现今我国国民经济发展速度放缓,为了能够更好的实现对国民经济发展的有效推进,为民众创造出更多的就业机会,在近年来的发展过程中,政府对于小微企业发展给予了诸多支持,以推进小微企业发展。但是,受制于自身规模等方面因素的限制,进而导致小微企业常常会出现融资困难的问题,进而影响了其快速发展,为了促进小微企业发展,国家鼓励发展普惠金融,要求银行业等金融机构加大对小微企业的资金支持,因此银行如何进行小微企业信贷
作为一种分泌性糖蛋白,颗粒蛋白前体(Progranulin,PGRN)包含一个由17个氨基酸残基构成的分泌信号肽以及7.5个高度保守的半胱氨酸衔接重复结构域,这些结构域被分别命名为 para
近年来,随着人工智能技术的发展,需要处理的问题规模越来越大。然而,电子计算机模型计算能力的发展速度正在逐渐放慢,使得人工智能技术在求解大规模问题时遇到的计算能力方面