缺失数据下超高维单指标模型的变量筛选

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:hy85323
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
变量筛选在各类生活场景中都有着广泛的应用,例如在探究影响疾病的关键基因时,可能的关键基因数远大于获取到的患者样本数,并且在基因数据的获取、保存等阶段又经常存在数据缺失的现象,而在这类带有缺失的超高维数据中进行有效的变量筛选是十分重要的,这样可以对疾病的关键基因进行定位,并且对后期精准医疗、疾病预防等都有着深远的意义。考虑到基因数据的复杂性和超高维数据的“维数灾难”现象,本文将结合单指标模型来探讨该问题。因此,在响应变量随机缺失的情形下,本文主要研究超高维单指标模型的变量筛选问题,并在逆概率加权和确定性独立变量筛选方法的基础上,本文提出基于MSIS方法(Sure Independence Screening Method with Missing data)构造的变量筛选器用来解决该问题。首先利用K-S统计量和Logistic回归模型估计逆概率权数;其次针对每个协变量建立逆概率加权的二次损失函数,将效用函数值按升序排列后便可将数据集的维度降低到一个合适的规模;最后运用基于LASSO惩罚的逆概率加权最小二乘方法对降维后的数据进行更精细的变量选择,以此完成重要变量的挑选。进一步地,本文还通过大量数值模拟来表明基于MSIS方法构造的变量筛选器性能良好、效果稳定,并且该变量筛选方法对于缺失率也具有一定的稳健性。另外,还将外周血基因谱数据作用在MSIS方法上查看效果。结果表明:即使数据存在不同程度的缺失,MSIS方法依旧能够在影响动脉粥样硬化时的关键基因探索上起到重要作用,并且还可以推广到其他领域中。
其他文献
目的:通过数字模拟技术探讨发育性髋关节发育不良患者行全髋关节置换术时不同高度旋转中心髋臼假体的有效CE角和髋臼杯覆盖率。方法:收集8例发育性髋关节发育不良(Crowe III型)患者的骨盆CT影像成像资料,使用Mimic s和Solidworks软件重建患者骨盆和髋臼杯图像,根据患者自身髋臼大小,在真臼的位置安装合适的髋臼假体,并以2 mm的增量以合适大小的臼杯假体逐级递增上移至20mm,比较不同
XL油田流体性质较差,胶质、沥青质和蜡含量高,油井卡堵严重,目前主要采取加药防蜡和热洗清蜡的方式清防蜡,但是这些措施不能彻底解决石蜡沉积的问题,还对油田正常生产影响很
黑木耳是著名的山珍,原产我国,是传统出口创汇产品,备受亚、欧、美洲各国市场的青睐。我国野生黑木耳分布在东北、华中、华北以及西南20多个省(市)自治区,而西藏是另据特点的
随着我国大跨度钢结构桥梁的推广,桥梁耐候钢因其优良的耐大气腐蚀性能在桥梁建设领域呈现出良好的发展前景。桥梁结构件中焊接、铆接等连接方式的大量使用,使得桥梁耐候钢缝
目的:干细胞再生医学是当代生命科学领域的研究热点,然而目前对于移植到体内的干细胞存活、滞留和分布仍缺乏了解,这严重制约了干细胞治疗的发展和应用。本课题拟借助报告基
目的:比较基于四种机器学习算法的三种倾向值分析技术在平衡协变量和估计真实干预效应的能力。并以此控制中国健康与养老追踪调查(China Health and Retirement Longitudinal Study,CHARLS)数据中的混杂因素、减少样本的选择偏倚,探索退休对老年人健康的潜在影响,以期了解老年人生活质量的变化,也为我国渐进式延迟退休相关政策的制定提供合理的科学参考。方法:1模拟研
大学生群体作为志愿服务活动的主要力量,其在很多领域的志愿服务行为对推动人类社会的进步和发展起着积极而重要的作用。因此大学生志愿服务相关工作一直都是高校学生管理工作和公共管理领域中的重点。但是当前我国高校大学生志愿服务相关管理水平较低,存在着大学生志愿服务工作欠缺灵活性、大学生志愿者专业化引领不足、大学生志愿服务缺乏长效化激励制度、大学生志愿服务宣传效果不佳且存在负面宣传等问题。这些问题导致我国大学
学位
时域有限差分算法(Finite-Difference Time-Domain,FDTD)已经发展成为一种成熟的处理非均匀、各向异性色散介质的工程电磁数值方法。在利用FDTD算法研究金属微纳复合结构电磁相互作用的物理机制问题时,由于亚波长微纳结构具有“场的局域性”和“模式的共振性”特点,计算结果对介质色散等媒质物理参数的变化异常敏感。算法参数因精度不匹配导致的近似误差,在局域共振环境下可能被进一步放
张力腿平台是深水油气资源开采平台的主要形式之一,筋腱支撑浮筒是张力腿平台安装过程中必不可少的安装工具,解决筋腱支撑浮筒关键技术难题对我国张力腿平台相关技术的发展有
十三五规划落实以来,新的住宅建造方式在不断发展。根据国家政策和地方政府的相关建议,使得混凝土叠合结构的研发取得了—系列成果、叠合结构的应用也进入社会生活中。混凝土叠合结构体系的优势主要体现在以下方面:混凝土叠合结构体系可以解现场浇筑程中存在的问题,如:模板支撑工作量大、人工消耗大、受季节局限、施工工期长、现场吊装压能力不足。混凝土叠合楼板是由预制板和现混凝土层叠合而成的装配整体式楼板。叠合楼板具有