随机森林回归分析方法在代谢组学批次效应移除中的应用

来源 :中国卫生统计 | 被引量 : 0次 | 上传用户:yuechao002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的通过随机森林回归(random forest,RF)方法提取不同批次间质控(quality control,QC)样本数据的批次特征,从而移除代谢组研究样本数据的批次效应,提高统计分析方法的分类识别能力。方法利用心血管疾病的代谢组质控样本在检测过程中产生的系统误差,通过随机森林回归方法获得质控样本质谱数据的系统误差特征,从而移除研究样本数据中存在的批次效应。对校正后的质谱数据用可视化方法和定量度量指标进行评价,再用统计方法筛选差异变量和建立判别模型,评价移除效果。结果经过QC-RF回归方法移除批次效应
其他文献
研究背景和目的:热性惊厥(febrile seizures, FS)是小儿时期最常见的惊厥性疾病,发病率为2%-5%。FS好发年龄为3个月至5岁,高峰年龄为18个月,6岁以后少见发生。FS可散发,也可呈家族聚
2009年2月10日,全国科学技术名词审定委员会召开2009年度常委会会议。全国科技名词委主任路甬祥,副主任刘成军、程津培、杜祥琬、武寅、孙寿山、刘青,常委寿晓松、李济生、王永
瑞典"百万住宅计划"是20世纪50、60年代大规模工业化住宅建造的重要事件。经过30余年的使用,这批住宅于20世纪90年代迎来大规模的更新。以"百万住宅计划"的住宅更新研究为背
科学技术名词规范化是我国科学技术事业发展的一项支撑性系统工程,对于促进科学技术进步、传承中华优秀文化具有重要意义和深远影响。全国科学技术名词审定委员会自2010年成立第六届全国委员会以来,已新组建或换届28个分委员会,审定公布49种科技名词。目前,审定分委员会总数达到95个,公布科技名词总数达到125种,科技名词体系日臻完善。这些成果是广大科技名词审定专家集体劳动和共同智慧的结晶。为此,在全国科技
仿制药是我国现今乃至今后相当长一段时期内药品研发的主流,目前,仿制药研发的要求越来越高、系统越来越复杂、投资规模越来越大、研发周期越来越长,国家药审中心对仿制药审
随着大规模云计算数据中心在全球范围内广泛部署,其高能耗、高费用、高污染等问题日益突出。清洁新能源、智能电网和高效储能设备为云数据中心的节能降耗带来了新的契机。但
目的探讨临床护理路径对肺癌微创胸腔手术患者康复效果的影响。方法选取2018年8月至2019年8月天津市第一中心医院收治的120例肺癌患者,均于入院后行微创胸腔手术治疗,按照围
通过梳理、分析清末上海地区卫生相关文献,再现了清末华洋卫生意识冲突与妥协的部分场景,探究了导致冲突及结局的原因,认为卫生意识的改变主要来自两方面的推动:经济利益和社会结
随着具有中国特色的社会主义市场经济体系的建立和完善,票据在经济生活中扮演着越来越重要的角色。票据市场的快速发展,票据风险也不断加大,票据纠纷亦日渐增多。如何有效减少票