一种基于深度神经网络算法的亚临床差异级别代谢组学数据处理方法

来源 :北京中医药大学 | 被引量 : 0次 | 上传用户：jhf44623386

【摘要】

：

【作者】

：

张飞龙

【出处】

：

北京中医药大学

【发表日期】

：

2020年01期

【关键词】

：

生物信息学代谢组学人工智能深度学习卷积神经网络迁移学习

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

实现一个生物体正常生理功能最基础的小分子化合物,我们通常称之为代谢物。它与生命体的功能与生理情况密不可分,可以直接的反应出一个生命体内所需要进行的各种生理学和生化反应的具体情况。代谢物中包含了丰富的生物学信息。代谢组学就是将各种代谢物和生命体作为一个可以高度组成整体的生物化学系统,进行生物化学研究的一种科学方法。它在详细分析代谢物在影响生命体和生命的过程的基础之上,使用组学的概念揭示其背后的各种生理活动的生理化学机理。因此相对于于传统的基因组、转录组学的研究,它的研究可以全面的展示一个生命体的真实生理状态与其过程。近年来,它的代谢组学研究被广泛的应用于生物化学标志物的采集与筛选、毒理学的研究、药物的设计与应用以及环境科学的研究等诸多领域之中。亚健康、亚临床的概念的提出与人类生活质量的提升密不可分,随着大健康理念的提出,亚临床或临床前病变的概念也被提了出来。要实现亚临床级别的诊断,就需要更为灵敏的检测仪器与更为准确的诊断机制,代谢组作为研究生物体所有代谢物的方法,可以使用大通量高灵敏性的质谱、核磁共振等仪器生产数据。代谢组研究的对象是生物的代谢物经采集、预处理、使用质谱或核磁共振得到的的信号数据,我们将其命名为代谢组特征数据。为了从代谢组数据中提取有意义的信息,我们往往使用统计分析与浅层机器学习的方法进行处理。不过现代代谢组学数据有着以下几种特点:1.维度高,样本数相对较少;2.数据中含有大量噪声,仅有少数特征与被研究对象高度相关,往往传统方法无法获得令人满意的分析结果。因此研究者们引入了特征选择算法对输入的数据进行预处理。这些方法本质上都是给变量加上了一个权重值。而研究表明,代谢物与代谢物之间并不是完全没有关联的,我们需要使用更智能的特征选择方法在特征选择时把物质间的联系考虑在内。尤其是目前国内外有大量的社区队列研究,这些研究可以产生大量的亚临床数据,这些数据相比传统的临床数据,信号噪声强度与信息量更为严重,传统的方法几乎无法得到可用的结果。为了出了这些数据,我们使用了深度学习的方法来对特征数据进行筛选。代谢组数据特征维度较高,尤其是亚临床级别的数据一般是没有特异性的,往往需要把检测做的非常全面,有时甚至会使用数种检测模式,其特征提取数据复杂的大规模优化问题。在本文中,我们使用两层迁移卷积神经网络对其进行了有效的处理。卷积神经网络与迁移学习策略是深度学习领域中重要的组成部分。通过合理调配全局优化的过程与局部搜索的侧率,卷积神经网络可以在较小的空间与时间复杂度内得到比其他算法更为优秀的特征提取结果。在深入分析目前流行的卷积神经网络学习方法后,我们提出了先使用临床确诊的患者的代谢组数据进行训练,随后将训练结果迁移到亚临床领域,然后再进行一轮更深的学习,从而得到了比现有代谢组特征数据处理方法更为优秀的特征提取结果。通过将深度机器学习算法以封装的形式引入框架以评估训练性能,论文提出了针对亚临床级别的高维度代谢组学特征数据的智能特征提取算法,在对冀东油田社区队列的血液代谢组学特征数据分析中,取得了比传统学习方法更佳的预测结果。特果特征提取器提取的物质标签有效的解释了代谢物与目标生物生理状态之间的关联。此外通过这一数据集进行训练的模型有着很强的复用性能,可以在今后的相关研究中直接迁移使用,可以作为代谢组学研究的一套完整的工具包,用于后续的进一步研究。

其他文献

基于融合树模型的幸福感分析

幸福感是衡量国民福祉的重要指标。针对当前研究难以量化幸福感的问题,本文提出一种基于融合树模型预测幸福感的方法,同时找出影响幸福感的重要因素。首先,基于中国人民大学

会议

幸福感特征工程树模型模型融合

加入WTO对我国证券市场及证券经营的影响

期刊

WTO中国证券市场证券经营

英语学习信念、学习策略与学业成就的关系研究

本研究调查了非英语专业大学生的外语学习信念和学习策略使用情况,以及两者对学业成就的影响。研究表明:1)学习信念在一定程度上影响语言学习,学习策略使用情况处于中等;2)学

会议

学习信念学习策略相关关系路径分析

复合时序事件及其基于Petri网的检测

主动数据库中的规则是由事件驱动的, 事件与时间密切相关, 然而目前的事件描述语言不能表达时间概念. 文章引入了一组一元时序算子, 将传统的事件表达式扩展到时序空间, 并给

期刊

主动数据库复合时序事件PETRI网增量式事件检测主动规则数据完整性active databaseECA rulecomposite temporal

具有阻塞影响的柔性制造系统排队网络模型

用有限容量局部库区的开排队网络模拟柔性制造系统，模型中，机床加工工件的时间服从指数分布，运送台车按照静态Ｍａｒｋｏｖ方式运送工件且运送时间服从指数分布，被阻塞的工件按照ＢＡＲ机理被处理，静

期刊

柔性制造系统排队网络阻塞机理乘积形式解flexible manufacturing systemqueueing network modelbloc

武汉体育学院体育教育专业篮球专修学生学习状况研究

本研究采用文献资料法、专家访谈法、问卷调查法、数理统计法和比较分析法,以武汉体育学院体育教育专业篮球专修学生学习状况为研究对象,以2016级、2017级、2018级、2019级篮球专修学生为调查对象,从学习态度、学习动力、学习行为、学习能力、学习成效五个维度,十三个二级指标,三十八个方面详细了解篮球专修学生学习状况,并将一年级与四年级篮球专修学生学习状况进行对比分析,为改善体育教育专业篮球专修学生

学位

体育教育篮球学习状况改善策略

新生儿窒息复苏的回顾性分析与体会

目的：回顾性调查121例新生儿窒息病例资料，总结复苏要点，提高新生儿窒息复苏成功率。方法：按ABCDE程序进行复苏。结果：经复苏由1分钟Apgar评分7分以下106例。3分以下15例，改善至5分

期刊

新生儿窒息复苏

“缩水”与“造困”亦腐败

期刊

人代会九届一次会议消息今年金融系统要继续加强和改善宏观调控做好三项工作

李鹏总理在政府工作报告中提出:要继续实行适度从紧的货币政策,改善金融调控方式,注意适时适度微调.优化贷款结构,支持国有大中型企业的改革和发展,适当增加对国有小企业和其

期刊