【摘 要】
:
代谢是一系列有序化学反应的总称,在维持人类生命中起着至关重要的作用,如生物的生长和繁殖以及对身体外部环境的反应。大量的研究和实验表明,与健康的人相比,病人的某些的代谢物浓度相差较大。因此,相关代谢物与疾病的关联关系是医生诊断和治疗的重要判断之一。随着高通量代谢组学技术的改进,研究人员可以获得大量关于代谢物与疾病的关联关系的信息。同时,代谢组学数据库如HMDB的建立,促进了代谢组学的发展。然而,由于
论文部分内容阅读
代谢是一系列有序化学反应的总称,在维持人类生命中起着至关重要的作用,如生物的生长和繁殖以及对身体外部环境的反应。大量的研究和实验表明,与健康的人相比,病人的某些的代谢物浓度相差较大。因此,相关代谢物与疾病的关联关系是医生诊断和治疗的重要判断之一。随着高通量代谢组学技术的改进,研究人员可以获得大量关于代谢物与疾病的关联关系的信息。同时,代谢组学数据库如HMDB的建立,促进了代谢组学的发展。然而,由于代谢物、疾病的多样化,仍有成千上万数的关联关系需要检测,目前得到的数据仍只是冰山一角。传统的生物学实验可以测试和验证一些假设,但通常需要相当长的时间才能得到结果。如果结果和假设的偏差太大或结果不太显著,实验者可能不得不承担相应的经济损失。因此,开发能够节省实验时间、资金和提供可用预测结果的计算方法,能挖掘出与疾病强关联的代谢物,给生物研究者提供参考,这样既缩小了实验范围又减少了成本的浪费。本文基于网络拓扑与生物信息融合的不同网络采用不同类型的计算方法挖掘了疾病相关的代谢物,具体工作如下:第一,提出基于KATZ模型的预测算法预测疾病相关联的代谢物。首先将生物信息(疾病语义信息)与拓扑信息进行融合。随后,将已知的疾病与代谢物关联关系及疾病、代谢物融合后的相似性网络输入到KATZ模型,KATZ模型根据每个结点之间的路径数和每个路径的长度计算每个结点的得分。通过实验分析可知,该算法可以作为挖掘疾病相关的代谢物的工具。第二,提出基于线性邻居相似性的二部网络推荐算法预测疾病相关的代谢物。通过多数据的生物信息(疾病与基因信息、疾病语义信息等)与拓扑信息进行融合得到对应的初始相似性及计算新的特征网络从而进一步得到线性邻居相似性作为最后的相似性网络。最后采用二部网络映射算法得到最后的预测关系,实验结果表明,此方法能够很好地识别疾病相关的代谢物。第三,提出基于轻量级梯度提升树(LightGBM)模型预测代谢物疾病关联关系。首先从代谢物与通路关联关系的生物信息中提取出代谢物功能相似性及从疾病与症状中提取出疾病功能相似性,其次再分别与提取的代谢物、疾病相应的拓扑信息进行融合作为提取特征的基础并使用统计方法、图论方法、矩阵分解方法及PCA降维的方法提取出最后的特征。最后将特征及标签输入到LightGBM分类器进行疾病与代谢物潜在关系的分类。从相应的性能评价方法及对实验结果进行分析后的结果表明该预测算法具有较好的性能。本文基于已知的代谢物与疾病关联关系,融合代谢物、疾病的拓扑信息及它们对应的多种生物信息设计了三个预测算法挖掘出潜在代谢物与疾病的关联关系,从而为相关领域的研究工作者验证疾病相关的代谢物打下基础。
其他文献
物理新课程标准中,提出了物理核心素养。物理核心素养,是学生在经历物理课程内容学习后形成的观念、品格及能力。此外,课堂教学评价是新课程标准所包含的重要内容之一,物理教学中评价教师是否依据课程标准开展教学,课堂授课能否落实学生核心素养培育要求及发展学生的核心素养等,成为课堂评价的重点。然而,现存的课堂教学评价框架无法客观地评价新课程改革下的课堂教学。基于物理学科核心素养,怎样构建一份合理、可靠、适用的
黄土高原被誉为全球最具有地学研究价值的独特地理区域之一。在黄土高原200多万年的发育过程中,复杂的地形地貌特征、易蚀的黄土、集中的暴雨等,使黄土高原地区成为我国土壤侵蚀最严重的地区。千沟万壑、丘陵起伏、梁峁逶迤、沟蚀严重是黄土地貌的重要特征。由塑造黄土地貌的侵蚀作用所主导的黄土沟谷,一直是黄土地貌侵蚀发育的重要研究对象,可分为水蚀沟谷与继承性沟谷两种基本类型。由于黄土高原现代侵蚀各种沟蚀的活跃性,
DNA分子计算是一项由高度交叉学科发展起来的知识密集型高新技术,超越了分子生物学固有的架构而趋向更完善的技术路线。将DNA分子作为运算载体,按照一定的规则根据问题的模型对其编码,可以将运算对象映射成相应的DNA链产生数据集合。这个新兴的研究领域在理论和实验上取得了重要进展,但在算法的设计和模型的构造方面还需要进一步摸索,多种交叉学科思想的汇聚往往能带来新的创意。核酸分子的功能化为纳米结构的精细调控
贯叶连翘(Hypericum perforatum L.)为金丝桃科(Hypericaceae)多年生草本植物,其作为一种重要的药用植物,全草皆可入药。贯叶连翘具有多种生物活性成分,其中,以褪黑素(melatonin)、金丝桃素(hypericin)和贯叶金丝桃素(hyperforin)为主的药用成分可用于治疗轻到中度抑郁症,且具有耐受性好、副反应少等优势。褪黑素(N-乙酰基-5-甲氧基色胺)是一
胶质瘤(Glioma)是中枢神经系统中最具侵袭性的原发性肿瘤,在成人脑肿瘤中的占比达到60%以上,且在不同患者中存在高度异质性。目前对胶质瘤的主流疗法仍依赖于手术切除,辅助以放化疗和替莫唑胺的治疗。但由于胶质瘤侵袭力强,疾病复发率高,通过治疗后患者的总体预后仍较差——其中位生存期仅为14-16个月。CD59是一类通过糖基磷脂酰肌醇(Glycosylphosphatidylinositol,GPI)
量子信息的掩蔽是指将编码在量子态中的信息映射到一个复合系统中使得所有子系统上的观测者都无法获得原有信息的任何知识.Modi等人在[Phys.Rev.Lett.120,230501(2018)]上证明了对于某些非正交态的受限集,掩蔽是可以实现的.在这篇论文中,我们分别讨论编码在纯态和混合态上的量子信息掩蔽的问题.首先,在明确纯态的可掩蔽概念的基础上,得到一组纯态可以被一个算子掩蔽的充分必要条件,基于
基于按需付费的云存储服务,用户可以将数据外包存储到云服务器(CS)上,利用较低的存储和管理成本享受便捷的数据存储服务。然而,云存储同时面临着数据机密性和完整性问题。首先,基于云存储的数据存储模式难以保证外包数据的安全,CS的软硬件故障或云服务提供商(CSP)自身利益驱动会造成数据的损坏且难以保证数据完整性和可用性。其次,为了避免数据集中存储带来的数据完整性和可用性问题,用户选择将数据分散存储到多个
抑郁症是世界重大精神疾病之一,女性抑郁症的发病概率为男性的二倍。抑郁症严重危害了人们的身体健康,影响人们的生活质量。一直以来人们致力于抑郁症发病机制和治疗手段的研究,但目前为止还不能透彻的解析抑郁症的发病原因和生产特效安全的治疗药物。应激是导致抑郁症发生的一个重要因素,有关应激性抑郁发生和应激易感性的研究对于抑郁症的防治有重要意义。RFWD2是一种E3泛素连接酶,研究表明RFWD2及其泛素化底物E
量子相干性最近已成为用于各种量子信息处理任务的一种关键的候选资源.量子资源理论的一个主要问题是利用理论的自由操作来描述资源之间的转换.本文考虑在参考系统已经存在的相干性,能否通过不相干运算广播到辅助系统.证明了通过不相干运算进行较弱形式的广播(称为弱广播)是不可能的.这表明,在每个有限维系统中,通过不相干运算来进行相干性广播是不被允许的.得到了通过不相干量子运算可以实现相干性的广义广播当且仅当参考
有机电致发光器件(OLED)自问世以来便备受关注。发光材料是影响器件性能的关键因素之一。目前,热活性延迟荧光(TADF)材料极具潜力,被作为下一代发光材料,可通过有效的上转换过程捕获三线态激子,理论上达到100%的激子利用效率。其中最低激发单线态(S1)和三线态(T1)之间小的能级差(ΔEsT)是分子设计的关键,尽管给-受体(D-A)型分子设计能实现较小ΔEST,但要实现更为稳定高效的TADF O