【摘 要】
:
随着生物工程技术的快速发展,代谢网络模型在代谢工程和合成生物学中得到了广泛的应用。但是,代谢网络模型的建立普遍需要胞内代谢物浓度作为初始参数。使用实验方法进行胞内
论文部分内容阅读
随着生物工程技术的快速发展,代谢网络模型在代谢工程和合成生物学中得到了广泛的应用。但是,代谢网络模型的建立普遍需要胞内代谢物浓度作为初始参数。使用实验方法进行胞内代谢物的提取和浓度的测定非常复杂和困难,尤其当要提取、测量大量低浓度代谢物的时候。相比于实验方法,使用计算的方法进行浓度的预测更为方便、有效。在这篇文章中,我们使用数据挖掘的方法,建立了以代谢物化学描述符、代谢网络拓扑参数、代谢通路特征为基础的代谢物浓度预测模型。在构建模型之前,我们使用遗传算法在包含91个代谢物浓度样本的训练集上对1669个特征进行特征选择。在特征选择的过程中,我们使用留一法交叉验证的Q~2值对特征子集的有效性进行评估。特征选择完成之后,我们使用包含39个代谢物浓度样本的独立测试集对特征子集的有效性进行外部测试,得到了较为一致的结果,说明我们选择出的14个特征可以较好地用于浓度预测。不同的机器学习算法在研究不同的问题中有着不同的优势。在上述研究的基础上,我们使用四种机器学习算法:朴素贝叶斯、BP神经网络、随机森林、支持向量机,在特征相同的情况下,进行浓度预测模型的构建,以期能够选出用于浓度预测实验的最佳机器学习方法,提高浓度预测的效果。经过对比我们发现,在训练集中,不同算法之间各有优势。但在测试集中,使用高斯核函数的支持向量机模型的结果明显优于其他三种算法。另外,其他三种算法的结果与使用多项式核函数、Sigmod核函数的支持向量机模型非常接近。这可能暗示,基于高斯核函数的支持向量机模型的优势更多是源于高斯核函数可以更好地将低维特征映射到高维空间。因此,在现有数据集和特征的基础上,我们认为,基于高斯核函数的支持向量机算法最适合用于代谢物浓度的预测。模型在内部交叉验证和外部独立测试的结果表明(R~2=0.74,RMSE=0.73,Q~2=0.57;R_p~2=0.59,RMSE_p=0.70,Q_p~2=0.58),我们建立的支持向量机回归模型在浓度预测实验中有着较好的训练能力和泛化能力。这一结果显著优于现有的各类方法,并且具有更广泛的覆盖范围。
其他文献
欧李(Cerasus humilis(Bge.)Sok.)是我国北方特有植物,强大的根系组织使得欧李有较强抗性,能很好适应各种立地环境,可在干旱地、盐碱地、霜寒地等环境生存,被列为防风固沙的
在天然气的输送过程中,部分起伏的天然气管道由于压力与温度的变化产生凝析液,当管道输气量小于连续携液所需的临界流量时,管道积液会滞留在管内,严重腐蚀管道、影响天然气输
本文对女权问题的历史和社会根源进行了分析,提出了广义的女权问题并不是人类社会的本质属性,而是诞生于一定的社会环境且具有:"女性作为弱势劳动力被买卖"、"女性不需要广泛
随着城镇化进程的加快,大量生活污水未经处理或处理未达标就排入河流,对河流生态环境造成严重危害。由于城市生活污水具有水量大、污染物成分复杂、有机碳源少等点和国家日益严格的要求,研发高效,稳定,实用的城市生活污水处理技术是目前城市生活污水控制领域的研究重点之一。本文拟采用改良A/O工艺对城市生活污水进行处理。本改良A/O工艺对传统A/O工艺中污泥回流、硝化液回流系统进行改良优化:其一是将污泥回流管路与
一个行为满足怎样的条件可以被称之为恶行?世俗的哲学文本中对恶行的定义有很多,但总的来说,绝大多数定义恶行的理论都认可,恶行至少包含以下两个要件中的一个或全部:(1)重大的伤害,如对精神上、身体上造成不可恢复的创伤;(2)特定的动机,如为了从他人的痛苦中获得快感。上述两个要件都面临着强有力的反驳,这些反驳使得现有的恶行理论,要么不能区别恶行与一般的不道德行为,要么排除了一些明显是恶行的情况。要想在这
游戏在肯·凯西的代表作《飞越疯人院》中占有重要比重,小说呈现了打扑克牌等室内游戏,打篮球、捕鱼等室外游戏,并在“狂欢节”式的聚会中达到高潮。游戏既是麦克墨菲为代表的疯人院诸人的娱乐方式,又表达了他们对自由的追寻和自我意识的觉醒。本文立足于文本和20世纪60年代美国的社会文化背景,结合游戏的相关理论,分析麦克墨菲为代表的众人对游戏空间和自由权利的追求。通过游戏,他们进行反叛,努力拓展自己的活动空间和
当下,人们对能源的担忧主要集中于两个方面,一是化石能源的日益枯竭;二是化石能源带来的环境污染。化石能源的枯竭促使人们寻找可再生能源来维持可持续发展,化石能源的污染让
作为作家的米兰·昆德拉对小说艺术有深邃的思考,他的随笔集《小说的艺术》、《被背叛的遗嘱》、《帷幕》、《相遇》等表达了独特的理论观点,形成了一种以哲学为参照的小说理论观。这些充满诗性的理论文本论述了作为哲学的小说与世界之间的复杂关系,也探讨了作为哲学的小说在构成方式与构成要素方面的独特之处。这些论述提供了不同于传统小说理论的新视野。通过对昆德拉这些随笔文本的分析,可以理清昆德拉小说理论的内在逻辑,探
磷是水环境非点源污染的关键因子之一,农田磷素流失受降雨等多种因素的影响,分析磷素流失的影响因素及其主控因子是非点源污染发生机理及其控制领域的重要科学问题。沂蒙山区
混杂纤维混凝土于20世纪70年代首次提出,随后因其优异的力学性能和更加合理的经济效果蓬勃发展,在机场跑道、大跨结构、大型隧道衬砌等工程应用中有广阔前景,已成为当下研究