若干有机小分子生物活性和毒性的识别及预测

来源 :上海大学 | 被引量 : 1次 | 上传用户:qnmdmm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年来,伴随着人类等生物物种基因组学、信息技术和生物检测手段的不断发展,生物信息资源日渐丰富,生物信息学作为新兴的交叉学科应运而生。理论研究者可以在实验获取的数据基础上进行加工、存储等,利用机器学习方法进行分析,从中找出隐含的规律和模式,从而进一步加深对事物的认识,揭示数据所蕴含的生物学意义。本文就是采用这一研究方法着手若干有机小分子生物活性和毒性的识别及预测。本文的主体工作分为三个部分:第一部分:基于集成学习算法的小分子生物功能预测如何准确并有效地确定小分子生物功能是一个挑战,小分子生物功能预报研究具有重要意义。本部分内容中我们运用集成学习算法来解决这个问题。我们尝试用AdaBoost-C4.5算法建模,用官能团组成来实现小分子编码,完成小分子代谢途径类型预测等研究。小分子生物功能的研究可以帮助我们认识疾病机理、理解生命现象。本部分研究所建立的模型显示出较好的预测性能,其交叉验证预报准确率为73.71%,对独立测试集的预报准确率达73.8%。根据建立的预测模型,我们开发了相应的小分子代谢途径类型预报的在线服务系统,有关WEB界面见http://chemdata.shu.edu.cn/pathway/。第二部分:基于集成学习算法的代谢过程中酶和小分子相互作用的预测酶和小分子之间相互作用的信息对于我们理解酶和小分子的新陈代谢作用和其它生物过程非常重要。本文中我们应用AdaBoost,Bagging and KNN等不同的分类器组合,通过多分类器投票系统来预测酶和小分子在代谢过程中的相互作用。研究表明:多分类器投票系统的预报结果优于任何单个分类器预报的结果。我们得到的训练数据集和独立测试集的预报准确率分别为82.8%和84.8%。其中对于酶和小分子相互作用对(即正样本)独立测试集的预报准确率为75.5%,比之前文献报道的准确率高出4个百分点。本工作提出的预报方法的相关内容已建立在WEB服务器上,地址为http://chemdata.shu.edu.cn/small-enz/。第三部分:基于支持向量机回归的麻醉药毒性构效关系研究本部分工作中,我们采用支持向量机回归方法、多元线性回归、偏最小二乘法及逆传播人工神经网络研究了39个麻醉药毒性的定量构效关系。从若干量子化学计算参数中筛选出能有效建模的分子描述符。所得SVR,MLR,PLS,BP-ANN模型的均方根差分别为0.283,0.385,0.392和0.466。结果表明,所建支持向量机回归模型的预报精度高于MLR、PLS和BP-ANN方法所得的结果。支持向量机方法有望成为结构毒性关系研究领域中有用的化学计量学工具。
其他文献
中国共产党作为马克思主义政党,讲政治是它最鲜明的特点和优势。成立95年来,党始终高度重视思想政治建设,把思想政治工作作为一切工作的生命线,这也成为中国共产党在长期革命
目的:探究中医肛俞穴麻醉应用于肛肠科的疗效。方法:300例肛肠科患者,随机分为对照组和观察组,各150例。对照组采用利多卡因进行局部浸润麻醉,观察组采用中医肛俞穴麻醉。对比
赣南燕山早期岩浆作用强烈,岩石成因以I型花岗岩为主,见少量S型花岗岩及A型花岗岩。笔者在赣南兴国地区新识别了晚侏罗世永丰和隆市A型花岗岩,其LA-ICP-MS锆石U-Pb定年结果分
要彻底遏制我国农村的环境污染,实现可持续发展,必须加大农村环保工作力度,采取有效措施。必须以健全、严格的法律、法规,足额的投入、积极的公众参与等来推进农村环保工作的
以硝酸钡和自制的二氧化钛悬浮液为原料,采用非均相共沉淀法合成了BaTi2O5前驱体粉体,然后将前躯体在一定温度下煅烧得到BaTi2O5无铅压电陶瓷粉体。对产物进行IR,XRD和SEM分
目的:研究安神定志灵对自发性高血压大鼠(SHR)多动冲动行为及前额叶去甲肾上腺素α2A受体(ADRα2A)的影响。方法:选择SPF级雄性SHR作为注意缺陷多动障碍(ADHD)模型动物,随机
强势群体所推行的“环境观”、“自然观”通常无法给弱势群体的生存以关照。人类社会权益分配的严重失衡最终转变成人与自然关系的失衡 ,人类行为越来越与自然法则的要求背道
结合多年工作经验阐述了沈海复线高速公路(漳州段)桥台背、涵背、挡土墙墙背(简称“三背”)的回填施工质量控制要点,希望为同类工程作为参考。
目的了解苏州地区围绝经期女性的骨密度水平,并分析其影响因素。方法在苏州市和太仓市随机选择年龄39~69岁的围绝经期女性1 024例,对其进行问卷调查和骨密度测定。结果在1 024
在精准扶贫工作中,受到各地工作方式和发展水平不同的影响,对于贫困信息的采集和统计分析等工作仍然存在不统一、耗时费力的问题。为了提高工作效率,以某“两联一包”扶贫村